关于语音交互产业趋势
关于语音交互产业趋势 思必驰是语音交互产业的明星公司。首先,有请介绍公司主要业务和发展规划。 高总:思必驰是语音交互业内唯一专注智能硬件的公司,包括车载、家具、机器人乃至穿戴设备。我们提供一站式语音交互服务,帮助合作伙伴提供AI系统和AI芯片模组。 苹果收购VocallQ后,成立新的语音交互研发公司,Siri现在最专注的是用交互的方式做自然语言的对话,而之前原始的Siri使用不太广泛,主要用来调剂、娱乐。Siri也从原先的语音合成和简单的语音交互向对话式的语音交互转变。此外,Siri还集成多模态的语音交互,针对图像、文字、语音等用户多种信息模态做不同的处理。 对比苹果和谷歌,苹果以产品为方向实现综合的交互技术,可以融合图像、用户ID和使用习惯,作为产品上综合的对话助手。与之相比,谷歌更像技术平台,更多在横向支撑更多开发者进行新的产品迭代,Google Now也在推交互式搜索。从大的方向,苹果可以做产品一体化服务体验,Google可以做一体化平台,现在苹果要做的好一些,它的用户体验更好。 苹果和亚马逊Alexa相比,Alexa只有语音,优势在于交互模态比较简单,容易上手,但缺乏多模态输入,用户体验的提升少一些。Alexa的优势则在于进入家居垂直线,把语音做到极致。但他们的共同点都是把人和机器通过语音链接起来。而思必驰既做语音合成,也做语意理解,期望把对话做成链接人和机器的核心手段。 一级市场存在周期性,14年是硬件,15年是金融,16年是人工智能。16年无论苹果还是国内厂商,都在推用户能接受的人工智能产品,用户也愿意为此产生消费,因而人工智能处在估值比较高的状态。人工智能现在相对其它板块一枝独秀,在这个阶段给予一些技术性公司较高的估值,是因为大家认为未来这个行业的技术壁垒很高,比如用公开的语音开放平台无法做到一线厂商的用户体验。 而之所以这么多创业公司涌现,是因为很多产业内很好的价值节点没有被很好的填补。未来需要更多公司来填补产业链,一级市场上供需还是存在一个平衡。 智能音箱这个点可能成为爆品。智能家居是现在关注的热点,语音又是交互的重点,载体是什么?音箱是众多智能家居比较有优势的。首先,音箱的位置不是家庭的边边角角;其次,音箱承载语音输出功能,容易使用户接受作为语音交互载体。另外,电视也有可能。 对于苹果来讲,苹果的产品线很少,不一定推出音箱,因为Siri已经可以控制智能家居了,未来灯甚至都可能成为入口。 Echo出货量现在达到400万台,大家看好它成为智能家居的生态核心,能够整合用户,撬动需求。我个人认为,音箱具备中心生态属性:1.刚性需求,高频次的应用;2.设备具有很强的服务拓展能力;3.用户有很好的交互体验;4.产品具备在用户市场很快落地的能力。音箱、电视、家庭机器人都可能成为未来入口,但家庭机器人的落地还存在问题,音箱相比更具有可能。 从技术上,第一,保存在本地的数据基本上没有办法提升性能,苹果应该是本地和云端的结合;第二,对于本地的模型本身,有一定的自身技术对本地的模型进行处理,将中间结果进行上传,而不是初始数据,可以保护用户隐私,技术上也可以实现。 如果进行严格对比,Siri和智能家居的性能相差不多。Siri之前专门进行了上下文理解的提升,在任何智能家居和车载领域都会用到类似Siri的语音处理技术。我们现在在做的自然语言处理,都是基于交互的自然语言处理,更关注上下文状态的理解和交互控制,会有针对地进行优化,是与之前不同的技术角度。苹果也逐步把这个技术用到Siri当中,所以未来Siri不会比车载和家居的理解能力差太多,总的来说,Siri的理解能力不算差,未来移动互联网也会更关注交互的认知计算。 从技术上,肯定可以实现延续。交互本身就是综合的,图像、文字、语音都可以综合。但小Ai机器人主要做文字本身的理解,不是交互,当文字输入比较准确时可以比较好的应用,但如果语音识别转换成文字的准确率较低,那第二阶段的文字识别率就会受到影响。此外,现在主要是基于单句理解和简单上下文理解,扩展性和复杂的上下文理解会存在一定的限制,如果超越规则覆盖的范围,会受到限制,怎么把语音语意结合等就成为重要的问题。 语音平台方面,国内包括思必驰在内,做平台尚早。整个智能硬件、物联网产业还处在早期,生态还没建立起来,开发应用都很少。在这个阶段,我们更多是和合作伙伴提升产品体验,促进生态的逐步完善,才能在之后提供面向开发者的平台。很多开发者以为注册了平台就能做出产品,其实不是,要等到整个产业成熟后才比较有优势。 整个智能语音行业,包括科大讯飞等都在做,这是好事,但大家定位不同。我们专注智能硬件、物联网,也有专注做产品,科大讯飞属于专注多个领域。但这个市场足够大,大家都会有成长,整个行业还是技术驱动的。每家公司都在高速发展,哪家公司能够迅速打穿这个市场,加速用户认知和生态完善,会为大的迭代变革创造巨大的机会。 在整体基础理论上,国内和国外还有差距,理论多是国外提出基础原创的东西,尤其是深度学习应用、新的解码方式等,但这一点也在很快地追赶。从产品技术性应用角度上,差别不大。 尤其中文领域,国内巨头都是世界一流水平。国内有的公司通过平台转化,有的通过产品转化,大家角度不同,但中国有独特的用户和基础优势,各有千秋。总而言之,应用角度上国内不比国外差,但基础研究上可能还有些差距。 |
相关阅读: |






