海豚声纳:移动浏览器中的另类Siri

文/搜狐IT 何峰

Siri的出现,为语音交互开启了一片新世界。追随其后,国内外出现一波类Siri应用,却几乎徒有其表,没有引发大的用户反响,反倒在不断地加温用户对Siri升级的期待。不过,也有一些产品,选择另一个方向,做成一个实用的辅助工具,也博得一些名声,海豚声纳是其中之一。

“海豚声纳”由百纳信息开发,今年3月在海豚浏览器iOS版和Android版上正式上线的一项语音控制功能。按官方的定义,它采用了智能语义识别技术,使得浏览器能够更好地“听懂”自然语言,用户只需要用自己最习惯的说法告诉海豚自己的需求即可得到满足。

以访问搜狐为例,搜狐IT在测试时,先后说出“上搜狐”、“搜狐”和“打开搜狐”,海豚声纳都能识别后,最终都直接访问上手机搜狐(m.sohu.com)网站。而测试“搜狐IT”,还只能引导至搜索框。

  为什么要做海豚声纳?

百纳信息CEO杨永智将智能手机时代的人机交互方式划分为三代,第一代为触摸屏,之后就是语音,最后是基于摄像头的图形图像识别交互。对于第一代人机交互,海豚浏览器通过手势功能,将触摸屏交互发挥到了很高的层次。

“语音第一个浪潮是由Siri引起,在那之后,我们开始思考语音的交互方式。”杨永智从竞争和用户的角度给出开发海豚声纳的理由:

在竞争层面,Siri在人工智能方面不完美,拔高了用户的期望,却远没有到成熟的程度,这是其一;其二,Siri不能覆盖所有特定的领域;Siri是在操作系统层面,整合iPhone上的一些原生应用。但是有很多第三方应用,每个应用都是一个特定领域,在这个领域一定有特定的语义。在每个特定的领域,我们不相信苹果能把每个特定的领域能做完。移动浏览器就是一个特定领域,只值得深挖和探索的。这是当时的出发点和价值所在。

从用户角度,网址导航和搜索是浏览器里面最典型的两个领域。语音交互能解决访问网址导航和搜索输入麻烦的问题。

海豚声纳的上线要晚于UC语音和QQ语音。杨永智认为,“当时的想法是,不是说一定要抢第一,而是看谁能把它做的更好。”

  海豚声纳怎么做?

在如何做海豚声纳上,百纳信息团队给产品的定位是:远远做不了Siri,也不做Siri。“Siri无所不包,挑战更大,我们和Siri理念不一样。”百纳信息CTO刘铁锋坦言。

在启动海豚声纳后,会飘动诸如看电影、看小说、上微博、看新闻、全屏、周星驰电影等指令示例。“我们担心用户像使用Siri一样,什么话都说,这样很特别复杂的命令……所以我们定义一些指令示例,希望用户去Follow,去学习。”杨永智解释设置这些行为规范的理由。他认为,如果一开始就是什么都不提供的开放环境,用户肯定容易也肯定会瞎说,但海豚声纳如果识别不了,导到搜索,结果是用户得不到自己想要的结果,会很失望。

引导用户去学习产品的使用,这个设计已被QQ浏览器模仿了。不过另一家移动浏览器UC仍在坚持自己的特点。

除了在首页底部看见麦克风点击使用外,海豚浏览器为了让用户更容易发现海豚声纳,设计了手机摇一摇这一炫酷启动动作。

  技术难度在哪?

杨永智透露,海豚声纳中文版使用的是科大讯飞TTS技术,实现语音到文本的转化。而针对国外英文市场,使用的是Nuance的技术。

刘铁锋认为,开发海豚声纳的难度不在于把语音转成文字,最大的挑战是做智能语义识别。杨永智解释为“需要大量的数据去训练这个系统。”

刘铁锋表示,海豚声纳在智能语音识别上,会监控哪些被引到搜索,哪些直接导到网站上,会在后台自学习,因而每天都会在改进。“这就小孩子学习说话一样,家长和他说话越多,小孩就会越来越会,独立判断的能力也会越来越好。”

目前,海润声纳在智能语义识别上,仍有不小的改进空间。杨永智认为,在语义识别领域,还没有看到很好的应用和产品。

  新的商业模式

中文版用户使用海豚声纳的比例超过英文版,这出乎海豚浏览器团队的预料。杨永智认为可能是因为英文版版本级别低一级,也和中文输入太难有关。据他在5月时表示,海润声纳在Android版中文版上发布时,每天有20%用户在用。

而这正是语音控制在智能手机时代开始获得流行的原因之一。在他看来,如果能大量流行起来,入口价值会越来越明显,未来给搜索带去的流量将非常大,也会催生新的商业模式。比如,用户想要买东西,浏览器在接受语音输入命令后,将用户导航到淘宝;又如用户想要查找一个好友,通过语音命令,浏览器为用户打开好友的 Facebook 个人页面。“除了网址导航、搜索,和很多特定领域,比如电商、SNS结合起来,还有更多应用场景,在语音上,会有更广阔的空间。”

本文内容来自于刘铁锋在HTML5峰会期间接受搜狐IT专访,以及杨永智今年5月在极客公园上的一次分享。

link:http://it.sohu.com/20120820/n351017115.shtml

友荐云推荐