百科狗-知识改变命运!
--

Google Assistant 和其他语音助手相比有什么亮点吗

是丫丫呀1年前 (2023-12-03)阅读数 6#综合百科
文章标签语音助手

我在周末体验了搭载Google 人工智能技术的Allo 之后,得出如题的结论,事实上,不只是我有这样的感觉,最近还有许多科技大佬和发烧友做了几款人工智能助手产品的对比测评,都对Allo的表现略微失望,竟然是百度的度秘压过了它成了大黑马,包括《纽约时报》记者在尝试了Allo五天以后,给出的结论也是:谷歌这个助手真的有待改进。

Allo早在今年5月的Google I/O大会上就已推出。这场大会的关键词是人工智能,最能体现“人工智能”元素的应用就是“Google Assitant(谷歌助理)”,Allo是消息聊天应用,与Facebook Messager、微信等聊天应用最大不同是整合了Google Assitant。跟中国的阿里巴巴一样,Google在社交这个事情上一直在努力,从来没成功,从IM时代的GTalk再到SNS时代的Google+,均惨淡收场,这一次携着人工智能技术通过Allo再战社交市场。

Allo能做什么?Google官方宣称,它整合了智能回复功能和Google助理,“让数字助理变成真人助理”是这款软件的初衷。在发布会上Google I/O演示了Allo智能回复朋友的信息,点评收到的照片,而Google助理则可在群聊时帮助用户预订意大利菜。真正的体验是怎样的呢?Allo 上周登陆了Google Play和AppStore,眼下对英语支持比较好,但也支持中文,先来看看上手体验。

判断人工智能助理的能力一般可从三个方面来看:一是“听懂人话”即理解用户意图的能力;二是“给出答案”即能让用户感受到它的聪明机智;三是“完成任务”即是否可在给出答案之外提供信息之外的服务。图灵测试是计算机历史上的经典测试,“如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。”现在AI助理通过图灵测试太容易,但要100%像人一样给出答案,尤其是100%像人一样完成任务,就太难了。Allo的“真人助理”理念很好,但其能力却距离一个合格的“数字助理”都还有差距。

Google助理:理想很丰满,现实很骨感

Allo是一个消息聊天应用,你可以跟朋友发送表情、文字、照片、位置等信息,前提是对方也要安装并登录Allo,Allo与通讯录打通,让用户可方便地邀请好友使用Allo。而要使用其“智能助理”功能,即可在聊天时@Google,也可与其内置的联系人Google Assitant(Google助理)对话。Google Assitant(Google助理)会在用户首次点开之后进行引导,告诉用户有订阅、运动、旅行、外出、新闻、笑话、游戏、行动、翻译、天气、问答等11大场景。

与Google助理的对话界面,与普通联系人对话界面没有什么区别,支持文字、语音、等类型的消息格式。在听懂人话方面,Google助理基于Google在自然语言处理和Google Now在语音技术上的积累,表现还是不错的。我说英语,说中文,它基本都可听懂,对于比较复杂的句式能很好地理解,你可以给Google助理发送一张鸟儿的,它可准确地识别出来,在你继续提问时,就给你WIKI百科的词条。

Google Assistant 和其他语音助手相比有什么亮点吗

在给出答案这一点上,Google助理很依赖搜索引擎。说附近好玩的、附近的饭店、附近的星巴克,都会收到Google地图的搜索结果。如果说来一个好看的视频,会收到Youtube的一个视频,支持评分、随机、最新等方式。如果问最近的**,它会给你一组**海报和名称,点击之后又是搜索结果。总的来说,在答案上,Google助理非常依赖搜索,且用户点击之后,都会调用Chrome浏览器打开,没有实现内容的内嵌,体验不好,感觉Google助理就是搜索导流工具,十分依赖Google搜索并且还要用浏览器打开结果。

当前形态的语音助手并不足够好,但它依然是人工智能技术在我们日常生活中最成熟、广泛的应用方式。你可以将语音助手看做是一个住在各种智能设备里的机器人大脑幼体程序,当它进化出判断力和创造力之日,就是人人拥有强大的管家贾维斯之时。语音助手是什么语音助手是一种语音控制程序,通过智能设备上的收音硬件,它能听见你的话,进行语义判断,然后在前台迅速做出回应:通过麦克风和你语音聊天,或者听令帮你操控智能设备。这种黑科技是如何实现的语音助手被唤醒、听明白、会说话的过程,背后对应的是机器学习(深度神经网络)和数据挖掘算法,以及语音识别、语义理解、语音合成技术,并需要语音知识数据库进行云端支持。何谓机器学习拿灵犀语音助手来举例,将科大讯飞公司的讯飞超脑技术作为深度神经网络后,就能不断自我学习了解主人的说话方式和爱好需求,进而给予个性化反馈服务。何谓语音唤醒通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。全天候黑屏唤醒最早由摩托罗拉在2013年通过硬件优化实现,摩托罗拉重返中国后的第一款手机 moto x通过灵犀语音助手来实现唤醒后的操控。何谓语音识别和语义理解声音是一种波,说到底还是信号处理问题。你可以理解为建立一套人和语音助手都懂的编码,语音助手的理解过程,就是通过解码引擎在云端数据库里又快又准找到编码对应的最优内容。何谓语音合成 像指纹一样,每个人也有独特声纹,语音合成就是将真人声纹特征采样、编码,经过连读韵律优化后,将任意文字有表现力得转化成虚拟人声。

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)