为什么手势会是下一个设计爆点,谁是撬动全球
分类:科学技术

原标题:为什么手势会是下一个设计爆点?

苹果、谷歌、亚马逊三巨头无疑都看中了未来万亿元级别的智能家居市场,但与苹果和谷歌一开始就明确智能家居战略的路数不同,亚马逊在初期没有那么庞大的野心,也没有那么明确的计划,智能音箱Echo更像是亚马逊无心插柳柳成荫的一个作品。因为产品上的成功,Echo背后的计算平台Alexa逐渐显露出它的分量,不少科技人士评论它有可能成为AI时代的Android,这让谷歌非常紧张。

译者篇首语:

谷歌在2014年用32亿美元收购温控器厂商Nest,轰动一时,彼时谷歌的智能家居战略浮出水面。苹果在2014年公布了智能家居平台HomeKit,Echo也是诞生于2014年,但到今天,亚马逊Echo成为撬动全球智能家居市场的支点,引得谷歌和苹果也慌忙投身智能音箱市场。然而,无论谷歌、苹果如何追赶,亚马逊在这一市场的知名度都要更高,也更为成功。

从语音识别、语义理解等基础技术的日臻成熟,到各大厂商纷纷发布各自的智能语音产品和语音操作平台,语音交互正在成为主流交互方式之一。但是语音交互也存在私密性差、易干扰他人等局限性,因此语音交互需要与其他交互方式进行配合组成多模交互才能发挥最大效用。而在众多其他交互方式中,手势交互符合人类自然心智模型,且已具备成熟的技术基础,无论是单独使用还是与其他交互方式组成多模交互,都能发挥良好作用,极有可能成为下一个设计引爆点。

亚马逊Alexa的成功

本篇文章中,麻省理工学院媒体实验室讲师David Rose结合他在全球创新设计公司IDEO的项目经历,分享了手势设计思路与方法、对手势交互的洞察以及手势交互的优势。本文基于他《Why Gesture is the Next Big Thing in Design》一文进行编译,在不改变作者原意的情况下,做了删减和编排。

Alexa获得成功的一个重要原因是亚马逊没有过度夸大这项技术。对比名气更响亮但经常让苹果用户失望的Siri,Alexa和Echo显得更加智能。

导读:

Echo是亚马逊研发的智能音箱,Alexa是搭载在Echo上的智能语音助手。亚马逊对Echo的定位是集成某些智能语音指令的产品,不是聊天工具。Echo开始只集成了十来个指令,接入了十来个应用。随着用户习惯与Alexa对话,Alexa获得了正面口碑,接入的应用越来越多。

01 手势交互会是下一个设计爆点

现在,Alexa更像是一个计算平台,通过运行各个独立的应用程序Skills来实现不同功能。这些Skills类似于手机上的App,Alexa则类似于Android或是iOS。比如从亚马逊商城下载并安装一个“披萨外卖”的“技能”,通过唤醒Echo,就能叫来披萨外卖上门;再比如控制灯的开关、恒温器的设定;还比如制定日历后,Echo就能主动提醒,外出帮忙叫车,听读新闻和音乐等。截至2017年6月底,Alexa的“技能”数量超过了1.5万个,而基于谷歌智能音箱Google Home的语音应用软件数量仅为几百种。

02 如何设计手势交互模型

Alexa“技能”数量快速增长的原因,一个是亚马逊很早就开放了Alexa平台,专注提升语音技术。亚马逊发布了ASK和AVS两个工具包。ASK是软件开发包,让开发者更容易开发Alexa的“技能”。AVS是硬件工具包,方便厂商将Alexa整合进他们的硬件产品中。目前,出现很多内置Alexa的电子产品,有LG的冰箱、GE的灯具、华为Mate9手机、联想智能音箱、优必选机器人等。

03 手势的特点

另一个原因是Echo在智能方面的优异表现,赢得口碑,让更多第三方愿意主动接入Alexa。亚马逊对Alexa的智能反应要求非常严苛。Alexa负责人Toni Reid表示,当用户下达指令时,Alexa只有一次机会部署相应的动作,所以不能有多轮对话发生,最多重复两次对话,否则就是失败的。

04 手势交互的优势

现在来看,Echo只选用了语音交互,舍弃手势和屏幕交互,而且运用新型麦克风阵列设计,解决了很多语音识别难题,让Echo准确识别用户话语,这其实是Echo在众多智能语音产品中脱颖而出最关键的地方。首先,Echo只选用语音交互,比起安装了智能语音助手的手机、平板电脑的多元化交互方式来说,虽然选择少了,但是给用户减少了很多不必要的动作。

  • 以下为正文 -

其次,Echo只通过语音交互方式,相当于“逼上梁山”,迫使亚马逊必须将语音识别技术做好,所以Echo成了目前语音识别效果最好的硬件产品。最后,Echo创新性地用麦克风阵列识别语音,解决远场语音识别难题。Echo的麦克风阵列由六个麦克风组成,距离声源最近的麦克风能智能识别命令,即使是从另外一个房间发出的声音,也能识别出来。

自2010年Siri(译者注:苹果语音助手)问世以来,人们越来越热衷于语音交互界面。当我们需要调节室内温度时,我们会找Alexa(译者注:亚马逊公司的智能语音助手)。当我们想播放电影时,我们会通过遥控器进行语音搜索。据报道,截至2017年底,美国家庭中已拥有大约3300万台语音智能设备。

根据eMarketer的数据,在2017年第一季度美国语音助手市场中,Echo的市场份额达到70.6%,Google Home则占到23.8%,其他厂商(包括苹果、Lenovo、LG、Harmon Kardon和Mattel)分食剩下的市场份额,为5.6%。

但是,语音交互存在明显的局限性。语音交互很慢,当旁人在场时会使人难为情,而且必须使用令人尴尬的唤醒词,如“Okay,Google”或“Hey,Siri”。

落后的谷歌和苹果

不过值得庆幸的是,对着空气说话,不再是我们唯一或最好的选择。

和亚马逊在智能家居方面只尝试了音箱产品不同,谷歌和苹果的路线变动颇大。

01 手势交互会是下一个设计爆点

作为一家软件公司,谷歌认识到智能家居时代需要以硬件打天下。所以收购Nest时,谷歌对Nest的恒温器产品寄予厚望,后者是美国恒温器市场第一品牌。再加上Nest恒温器的智能功能,理论上能随时控制家里各个电器的运行情况,这为谷歌构想未来智能家居蓝图奠定基础。

苹果公司的新款手机所采用的摄像头(译者注:此处应指iPhone X的3D摄像头“TrueDepth”),可以感知三维空间,能记录每个像素的深度信息;而诸如Nest IQ(译者注:谷歌子公司Nest推出的智能家用监控摄像头)、Amazon's Echo Look(译者注:亚马逊推出的一款搭载Alexa语音助手的相机,可根据用户的指令来完成拍照等动作)这样的家庭设备,也配备有摄像头。神经网络可以学习这些信息,并利用更多的训练集来提升学习效果。结合神经网络,这些新型相机可以在场景中创建人物的点云(译者注:计算机视觉领域术语,指三维空间参考系下表示目标表面特性的海量点集合)或深度图(译者注:计算机视觉领域术语,指有深度信息的图片,可以表示出物体的到镜头的距离),描绘他们的运动姿势,以及运动形态。经过训练,神经网络能识别特定的人,对他们的活动进行分类,并从远处对他们的手势进行回应。神经网络和摄像头技术的进步,共同为手势设计和基于手势的交互模型开辟了新纪元。

Nest在被收购时只有温控器和烟雾探测器两款产品,被收购后,在一两年内它也没推出新产品,因为它在致力于让自己的产品成为所有家电产品的中央控制中心,开放API,吸引更多开发者加入到智能家居的研发队伍中,打造出一个智能家居平台。当时智能家居界的流行观点是平台比产品更重要。

这些新的选择带来了一个问题:在现有的交互模式中 ,触觉(触摸),声音(语音)和视觉(手势),哪一种更好?它们各自更适用于哪些场景?为什么?

然而,今天Nest恒温器并没有成为理想的智能家居平台,在谷歌收购后反而还没有收购前运行得好,出现了人员大批流失、管理层变动和营业亏损。

现有用例指向了一个答案。当你在潜水、滑水、活在航母甲板上指挥交通时,听觉通道不可用,手势或触摸操作就变得重要了起来。

苹果同样在致力于做智能家居平台HomeKit。在苹果手机、平板电脑、苹果TV中安装“家庭”App,也可以呼唤Siri语音操作,控制支持了Homekit的门锁、各类灯光、插座、家居摄像头、窗帘、空气质量检测仪等。与谷歌不同,苹果有自己的硬件家族和庞大的苹果用户作背书,在智能家居市场底气更足一些。苹果官网显示,截至目前,有50多个品牌几百种硬件产品接入了HomeKit。

在手术室内,外科医生的手是无菌的,所以她无法手动操作放射扫描仪,只能用语音和手势。如果你正在指挥管弦乐队或正在进行军事突袭,你无法喊出指令,因此,我们别无选择,必须使用手势。

苹果的做法是在各品牌厂商的产品中内置一个芯片模块,以支持HomeKit。与亚马逊Echo的亲民价格路线不同,苹果HomeKit一是保持苹果惯有的封闭路线,二是支持HomeKit的配件,在支持前后价格上升幅度偏大,厂商需要为安装HomeKit芯片开发特殊的适用版本。诸多障碍摆在那里,HomeKit的普及速度明显不快。

在进行手势交流设计时,从查理卓别林到板球,有各种各样的资源可以启发我们。

Echo的成功刺激了谷歌,给了苹果启发。越来越多的用户使用Echo去管理家居自动化,亚马逊Alexa在新生的智能家居市场展现出强大实力。

(译者注:视频中展示了各种各样的手势,按出现顺序依次为:公共空间(台阶上的行为艺术、公园中的情侣)中的手势,挥动旗帜的士兵、气象播报员、隔空手势控制计算机桌面、卓别林在狮笼中的动作、舞台剧表演中的手势、指挥家的手势、手语中的手势、猜字游戏中的手势、板球中手势、音符的手势表达、瑜伽中的手势、校园中见面问候的手势、日本茶道中的手势、演唱中的手势、日常聊天中的手势、街舞表演中演员及台下观众的手势、科幻电影中的手势、哈利波特电影中的魔法手势、小丑的手势、太极中的手势、Butoh舞(日本一种另类舞蹈)中的手势,其它舞台表演中的非手势形态,星际迷航电影中外星人的手势等。)

于是,在Nest久无建树之后,谷歌急于给自己打造硬件路线。9月份,谷歌收购HTC手机团队,部分原因是加强自身的硬件开发能力。10月4日,谷歌在秋季新品发布会上发布了手机、耳机、笔记本、音箱等诸多硬件产品,其中的Google Home智能音箱mini版,对标Echo Dot,后者占到Echo系列智能音箱总销量一半以上,而售价不到50美元。

02 如何设计手势交互模型

苹果则将在今年年底发售首款智能音箱HomePod,通过搭载的Siri语音系统与兼容HomeKit的控件相连,HomePod将成为智能家庭的“中枢”。

为了进一步了解手势的用途,我们剑桥工作室的团队利用了一个类似iPhone X上搭载的摄像机,进行了一系列的实验,来探索什么情况下使用手势可能是最佳选择。

谷歌将Google Home看作智能家居战略的中心,从价格策略、产品型态、产品矩阵上看,都和Echo十分相似,在2016年面市后不久也对第三方开放,与亚马逊的Echo展开大赛。Google Home也融入了Nest的产品,说明谷歌慢慢从智能家居平台战略走向单品战略。苹果HomePod则定位高端的音箱产品,不仅智能,而且追求音质,奉行苹果一贯的封闭路线。从时间上看,谷歌Google Home晚了Echo两年,苹果HomePod则晚了三年。Echo奠定了亚马逊在智能音箱市场的老大地位,谷歌Google Home虽然进步很快,但是在各项智能应用上,依旧与Alexa有距离。

首先,设计师们两人一组,给每组一个想法,然后让他们通过四只手的姿势来表达这个想法。

中国企业应抓住时机

图片 1

亚马逊Alexa的成功并非偶然。和苹果的Siri、HomeKit,以及谷歌的Nest、语音助手Google Assistant都不同,Alexa从设计之初就被设定要在各种不同的设备上运行。苹果和谷歌的语音助手,起初是安装在手机或平板这样薄而小的设备上,只需要提升近场语音识别技术。而Alexa主攻的是适应各种家居设备的远场语音识别,在多个说话人中辨识真实的语音指令,或者辨识来自另一个房间的语音指令等,这些更符合智能家居的实际应用场景。

IDEO设计师两人一组用手势表达想法

到今天,不仅国外的很多家居家电品牌接入Alexa,而且中国的华为Mate 10手机、联想的智能音箱,也支持了Alexa,联想音箱即是使用Alexa开发包开发的产品。不过,Alexa在中国的发展缓慢,围绕Alexa构建的中文智能语音交互整体解决方案寥寥无几。

然后,两人相互讲故事。利用计算机视觉技术记录他们讲述的故事,并实时跟踪他们在讲述时手势,以研究什么时候我们会自然地通过手势来增强情感或者解释某个概念。

国内的智能家居产品,多是以科大讯飞、云知声、声智科技的语音交互解决方案来设计,但也相当地碎片化。无论是科大讯飞、云知声等专业语音技术企业,还是百度、阿里等互联网企业,都没有形成像Alexa这样的平台型产品。

跟踪手势如何帮助讲述生活中的故事

从欧美市场在智能音箱上的竞争进入白热化状态来看,语音作为智能家居的理想入口,正成为撬动智能家居市场的重要支点,国内一时间模仿Echo的智能音箱产品纷涌而出。智能音箱并非用户的刚性需求,但亚马逊、谷歌、苹果三巨头在智能音箱上的多番竞争,在全球范围形成了羊群效应,所以当前是加快智能家居进程的最好时机。

本文由威尼斯网址开户网站发布于科学技术,转载请注明出处:为什么手势会是下一个设计爆点,谁是撬动全球

上一篇:没有了 下一篇:没有了
猜你喜欢
热门排行
精彩图文