为什么手势会是下一个设计爆点？

语音交互存在其非常明显的局限性，譬如，当你对着空气大声喊着：“Hey，Siri”，特别这时身边还有其他人的时候，是否会觉得特别尴尬？不过别担心，手势交互将会解决这个问题！

译者篇首语：

从语音识别、语义理解等基础技术的日臻成熟，到各大厂商纷纷发布各自的智能语音产品和语音操作平台，语音交互正在成为主流交互方式之一。但是语音交互也存在私密性差、易干扰他人等局限性，因此语音交互需要与其他交互方式进行配合组成多模交互才能发挥最大效用。

而在众多其他交互方式中，手势交互符合人类自然心智模型，且已具备成熟的技术基础，无论是单独使用还是与其他交互方式组成多模交互，都能发挥良好作用，极有可能成为下一个设计引爆点。

本篇文章中，麻省理工学院媒体实验室讲师David Rose结合他在全球创新设计公司IDEO的项目经历，分享了手势设计思路与方法、对手势交互的洞察以及手势交互的优势。

本文基于他《Why Gesture is the Next Big Thing in Design》一文进行编译，在不改变作者原意的情况下，做了删减和编排。

导读：

手势交互会是下一个设计爆点？
如何设计手势交互模型？
手势的特点
手势交互的优势

自2010年Siri（译者注：苹果语音助手）问世以来，人们越来越热衷于语音交互界面。当我们需要调节室内温度时，我们会找Alexa（译者注：亚马逊公司的智能语音助手）。

当我们想播放电影时，我们会通过遥控器进行语音搜索。据报道，截至2017年底，美国家庭中已拥有大约3300万台语音智能设备。

但是，语音交互存在明显的局限性。语音交互很慢，当旁人在场时会使人难为情，而且必须使用令人尴尬的唤醒词，如“Okay，Google”或“Hey，Siri”。

不过值得庆幸的是，对着空气说话，不再是我们唯一或最好的选择。

一、手势交互会是下一个设计爆点

苹果公司的新款手机所采用的摄像头（译者注：此处应指iPhone X的3D摄像头“TrueDepth”），可以感知三维空间，能记录每个像素的深度信息；而诸如Nest IQ（译者注：谷歌子公司Nest推出的智能家用监控摄像头）、Amazon’s Echo Look（译者注：亚马逊推出的一款搭载Alexa语音助手的相机，可根据用户的指令来完成拍照等动作）这样的家庭设备，也配备有摄像头。

神经网络可以学习这些信息，并利用更多的训练集来提升学习效果。

结合神经网络，这些新型相机可以在场景中创建人物的点云（译者注：计算机视觉领域术语，指三维空间参考系下表示目标表面特性的海量点集合）或深度图（译者注：计算机视觉领域术语，指有深度信息的图片，可以表示出物体的到镜头的距离），描绘他们的运动姿势，以及运动形态。

经过训练，神经网络能识别特定的人，对他们的活动进行分类，并从远处对他们的手势进行回应。神经网络和摄像头技术的进步，共同为手势设计和基于手势的交互模型开辟了新纪元。

这些新的选择带来了一个问题：在现有的交互模式中，触觉（触摸），声音（语音）和视觉（手势），哪一种更好？它们各自更适用于哪些场景？为什么？

现有用例指向了一个答案。当你在潜水、滑水、活在航母甲板上指挥交通时，听觉通道不可用，手势或触摸操作就变得重要了起来。

在手术室内，外科医生的手是无菌的，所以她无法手动操作放射扫描仪，只能用语音和手势。如果你正在指挥管弦乐队或正在进行军事突袭，你无法喊出指令，因此，我们别无选择，必须使用手势。

在进行手势交流设计时，从查理卓别林到板球，有各种各样的资源可以启发我们：https://v.qq.com/x/page/a0812soz0nb.html

（译者注：视频中展示了各种各样的手势，按出现顺序依次为：公共空间（台阶上的行为艺术、公园中的情侣）中的手势，挥动旗帜的士兵、气象播报员、隔空手势控制计算机桌面、卓别林在狮笼中的动作、舞台剧表演中的手势、指挥家的手势、手语中的手势、猜字游戏中的手势、板球中手势、音符的手势表达、瑜伽中的手势、校园中见面问候的手势、日本茶道中的手势、演唱中的手势、日常聊天中的手势、街舞表演中演员及台下观众的手势、科幻电影中的手势、哈利波特电影中的魔法手势、小丑的手势、太极中的手势、Butoh舞（日本一种另类舞蹈）中的手势，其它舞台表演中的非手势形态，星际迷航电影中外星人的手势等。）