语言交互场景探索一关于语言交互效率的探讨

8月16日回头爱投稿

　　在什么时候语言交互的效率更高，什么时候更低？
　　自然语言交互，这个名词似乎在去年已经长期占据科技类新闻的头条，各大巨头们都想抢占这个据说是下一个互联网入口的巨大机会。
　　然而，就跟历史上每一次的交互变革一样，目前我们离真正搞明白这个下一代的人机交互方式还有很长的一段路要走。希望通过这一系列的文章，我能帮助自己理清思路，同时也能为大家提供一些想法。同时希望，我真的能把这个系列坚持下去
　　定义
　　跟一般市面上所说的语音交互不一样，本文用到的是语言交互，或者叫所谓的对话式交互（CUI），因为本文想讨论的不只是语音交互，也包括文字交互。
　　本文关注什么
　　在阅读后面的内容前，我们先来问两个问题：
　　什么情况下语言交互效率更高？
　　什么情况下语言交互效率更低？
　　没错，在本文的语境下，我们暂时只讨论交互效率。
　　举一个例子
　　我想以我们做过的一个功能日程提醒（实际上很多产品也做了这个）为例来展开下面的论述。如果我们是在日常会话中想让助理给我们设置一个提醒，我们也许会这么说：
　　下周一下午三点提醒我坐飞机
　　中秋节10点提醒我要回家吃饭
　　上面所列的是比较自然的一些语言交互的问法。由于本人所做的产品是面向PC端办公的场景，所以这里先比较纯键盘输入的文字交互和传统的基于图形交互界面（GUI）的鼠标键盘的交互之间的优劣。那接下来我们就看一个选择时间的典型的GUI交互方式：
　　大家可以很容易地发现，第一种纯文字交互的好处是整个交互体验非常一致、流畅，用户只需要通过键盘打出TA想要设置的提醒内容就可以了；而第二种交互，用户必须通过鼠标和键盘的来回切换才能完成整个动作（时间用鼠标选择，事件内容要通过键盘输入），非常地不流畅。
　　我不知道大家的操作习惯怎么样，对于我来说，我既讨厌在鼠标和键盘间来回切换，也不太喜欢操作鼠标。
　　试想一下，你正单手托腮很慵懒地用一只手在操作鼠标，或者你正用一只手摆了个很帅的pose，另一只手在操作鼠标，而这时候你被迫要切换成两只手在键盘上面进行输入，这种姿势的切换是会给用户带来巨大的体验成本的。
　　鼠标加键盘是PC时代不得已的交互方式，虽然现在我们也讲所谓的多模态交互，但是鼠标加键盘的组合在很多场景下显然不是最优解。
　　谈谈效率
　　说完交互的问题，让我们回归到文章的中心：效率。
　　GUI有一个很大的问题，就是在处理特别多的选项的时候，无论是显示效率还是操作效率都不尽如人意，而时间选择就是一个典型的例子。
　　为什么？因为日期的选项是无穷多的，如果你提供未来一年的提醒功能，那么你需要想办法显示365366天。
　　而时刻的选项也是非常多的，如果你的功能是精确到分钟的话，那么你则需要想办法显示6060241440个选项。当然一般的GUI都不会选择把全部选项直接平铺出来，因为这样太傻。
　　一般的做法（如上图Win10）都是以月为单位列出日期，然后提供翻页（翻月）功能。对于时刻的选择来说，一般的做法可以是降低精度（如上图Win10，以半小时为单位，降低了29倍的精度），或者是提供以滚轮滚动的方式来增减分钟。
　　这些做法的本质都是一样，就是只显示部分选项，隐藏其他选项，然后提供一个切换选项的机制。诚然这种做法里也还是有一些提高选择效率的方式，如最常见的热门选项：
　　但是总体来说，这种GUI的选择效率还是很低，因为用户真正想选的选项很多时候都不出现在首页，而且用户体验非常糟糕：我明明知道我要选的是什么，但是你居然要让我经过辣么多步骤才能选到我想选的。
　　另外大多数这些GUI的设定都有使用门槛，或者说预设了用户的某种先验知识，例如（如上图）需要用户学过普通话与拼音，或者需要用户知道焦作在哪个省（那些要先选省再选城市的GUI）等等，要知道，部分用户是不具备这些先验知识的。
　　改进GUI？
　　现在，我们要问一个问题，上述GUI的问题可以通过改善设计来解决吗？在这里，我想仅以时刻的选择为例来说明：
　　（请原谅我用表格来画UI）
　　在上图的第一种显示方式中，我们把一天内的每一分钟都显示出来了，这样的好处是点击效率高，只需要点击一次就完成选择。但是确定也很明显，就是显示效率和定位效率都太低。在第二种显示方式中，我们改善了一下，把时和分分开来选择，这样操作数虽然增加到了2，但是显示效率大大提高。
　　在上图的第三种显示方式中，我们再进一步把分里面的十位和个位进行了分离，这样再进一步提升了显示效率，但是操作数上升到了3。当然3次的操作数是完全可以接受的，就算你用键盘输入，也起码要操作四次才能完成例如8：00这样的输入。
　　其实第三种GUI本质上来讲就已经跟弹出个虚拟键盘差不多了，在这里我们会发现对于这个例子来说，点击操作最终会收敛于键盘操作。
　　但是改进到了这里，是不是GUI就能和文字（键盘）交互抗衡了么？不一定。
　　鼠标交互的问题
　　鼠标交互对于键盘交互来说，最大的缺陷就是，鼠标交互是不直接的。
　　为什么不直接？大家可以试一下从屏幕左半部的某个指定的点迅速移动到屏幕右半部的某个指定的点（除屏幕的四个角外），你会发现你是几乎不可能一步到位的，你必须在快到那个点的时候不断地做微调，最后才能让鼠标准确地落到那个点上。
　　原因就在于人操作屏幕上的鼠标是通过手里的鼠标硬件来进行的，而这个过程是鼠标这个硬件通过传感器扫描鼠标底下的平面来测出用户在这个平面上移动的距离，然后再通过一个系数来转换成屏幕上的鼠标移动距离的（像素值）。这个过程是极其不直接的。
　　我曾经教过我爷爷使用鼠标，我不能忘记当时他小心地慢慢移动手中的鼠标，时刻观察着屏幕上鼠标的移动，每一点的移动对于他来说都困难无比。所以即使鼠标的操作数（其实上文是忽略了移动鼠标这种操作）跟键盘的操作数相当，键盘输入也有着强大的交互优势，因为键盘是所见即所得，敲什么出什么。
　　选项比你想象中的要多
　　接下来，GUI将会面临一个更加严峻的问题，那就是用户的需求比你想象中的要多。就如本文开头所举的两个例子下周一和中秋节，你都无法在GUI下找到很好的解决办法。
　　对于前者，用户要先在日历中定位今天的位置和日历上星期一对应的那一列在哪，然后才能艰难地找到下周一在哪；而对于后者，更痛苦，用户需要先百度一下今年中秋是几号然后才能回来选择。你当然可以说，我们可以把下周X和XX节这些快捷按钮列出来，但是试问你能列出多少呢？
　　在这里，我们会看到，在面临用户的表达自由度非常高的场景，GUI是十分无力的。当然语言交互也会面临相同的问题，不过这个问题将会变成语言表达自由度的问题，例如用户会说下周一、下周1、下礼拜一、下星期一等等，不过这部分的问题暂时不在本文讨论。
　　其实我作了个弊
　　为什么这么说呢？因为事实上是存在更优化的GUI策略，能让时间选择的操作效率更高也更舒服的，只不过我以一个作者的身份让大家掉入了某个逻辑陷阱中而忽略那些更好的设计的存在而已。
　　而且本文主要针对的是（非触摸型）PC端的办公场景，实际上在移动端（或触屏PC）使用触摸交互代替鼠标交互就可以避免上文提到的鼠标交互与切换交互姿势等的问题。而且，打字还存在打错字、打字速度慢等等的问题
　　但是，就算GUI赢得了文字（纯键盘）交互，还是赢不了语音交互假设在语音识别率接近100的前提下，到目前为止，我还没有见到过有任何GUI的时间输入效率能胜过语音输入。
　　下一个问题
　　前文讲了那么多语言交互的好处，但是什么时候CUI的效率比GUI低呢？请看一张图片：
　　（请注意，这不是广告，是百度然后随机的）
　　如果你来到一家只有CUI而没有GUI的餐厅，你一定会疯掉，因为你只能通过服务员慢慢地给你报菜名来知道这家餐厅有哪些菜。当然播报效率是一个问题，另外一个问题就是服务员播报完以后没有留下任何东西，剩下的就靠用户的记忆力了，所以很容易报到后面，用户已经忘了前面有啥了。
　　所以你会发现所有电话自动语音回复都会有一个重新收听请按的选项，连一般客服点化的4、5个选项用户都记不住，更别说一份完整的菜单了。这样的例子还有很多，例如某宝的商品详情页：
　　（对不起，这。。应该是条广告吧。。）
　　如果上图中的所有信息都只通过语音展示给用户，那效率肯定会比GUI低很多，因为人的阅读速度是非常高的。这里我们可以看到，其实交互可以大致分为两个部分：展示和输入。
　　在本文的前半部分中主要讨论了CUI如何在输入方面拥有比GUI更高的效率，但在这两个例子中，我们会发现，在绝大部分场合中，GUI的展示效率要比CUI高得多。
　　作为最早推出智能音响的公司，Amazon早就意识到了这个问题，并在后续的产品升级中推出了EchoShow这个产品。这个产品就是在原来的智能音响Echo的基础上加了一块显示屏，必要的时候使用显示屏来显示信息，而抛弃原来的纯语音交互模式：
　　初步的结论
　　于是我们得到了一个初步的结论：
　　图形界面展示效率更高
　　语言交互输入效率更高
　　展示效率不用说，无疑是GUI完胜。而输入的话，例如我们上某宝买衣服，如果我们想输入5件S码的话，说四个字就好了，如果用GUI进行输入，则可能需要点击S码，然后可能要点击四下那个按钮，输入效率明显语音交互更优。
　　不那么初步的结论
　　但是，下面让我们来看一个反例：
　　我们可以很容易地发现，如果我是想买那个HB2H2B3B4B5B6B8B10B12的话，我得说多久才能说得完这一长串文字。但是如果用GUI的话，则只需要轻轻地点击一下。当然你可以说，我们可用买最后那个来代指那个选项，但是如果一个超长的选项是在各大选项中间呢？或者说所有选项的名字都辣么长呢？那你就没办法了。于是我们得到了一个不那么初步的结论：
　　图形界面展示效率更高
　　语言交互固定短输入效率更高
　　图形界面固定长输入效率更高
　　GUI的尴尬
　　虽然说接下来我要讲GUI的尴尬，但是这其实是所有单模态交互的尴尬。从上文的分析中可以得出，GUI中的像素同时承担着两个任务：展示和输入。但是很多时候GUI里的展示是多余的，展示的唯一目的是为了输入，因为你不把选项展示出来，用户无法输入。让我们来看两个例子：
　　上图左边的展示是必要的，因为你不展示出来买家不会知道你有什么套装可以选择；但是右边的展示是非必要的，因为谁都知道一年有几个月，每个月里面有哪几天（连这个都不知道的用户暂不考虑），可是GUI里又必须把这个展示出来，因为用户需要点击选择TA想要的东西，所以很多时候GUI里是有很多冗余的信息的。
　　讲到这里，再结合上文中提到的结论，我们就可以推导出适合进行纯语音交互的场景了：那就是选项已知且不变的适合使用纯语音交互。
　　这种场景还是很多的，例如编辑文章后未保存状态下返回上一级页面，页面就会弹出文章未保存，是否确定要退出？这样的提示，这个情况下用户会知道只有是和否两个选项，所以这里也无需做GUI的展示考虑。
　　有那么点意思的结论
　　于是我们又得到了另外一个结论：
　　图形界面展示长文本效率更高
　　语言交互固定短输入效率更高
　　图形界面固定长输入效率更高
　　选项已知且不变的适合纯语言交互
　　值得注意的是，上述的四条结论都是有比较严格的前提条件的，至于具体前提条件是啥，其实本文没有从逻辑上讨论得非常充分，这里就留给读者一些想象和思考的空间。
　　有了前文的一些推理，然后再加上结合GUI和CUI两种交互以后，我们会发现当多种交互方式并行的时候（所谓的多模态），展示和输入是可以进行分离的。至于什么时候选择哪种交互方式来进行展示或者输入，则需要根据实际情况来决定了。
　　还有更多值得探讨的地方
　　这里就举几个例子，第一个是点菜。你会发现一般情况下，人们来到餐厅进行点菜时都是会向服务员询问菜单本子的，但是有些情况下你会发现，例如熟客，一坐下来开口就可以进行点菜；或者是点菜老手，一坐下来就直接问有什么肉推荐、有什么招牌菜、有什么油菜等等的。
　　本文通篇讨论的基础都是效率至上，但是实际生活中，很多时候用户考虑最多的并不是效率，而是另外的东西，例如社交地位，或者俗称的装X。
　　第二个例子就是语音交互的另一个典型应用场景驾驶。人在驾驶的过程中注意力是需要高度集中在前方的道路状况中的，所以这时候很多情况下GUI不是一个很好的选择，因为会降低驾驶的安全性。那么在这种场景下，安全的优先级就是高于效率的，所以GUI是比CUI更好的选择。
　　还有一个不那么常见的例子，也是日期选择：
　　我们可以看到这个日历所展示的内容不是简单的一个月里有哪几天的信息，而是还包含了这个月里有哪些天是可以住的的这一层的信息，而后者是用户所不会默认知道的，所以这里必须配合GUI，而不适宜用纯CUI了。
　　除了上述的这些，其实还有很多很多很多语言交互的场景的确还有很多值得我们去共同探讨的地方。

投诉评论

手把手教你入境美国海关带错东西说错话哇！踏上美国国土是不是内心都有点小鸡冻，可是在真正踏上美国国土前，要先经过很难搞的美国海关，听说，他们是国人心目中最刁钻的海关，问起问题来花样百出，而且据说，说错话就会被关到恐……切菜切了手怎么办居家生活妙招切菜切了手怎么办？居家生活妙招居家生活妙招嘴角烂了怎么办？如果嘴角烂了，不要用舌头舔，不然唾液将在嘴角处残留，形成一种高渗环境，导致嘴角越发干燥，进而糜烂。处……分类【酷壳网】SEO分类白帽SEO白帽SEO是一种公平的优化方法，是符合各种搜索引擎发行规定的一种优化方法。它一直都被seo界内认为是最好的手法，它会避免与各种搜索引擎……语言交互场景探索一关于语言交互效率的探讨在什么时候语言交互的效率更高，什么时候更低？自然语言交互，这个名词似乎在去年已经长期占据科技类新闻的头条，各大巨头们都想抢占这个据说是下一个互联网入口的巨大机会。然……在中的最新强大功能范围遮罩2018新版Photoshop以及Lightroom已经发布，在众多的新功能中，范围遮罩可以说是摄影师后期的神器。不用不知道，一用真的吓一跳。二天这PS修图真的是越来越快越来越……汽车钥匙打不着火的两种情况分析发动机打不着火，是汽车最常见的故障之一。打不着火有两种情况：一种是可以听见启动机的转动声，但是发动机不能起动。另一种是扭动钥匙后，什么声音也没有。第一种情况是起动机……晚上失眠喝什么茶让你从此睡安稳觉相信大多数人选择晚上不喝茶，就是有人怕失眠，只喝淡茶，甚至一口茶水都不喝。喝茶并不是能让你失眠的原因，也有很多朋友选择茶帮助自己睡个安稳觉，那晚上失眠喝什么茶？小编这就带你去了……每个人都有一盆命定的盆景再平凡的个体喜欢花木盆景的人都是有情调的人浙江省嵊州市的四明山主峰下，有一座藏于深山的古寺红佛寺。淳朴憨厚的潘公渭，在红佛寺的山脚下，经营着一家小小的农家乐，至今已十年有余。……真正可怕的老板们的九个特征真正可怕的老板在工作和管理方面有着很多特点，最糟糕的老板们会从根本上破坏对职场、公司和团队活力的理解。不要犯这些错误。根据我的经验和观察，绝对是最糟糕的老板们相信以下这些……如何从命理角度改善夫妻关系文：武广盛现代社会，经济社会环境使然，夫妻关系越来越不稳定。大家都在探讨，怎么才能有效改善夫妻关系，非常多人从社会学、心理学、婚姻学、甚至法学角度进行研究，提出了各自的理……你爱人的性格是什么想不想更加的了解你的爱人是什么性格呢？快来做个小测试就知道了！【题目】一对情侣正乘坐吊缆车玩，当缆车走到中途高空，女的好像突然大声向男说话，你觉得会是哪句？A……星座老婆的型格还是单身贵族的你，也许想像不出自己婚后是否一个称职的好老婆，牡羊座你是独立型妻子，要你依附丈夫或全听老公话都是绝不可能。你要有属于自己的生活圈子，经济亦要完全独立。但你同……

<<<<<<－>>>>>>

香菇山药羹的做法一道产妇适合吃的食谱做法aclasstaghrefwiki10087I4CKrO21。html香菇a山药羹的做法香菇山药羹营养价值极高，口感鲜嫩爽口，山药可健脾养胃，香菇能软化血管，让妈妈获取优……几月出生的小宝宝最聪明今天就跟随小编一起看看几月出生的小宝宝最聪明？这里和大家简单介绍一下！宝宝聪明跟几月出生有关系吗？几月出生的小宝宝最聪明？操作方法01：hr农历二月在农历二月……动物房子简笔画怎么画画动物aclasstaghrefwiki10168IQMT6dx9。html房子a，是很简单的。最重要就是简洁明了。内容上，有房子、大树、云彩、太阳、草地。操作方法……几个小技巧让你更完美儒家经典礼数儒家三式性爱法性活动是人类物种繁衍生息的重要活动。一些小技巧对提升性活动质量有着事半功倍的效果。如果我们从儒家经典的礼数方面去体会一个男人的性爱姿势的话，你会发现，其实男人们性爱姿势很……避孕药使用过多会有以下一些副作用避孕药能缓慢释放雌激素和孕激素，从而阻止卵巢排卵达到避孕的目的。虽是简单方便的避孕方法，但是不能过分依赖，否则会对身体产生一定的危害。由于避孕药会影响到身体的激素水平，因此一年……高中物理知识结构图大全高三复习真的很需高三党进入二轮复习后，各专题的复习成为重中之重，能否在这一轮复习中形成、完善自己的知识结构，决定着三轮复习甚至高考的成功。今天为大家整理了高中三年物理学科的知识点，并用结……六年级下册期中考试数学试卷及答案青岛版20192020学年度青岛版六年级下册期中考试数学试卷评卷人得分一、选择题1。把棱长是2分米的正方体木块，削成一个最大的圆柱，这个圆柱的aclassta……如何看别人网站适不适合交换友情链接【厦门seo公司】如何看别人网站适不适合交换友情链接？网站外链如何发布？外链发布注意点，接下来我们一起来学习友情链接交换。友情链接交换要点1。交换友情链接地方……车上的个隐藏功能很多车主还不知道不少车主都不知道的5个汽车隐藏小功能：1、儿童安全锁小孩子坐在安全的后排，可是不知道车主有没有想过？有些车子即便是中控锁落锁了，后排说不定还是能打开车门。这个时候，在后门……喝什么茶排毒祛痘排毒祛痘茶饮推荐想要排毒祛痘，品茗是个不错的要领。下面我们来看看排毒祛痘茶饮，不知道喝什么茶能排毒祛痘的伴侣，赶忙来看看了。喝什么茶排毒祛痘想祛痘，就要留意排毒、降火，通过品茗调剂……互联网思维产品营销未来传统型的营销模式一直延续至今如同鸡肋一样食之无味弃之可惜，改变一种习惯很难，改变一个人也很难，改变一种商业模式难上加难。例如一个成功人士吃中餐吃了数十年年一下子改吃西餐，是激动……收藏卫生间装修的个小建议用上年都能卫生间装修设计，一直是居家装修设计的难题，单纯的卫生间基础装修其实是远远不够的，我们要让卫生间变得好用又美观，其实还有不少学问。今天呢，站主就给大家总结了一些卫生间装修的几个建……

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找