替换语音助手,语音助手开发语言( 三 )


在前文,我承诺讨论仅使用语音输入用户数据的语音用户界面 。这种语音用户界面受益于语音用户界面的最佳部分——自然、快速和易于使用——但不受恐怖谷和顺序交互的影响 。
让我们考虑一下这个替代方案 。
三、语音助手的更好选择克服语音助手中这些问题的解决方案是放弃自然语言响应 , 代之以实时视觉反馈 。将反馈切换到视觉 , 将使用户能够同时提供和获得反馈 。这将使应用程序能够在不中断用户的情况下做出反应 , 并启用双向信息流 。由于信息流是双向的,其吞吐量更大 。
目前 , 语音助手最常用的用例是设置闹钟、播放音乐、查看天气和询问简单的问题 。所有这些都是低风险的任务,在失败时不会让用户太沮丧 。
正如《华尔街日报》的大卫·皮尔斯曾经写道:
我无法想象通过语音助手预订航班或管理我的预算 , 或者通过对我的扬声器大喊食材配料来跟踪我的饮食 。
——《华尔街日报》的大卫·皮尔斯
这些是信息密集型任务,需要正确处理 。
然而,语音用户界面终会走向失败 。关键是尽快解决这个问题 。在键盘上打字时,甚至在面对面的对话中,都会出现很多错误 。然而,这一点也不令人沮丧,因为用户只需单击退格并再次尝试或请求澄清即可恢复 。
这种从错误中快速恢复的方式使用户能够提高效率,并且不会迫使他们与助手进行奇怪的对话 。

替换语音助手,语音助手开发语言

文章插图
使用语音预订机票 。
直接语音互动在大多数应用程序中,操作是通过操作屏幕上的图形元素、戳或滑动(在触摸屏上)、单击鼠标和/键,或按下键盘上的按钮来执行的 。语音输入可以作为操作这些图形元素的额外选项或模式添加 。这种类型的互动可以称为直接语音交互 。
直接语音交互和语音助手之间的区别在于,用户不是要求语音助理化身去执行任务 , 而是直接用语音操作图形用户界面 。
替换语音助手,语音助手开发语言

文章插图
语音搜索在用户说话时提供实时视觉反馈 。(图片来源:截图)
“这不是语义吗?”你可能会问 。如果你要和电脑对话,你是直接和电脑对话还是通过虚拟角色对话真的重要吗?在这两种情况下,你只是在和电脑说话!
是的 , 差别很细微,但很关键 。当单击GUI(图形用户界面)中的按钮或菜单项时,很明显,我们正在操作一台机器 。人对此没有幻想 。通过用语音指令代替点击,我们对人机交互做出了改进 。而另一种 , 使用语音助手模式,我们正在创建一个人与人之间的互动的恶化版,所以,获得了恐怖谷效应 。
而将语音功能与图形用户界面相结合,可能利用不同模式的力量 。虽然用户可以使用语音操作应用程序,但他们也能够使用传统的图形界面 。这使用户能够在触摸和语音之间无缝切换,并根据他们的上下文和任务选择最佳选项 。
例如,语音是输入丰富信息的一种非常有效的方法 。在几个有效的选项中选择,则触摸或单击可能更好 。然后,用户可以通过说“向我展示明天从伦敦飞往纽约的航班”来代替打字输入和浏览 , 然后通过触摸从列表中选择最佳选项 。
替换语音助手,语音助手开发语言

文章插图
现在你可能会问:“好吧,这看起来很棒 , 那为什么我们以前没有见过这样的语音用户界面呢?为什么科技公司大厂不为这类事情开发工具呢?”