再见,鼠标。你好,精神控制

新的接口方法将彻底改变我们与计算机的交互方式

当工作场所的电脑超越了命令行界面到基于鼠标和Windows图形用户界面,这是在可用性方面的一大进步。和命令行本身是在一个地方开始打孔卡和磁带有了很大的改进。

我们现在正进入一个用户界面设计的新时代,公司正在试验从触摸、声音到手势甚至直接精神控制的一切。但是这些新接口中,哪些适合企业环境,哪些还没有准备好?(看这个故事的幻灯片版本。)

你能听到我吗?

语音识别是近年来取得重大进展的一项输入技术。十年前,准确性很低,技术需要广泛的训练。如今,在呼叫客户支持时使用语音识别是很常见的,当然,最近也有类似的应用智能手机

然而,对于一般的办公室使用,语音识别在专业领域产生了最大的影响,如法律和医学。例如,在匹兹堡大学医学中心(University of Pittsburgh Medical Center),在放射科,自动转录几乎完全取代了人类转录员。

医院医疗信息技术副总裁Rasu Shrestha说:“在放射学中最重要的事情是我们如何尽可能多地进行研究。”“周转时间非常重要,报告的准确性也是如此。”

这个工作本身是非常常规的事实也很重要,他补充说。“我们坐下来,我们就来看看图片,我们写报告,”他说。“这是一个非常平凡的任务。”

什雷斯塔说,他十年前开始从事语音识别的工作,起初“非常可怕”。“我们一直在努力,特别是如果你有任何程度的口音。但事情已经走了很长一段路。Dragon Medical Engine(来自Nuance)整合了大量医学本体和词汇结构,因此平台是智能的。”

作为结果,准确率从70%左右去了80%,10年前的今天,以接近100%的准确率。同时,人类转录精度实际上已经下降为医院使用专用秘书谁也结识了医生的声音外包转录服务感动。

“你没有机会与任何一个坐在转录服务后面的人建立联系,”他说。机器转录现在更好的另一个原因是,用户可以设置宏来自动处理大量的工作。

“如果你有一个正常的胸部x光,你可以缩短整个记录过程,”他说。他说:“你只要打开麦克风,说‘模板正常胸部’,它就会自动把所有的东西都放进去,加上病人的姓名和年龄等背景信息。几秒钟后,你就可以创建一个完整的报告,而之前可能需要几分钟。我想说人类转录员的日子屈指可数了。”

最后,机转录显着加快了工作流程。“十年前,五年前,当我们在使用传统的转录服务,它使用的是几天从任何地方一天前的最后报告被送回,”他说。“今天,这是任何地方从几秒钟到几分钟的时间。那一刻患者在扫描仪和扫描完成后,它在我们的工作列表。有时秒内或者在提供给我们的研究分钟,订货临床医师提供给他们的报告。它清楚地提高了我们的工作效率,并简化流程“。

更人性化的设计方法

语音识别准确率的提高只是新界面如何改变我们与计算机交互方式的开始。

麻省理工学院媒体实验室信息生态小组负责人亨利·霍尔茨曼说:“真正的力量并不在于这些新方法是完美的。”“但它们结合在一起,可以让我们拥有更人性化的体验,让技术按照我们的方式接近我们,而不是让我们去学习如何使用技术。”

语音识别是这一变化的驱动因素之一,它改变了与计算机交互的标准方法。“我们可以说,‘提醒我,我5点有个会议’,这与打开手机,到达主屏幕,选择时钟是非常不同的。应用程序Holtzman说。

传统上,大多数接口都是围绕第二种方法设计的,即集合一组有用的特性,并让用户学习如何使用它们。即使是语音接口,比如那些为残疾人设计的可访问性,通常也只是添加了使用语音命令导航标准菜单集的能力。

他说:“但说‘提醒我5点有个会议’就是向设备表达一个目标,让它为你完成这些步骤。”这就要求计算机有额外的智能。

MoneyCrashers的IT主管安德鲁•施拉格(Andrew Schrage)表示,他和该公司的其他高级员工都在使用虚拟助理Siri苹果iPhone。他表示:“这无疑提高了生产率。”“我们显然能更方便地在工作中完成更多的事情。”

Siri可以理解并执行复杂的命令,比如“提醒我回家后给助手打电话”,还可以回答“大西洋有多深?”

“这已经有些改变游戏规则的对我们来说,”施拉格说。

智能代理

苹果的Siri只是公司利用人工智能来确定用户想做什么的一个例子,也是最有野心的例子之一,因为用户可以向Siri询问任何事情。

稍微容易一点的工作是在有限的上下文中理解口语,例如,银行和电信呼叫中心。

“我们从一组通用的规则,我们知道工作,说,电信行业,然后使用与他们的特定的域,”Chris以西结说,创造虚拟的CEO,一个公司处理口语和书面讲话像Verizon公司,Virgin Media,雷诺,英国的国家铁路。

他表示:“例如,(英国的)M&S银行的‘汉娜’,对自己的信用卡、贷款和其他金融服务产品了如指掌。”

对于公司来说,像汉娜部署虚拟助理,目的是为了回答通常是由人类的工作人员来处理问题。根据以西结书,这些虚拟代理通常平均为20%至30%的成功率,并且系统不断更新,从以前遇到的学习,使他们能够处理更多的查询。

一个创新的虚拟客户端,西班牙电信英国,发现他们的智能代理露西减少了10%的客户服务电话至15%。这并不意味着,她只明白的问题,10%至15%,西班牙电信知识库经理Richard哈格蒂说。“其中一个客户问的关键问题是,‘我怎么联系客服?’”

在其他情况下,露西可能还不知道答案,该公司将需要创建一个。“也许我们不会回答这个问题,反正,”他说。

什么公司了解到,在过去12个月是它最好有一个明确的答案,而不是与一些可能的答案回应。此外,露西需要变得有点不够人性化,他补充道。例如,露西可以处理各种个人问题。她说,她喜欢意大利食物,例如,已经看到泰坦尼克号几次,喜欢打网球和萨尔萨舞。

哈格蒂解释说:“有一个后台故事可以让顾客问一些私人问题。”她住在温布尔登,已经和男友订婚了。但一些客户认为,他们是在与人交谈。因此,我们正在考虑减少一些个性化元素,以便正确管理客户的期望。我们想让客户明白,他们使用的是自动化服务,而不是人工。”

这是一个棘手的问题

比起那些为手势或其他非传统输入法设计界面的人,那些希望将口头或书面语言转化为实际目标的界面设计师有着坚实的优势。

这是因为设计师已经熟悉了口语的使用。麻省理工学院媒体实验室的Holzman说,如果不是这样,还有很多关于人们如何使用语言进行交流的研究。人类的手势语言很少被理解和研究。

“那你移动你的身体,而不是移动鼠标的工作,我们一直在玩弄浏览器界面。”他说。但目前还没有通用的手势等同于“掐收缩”和“刷卡翻转页面”触摸命令。

有一些手势是普遍辨认,但他们可能是工作场所不太合适。

“我们正处于手势阶段的开始,”他说。不仅仅是手势,而是我们通过摄像头对着自己所能做的一切,比如动眉毛和动嘴巴。例如,笔记本电脑的屏幕保护程序——为什么它不使用盖子上的摄像头来判断是否进行屏幕保存?如果你的眼睛是睁着的,而且你面对着显示器,它应该保持亮着。”

一个公司跟踪手的运动是无限Z,这要求用户佩戴3D眼镜和使用手写笔,其似乎漂浮在空气中在他们面前触摸对象。

“虚拟环境对于计算机辅助设计、数据可视化、制药、医药以及石油和天然气模拟都很有意义,”该公司的CTO David Chavez说。该产品与Unity 3D和其他虚拟环境引擎以及公司自己的Z-Space平台一起工作。

另一项难以商业化的技术是眼球追踪,它通常用于查看广告或网站的浏览者最先看到的部分。它也被用来改善残疾人的交流。

罗彻斯特理工学院(Rochester Institute of Technology)的计算机科学教授雷诺·贝利(Reynold Bailey)使用眼球追踪技术教医生更好地阅读乳房x光片。这样做的目的是巧妙地突出学生接下来应该看的区域,并教他们扫描模式,然后由经验丰富的放射科医生指导。

他说:“如果这项技术适用于乳房x光检查,那么还有其他应用。”同样的技术也可以用来训练飞行员如何检查仪器。

但他说,他不希望眼球追踪被用作输入设备,比如取代鼠标的一般用途。

“眼睛不是输入设备,”他说。用鼠标,你可以悬停在一个链接上,决定是否点击。用眼睛,你可能只是在阅读,所以你不想激活你看到的所有东西。所以你可以眨眼点击,但你的眼睛会累。我们会不由自主地转动眼睛和眨眼。”

精神控制的极限

这听起来像科幻小说,但读心设备已经上市了——而且它们不需要将传感器或插头植入颅骨。有些工作是通过感知发送到胳膊和腿上的神经信号,对帮助残疾人恢复行动能力很有帮助。其他的则可以读取脑电波,比如Intific、Emotiv和NeuroSky耳机。

Intific和Emotiv耳机可以用来和你的大脑玩视频游戏。但这些读心设备不仅仅能与电脑连接。例如,NeuroSky是《星球大战》Force Trainer和Mattel的MindFlex决斗游戏背后技术的制造商,这两款游戏都允许玩家用意念的力量悬浮球。

这并不意味着办公室职员可以坐下来,思考他们想写的句子,然后神奇地出现在屏幕上。麻省理工学院媒体实验室的Holtzman说:“如果你身体健全,在键盘上打字比用大脑控制接口打字要快得多,也可靠得多。”

一个瘫痪的人可以从能够挑选出字母或仅仅是想将它移动画笔大大受益,他说。和走动的轨道赛车用你的头脑是一个有趣的客厅把戏。但它仍然容易只是使用真实的画笔,或者干脆拿起你手中的车,移动它。

但是,在读心术可以直接受益的上班族是拾取用户的心情,他说。

例如,如果用户压力很大或很忙,邮箱可以自动排序,把优先邮件放在最前面,然后在用户放松时突出显示朋友发来的有趣邮件。

他说:“如果我很紧张,注意力很集中,它可能会延迟我的短信提醒和信息,而不是打断我。”

不仅仅是面部表情或思维扫描可以用来让电脑切换模式。如今的智能手机和平板电脑都配备了各种各样的传感器,包括GPS追踪器、时钟、麦克风、加速计、陀螺仪和罗盘,这些传感器可以告诉设备是否在移动、如何握持、位置、时间等等。

例如,传感器技术公司InvenSense的应用工程高级总监哈米德•纳杰菲(Hamid Najafi)表示,智能手机应该能够识别用户在影院、飞机上、健身房锻炼、睡觉或开会。他说,它可以在影院和会议期间自动切换到静音模式。

“还有很多很多其他的任务手机可以做,如果它智能化地集成了来自所有传感器的输入,并成为积极的伴侣给你,而不仅仅是一个被动的设备在需要时您可以访问,”他说。

企业采用滞后

根据旧金山州立大学专注于用户体验的心理学教授David Hogue的说法,在新界面方面,商业应用通常落后于其他应用。他表示:“你可能会认为企业是领导者,但人们在家里做的是设定自己的期望。”

例如,最先进的意念控制界面出现在游戏中,并帮助残疾人。与此同时,触控界面和语音识别已经成为主流,因为消费者的采用。

他表示:“有时候,看到企业在个人世界背后有两到三个版本的软件是令人惊讶的,因为改变基础设施需要付出巨大的成本。”

但他说,随着企业转向软件即服务和基于云的应用,变化的步伐将会加快。

Korolov是马萨诸塞州的一名商业和科技自由撰稿人。请联系她maria@tromblyinternational.com

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

版权©2012Raybet2

IT薪资调查:结果在