IBM本周表示,其语音识别系统的错误率创下了5.5%的行业纪录,这个百分比让计算机几乎和普通人一样能理解人类的对话。
据IBM人类平等被认为是5.9%,字错误率,但IBM谁与澳鹏,演讲和技术服务商合作,重新评估行业的标杆,并确定人的奇偶比别人怎么还没有达到降低5.1%。
+更多关于网络世界有个足球雷竞技app:高德纳:大型网络变革的核心——人工智能、算法和智能软件+
“达到人类平等 - 这意味着在同水准与那两个人讲的出错率 - 已久的终极目标行业。在同行业中其他人都在追逐这个里程碑和我们一起,有的最近声称达到了5.9%,等同于人类的平等......但我们不弹出的香槟呢。正如我们在到达今天的里程碑进程的一部分,我们确定人类平等实际上是比任何人都还没有达到降低 - 在5.1%,”在写乔治·萨翁首席科学家与IBM博客文章就此主题而言。
然而,这种重新评估可能会激怒一些人微软人工智能研究集团10月表示它的语音识别系统已经达到“人平价”,比人的专业打字员做更少的错误。
在数据的总机部分,即新认识的两个人讨论一个指定话题时,专业转录员的错误率为5.9%,而在打电话回家部分,即朋友和家人进行开放式对话时,错误率为11.3%。在这两种情况下,我们的自动化系统都建立了一种新的最先进的技术,并超越了人类的基准。这标志着第一次在谈话中报道了人类的平等纸。交换机是一套用于语音识别测试的标准会话语音和文本。
5.9%的错误率与被要求抄写同一段对话的人的错误率差不多,而且这是有史以来与行业标准的交换台语音识别任务(微软)相比的最低记录在其网站上写道。
IBM的Saon写道:“我们还意识到,在整个行业找到一种衡量人类平等程度的标准比看上去要复杂得多。除了SWITCHBOARD之外,另一个被称为“CallHome”的行业语料库提供了一套不同的可测试的语言数据,它是从家庭成员之间关于没有预先确定的话题的更通俗的对话中创建的。对机器来说,转录来自电话家庭数据的对话比转接电话更具挑战性,这使得突破更难实现。(在这个语料库中,我们的错误率达到了10.3%——这是另一个行业记录——但同样,在Appen的帮助下,人类在同样情况下的表现为6.8%)。”
同样来自IBM博客,哥伦比亚大学计算机科学系教授兼系主任Julia Hirschberg评论了语音识别的挑战:
“像人类一样识别语言的能力是一个持续的挑战,因为人类的语言,尤其是在自发的对话中,是极其复杂的。人类的表现也很难定义,因为人类理解他人讲话的能力也各不相同。当我们比较自动识别和人类的表现时,把这两个因素都考虑进去是非常重要的:识别器的表现和人类对同一种语言的表现的估计方式。”
语音识别的突破来几十年的语音识别的研究后,在20世纪70年代初开始使用DARPA,微软写道。随着时间的推移,大多数主要技术公司和许多研究机构都开发了语音识别技术,包括BBN、谷歌、微软、惠普和IBM。
看看其他热点的故事: