在昨天的Strata大数据大会上,微软让全世界都知道了它Azure机器学习开发人员通常可以获得产品。这可能会让人感到意外。微软?机器学习不是谷歌、Facebook或无数热门创业公司的专利吗?
事实上,微软在过去的几十年里已经悄然建立了自己的机器学习技术,将学术发现转化为产品功能。没有多少企业能与微软的人才储备相媲美。
机器学习——让一个系统从大量数据中进行自学,而不是简单地遵循预设的规则——实际上为你每天使用的微软软件提供了动力。机器学习已经渗透到微软的产品中,从必应(Bing)到Office,从Windows 8到Xbox游戏。它最炫的交通工具可能是未来的Skype翻译,它可以处理不同语言的双向语音对话。
现在,有了Azure云上可用的机器学习,开发人员可以在自己的应用程序中构建学习功能:推荐、情绪分析、欺诈检测、故障预测等等。
Azure新产品的理念是让机器学习更加大众化,因此你不再需要雇佣拥有博士学位的人来使用机器学习算法。能“拉幻想破灭的大数据,”约瑟夫·Sirosh表明微软公司副总裁信息管理和机器学习,新的负责人Azure服务,“把它从后视镜与商业智能真的能够预测并生成预测你可以行动。”
Sirosh的梦想很大,他认为这种潜力远远超出了预测和预测,“现在每个移动应用程序都可以是智能的,每个物联网传感器都可以将数据发送到云,并调用为其提供智能的api”。如果这看起来过于乐观,那么有必要看看机器学习对微软自己的产品已经有多重要。
机器学习无处不在
机器学习使办公室365凌乱不堪以不可思议的准确性来决定你想要阅读哪封邮件,以及你可能会忽略和删除哪封邮件。在新的Microsoft Power BI门户中,您可以从Salesforce或GitHub的代码中打开客户数据,并立即询问自然语言的问题,如“上个季度的客户销售额”,不仅可以得到数字,还可以得到一种突出显示数据中重要内容的图表。
这就是Office 365和Azure如何发现试图入侵账户的黑客,Cortana如何识别你在说什么,Kinect如何通过红外图像检测你的手指或骨骼关节的位置。这也是Windows Phone的键盘如此精确的原因:来自于成千上万人在他们的手机上纠正错误的数据,使得软件能够猜出你接下来要输入的是哪个字母,并让键盘(在不可见的情况下)变大。
同样的机器学习技术使你更容易用手指触摸Windows平板电脑上的正确菜单,并帮助电脑辨认你的笔迹。在Windows 8中启动一个应用程序,四分之三的时间几乎是瞬间打开的,这要归功于机器学习,它会告诉系统哪些应用程序需要预加载到内存中,因为你需要它们。
机器学习需要大量的数据——无论是服务器日志、来自传感器的信息流,还是大量的图像、视频或音频记录——并将其整合到一个比任何算法都更擅长处理复杂情况的系统中。这个想法已经存在了50年,但是随着越来越多的数据变得可用,机器学习已经变得越来越有用,从学术研究到有力的突破,如可用的语音识别。
“老实说,我想不出微软最近参与的任何产品开发没有不涉及机器学习的,”微软研究部主任Peter Lee说,他离开DARPA去管理微软的研究部门。“我们现在做的每件事都以这样或那样的方式受到机器学习的影响。”
以最近推出的微软手环(Microsoft Band)为例,这是微软新健康平台的旗舰设备。“我们想让血液流动传感器提供准确的读数,即使在像赛艇这样极端的运动压力下,”Lee解释说(批准这个项目的副总裁是一个狂热的赛艇爱好者)。“这是一个非常低成本的传感器;仅仅是解读传感器的读数,我们发现机器学习是实现这一点的唯一实用方法。”
几十年的实验室研究
微软是如何在机器学习方面如此出色的呢?感谢经常被低估的微软研究院(MSR)。“(这一成功)最早的一些根源可以追溯到20多年前,当时出现了像埃里克•霍维茨(Eric Horvitz)这样的人,他真的给公司带来了机器学习的整个愿景,”李说。“他们很快就想出了把这个应用到微软产品上的主意。”
霍维茨现在是微软研究院雷德蒙德实验室(Redmond Lab)的常务董事,他曾获得美国艺术与科学学院(American Academy of Arts and Sciences)和美国人工智能促进会(Association for the Advancement of Artificial Intelligence)颁发的奖项,最近还资助了一项为期100年的人工智能研究。随着机器学习在一个又一个研究领域变得重要起来,拥有一位在微软研究院有影响力的人物,帮助吸引了其他先驱。
“15年前,当我们在剑桥建立这个实验室时,它增加了动力,像克里斯·毕晓普(Chris Bishop)这样从事概率建模的人,被MSR所吸引。”
Bishop确实写了一本关于神经网络和模式识别的书;他的教科书使得统计方法在机器学习中很常见。他现在是微软剑桥研究院(MSR Cambridge)的首席研究科学家,负责Kinect的骨骼追踪、Forza Motorsport的人工智能、Xbox上的TrueSkill排名系统,以及必应(Bing)和SharePoint的一些搜索功能背后的机器学习和感知小组。
该团队还在致力于Infer。Net是一个概率编程工具包,它使用机器语言对世界的描述来处理不确定性,而不是要求每个问题都有计算机通常的“是/否”答案。这就是杂乱分类收件箱的方法。研究人员约翰·韦恩(John Winn)和他的同事们与Exchange团队合作了四年,研究了不同的想法,直到他们发现了一些“真正有价值的东西,不会让人感到毛骨悚然,也不会像你开始在个人电子邮件中使用机器学习时有时会遇到的消极情绪”。
“然后,随着计算机视觉开始越来越多地受到机器学习的影响,(我们)吸引了该领域大量非常重要的杰出人士,他们都有一只脚在机器学习,一只脚在视觉,像安德鲁·布莱克这样的人变得非常相关,”李解释说。(布莱克现在是剑桥实验室的负责人,他在爱丁堡大学和牛津大学率先提出了关键的概率计算机视觉算法。)
几年后,AT&T关闭了贝尔实验室,许多研究人员加入了微软。“那些真正考虑神经网络和更多统计方法的人开始出现,”Lee说。“这与大数据的相关性的出现是同步的;这股浪潮不仅在微软内部,而且在整个行业都产生了巨大的影响。”
然后在2009年,就在李开复加入微软前不久,他开玩笑说,一个他可能会轻易拒绝的项目帮助机器学习走出了实验室,进入了主流计算领域,这是一个“使用分层神经网络进行语音处理的不明智尝试”。
“我会说这是完全荒谬的,我会得到所有顶级研究人员的支持,”李承认。相反,这项工作成为了多层“深度”神经网络的基础,这种网络已经改变了整个行业的语音和图像识别。
潜水深
语音识别曾经意味着训练你的电脑学习你的声音,或者坚持一些简单的命令;现在,这意味着你可以买一部新手机并开始与它通话,而Windows 10将把这一功能带到你的电脑上。
图像识别已经从发现照片中的人脸,发展到处理从文本到交通信号的所有事情。ImageNet基准测试可以识别1000个物体的照片,比如不仅可以识别150个不同的狗的照片,还可以识别它们的品种。“你必须区分彭布罗克威尔士柯基犬和开襟羊毛衫威尔士柯基犬,其中一种有较长的尾巴,”MSR的约翰·普拉特解释说。
本月,北京实验室的一组微软研究人员宣布,他们的深度学习系统是第一个在基准测试中击败未经训练的人类(以微弱优势击败谷歌)。
这都要归功于深度学习。这是当今人工智能发展最快的领域之一;深度学习的先驱者们在谷歌、Facebook、百度以及微软工作。
Geoff辛顿在2009年,多伦多大学的提议建立一个神经网络识别的不雅言论逐渐建立的理解越来越多的单词(大大简化版本的一个人类的大脑使用的技术在图像识别模式的声音),大多数研究者不感兴趣。作为MSR实验意愿的证明,Hinton的一名实习生和一名研究生获准与他的研究人员合作,用真实的数据尝试这个深度网络。
他们的结果不仅好了一点点;他们的准确率提高了25%。李开复指出,一旦发布,“不仅是微软,整个行业都开始使用它们。”
将机器学习普及到大众
随着微软向开发人员提供自己的机器学习工具,该公司的开创性工作可能会获得更大的认可。李开复说:“我们掌握了大量的知识、算法和代码,涉及大量的机器问题,如果能得到更广泛的应用,将会非常强大,令人满意。”
微软正在努力实现Azure机器学习。Joseph Sirosh称之为“构建并部署预测模型的最快方法”。您所需要的只是一个Web浏览器来启动机器学习。它允许在云中简单地一键创建api,从而简化了部署。连接一个网页很容易,连接一个移动应用程序也很容易。这就是为什么我认为它正在改变开发的方式。”