一个机器学习项目来建造一架依靠热电流保持飞行的自动滑翔机已经足够令人印象深刻了。但微软研究员安德烈·科洛波夫和伊恩·格利亚德的研究也将提高物联网设备、个人助理和自动驾驶汽车的决策能力和可靠性。
限制飞机机身重量和空间的计算资源的约束为泛在计算的许多新发展增加了相关性。自治滑翔机由160 mhz的手臂控制皮层M4 256 kb的RAM和60 kb的flash运行在电池监控传感器,运行自动驾驶和控制伺服电机,研究人员给它添加了一个机器学习模型,不断自主学习如何骑热电流。
+也在网络世界:有个足球雷竞技app物联网和机器学习之间不可分割的联系+
在数字助理、物联网(IoT)和自动驾驶汽车等平台发展的初期,有数百个悬而未决的问题,这些问题将被提炼为少数几个科学问题,首先必须回答这些问题,以打造出符合大众视野的产品。当科学问题开始出现时,平台的未来就变得可预测了——也许不是精确到一个月,而是在一到三年内。
物联网以下作为Web 2.0的相同路径
Web 2.0的平台,遵循了类似的课程。首先谈到了1999年,它在2004年开发出足够的兴趣为O'Reilly媒体公司和MediaLive主办的第一个Web 2.0会议于2004年,但它不是直到后来的十年中,公司如Salesforce和谷歌实现的Web 2.0。这是第一视觉的长达十年的进化,开放题集提炼成的科学问题,大学和工业界的研究回答。
从研究发展技术转移,产品开发人员可以找到答案的研究人员,使他们能够建立一个产品工作的科学问题。数字助理,物联网和自动驾驶车辆 - 在Web 2.0的时间尺度 - 更接近2004年超过这个千年的第一个十年的后期,当有足够的研究被翻译成开发的产品可以大规模建造。
微软的滑翔机项目的目标
在一次全体会议上,由a2013故事的经济学家关于自主滑翔机,微软研究人员的团队设置该项目的目标回答两个科学问题:如何建立信任的AI系统,以及如何与AI建筑师系统和机器学习为根本,系统设计原则。Kolobov的说:
“本领域的人工智能发展的状态不是这个级别中AI剂可以可靠动作完全自主,这就是为什么我们看不到有充分的自治权物理世界中行动许多AI系统。MSR正在努力建立AI系统是功能强大且可以信任自己的全面贯彻,比人类表现更好。这项研究的意义适用于个人助理,自动驾驶汽车和物联网。
“我们希望获得的经验在设计,其中AI和机器学习是一等公民系统,因此我们没有从根本上修改系统事后的架构。”
Kolobov和Guillard是一个多学科的团队,互补的技能的一部分。Kolobov已申请AI和机器学习到商业产品,如Windows和Bing。Guillard,十多年来对空客350和A4天鹰控制系统工作后,是计算机科学博士学位候选人在澳大利亚国立大学和微软的实习生。一个奇怪的配对可能,除非这个问题,他们正在试图回答的理解。
有许多机器学习问题是没有事实根据的。Ground truth是用于机器学习分类和训练的精确数据集。机器学习模型是用数据编程(训练)的,而不是用一行行的代码。这些模型通过数据来预测正确答案。如果一个模型被教去识别猫,那么被标记的猫的图像就是事实。这种被称为监督训练的方法有两个阶段:训练,通常基于强大的gpu——从猫和不是猫的图像中学习——和推理,或者预测正确的答案——猫或不是猫。
由于该机器学习模型交互物理世界是不可预知的,地面实况不能轻易地用电脑模拟 - 和分类训练数据不存在。如何反应到其他车辆的自主车辆的每一个防御机动预测?要不怎么能每老人看守机器人遇险患者的反应进行预测?
这些不稳定的系统是无法预测的。该模型需要通过与混乱,不稳定的系统交互学习。在公路上和老年患者的车辆不适用于AI学习可靠和安全运行。滑翔机,但是,是。
滑翔机是如何工作的
对于自主滑翔机基础事实的限制,因为它是无法衡量的动荡状态,其中空气上升的热列的开始和结束,正在发生的事情里面。对基于从利用当地的地形和风力条件来预测通过遥测发送到自主滑翔机的热气流滑翔机载人飞行数据的滑翔机在地面进行高层次的规划一台笔记本电脑。
滑翔机使用板载贝叶斯强化学习算法,利用它从传感器得到的意见作出决定。贝叶斯强化学习选择的,因为模型的规划自己的行动学习,以最佳方式利用知识的能力。这种方法是比较容易理解的代理做决定,为什么。
该模型使用蒙特卡洛树搜索以选择升程的检测区域,可被利用来优化高度,以指示自动驾驶仪来调整电梯,其是在尾部水平控制表面,其原因的飞机爬升或与伺服马达下降保持滑翔机翱翔。它还使用蒙特卡罗树搜索利用热电流,发送指令到自动驾驶仪。蒙特卡洛树搜索已应用于赢得不确定性的游戏,如谷歌的围棋项目和扑克。它逐渐积聚的移动部分博弈树,然后采用先进的策略来寻找探索新的决策分支和利用最有前途的分支之间的平衡。
与围棋和扑克相比,在滑翔机上运行贝叶斯强化算法是一项重大挑战。还记得计算和电池的限制吗?滑翔机由实时开源的ArduPilot控制,运行在开源的Pixhawk Arm Cortex M4硬件上。Bayesian强化算法的执行与实时ArduPilot交互,间隔小于100ms,保持了对滑翔机传感器和伺服电机的控制,避免了碰撞。
Kolobov和Guillard的搭档是机器学习专家和航空控制系统领域专家的完美结合,后者也是计算机科学博士候选人。但它们的配对并不是唯一聪明的组合。这种对更深层次理解的探索结合了现成的飞机机身、传感器、伺服电机、开源硬件和开源自动驾驶仪,这样Kolobov和Guillard就可以正确地实现和调整贝叶斯强化学习,并快速迭代他们的设计,改善他们的结果。
在数字助理,物联网和自动驾驶汽车的这些开创性的日子里,产品开发者会发现一些最相关的答案是可以转化为自己的产品领域的科学问题,如可能在第一次出现是正交的和无关的滑翔机的。
数字助理、物联网和自动驾驶汽车可能还需要5到10年的时间才能像人类一样可靠。微软研究院(Microsoft Research)正在研究一个科学问题,在这些开创性的产品愿景达到这一点之前,必须首先回答这个问题。