机器学习再热不过了。机器学习是一种人工智能,可以让计算机在不需要明确编程的情况下学习执行任务和做出预测。机器学习在时尚科技界引起了轰动,但对大多数企业来说,它仍是一个有点未来主义的概念。但由于技术进步和新出现的框架,机器学习可能很快就会成为主流。
咨询公司德勤(Deloitte)预计,未来一年机器学习的使用和采用将大幅增加。这在很大程度上是因为这项技术正变得越来越普遍。该公司的最新研究显示,2017年全球将有超过3亿部智能手机具备机器学习能力,占总销量的五分之一以上。
“新芯片技术形式的中央处理单元,图形处理单元,或专门的现场可编程门阵列能够提供神经网络处理价格,尺寸,功耗,适合智能手机,”斯图尔特·约翰斯顿说的科技、媒体和电信在德勤练习。
约翰斯顿说:“将这种硬件添加到机器学习软件中,将使模拟人脑结构和功能的本地程序得以设计,并将应用于诸如室内导航、图像分类、增强现实、语音识别和语言翻译等领域。”“从日常用户的角度来看,这意味着复杂的任务将变得更容易,更个性化,更快,更隐私。”
各行各业的公司已经在使用或试验机器学习技术。下面我们来看看三家公司是如何利用机器学习来取得巨大的商业效果的。
寄希望于数据丰富的图像
2014年,社交媒体网站Pinterest开始涉水机器学习,当时该公司开始大举投资计算机视觉技术,并成立了一个工程师小组,专注于重塑人们寻找图像的方式。
不到一年之后,该公司推出了“视觉搜索”,这是一种不需要文本查询来搜索信息的新工具。Pinterest的数据科学主管Mohammad Shahangian说:“这是第一次,视觉搜索为人们提供了一种获取结果的方法,即使他们找不到合适的词来描述他们所寻找的东西。”
视觉搜索是由深度学习,a深入神经网络的机器学习版本,并允许Pinterest自动检测任何pin图像中的对象、颜色和图案,并推荐相关对象。每个月在Pinterest上有超过2亿的视觉搜索,还有20亿的文字搜索,Shahangian说。
2016年夏天,随着Pinterest引入了对象检测技术,视觉搜索应运而生,该技术可以实时找到pin图像中的所有对象,并提供相关结果。
“如今,视觉搜索已经成为我们最常用的功能之一,每月有数亿次视觉搜索,探测到数十亿物体,”Shahangian说。“现在,我们将在视觉发现基础设施的基础上推出三款新产品。”
Pinterest拥有互联网上最大的数据丰富的图片收藏。Shahangian说:“我们使用机器学习来不断地对750亿动态对象进行排序和缩放,从可购买的pin到视频,并在最好的时间向正确的人展示正确的pin。”“我们的核心关注点是帮助人们发现引人注目的内容,比如需要购买的产品、需要制作的食谱和需要尝试的项目,而机器学习帮助我们提供更个性化的体验。”
Shahangian说,随着Pinterest的国际受众的扩大,无论人们住在哪里,说什么语言,或者他们的兴趣是什么,Pinterest的个性化服务都是至关重要的。他说:“通过使用机器学习模型,我们在过去一年里已经将美国以外国家的本地化pin数量增加了250%。”“现在,每个月访问Pinterest网站的超过1.5亿人都能看到与自己国家和语言最相关的pin码。”
此外,机器学习可以预测网站上推广的pin的相关性及其性能,帮助利用来自企业的推广创意改善用户体验。
Shahangian说:“我们最近在推荐名单中加入了深度学习,使相关的pin更加相关。”“Pinterest的工程师已经开发了一个可扩展的系统,可以随着我们的产品和人们的兴趣而发展,所以我们可以推出最相关的推荐。”通过应用这种新的深度学习模型,早期测试显示,全球相关pin的参与度提高了5%。”
Pinterest正在不断开发最新的机器学习技术,“以构建一个视觉发现引擎,包括在物体检测方面取得进展,并将不断增长的数据和世界上数据丰富的图像扩展到世界各地的人们,”Shahangian说。
建立高维模型
Adobe Research副总裁阿南丹?帕德马纳班(Anandan Padmanabhan)说,另一家使用机器学习的公司Adobe Systems多年来一直在使用监督和非监督机器学习以及统计模型来帮助运营业务。
Adobe的过渡云订阅提供的业务,有两个基本驱动程序导致公司内部需要大规模机器学习:在线渠道成为主要来源获取客户,推动产品参与的必要性和保留在数以百万计的客户规模。此外,通过机器学习获取的客户对特定产品的参与程度数据要详细得多。
Padmanabhan说:“Adobe从产品使用、市场营销和客户支持等多个方面获取事件级别的纵向数据,以构建各种类型的预测模型。”这些包括付费转换和保留模型,客户保留模型,自动特征提取和细分,向上销售和交叉销售模型,以及最优分配和基于细分的预测模型。
该公司用于机器学习的工具包括Python Scikit-learn、Spark ML、SAS和专有的内部方法。
Padmanabhan说,机器学习方法帮助公司建立了个人层次的高维模型。他说:“以前,Adobe利用统计工具来构建更多的聚合模型,从而完全忽略个体层面的异质性。”
对于Adobe来说,机器学习的主要好处之一是能够更好地理解付费媒体的边际影响,这使得媒体接触点在不同销售渠道之间的分配得到了改善;以及了解个人客户倾向和生命周期阶段的能力,这有助于推动营销活动。
通过更好地理解单个产品的使用方式以及对市场营销活动的反应,公司还提高了客户参与度,从而带来了更多定制化的产品和客户支持体验。这反过来也有助于留住客户。
此外,Adobe还看到了企业销售和区域规划方面的改进,这提高了销售效率;建立一致的方法来定义和分析整个业务的关键绩效指标,使公司能够在一个统一的框架内评估所有活动。
鉴于到目前为止的成功,该公司正在寻找利用机器学习的其他选择。帕德马纳班表示:“Adobe内部正大力利用机器学习来管理客户体验的各个方面。”
为客户管理风险
在金融风险管理服务提供商LexisNexis Risk Solutions (LNRS),机器学习帮助客户防范身份盗窃、洗钱、利益欺诈、医疗欺诈、坏账和其他风险。
LNRS技术架构和产品副总裁Flavio Villanustre说,LNRS在几年前就开始使用机器学习来分析和从超大的异构数据池中提取信息,创建图表并对事件进行预测。
该公司主要使用基于HPCC Systems的自主研发的机器学习工具。HPCC Systems是一个用于大数据处理和分析的开源、大规模并行处理计算平台。
Villanustre说,该平台“在处理复杂模型和需要可伸缩性以应用于非常大且多样化的数据集时,为我们提供了优势”。在HPCC平台上,LNRS以特定于领域的语言的形式设计了自己的特定于领域的抽象,例如可伸缩的自动化链接技术,一种复杂的记录链接工具,以及知识工程语言,它结合了图形分析和机器学习能力。
Villanustre说,在机器学习之前,通过算法建模需要人们理解特定的问题领域,从现有数据中提取事实,并编写大型的“启发式”程序,使用条件规则对来自输入数据的不同可能结果建模。他说:“这些早期的系统需要专家筛选数据来理解现实,并通过计算机能够理解的条件语句来描述现实。”“这是一项非常乏味、艰巨的工作,最好还是留给计算机去做。”
Villanustre说,机器学习让计算机提取这些事实,并通过基于统计等式的模型来表现现实,从而改变了这种情况。他说:“这节省了领域专家无数小时的时间,使他们能够处理人类在其他情况下很难处理的数据集。”由此产生的计算机程序更紧凑,更容易执行,也更高效。
LNRS使用机器学习来描述组织和个人的完整网络来识别诈骗团伙。它还使用该技术来评估和预测信用和保险风险,识别医疗保健相关交易中的欺诈行为,并帮助抓捕罪犯。
“机器学习是我们所做一切事情的核心,”Villanustre说。该公司正在研究这项技术的最新版本。他表示,事实证明,深度学习(deep learning)和深度信仰网络(deep belief networks,由多层潜在变量组成的生成图形模型,这些潜在变量之间存在联系)的一些近期发展,都是很有前景的应用领域。
Villanustre说:“对我们来说,重要的是要根据我们所工作的各个国家的法律和法规来验证这些新方法,以确保它们能够以最大限度地造福于个人和社会的方式使用。”
机器学习成为主流
德勤的约翰斯顿说,机器学习的应用很可能是多种多样的,而且可能跨越多个行业,包括零售、汽车、金融服务和医疗保健。
约翰斯顿说,在某些情况下,这将有助于改变公司与客户互动的方式。例如,在零售行业,机器学习可以彻底重塑零售客户体验。亚马逊(Amazon)等公司正以新的方式,在其Amazon Go商店或通过其Alexa平台,将改进后的面部识别能力用作客户身份识别工具。
约翰斯顿说:“亚马逊Go通过使用计算机视觉、传感器融合和深度学习或机器学习,消除了结账的需要。我预计许多购物中心和零售商今年将开始探索类似的选择。”
智能手机等普通设备将配备机器学习能力,这意味着这项技术将不再局限于理论或高度选择性的应用。
约翰斯顿说:“由机器学习驱动的新兴智能手机技术包括通过压力传感器确定用户情绪和情绪的程序,利用健康数据做出健康和生活预测的程序,以及探测周围物体的程序。”
约翰斯顿说,除了智能手机,我们还将看到机器学习出现在无人机、平板电脑、汽车、虚拟或增强现实设备、医疗工具和一系列物联网设备上,使其可用于使用这些产品的行业。
相关文章
这个故事,“机器学习证明了它的商业价值”是最初出版的信息世界 。