首席信息官们必须学习新的分析数学

3月封面

我们习惯于用算法推荐书籍、电影、音乐和网站。算法还可以交易股票、预测犯罪、识别糖尿病患者、监测睡眠呼吸暂停、找到日期(和保姆)、计算路线、评估你的驾驶情况,甚至还可以构建其他算法。这些数学方程,可以达到数千页的代码和日常处理数百个变量,也许有一天会运行我们的生活。越来越多的公司利用它们来经营数字业务,并获得竞争优势。

推出一种算法可以带来新的客户和收入,但也可能带来道德和法律方面的麻烦。消费者权益倡导者和监管机构已经开始把目光瞄准算法革命的阴暗面,比如令人毛骨悚然的过度个性化和可能存在的非法价格歧视。

(参见“行动中的算法示例在第三页]

当首席执行官们指望首席数字官和数据科学家们征服下一个前沿领域时,首席信息官们有时会选择或默认地袖手旁观。但作为商业领袖,首席信息官现在可能不得不挤进博士、公司律师和其他同事正在讨论的会议,讨论数据驱动的未来。首席信息官们当然需要参与这些对话,以帮助引导公司的战略,但也要对哪些数据需要输入算法、哪些数据需要屏蔽,以及如何监控算法的运行等决策做出贡献。

马里兰大学(University of Maryland)法学教授弗兰克•帕斯夸莱(Frank Pasquale)表示,这包括为处理产生的信息设计一种可辩护的政策。他表示,“算法问责制”将成为IT领袖工作的一部分。

[幻灯片:2015年的分析趋势

这种认识可能会带来伤害。高频股票交易商雅典娜资本研究公司(Athena Capital Research)利用一种名为“肉分”(Gravy)的专有算法,在纳斯达克(NASDAQ)当日收盘前几毫秒输入大量买卖指令,以推动股价上涨或下跌,这对雅典娜有利。美国证券交易委员会(Securities and Exchange Commission,简称sec)认为这是非法操纵,并于去年指责雅典娜的首席技术官在2009年至少6个月的时间里帮助其他基金经理策划最有效地使用“Gravy”。雅典娜以100万美元了结了这个案子。

没人说首席信息官必须钻研博士水平的数学。但是,对算法背后基本概念的掌握可以帮助避免不良结果和负面报道。哈佛商学院(Harvard Business School)助理教授迈克尔•卢卡(Michael Luca)表示:“算法让我们摆脱了我们认为存在于人类决策中的偏见。”“但思考陷阱也同样重要。”

数学魔术

算法可以用来提高运营效率,回答“如果……会怎么样”的问题,并使新产品和服务成为可能。在联合包裹服务公司(United Parcel Service),长达1000页的猎户座(Orion)算法完成了所有这些工作。2003年,UPS开始建造Orion(道路综合优化和导航),以优化配送路线。你一天可能有六件差事要做。UPS司机大约有120个。该公司流程管理总监杰克•李维斯(Jack Levis)表示,公司希望让司机按照最高效的路线行驶,同时还能按时交货,从而节省时间和燃料。李维斯负责监督猎户座以及由700名工程师、数学家和其他支持它的人组成的团队。

[相关:分析应用揭示未开发的销售机会

Levis说,每位司机每天只需减少1英里,每年就能节省5000万美元,Orion目前为止已经为每位司机每天节省了7到8英里。到2017年,UPS有望每年节省3亿至4亿美元的天然气和其他成本。

Levis说,任何管理者在着手一个算法项目时能做的最重要的事情就是“逆向工作”。也就是说,仔细定义公司面临的困难是什么,然后确定哪些知识会有帮助——你需要哪些信息来教会你所缺乏的知识。然后识别原始数据——当组合、分解和解释时——将提供该信息。

在Orion投入生产之前,UPS花了9年时间研究它,添加和减去数据,测试,然后再次添加和减去。例如,猎户座一开始使用的是公开可用的地图。但他们还不够详细。因此,联合包裹设计了自己的方案,展示了客户半英里长的车道或后巷等特征,节省了到达接收站的时间——猎户座需要这些数据点,以便计划如何在上午10:30前收到包裹。

但由数据科学家在实验室创建的算法无法预测所有因素或解释所有细微差别。假设一个业务客户通常每天收到一个包。如果Orion知道包裹没有固定的送货时间,算法可能会建议把包裹放在某一天的早上,但根据当天的任务安排在第二天的下午。对UPS来说,这可能是最有效的方法,但如果送货时间频繁变化,客户将不知道该期待什么。

功能杰克李维斯 哈特洛夫克里斯

UPS流程管理总监杰克•李维斯(Jack Levis)表示,在开发算法时,首先要确定一个业务问题,然后确定解决该问题所需的数据。

人们不喜欢这么多的不确定性,这可能会让UPS的业务蒙受损失。公司通常在早上接收包裹,在白天处理他们的业务,然后在下午晚些时候打电话给UPS要求取走一个寄出的包裹。李维斯说,如果UPS出于效率考虑把送货时间推迟到当天结束,它可能就不会接到晚些时候的电话。他说:“我们开始意识到,我们告诉算法的规则没有它们应该有的那么好。”“我们知道,你需要在最优性和一致性之间取得平衡。”

Orion团队不在IT部门,但李维斯表示,IT部门建立了Orion的生产版本,首席信息官戴夫·巴恩斯(Dave Barnes)了解Orion能做什么,不能做什么,这在他帮助UPS制定业务战略时至关重要。李维斯说,如果没有Orion, UPS的“我的选择”(My Choice)服务是行不通的。该服务会通知客户有待交付的货物,并让他们更改交货时间或地点。“我的选择”不仅减少了多次送货尝试,还带来了新的收入:已有700万用户注册了这项服务,并为每次更改支付5美元,或为每年无限制更改支付40美元。接下来,UPS想把它带到其他国家。

为了从算法的洞察中发展新业务,公司必须寻找竞争对手没有发现的相关性。

以H&R Block为例。去年12月,这家报税软件和服务提供商的高管与金融分析师详细讨论了该公司的新算法,该算法为个人客户定制营销电子邮件和软件内弹出框。该公司在这个纳税季推出了这项服务,在此之前,该公司启动了算法测试,对8700名报税者的行为进行量化和分类,以预测客户会做什么。

例如,首席营销官凯西•柯林斯(Kathy Collins)讨论了H&R Block如何知道,根据过去的行为,你通常是一个喜欢通过移动设备与公司互动的2月份申报者。如果你在2月10日之前还没有提交,算法会建议有人通过电子邮件提醒你,并在帮助你准备申报表时给予折扣。其他客户可能会在收到W-2表格的那一周收到电子邮件。

H&R Block全球数字和产品管理总裁贾森•豪斯沃思(Jason housworth)表示,随着时间的推移,该公司希望通过分析客户纳税申报单的内容以及纳税人在使用该软件时的点击次数来改进算法。“在我们的案例中,”他说,“个人数据非常丰富,”

通过算法实现的个性化,豪斯沃思说,“将让每个用户感到,软件不仅是为他们设计的,而且总是领先一步。”

帕斯夸里写道,一些客户可能会喜欢这样,但其他人不会黑箱社会:控制金钱和信息的秘密算法.“想要了解更多,压力太大了。这就是我担心的军备竞赛。”

更多地了解人们的想法是eHarmony的驱动力。该交友服务根据会员的自我认同特征,如爱好和性取向,为其配对。但eHarmony还通过不同的公式给出问卷的答案,推断出它所称的未阐明的“深层心理特征”,比如好奇心。神经网络还会产生一个“满意度评估器”来评估潜在的配对,随着时间的推移,系统会不断学习,因为成员会反馈他们对eHarmony建议的配对的满意度。

公司没有首席信息官;首席运营官Armen Avedissian负责这个职位。是否改变算法的决定是由一个包括Avedissian、首席技术官Thod Nguyen、负责匹配Steve Carter的副总裁以及公司律师在内的团队做出的。Avedissian说:“不仅仅是硬件和软件,还有数据操纵的策略和策略。”

功能armen avedission 丹尼尔轩尼诗

在eHarmony,首席运营官阿门·阿维迪斯安(Armen Avedissian)表示,关于改变匹配用户的算法的决定涉及“数据操纵的策略和策略”。

该公司研究了29个兼容性维度,如“情绪能量”和“好奇心”,每个维度都包含了通过详细的问卷收集到的几个变量。涉及的数据超过125TB。算法通过评估每个成员对eHarmony建议的匹配(立即联系?忽略?),以及成员在问卷和开放式回答中提供的反馈。Avedissian说,这些数据被重新注入等式,循环又开始了。

匹配越相关,成员之间交流的频率就越高。他们参与的越多,就越有可能购买年度订阅。eHarmony的所有算法都旨在将注册用户转化为订阅者。

该约会服务通过为不同的客户运行略有不同的算法,然后测量注册会员转换为年度订阅者的速度来测试这些想法。风险和合规团队运行自己的算法,以了解该公司的其他算法如何使用敏感数据。

最近的一项发现是:与美国相比,欧洲人约会时是否吸烟喝酒更重要。雷竞技比分一旦eHarmony在英国的匹配算法中增加了吸烟和饮酒变量的权重,“业务就会蓬勃发展,”Avedissian说。这意味着,建议匹配更有针对性,因此满意度提高了,转化率也提高了。

然而,并非所有结果都是预期的。

意想不到的后果

优步(Uber)正在颠覆出租车行业,它推出了一款将乘客与乘车联系起来的应用,以及一种专有算法,该算法在一定程度上控制了“高峰定价”(surge pricing),即在需求旺盛的时候提高车费。从纽约到巴黎,再回到纽约,出租车协会都在抗议优步侵占他们的业务,政府监管机构也在公平定价和安全问题上质疑该公司。即便如此,“破坏”的宠儿还是获得了估计49亿美元的投资者资金

12 第1页
第1页共2页
工资调查:结果在