雷竞技电脑网站曾经由IBM大型机和Sun服务器处理的数据中心工作负载,在谷歌等云计算公司的推动下,被英特尔PC硬件商品化。直到最近,包括安德森•霍洛维茨基金(Andreessen Horowitz)风险投资家本•埃文斯(Ben Evans)在内的科技行业都认为,这种情况将永远持续下去谷歌发表了一篇详细的研究论文关于它的Tensorflow处理单元(TPU)的性能和架构细节。
一家脱离其核心业务的广告、云服务和软件公司提出了一个问题:为什么英特尔、高通和英伟达不能满足谷歌的数据中心需求?雷竞技电脑网站
+也在网络世界:有个足球雷竞技app人工智能今天能做什么和不能做什么+
TPU不是像英特尔CPU或Nvidia GPU那样的通用设备。它是一种为人工智能的专门子领域机器学习而设计的专用集成电路(ASIC)。在过去的几年里,机器学习已经出现,可以精确地翻译语言,识别图像,推荐从消费者的下一本书到下一顿餐馆餐的一切东西,以及其他类型的事情,通过谷歌的大量数据可以准确地预测。
机器学习有两部分:训练和推理。训练就是用数据给电脑编程。训练是通过向机器学习系统输入数百万个不同语言的句子,教它从一种语言翻译成其他语言来完成的。用一种语言在智能手机上说或输入一个句子,然后把它翻译成另一种语言,这就是推理。训练和推理都在神经网络上运行,神经网络是在数据中心硬件上为机器学习而优化的软件层。雷竞技电脑网站
TPU是为特定于应用程序的推理任务而设计的,这是谷歌工作负载中很大且正在增加的一部分。随着谷歌大脑小组所进行的机器学习研究的深奥科学被应用到一些谷歌服务中,机器学习的工作量也随之增加。随着谷歌Brain的技术被分发给产品组的开发人员,这些开发人员将人工智能添加到更多的服务中,负荷甚至还在增加。
不断增加的工作负载导致了谷歌的TPU。推理模型(如语言翻译和图像搜索)的处理能力是面向用户的,需要低成本和低延迟的性能。推论是开始为神经网络工作负载优化数据中心容量的正确位置。雷竞技电脑网站
下面是谷歌设计和构建TPU的一些原因。
1.性能
谷歌将TPU性能与服务器级Intel Haswell CPU和Nvidia K80 GPU进行了比较,后者运行的基准代码代表了95%的推理工作负载。通过神经网络推断,TPU比Nvidia的gpu和Intel的cpu快15到30倍。
2.物理空间
云数据中心相雷竞技电脑网站当于IT工厂。预算包括设备、房地产、电力和建设数据中心的成本。雷竞技电脑网站该计划的目标是将尽可能多的处理能力压缩到能吸收最少能源、产生最少热量的空间,从而使所有成本最小化。谷歌庞大的信息处理工厂基础设施的资本和运营费用是一项庞大且不断增长的预算项目。
六年前,当用户第一次开始使用自然语言识别的智能手机键盘,谷歌工程师估计三分钟的自然语言输入每个用户每天使用英特尔将双数据中心的数量和Nvidia设计部署。雷竞技电脑网站
3.电力消耗
没有相应减少功耗的更快芯片只会影响物理空间的成本。降低功耗有双重影响,因为它减少了功耗,并降低了散热的冷却成本。不仅仅是原始性能,TPU与CPU主机处理器的结合更有影响。下面的图表比较了TPU/CPU /瓦特性能,并显示了在不同工作负载下,与使用CPU和gpu的替代技术配置相比,性能提高了30到80倍。
谷歌
4.TPU解决了特定于应用程序的问题
英特尔的cpu和Nvidia的gpu都是芯片上的通用系统,设计用于广泛的应用,特别是用于精确计算的浮点运算。机器学习模型可以容忍低精度的数学操作,消除了对浮点处理单元(FPU)的需要。与英特尔和英伟达的带FPUs的SoCs相比,使用TPU的8位数学运算驱动推理模型的预测精度是相等的。
矩阵代数数学包含了大部分神经网络操作。矩阵乘单位(MMU)是TPU的核心。它包含256x256个执行8位乘法和加法的倍增器累加器(MAC)。MMU每个周期可以进行64,000次累加。通过优化低精度的矩阵运算,以及快速将数据和结果移入和移出MMU,以0.7GHz运行的TPU取得了显著的性能提升,超过了以2.3GHz运行的Intel SoC和1.5GHz运行的Nvidia SoC。谷歌在其研究论文中推断,在未来TPU重新设计中增加总线带宽可以使性能增加两倍或三倍。
5.领导和推动芯片制造商建立TPU
谷歌研究论文的作者说:“在计算机架构中,商业产品之间的数量级差异是罕见的,这可能会导致TPU成为特定领域架构的原型。我们预计,许多人将培养接班人,把门槛提高得更高。”由杰出芯片工程师Norman Jouppi领导的工程团队仅用了15个月就完成了TPU的制造。这是一个令人印象深刻的时间表,因为asic的制造是一个巨大的财务承诺,一旦构建,如果在数据中心生产中发现错误,昂贵的制造过程将被重复。雷竞技电脑网站
英特尔可以建立一个更好的TPU,尽管它有更多的资源,更多的架构师,更多的设计工程师和芯片制造设备。除了拥有制造设备之外,英伟达拥有相同的资源。英特尔、英伟达和其他芯片制造商一直在观望,等待人工智能/机器学习芯片市场变得足够大,值得他们投资和关注。目前这个市场只有几个非常大的客户,包括亚马逊、谷歌、Facebook、IBM、微软和其他一些公司。虽然个别规模较大,但与通用cpu市场相比,芯片制造商仍持观望态度。
硬件业务实际上并不是谷歌战略的一部分。它是一家广告、云服务和软件公司。但谷歌战略上构建了早期版本的硬件来表明自己的观点,就像他们在谷歌Home、Pixel和Chromebook上做的那样。
谷歌是一个非常了解机器学习问题并能够构建解决方案的主要用户。经过其数据中心两年的运行,该公司证明这个问题已经得到解决。雷竞技电脑网站谷歌发布这篇研究论文的目的是为了提高机器学习社区和芯片制造商之间的讨论水平,是时候为大规模运行推理提供现成的商家解决方案了。
6.专利和知识产权的贸易
在美国专利局的数据库中搜索专利发明人Jouppi的专利申请产生了许多TPU相关的专利。正如三星和苹果所证明的那样,专利既可以用于进攻,也可以用于防守。作为拥有专利的主要用户,谷歌可以激励芯片制造商利用其专利作为货币进入芯片行业。
领先的机器学习用户公司,如亚马逊、Facebook、谷歌、IBM和微软,正等着欢迎商用芯片制造商的销售人员,并为特定于机器学习的soc下订单。这是一个先有鸡还是先有蛋的问题。他们需要新的、更快的计算架构来推动整个行业的发展,并推动许多企业采用人工智能。芯片制造商正在等待更多的人工智能客户。谷歌的TPU可以改变这一点。