这种新的编程语言有助于在大数据上提升4倍

它为大型分散的数据集提供更好的内存管理

乳头牛奶
Christine Daniloff / MIT

内存管理可能在传统数据集中挑战,但何时大数据进入图片,事情可以缓慢,向下。本周麻省理工学院宣布的新编程语言旨在解决这个问题,到目前为止已经发现它可以在常见算法上提供四倍速度升高。

本地原则是当今大多数计算机芯片中的内存管理的目标,这意味着如果程序需要存储在某些内存位置的数据块,通常假设也需要邻近的块。然而,在大数据中,情况并非总是如此。相反,程序通常必须仅在跨越数据集中分散的一些数据项。

从主存储器中获取数据是当今芯片中的主要性能瓶颈,因此必须更频繁地获取它可以大大减慢执行。

“It’s as if, every time you want a spoonful of cereal, you open the fridge, open the milk carton, pour a spoonful of milk, close the carton, and put it back in the fridge,” explained Vladimir Kiriansky, a doctoral student in electrical engineering and computer science at MIT.

由于考虑到这一挑战,来自麻省理工学院计算机科学和人工智能实验室(CSAIL)的基年人和其他研究人员已经创造了一种新的语言,这是一种新的语言,让应用程序开发人员在大数据集中处理分散数据点的程序中更有效地管理内存。

基本上,牛奶将一些命令添加到OpenMP,一个用于C和Fortran等语言的API,这使得更容易编写多核处理器的代码。使用它,程序员围绕任何迭代的指令围绕迭代的任何指令围绕稍微少量的项目插入一些额外的代码行。牛奶的编译器然后介绍如何相应地管理内存。

使用用牛奶编写的程序,当核心发现它需要一条数据时,它不会要求它 - 以及来自主内存的伴奏者相邻的数据。相反,它将数据项的地址添加到本地存储的地址列表中。当列表足够长时,所有芯片的核心池都会汇集它们的列表,将这些地址汇总在一起,并将其重新分配给核心。这样,每个核心只请求它知道它需要的数据项,并且可以有效地检索。

麻省理工学院说,在几种常见算法上,用新语言编写的程序的程序是现有语言编写的程序。因为研究人员进一步改善了技术,这也可能更好。他们在呈现A.本周在项目上并行架构和汇编技术国际会议

加入网络世界社区有个足球雷竞技appFacebook.linkedin评论是最重要的主题。

版权所有©2016.Raybet2

IT薪水调查:结果是