22个数据可视化和分析的免费工具

有资料吗?这些有用的工具,可以把它变成翔实,引人入胜的图形。

你可能不会想到你有许多共同之处的调查记者或学术医学研究员。但是,如果你试图从不断增长的数据流有用的信息,你可能会发现有用的可视化 - 无论是显示与图形,而不是文字的山模式或趋势,或者试图解释复杂的问题对非技术人员。

有各地的帮助下将数据转化为图形很多工具,但它们可以携带沉重的价格标签。成本可以为专业人士,其主要任务是找到的信息山意感,但你可能不能够证明这种费用,如果您或您的用户只不时,或者如果你的预算,需要一个图形应用程序新的工具是比较有限。如果价格较高的选项之一是你接触的地方,也有用于数据可视化和分析非常强大的工具是免费提供数量惊人。

要看到所有的工具来一次?

为便于参考,看看我们的图表上市22个免费的数据可视化工具。

下面是一些比较知名的选项,其中有许多在被证明破败计算机辅助报道(CAR)会议上个月。其他人都不如众所周知的,但表现出极大的希望。它们的范围从简单的够初学者(即,谁可以做基本的电子表格数据录入),专家(需要动手编码)。但他们都有一个重要的特点:他们是免费的。你唯一的投资:时间。

数据清理

之前,你可以分析和可视化数据时,通常需要进行“清洗”。那是什么意思?也许有些条目列表“纽约城”也有人说“纽约,纽约”,你需要规范,然后才能看到图案。可能有一些记录有拼写错误或数字数据输入错误。下面的两个工具,旨在帮助您的数据在最佳状态进行分析。

DataWrangler

它能做什么:从斯坦福大学的可视化集团这个基于Web的服务是专为清洁和重新排列数据,因此它在的形式,其他工具如电子表格应用程序可以使用。

点击行或列,并DataWrangler会提出修改意见。例如,如果你点击一个空白行,一些建议弹出诸如“删除行”或“删除空行。”

还有一个历史记录列表,允许容易撤消。

缺点:我发现,发生意想不到的变化,因为我试图探索DataWrangler的选择;我经常不得不单击“清除”来重置。而不是所有的建议是有用的(“促进行标题”似乎奇数建议当行是空白的)或容易(“使用2作为密钥倍分裂1”)来了解。

尽管事实上,DataWrangler是一个基于Web的服务可以方便地使用,千万不要忘了,它会将您的数据从外部网站 - 这意味着它不是敏感的内部信息的选项。然而,也有一个独立的桌面版本,未来的发行计划。要记住的另一个重要的事情是,DataWrangler目前的字母代码,和它的创造者说这是“仍在进展中的工作。”

技能等级:高级初学者。

上运行,:任何Web浏览器。

学到更多:有一个在一个截屏数据牧马主页。此外,请参阅这个帖子使用DataWrangler格式化数据(来自公共的Tableau的博客)。

谷歌瑞风

它能做什么:谷歌瑞风可以采取在文本和数字数据先看看被描述成一个电子表格上的类固醇。如Excel,它可以在多种格式,包括制表符和逗号分隔的文本文件和Excel,XML和JSON文件导入和导出数据。

瑞风具有几个内置的发现是拼写不同,但实际上要相对集中的文本项的算法。导入数据后,您只需选择编辑单元格 - >群和编辑,并选择要使用的算法。瑞风运行后,您决定是否接受或拒绝这些建议。例如,你可以说是结合微软和微软,但没有教练与公司CQG公司合并如果它提供太少或太多的建议,您可以更改建议功能的强弱。

也有提供数据分布的快速方便地概述数值选项。这个功能可以显示异常,可能是数据输入错误的结果 - 比如$ 800,000,而不是$ 80,000的工资条目,或者它可能使矛盾 - 如补偿数据从入门到进入报告方式差异,一些表现,比如,计时工资和其他显示每周工资或年薪。

除了数据家政,谷歌瑞风提供了一些有用的分析工具,例如排序和筛选。

什么是酷:一旦你习惯到命令做什么,这是触击功能性和易用性之间的良好平衡的数据处理和分析的有力工具。你的每一个动作的撤销/重做列表,可以在需要的时候回滚。和文本函数处理Java的语法的正则表达式,让您寻找模式(如,说,三个数字后面两位数字),以及特定的文本字符串和数字。

最后,虽然这是一个基于浏览器的应用程序,它与您的桌面上的文件,让你的数据依旧是局部的。

缺点:尽管谷歌瑞风看起来像一个电子表格,你不能用它做典型的电子表格计算;对于这一点,则必须导出到传统的电子表格应用程序。如果你已经有了一个大的数据集,能开出一些时间在你每天经过的所有的细化的修改建议,因为这可能需要一段时间。- 或者两者你可能会得到两种大量的误报或遗漏的问题:和,取决于数据集,寻找文本项合并时准备。

技能等级:高级初学者。数据分析概念,知识比技术能力更重要;谁了解数据清洗的需求动力Excel用户应该熟悉这个。

上运行,:在Windows,Mac OS X(如果它出现在Mac上加载后什么都不做,手动浏览器指向http://127.0.0.1:3333/),Linux操作系统。

学到更多:这些3截屏给出的原因,你会如何使用瑞风一个很好的概述;这里还有相当详细的文档在谷歌代码项目区。

统计分析

有时你需要你的数据的图示与更为强大的数值分析相结合。

在R项目的统计计算

它能做什么:R是一般统计分析平台(作者称其为“环境”)在命令行上运行。需要找到办法,中位数,标准差,相关性?R可以处理该等等,其中包括“线性和广义线性模型,非线性回归模型,时间序列分析,古典参数和非参数测试,聚类和平滑,”根据项目网站

R还图形,图表和图形效果。有许多附加组件到这个开源项目,显著扩展功能。对于谁喜欢GUI用户,彼得Aldhous,旧金山分社社长新科学家杂志,顾名思义RExcel,它提供了访问通过Excel中的R发动机。

什么是酷:有功能R中一个很大的,包括相当多的可视化选项以及数字和空间分析

缺点:即在命令行方式R运行,用户将不得不花时间去学习它的命令做了什么,而不是所有用户都将舒适与纯文本界面的事实。此外,Aldhous说,这些处理大型数据集可能会碰到一个内存屏障(如果是的话,有一个从革命Analytics(分析)商业选择)。

技能等级:中级到高级。舒适与命令行提示和统计数据的知识是核心应用葡萄汁。

上运行,:在Linux,Mac OS X,Unix和Windows XP或更高版本。

学到更多:尝试R代表统计:第一步(PDF)彼得Aldhous,动手R,一步一步的教程(PDF)雅各芬顿,以及项目自身简介于R。该[R统计博客有许多可视化样品。

可视化应用程序和服务

这些工具提供了许多不同的可视化选项。虽然一些坚持传统的图表和图形,其他选择,如树图和字云多提供一系列。一些报价的地理测绘为好,但如果你有兴趣的地图,我们对具体GIS /制图关注那些部分。

谷歌的Fusion Tables

它能做什么:这是我见过将数据转化为图表或地图的最简单的方法之一。您可以采用多种不同格式上传一个文件,然后选择如何显示:表,地图,热图,折线图,柱状图,饼图,散点图,时间线,故事情节或运动(动画一段时间内)。这有点定制,让你改变地图的图标和风格的信息窗口。

有一些数据融合表内编辑功能,虽然改变以上几个单独的单元格条目很快就会变得乏味。您还可以参加表(这是很重要的,当你想地图的数据在多个表中),和筛选,排序并添加列等等。还有几个选项,以允许其他人就数据本身的意见。

映射超越只是放置点,我们很多人都习惯于使用谷歌地图。多个多边形与颜色的变化基于基础数据,如该融合表也映射强度图显示家庭从2007年美国人口普查局的数据由国家互联网的百分比。

骑士数字媒体中心指出,一个方便的无证功能允许使用融合表的“模板”出口到生成一个JSON文件从其它格式的数据。JSON是由一些API和JavaScript库需要。

与IBM的许多眼睛,谷歌允许您指定您的数据,私有或不公开以及公开,尽管数据仍驻留在谷歌的服务器 - 利益或缺点,这取决于服务器带宽成本或数据隐私是否对你更重要。

什么是酷:融合表提供相对快速的图表和映射,包括地理信息系统(GIS)的作用是通过地理分析数据。该服务还可以自动进行地理编码地址,试图在地图上放置无数个点时非常有用。这对于初学者和高级初学者使用获得舒适与分析数据,一个优秀的工具;它也是一个不错的选择的人谁不编程的人。对于更高级的用户,有一个API。

缺点:功能,定制和数据容量都与桌面应用程序或自定义代码比较有限,并与现场的大型数据集交互可以是缓慢的。它有它的局限性 - 现场呛3月11日,在日本大地震和海啸的一天。(这仍然是一个谷歌实验室测试项目。)

技能等级:初级。

上运行,:任何Web浏览器。

学到更多: 一个谷歌的Fusion Tables旅游和几个教程可用。我们也得到了什么就可以在我们的故事做一些例子“H-1B签证资料:视觉和互动工具”另请参阅Fusion Tables的实例库

不纯

它能做什么:不纯是一个排序雅虎管道用于数据可视化,设计用于使用拖和下降的工作空间创建多种类型的数据的高度抛光的图形表示。该服务包括的对象和各种方法的图书馆和 - 与雅虎管道 - 它可以让你点击拖动连接模块,这样一个的输出成为另一个的输入。它是由西班牙的分析公司发展Bestiario

什么是酷:不纯为创建可视化的任务高度可视化的界面 - 这并不像你想象的常见。它具有时尚的用户界面和众多的模块,包括被设计为从Web提取数据相当多的API。其特点是由类似的数字,表格,节点,几何形状和地图关键字搜索众多的可视化类型。虽然这样可以节省您的工作区到Web上,您可以复制并在本地保存工作区后面的代码,所以你可以备份你的工作或者维护自己的代码片段库。

缺点:不纯的用户面临着一个令人惊讶的陡峭的学习曲线,尽管其拖和拖放功能。该文档在某些领域中详述,但在其他缺乏。例如,虽然很容易找到API的列表,这是比较难找到如何使用工作区的基本指令 - 甚至弄清楚,有一个工作空间,更不用说如何使用不同的对象和方法。

一旦你保存工作区,它的公共网络上,虽然它是不可能的,任何人都将能够找到它,除非你分享的网址。而且我发现,一些样品不是所有的有助于理解底层的数据,即使他们是视觉冲击力。

技能等级:中级。

上运行,:任何Web浏览器。

学到更多:首先,我建议的影片“接口的基础知识“(7分钟)和”工作区和代码”你可以找到一个名为样本薪酬差距男人和女人之间的映射方式在英国报纸卫报的网站。

画面公开

它能做什么:此工具可将数据转化为任何数量的可视化的,从简单到复杂。你可以拖放字段拖到工作区,并要求该软件提示可视化类型,然后自定义一切从标签和工具提示大小,交互式过滤器和传说中的显示。

有关:
1234 第1页
第1页的4
IT薪资调查:结果是