60 + [R资源,以提高数据的技巧

这个列表最初是作为Computerworld初学者R指南的一部分发布的,但是现在已经扩展到包括高级初学者和中级用户的资源。如果你刚开始学习R,我建议你先去看初学者指南。

这些网站,视频,博客,社交媒体/社区,软件和书籍/电子书可以帮你做更多的R.

书籍和电子书

[R食谱。就像O'Reilly的食谱系列的其余部分,这一个提议如何做“食谱”做很多不同的任务,从R安装过程中的基本知识,并生成概率,图形和线性回归创建简单的数据对象。它被写得很好额外的奖励。如果您喜欢的例子学习或正在寻求一个良好的R参考的书,这是非常值得添加到您的参考库。保罗Teetor,定量开发商在金融部门工作。

R图形食谱。如果你想要做超越最基础图形R,这是一个有用的资源都为它的图形配方和简单的介绍GGPLOT2。虽然这超出了图形处理能力,我需要R中的方式,我建议这一点,如果你正在寻找超越先进初学者绘图。温斯顿·张,在RStudio的软件工程师。

R in Action: R的数据分析和图形。这本书针对所有层次的用户,有从“探索R数据结构”到运行回归和进行因素分析的初级、中级和高级R部分。如果您没有接触过R,初学者的部分可能有点难理解,但是一旦您有了一定的经验,它为数据类型、导入和重塑提供了一个良好的基础。这里有一些特别有用的解释和例子,用于聚合、重组和细分数据,以及许多应用的统计数据。注意,如果您对图形感兴趣的是学习ggplot2,那么与基本R图形和格包相比,这里的内容相对较少。您可以从在线书中看到一个摘录:数据的聚合和重组。罗伯特·卡巴科夫(Robert I. Kabacoff)著。

[R编程的艺术。对于那些谁想要超越“在R.在一个特设的方式......发展[和]软件”,使用R如果你已经至少在另一种编程语言精通适度这是最好的。这是一个很好的资源,系统地学习基础知识,如对象的类型,控制语句(不像许多[R较真,笔者不主动劝阻循环),变量的作用域,类和调试 - 事实上,有那么大的一章几乎是在调试上仍然有图形。随着解决R.由诺曼·马特夫真实世界的统计问题的一些健壮的例子。

中的R果壳。合理引导读取与R,教语言的基本面 - 语法,功能,数据结构等 - 以及如何做统计和图形任务。有用的,如果你想开始编写健壮[R计划,因为它包括在功能部分,面向对象的程序设计和高性能的R.约瑟夫·阿德勒,在LinkedIn的高级数据科学家。

可视化。请注意;这本书的大部分内容都不是关于R,但是有几个用R可视化数据的例子,还有很多关于如何用数据讲故事的有趣信息,值得一读。作者Nathan Yau,他经营着流行的流动数据博客,他的博士论文是关于“个人数据收集以及我们如何使用可视化来了解自己。”

R有关傻瓜。我还没有机会看到这一个,但它囊括在Amazon.com上一些好的评论。如果你熟悉的傻瓜系列,发现他们在过去的帮助,你可能要检查这一个。你可以得到作者的风格的味道在Dummies.com的R段编程,拥有超过100小段如如何构建载体在R和如何使用R.由申请家庭的功能里斯Meys和Andrie德弗里斯。

介绍数据科学。它具有很强的可读性,挤满了有用的例子和自由 - 你还能想要什么?该电子书是不是技术上的“R书”,但它使用的R用其所有的例子,因为它教导数据分析的概念。如果你熟悉这个话题,你可能会发现一些解释,而基本的,但还是有很多的东西像分析鸣叫速度R代码(包括如何获取Twitter的OAuth授权在R工作有帮助的部分),简单映射混搭和基本线性回归。虽然斯坦顿称此为“电子课本”,介绍数据科学有一个谈话风格那是愉快的非教科书等。曾经有一个PDF格式下载,但现在唯一的版本是OS X或iOS。

R。作者Jared P. Lander承诺“完成80%的工作需要20%的功能”。And in fact, topics that are actually covered, are covered pretty well; but be warned that some topics appearing in the table of contents can be a little thin. This is still a well-organized reference, though, with sections on topics beginning and intermediate users might want to know: importing data, generating graphs, grouping and reshaping data, working with basic stats and more.

统计分析与R:初学者指南。这本书让你“假装”你是一个古代中国王国的战略家,用r分析军事战略。如果你发现这个想法太假,继续看另一个资源;如果没有,你会得到一个入门级的关于R中各种任务的介绍,包括你在介绍文本中不经常看到的任务,比如多重线性回归和预测。注意:我早期的电子版本在我的Kindle应用程序中有相当多的坏空格,但它仍然是可读和可用的。

使用R和RStudio进行可重复的研究。虽然被归类为“生物信息学”教科书(而且定价也是这样——甚至Kindle版本都超过50美元),但这是关于确保你能够记录和展示你的工作的更一般的建议。这包括许多关于使用knitr包、LaTeX和Markdown创建报告文档的章节——这些任务通常不会在一般的R书籍中深入介绍。作者已经在GitHub上发布了生成这本书的源代码,如果你想自己创建一个电子版本的话。

用R和Ruby探索日常事物。这本书从几个基本的介绍性章节奇怪地变成了一些相当健壮的、超越初学者的编程示例;对于那些刚开始编写代码的人来说,本书的大部分内容在一开始可能很难理解。但是,对R的介绍是我读过的较好的介绍之一,包括许多语言基础知识和使用ggplot2绘制图形的基础知识。再加上经验丰富的程序员可以看到作者Sau Sheong Chang是如何在Ruby这样的通用语言和侧重统计的R语言之间划分任务的。

在线参考资料

4个数据扯皮任务的R用先进的初学者,这后续我们的新手指南提纲怎么办R中几个具体数据的任务:将列添加到现有的数据帧,得到汇总,排序结果和重塑数据。与示例代码和解释。

不要和上面提到的R Cookbook混淆,这个网站由软件工程师温斯顿·张(R Graphics Cookbook的作者)提供如何处理数据输入和输出、统计分析和创建图表等任务。它的格式类似于O'Reilly的烹饪书;虽然还不够完整,但可以帮助回答一些“我该怎么做?”的问题。

Quick-R。这个网站有相当数量的样本和简要说明,按主要类别和具体项目分组。例如,您可以转到“Stats”,然后转到“Frequencies and crosstabs”,以获得表()函数的解释。内容包括基础知识(包括定制R启动的有用指南)、超越新手统计知识(矩阵代数,有人吗?)和图形学。作者Robert I. Kabacoff, R in Action的作者。

R参考卡。如果你想完成各项任务,帮助记忆功能的名称和格式,这4页PDF是尽管其年龄(2004年),事实上,什么的应该是最新版本的链接不再起作用相当有用。由汤姆短,在电力科学研究院的一名工程师。

最有用的命令的简短列表。按功能分组的命令,如输入、“移动”和“统计和转换”。This offers minimal explanations, but there's also a link to a longer guide to Using R for psychological research. HTML format makes it easy to cut and paste commands. Also somewhat old, from 2005. By William Revelle, psychology professor at Northwestern University.

这里面有很多R可视化的例子和示例代码,包括条形图、柱状图、堆叠条形图和柱状图、气泡图等等。它还按比较、分布和趋势等类别对可视化进行了细分。Greg Lamp,基于果汁实验室的Excel和PowerPoint图表选择器。

关于r的常见问题:阅读、写作、排序和塑造数据的一些基本知识,以及如何进行各种统计操作和一些专门的图形(如意大利面图)。来自加州大学洛杉矶分校数字研究和教育学院。

R数据挖掘参考卡。这是一个面向任务的有用R包和函数的编译,用于从文本挖掘和时间序列分析到图形和数据操作等更一般的主题。由于描述是赤裸裸的,这可能会更有用,提醒你以前见过的函数或给你一些建议,让你尝试。关于这个主题的更多信息,请访问作者的R和数据挖掘网站,其中包括示例和其他文档。包括他2012年由爱思唯尔出版的《R和数据挖掘》一书的大部分内容。延长赵。

空间备忘单。对于那些做GIS和空间分析工作的人,这个列表提供了一些处理空间矢量和栅格数据的关键功能和软件包。英国兰开斯特大学的巴里·斯蒂芬·罗林森(Barry Stephen Rowlingson)著

在线工具

ggplot2的Web界面。这个在线工具由UCLA博士候选人Jeroen Ooms为ggplot2创建了一个交互式前端,允许用户输入他们想做的任务,并获得一个plot加R代码作为回报。对于那些想了解如何使用ggplot2处理图形而不需要阅读冗长的文档的用户来说,它非常有用。

十件事情你可以做R中,你会已经完成在Microsoft Excel中。从R傻瓜网站,这些代码示例旨在帮助Excel用户感觉更舒服R.

视频

Twotorials。你要么会喜欢这些2分钟的“两段式”视频,要么会觉得它们太老土,太夸张。我认为它们既能提供信息又很有趣,是您经常在统计编程中发现的典型的干巴巴的操作指南的一种受欢迎的解毒剂。分析师Anthony Damico用2分钟的时间来研究R,从“如何用R创建一个变量”到“如何从R的回归中绘制残差值”;他还解决了一个偶发的问题,比如“如何用R计算地球上的第10天、第15天或第20,000天”。I'd strongly recommend giving this a look if textbook-style instruction leaves you cold.

这个由21个YouTube短片组成的系列包括一些基本的R概念,一些关于数据重塑的课程和一些关于循环的信息。此外,有6个视频关注R介绍中经常遗漏的主题:使用和编写自己的函数。这个YouTube播放列表提供了一个很好的程序员对该语言的介绍——请注意,如果您想了解更多关于R的可视化,这不是其中的主题。

启动并运行R.这lynda.com视频类涵盖的主题包括使用R环境,在数据读取,创建图表和统计计算的基础。该课程是有限的,但主持人巴顿Poulson芯片试图解释自己在做什么,为什么,不是简单地执行命令。他也有一个更深入的6小时的课,R统计的基本训练。Lynda.com是一项订购服务,在25 $ /月,但一些的视频​​开始都是免费供您查看,看看你喜欢的指令风格,并有可用的7天免费试用。

Coursera:计算数据分析。Coursera的免费在线课程对时间非常敏感:你必须在课程开始时注册,否则你就没那么幸运了。然而,如果没有课程马上开始,约翰·霍普金斯大学生物统计学副教授、讲师罗杰·彭将他的课程发布到了YouTube上;Revolution Analytics将它们收集到一个方便的单页上。虽然我发现其中一些有时有点难以理解,但它们包含大量信息,您可能会发现它们很有用。

Coursera:数据分析。这是更大的应用统计类的使用R作为反对一个教导R等但如果你已经有了将R基本下跌,并希望看到它在行动,这可能是一个不错的选择。这有没有即将到来的预定会议在Coursera,但是教练杰夫韭菜 - 生物统计学的约翰霍普金斯大学的助理教授,在YouTube上发布了他的演讲视频和革命分析收集一周链接他们。

有关:
123 第1页
第1页共3页
工资调查:结果是