嗨,我是莎朗·马克利斯,编辑数据和分析总监IDG通信。我在这里做13集多与R:拖和下降ggplot。
有些用户[R成为了图形用户界面的一点持怀疑态度。鼠标点击和拖拉可方便,但它也很难保存或检查或重新运行分析。
但我认为,即使是最铁杆的命令行爱好者也会同意,拖放界面对某些探索性的dataviz是有帮助的。
这就是新的R包esquisse带来GGPLOT2。它提供了两全其美的:拖和下降,再加上生成基本ggplot代码为您创建的图表。而且,它很酷!esquisse是由一家法国R 2人的咨询公司,dreamRs创建。该名esquisse是法语草图。
让我们看一下包装。
我会用我喜欢的类型的数据集,航空公司的飞行性能之一。在这里,我坦然2个数据帧 - 从波士顿到德克萨斯州奥斯汀市的航班在2018年一月和航班从奥斯汀同月回到波士顿。我飞往奥斯汀这个未来2019年1月为RStudio会议。我很好奇,看看有什么会延迟看起来像去年一月。(当然,虽然过去的业绩是没有未来业绩的保证 - 或天气)
从RStudio加载项菜单我平时开esquisse ggplot建设者。默认的行为就像一个通常的加载项。但是你可以在浏览器中,如果你想也打开它。刚刚成立的R选项esquisse.display.mode到浏览器:
现在看,如果我运行会发生什么esquisse ggplot建设者插件。
它弹开我的默认浏览器。但我更喜欢平时RStudio对话框窗格。所以,我将关闭这一点,设置显示模式对话框,并重新打开。
首先,我会选择加载到我目前的工作会议的数据帧中的一个:to_austin。
如果我点击验证选择变量下拉,我会看到所有可用列,并选择我要哪一个。我会继续他们所有现在,并单击选择。
现在,我有我的拖放和拖放界面。比方说,我想通过载体来看待到达延迟。我把OP_CARRIER在X框和Y框ARR_DELAY。通过B6的方法是捷蓝航空,DL是台达和WN是西南地区。这可能是更容易一些,看看我做了填充颜色的载体也。
嗯。捷蓝具有最低的平均航班延误,但一对夫妇相当惊人的异常值。我不知道那些是哪个航班吗?我可以X值从载体改变航班号,通过载波仍然着色。
哎呀,这是飞行,我想带,1039我在周三飞,所以也许在周中的数据比较好?见数据面板在底部
Tt为我提供了筛选数据的选项。
我要去看看刚刚在周三
好多了。也许我会采取在所有这一切飞行。
让我们看看《爱斯基摩人》的其他选择。我可以改变我的轴标题与标签和标题
我可以改变我的调色板和主题的阴谋选项,也可以移动或删除的传说。我将把调色板改为我最喜欢的调色板之一,Dark 2。
然后玩弄一些主题。
即使你真的很舒服创建图表通过编写代码ggplot,这是看颜色调色板和主题有什么不同看你的图形的好方法。
现在这个插件有一个很酷的部分。如果我选择Export & Code,我有生成ggplot图的R代码。如果在script中单击Insert code,代码将出现在RStudio中光标最后出现的地方。或者,更安全的方法是,单击“复制到剪贴板”,关闭外接程序,然后将代码复制到我的脚本中。
如果我想要一个从奥斯汀返回的航班平均延误的柱状图,我需要对数据进行一些预处理,比如这里。
然后,我会选择在ggplot建设者外接的avg_delay数据帧。
瞧,一个柱状图。
如果想要一个柱状图,其中从低到高排序,我可以自己动手通过添加ggplot代码重新排序,或者在原始数据中创建有序因子。这对于猫来说很容易做到:
在最后几行中,我使用forcats as_factor()来创建一个新因子,然后根据AvgDelay的值对它进行重新排序。现在…
瞧,有序的柱状图。
这是它为这个情节,感谢收看!对于以上R提示,头向多与R视频网页在go.infoworld.com/morewithR。这是HTTPS去点InfoWorld的点com削减更多的与R,除了R.或全部小写,您可以在“做更多的R”播放列表添加到您的YouTube库。这么久了,希望看到你下一集!