免费数据可视化与微软的双向电力:你一步一步的指导

我们会告诉你如何分析与两百多万条记录的美国航空公司航班延误的一个文件,在这个动手与视频教程。

123.4 第3页
第3页共4页

过滤数据

当我在3月份开始使用Power BI时,一个主要缺点是不能向报表、表或切片器添加文本搜索框。如果你要分析很多不同类别的信息,比如美国航班数据,那就得在列表上按顺序滚动数百个城市才能找到圣路易斯,这是相当恼人的。

在6月30日的Power BI桌面软件更新中,你可以在你的报告中添加一个可搜索的切片器,让你更容易在数百(或数千)个报告中找到一个。这一点我稍后会讲。但也有可能您知道列表中的数百项中只有少数项感兴趣,并且您想创建一个仅使用数据子集的报告。

要做到这一点的方法之一是筛选报表到几个关键的类别 - 在这种情况下,可能只显示某些城市已知的兴趣,如您公司设有办事处。

为此,单击画布上的空白区域,然后将DEST_CITY_NAME拖放到报表级别的过滤器上(在这里您可以看到“拖动数据字段”区域)。选择几个城市。如果你继续,我选择了亚特兰大、波士顿、芝加哥、克利夫兰、拉斯维加斯、洛杉矶、新奥尔良、纽约、费城、旧金山、圣何塞、西雅图和华盛顿特区

单击过滤器上的DEST_CITY_NAME标题关闭它。然后对ORIGIN_CITY_NAME做同样的操作——将它拖放到DEST_CITY_NAME过滤器的顶部并选择你想要的城市——你就会得到你主要城市之间的航班信息。

在这一点上,报告本身可能值得注意的是,这些数据现在只针对几个城市。可以通过单击Home ribbon上的文本框按钮向页面添加文本。在画布上按照您想要的方式移动和塑造它,然后编写一些文本说明报告涵盖哪些城市。

现在,我们可以很容易让用户通过添加一对夫妇切片机挑出发地和目的地城市。点击到画布上的空白区域,然后单击切片可视化图标(它看起来像在可视化表图标有点过滤器/漏斗 - 在2016年5月版电源BI的,它是从下可视化最后一个图标第三)。检查ORIGIN_CITY_NAME。现在点击画布上的空白区域再次点击该图标切片机第二次,然后点击DEST_CITY_NAME。周围的画布大小和移动切片机,只要你喜欢。

如果你仍然有足够的城市你的切片机,添加一个搜索框是值得的,请在切片机的右上角的省略号,然后选择搜索。这将文本搜索框添加到切片机。

微软双向电力新切片机搜索

向切片机添加搜索框。

如果文本是小了点,难以阅读,点击每个切片器,然后单击画笔图标,然后选择项目下的一个新的文本大小。正如图中,你可以更改标题,并单击字段,以将其重命名(从比如说,ORIGIN_CITY_NAME到出发城市和DEST_CITY_NAME到Desintation市),并增加标题字体大小。

您现在可能看到了先过滤数据的好处:如果没有页面级过滤器,每个切片器上将有300多个城市需要滚动查看。

最后,看看实际的航班,而不仅仅是航空公司,可能会很有趣。将Airline拖到画布上的一个空点,然后添加FL_NUM。你会有位子的。添加Dep延迟和Arr延迟,然后再次确保将两者从求和更改为平均值(小于值)。将FL_NUM重命名为Flight。您可以通过单击CRS_DEP_TIME并将其添加到表中来添加预定的出发时间。

现在,当您点击切片机中的出发地和目的地城市时,您将看到所有可用的航班以及平均到达和离开延误。如果单击图中一家航空公司的条形图,该表将只显示该航空公司的航班。

(注意:这不是很容易找到,但你可以定制你的页面上的图形如何相互交互。点击一个图形激活它;然后在ribbon上选择“编辑交互”。页面上的其他图形都有一些额外的图标:一个过滤器和一个横线穿过它的圆圈。单击过滤器意味着图形将根据活动图形中发生的情况而改变;点击带有斜线的圆圈表示它不会。)

使用相同的图形并决定使用中值而不是平均值也很容易,因为有些人是不幸的非常航班延误可能会对整体平均水平产生巨大影响。在Excel中,您可以通过单击带有页面名称的选项卡旁边的加号(默认为page 1)向Power BI报告添加页面。

更方便的是,因为我们已经设置了切片器和图形:右键单击页面并复制它。现在很容易点击图表;在Value区域,点击Dep延迟的平均值和Arr延迟的平均值,将它们分别改为中值。如果您要继续下去,您还需要将图表和飞行数据表的标题从平均值更改为中值。

所有这些城市加起来,所有航空公司到达延误的中值都为0或低于0——精灵航空除外。当我看到抵达波士顿的航班时,精灵航空的延误似乎更为明显——不过公平地说,它们可能只是在2015年经历了一个糟糕的夏天,此后情况有所好转。

014 powerbi spiritbostondelays

显示到达波士顿航班的图表。

互动的钻取

对平均延迟是如何按月分解的感兴趣吗?Power BI根据日期字段自动展开,我们可以通过在新页面上创建新的可视化来看到这一点。

再次,右键单击第1页并复制它,单击图形以激活它,然后取消单击Airlines并单击FL_DATE。在图表上你只能看到两个条形图,分别表示到达和离开。

这是因为电力BI默认为按年度绘图,而我们只得到了一年的价值的数据。在轴,您可以点击旁边的年份的X,删除使图形将停止每年汇总(这有点没用这个数据)。现在默认为季度。这同样是不适合这个特殊的四月份数据集多大用处,但让我们假装它是。

要启用Power BI的日期钻取,请单击图右上方的向下箭头。现在,如果你点击第三季度的一条,它会向下钻出显示月份。点击一个月的工具条,它就会放大这个月的天数。

若要回到较大的时间组,请单击图形左上角的向上箭头。请注意,在上下钻取时,将不再影响页面上的其他视觉效果,因此表格上的数据不会改变。

日期钻取对于日期字段是自动的,但是您可以为任何层次结构设置钻取。在第一页上激活图形,然后将FL_NUM拖放到Axis字段上,确保它最终位于Airline的下方。除了出现钻取图标外,图形上似乎没有发生任何变化。

点击在激活钻取顶部右侧的向下箭头,单击航空公司的栏上,你会看到该航空公司的各趟航班的所有数据。同样,因为钻是积极的,你不会看到桌子上的任何变化。如果您希望能够手动过滤表中特定的航空公司,而这是怎么回事,你可以暂时增加航空公司的页面级过滤器或添加第三个限幅器的航空公司。

单击左上角的向上箭头返回原始图形,如果仍被选中,再次单击向下箭头以禁用钻取功能,图形将像以前一样工作。

如果要更改该页上图形的标题,请再次激活该图形,单击可视化面板上的画笔图标,然后单击标题。

对于最后一步,您可能希望将页面选项卡从“page 1”和“Duplicate of page 1”重命名为更有意义的内容。这与Excel中的工作方式不同——不是右键单击一个选项卡,而是需要双击选项卡的名称。

在Power BI中可以生成更多的可视化。除了可视化面板中的所有图标(包括树图和实际地理图)之外,还有其他图形可供从自定义图像画廊。如果您找到一个您喜欢的,请从图库下载它,然后使用Visualizations面板中最后一个图标旁边的省略号导入它。你必须将它单独导入到任何你想要使用它的报表中。(你可以找到一个最近由微软研究院创建的自定义视觉效果的例子在这里)。

有很多其他的方式来可视化这些数据,如寻找与理由拖延列,但现在我会继续前进。

(继续下一页]

有关:
123.4 第3页
第3页共4页
IT薪资调查:结果在