如何提取从谷歌Analytics（分析）自定义数据

您可以使用像R这样的编程语言来绕过谷歌Analytics Web界面来检索您想要的数据。这是一个循序渐进的。

执行编辑，数据和分析，计算机世界 |

不开心与谷歌分析界面？我们告诉你如何使用的编程语言如R绕过谷歌分析和检索所需的数据。

谷歌Analytics（分析）是衡量网站使用一个有用的工具 - 从简单的网页浏览到各种复杂的广告活动跟踪营销可能需要的一切。不过，我觉得用户界面是很好，不太理想。好消息是，谷歌Analytics（分析）提供了强大的API，使您能够保存到您的数据编程，这意味着你可以方便的方式，可能不那么容易在网络上做拉和封装数据。

谷歌有教程其中介绍了如何在Java、Python、PHP和JavaScript中使用该特性，但是我更喜欢使用R来进行谷歌分析，这是一种专门为数据可视化和图形化分析而设计的语言。R的版本可用于Windows、Mac OS X和Unix，您还可以获得用于R的附加包，这些附加包可以简化大量的数据工作。如果你想学习R基础知识，请去计算机世界R入门指南。)

您不需要知道R来跟随这里的步骤。事实上，如果您愿意，在提取数据之后，您可以将其保存为CSV文件，以便在Excel中使用。

步骤一：获取[R

首先，如果它不是你的系统上已经下载并从安装RR项目的统计计算网站。当您运行读应用程序，你会看到一个控制台窗口，您可以在文本输入的命令。而且，当然，要确保你有一个谷歌Analytics帐户和一些数据一起工作。

R控制台窗口中，你可以在命令输入。

有几种R封装有专门针对谷歌Analytics（分析）设计的功能，包括ganalytics，RGoogleAnalytics和rga(“R谷歌分析”)。我将在本教程中使用rga，但它们中的任何一个都可以工作。

像ganalytics，RGA驻留在GitHub上。容易地安装任何从GitHub所述谷歌分析软件包，首先安装和装载通过输入以下命令转换为R控制台窗口将R包devtools：

install.packages (devtools)库(devtools)

然后安装和加载rga从包作者BR或Skardhamar的帐户:

install_github（ “RGA”， “skardhamar”）库（RGA）

（你只需要每运行一次机器前三个命令，但你需要加载库（RGA）每次打开R.时间）

步骤二：允许RGA访问您的谷歌Analytics帐户

在Mac上，认证是简单：通过键入您的[R控制台窗口下面创建一个谷歌Analytics（分析）API认证对象的实例：

rga.open（例如= “GA”）

这将打开一个浏览器窗口，要求您给予rga权限来访问您的谷歌数据。当您接受时，您将得到一个代码，可以剪切并粘贴回您的R控制台窗口，其中显示“请在这里输入代码”。

在Windows中，我发现在打开rga实例之前添加一行代码可以帮助解决任何身份验证错误:

选项（RCurlOptions =列表（cainfo =执行。系统（ “CurlSSL”， “cacert.pem”，包= “RCurl”）））rga.open（例如= “GA”）

接下来，您需要找到您的谷歌帐户的配置文件ID，这是在跟踪代码中没有发现的，您添加到一个网站，以允许谷歌分析监视您的网站。相反，在你的谷歌Analytics管理页面上，去查看设置，你会在“查看ID”下看到ID。

你会发现你的个人资料的ID为您的谷歌帐户转到视图设置您的谷歌Analytics（分析）管理页面上。

或者，运行命令

GA $ getProfiles（）

在你的R终端窗口获得所有可用配置文件的列表在你的帐户;配置文件ID将列在第一列中。

无论怎样你找到它，保存在一个变量的值，这样你就不必继续键入它。您可以使用像这样的命令：

id < -“1234567”

（与你的实际ID替换的数量，并确保把它放在引号之间）。此存储您的配置文件ID作为变量“ID”。

步骤3:提取数据

现在，我们已经准备好开始使用拉我们刚刚创建的GA比如有的数据。GetData方法实际上会从您的谷歌Analytics帐户提取数据，然后可以在另一个新的R变量存储。如果你想看到你的GA对象的所有可用的方法，运行：

ga getRefClass美元()

您可以查询谷歌API以获得度量和维度。指标包括页面访问量、访问量和有机搜索;维度包括流量来源和访问者类型等信息。(见谷歌的尺寸和度量参考完整的细节。）

此外，可以通过标准的集中查询像搜索访问，与转换次数（假设你已经设定了在谷歌Analytics（分析）事前），甚至参观刚刚从片，通过在一个查询段。最后，你也可以创建自己的过滤器缩小搜索结果。

谷歌的查询浏览器可以帮助你找出哪些数据可用，以及如何构建一个查询。

谷歌已经创造了一个查询浏览器的谷歌Analytics（分析）API。这是一个巨大的资源来帮助你弄清楚哪些数据可用，以及如何构建一个查询。如果你是新来的谷歌Analytics（分析）API，玩弄查询浏览了一下，看看有什么数据可以解压，你需要拉你想要的数据变量。在条款使用了各种查询更多相关信息，可用API文档。

一旦你决定你想要什么在查询中包括，这是一个使用R键获取数据的语法：

$getData(id，开始)日期= " ",结束。date=""， metrics =""， dimensions =""， sort =""， filters =""， segment =""， start = 1, max = 1000)

当然，您需要在各种引号之间为特定的查询填写信息。注意，日期的格式是yyyy-mm-dd，比如“2013-10-30”。

这里有一个具体的例子：说我想看到的十大引荐的访问我的网站在九月。我的开始日期是9月1日，我的截止日期是9月30日我的指标是考察 - 所谓的“GA：探访”由API - 和我的尺寸是它们的来源 - 被称为“GA：来源。”

我将进一步细化查询得到我的前10个推荐人:

$getData(id，开始)日期=“2013-09-01”,结束。date="2013-09-30"， metrics =" ga:visits"， dimensions =" ga:source"， sort =" -ga:visits"， start = 1, max = 10)

下面是查询的明细：

GA $的getData在使用我が谷歌Analytics（分析）API的访问对象的GetData方法。
第一个参数id是我的帐户的配置文件号，我已经将其存储在一个名为id的变量中。
接下来是我查询的开始和结束日期，然后是我想要的度量(“ga:visits”))。
因为我想知道由源的访问，我指定的尺寸作为“ga.source”。
我只希望在排名前10位的引荐，所以我需要排序的GA：考察结果降序排列。我做的下一行通过将在GA的前面减号：设置排序标准时访问。
最后，我特别要求从第一个结果开始，最多返回10个清单。

结果存储在变量myresults。类型

myresults

在R终端窗口的R提示符处，查看返回了哪些数据。

从查询检索的网站的排名前10位的引荐的结果。

如果我想看看访问的总体数量没有打破下来的来源，我将不包括尺寸，排序，启动或最大的查询。相反，我只是用一个简单的：

myresults < - ガ$的getData（ID，start.date = “2013年9月1日”，end.date = “2013年9月30日”，指标= “GA：访问”）

返回一个每天的访问数量的上市。我可以把它加入我的选择的时间维度返回按不同时间段的结果 - 通过周例如：

$getData(id，开始)日期=“2013-09-01”,结束。日期=“2013-09-30”，度量=“ga:访问量”，维度=“ga:周”)

或者，我可以得到每月一整年页面访问量：

<- ga$getData(id，开始。日期=“2013-01-01”,结束。date="2013-12-31"， metrics =" ga:pageviews"， dimensions =" ga:月")

您可以寻求在同一时间超过一个指标：

myresultsPVsVisits < - ガ$的getData（ID，start.date = “2013-01-01”，end.date = “2013-12-31”，指标= “GA：访问次数，GA：网页浏览”，尺寸=“GA：月”）

(对于那些知道R并习惯使用R的concatenate c()函数组合项的人，在组合ga$getData查询中的项时不使用该函数。)

只想看到来自，比如说，谷歌新闻每月今年互访？添加过滤器，如

myresultsGNvisits < - GA $的getData（ID，start.date = “2013-01-01”，end.date = “2013-12-31”，指标= “GA：探访”，过滤器=“GA：源=〜新闻.google.com”，尺寸= “GA：月”）

我使用=~而不是==，因为后者会将过滤器设置为那些完全等于news.google.com的引用。通过使用=~操作符，它使用了更强大的功能正则表达式搜索，在这种情况下将匹配包含news.google.com什么。（正则表达式允许更健壮模式的搜索。）

和以前一样，对于这些查询，类型

myresults

(或适当的结果变量)在您的R窗口的提示中查看返回了什么。

查询已细化到显示，从谷歌新闻来每个月一年的访问。

步骤4:操作数据

现在，你有你的数据，你还能做什么呢？

如果你不是的R发烧友，最简单的就是将结果保存到CSV文件。的r write.csv（）函数，你想保存，然后将文件名列表第一。到myresults变量保存到一个名为data.csv，类型的文件：

写。csv (myresults、文件= "数据。csv”,row.names = FALSE)

可选row.names = FALSE消除了行号一个额外的列，只是为了保持整洁的文件。生成的文件看起来是这样的（但希望有更多的访问）：

“月”、“访问”“01”,625年“02”,790年“03”,395年“04”,219年“05”,927年“06”,151年“7”,231年“08”,244年“09”,231

然后，您可以在您选择的电子表格或绘图程序中使用这些数据。

您还可以分析R内数据对的，当然，没有出口到电子表格。让我先拉了一些真实的数据 - 访问和页面访问量 - 从个人网站，我几年前，我不再倾向于但是仍然得到稀客设置：

MYDATA < - ガ$的getData（ID，start.date = “2013-01-01”，end.date = “2013-12-31”，指标= “GA：访问次数，GA：网页浏览”，尺寸=“GA：月”）

每月浏览网站的数据。

您均可以使用的STR（）函数来找出MYDATA对象是如何构成的。

这显示了mydata对象的结构。

像上面的其他结果，它与字符串作为月份数和号码为数据的R数据帧。这使得它容易运行简单的分析和生成基本图表内R，如

barplot(mydata$visits, main=" month by month"， xlab=" month"，姓名。arg = mydata美元月,拉斯维加斯= 1,坳=彩虹(9))

您可以生成R内基本图形，比如这一个，这表明访问每个月站点的数量。

上述用途将R barplot（）命令用于将图表的y轴的访问次数轴值（可以参考一个特定的列与所述语法dataframename $ COLUMNNAME的数据帧），并作为names.arg在x轴的名称。该命令主要指定的图形标题，xlab是x轴标签和col =彩虹（9）告诉R键选择从它的彩虹色调色板九种颜色来着色条。的不直观的命令拉斯= 1告诉r，以设置两个x轴和y轴标签水平地（0使得它们平行于轴线，2垂直于轴线，和3个垂直）。

欲了解更多关于自R的数据帧创建图表，请参阅我们的文章“初学者指南R：无痛数据可视化。”

结论

谷歌Analytics（分析）是一款功能强大的工具，但Web界面并不总是易于浏览。如果您想了解更多可自定义的工具来提取数据 - 和数据的请求更容易自动化 - 考虑使用与谷歌Analytics（分析）API的编程方法。如果你还没有为API工作最喜欢的语言，R是一个不错的选择。

本文，如何提取从谷歌Analytics（分析）自定义数据，最初发表于Computerworld.com。

莎朗·马克利斯是在线管理在Computerworld主编。她的电子邮件地址是smachlis@computerworld.com。您可以按照自己的Twitter@ sharon000，上Facebook的，上Google+的或订阅她的RSS频道:文章|博客。看到更多信息由Sharon Machlis在Computerworld.com报道。

阅读更多关于商业智能/分析的内容在Computerworld的商业智能/分析主题中心。

这个故事，“如何从谷歌Analytics（分析）中提取自定义数据”最初发表计算机世界。

加入对网络世界的社有个足球雷竞技app区Facebook的和LinkedIn对最重要的话题发表评论。

莎朗·马克利斯是执行编辑，数据和分析的IDG，她工作在数据分析和内部的编辑工具，除了写作和编辑。她的书适用于大众传播和新闻出版于2018年12月。

IT薪资调查：结果是