不开心与谷歌分析界面?我们告诉你如何使用的编程语言如R绕过谷歌分析和检索所需的数据。
谷歌Analytics(分析)是衡量网站使用一个有用的工具 - 从简单的网页浏览到各种复杂的广告活动跟踪营销可能需要的一切。不过,我觉得用户界面是很好,不太理想。好消息是,谷歌Analytics(分析)提供了强大的API,使您能够保存到您的数据编程,这意味着你可以方便的方式,可能不那么容易在网络上做拉和封装数据。
谷歌有教程其中介绍了如何在Java、Python、PHP和JavaScript中使用该特性,但是我更喜欢使用R来进行谷歌分析,这是一种专门为数据可视化和图形化分析而设计的语言。R的版本可用于Windows、Mac OS X和Unix,您还可以获得用于R的附加包,这些附加包可以简化大量的数据工作。如果你想学习R基础知识,请去计算机世界R入门指南。)
您不需要知道R来跟随这里的步骤。事实上,如果您愿意,在提取数据之后,您可以将其保存为CSV文件,以便在Excel中使用。
步骤一:获取[R
首先,如果它不是你的系统上已经下载并从安装RR项目的统计计算网站。当您运行读应用程序,你会看到一个控制台窗口,您可以在文本输入的命令。而且,当然,要确保你有一个谷歌Analytics帐户和一些数据一起工作。
R控制台窗口中,你可以在命令输入。
有几种R封装有专门针对谷歌Analytics(分析)设计的功能,包括ganalytics,RGoogleAnalytics和rga(“R谷歌分析”)。我将在本教程中使用rga,但它们中的任何一个都可以工作。
像ganalytics,RGA驻留在GitHub上。容易地安装任何从GitHub所述谷歌分析软件包,首先安装和装载通过输入以下命令转换为R控制台窗口将R包devtools:
install.packages (devtools)库(devtools)
然后安装和加载rga从包作者BR或Skardhamar的帐户:
install_github( “RGA”, “skardhamar”)库(RGA)
(你只需要每运行一次机器前三个命令,但你需要加载库(RGA)每次打开R.时间)
步骤二:允许RGA访问您的谷歌Analytics帐户
在Mac上,认证是简单:通过键入您的[R控制台窗口下面创建一个谷歌Analytics(分析)API认证对象的实例:
rga.open(例如= “GA”)
这将打开一个浏览器窗口,要求您给予rga权限来访问您的谷歌数据。当您接受时,您将得到一个代码,可以剪切并粘贴回您的R控制台窗口,其中显示“请在这里输入代码”。
在Windows中,我发现在打开rga实例之前添加一行代码可以帮助解决任何身份验证错误:
选项(RCurlOptions =列表(cainfo =执行。系统( “CurlSSL”, “cacert.pem”,包= “RCurl”)))rga.open(例如= “GA”)
接下来,您需要找到您的谷歌帐户的配置文件ID,这是在跟踪代码中没有发现的,您添加到一个网站,以允许谷歌分析监视您的网站。相反,在你的谷歌Analytics管理页面上,去查看设置,你会在“查看ID”下看到ID。
你会发现你的个人资料的ID为您的谷歌帐户转到视图设置您的谷歌Analytics(分析)管理页面上。
或者,运行命令
GA $ getProfiles()
在你的R终端窗口获得所有可用配置文件的列表在你的帐户;配置文件ID将列在第一列中。
无论怎样你找到它,保存在一个变量的值,这样你就不必继续键入它。您可以使用像这样的命令:
id < -“1234567”
(与你的实际ID替换的数量,并确保把它放在引号之间)。此存储您的配置文件ID作为变量“ID”。
步骤3:提取数据
现在,我们已经准备好开始使用拉我们刚刚创建的GA比如有的数据。GetData方法实际上会从您的谷歌Analytics帐户提取数据,然后可以在另一个新的R变量存储。如果你想看到你的GA对象的所有可用的方法,运行:
ga getRefClass美元()
您可以查询谷歌API以获得度量和维度。指标包括页面访问量、访问量和有机搜索;维度包括流量来源和访问者类型等信息。(见谷歌的尺寸和度量参考完整的细节。)
此外,可以通过标准的集中查询像搜索访问,与转换次数(假设你已经设定了在谷歌Analytics(分析)事前),甚至参观刚刚从片,通过在一个查询段。最后,你也可以创建自己的过滤器缩小搜索结果。
谷歌的查询浏览器可以帮助你找出哪些数据可用,以及如何构建一个查询。
谷歌已经创造了一个查询浏览器的谷歌Analytics(分析)API。这是一个巨大的资源来帮助你弄清楚哪些数据可用,以及如何构建一个查询。如果你是新来的谷歌Analytics(分析)API,玩弄查询浏览了一下,看看有什么数据可以解压,你需要拉你想要的数据变量。在条款使用了各种查询更多相关信息,可用API文档。
一旦你决定你想要什么在查询中包括,这是一个使用R键获取数据的语法:
$getData(id,开始)日期= " ",结束。date="", metrics ="", dimensions ="", sort ="", filters ="", segment ="", start = 1, max = 1000)
当然,您需要在各种引号之间为特定的查询填写信息。注意,日期的格式是yyyy-mm-dd,比如“2013-10-30”。
这里有一个具体的例子:说我想看到的十大引荐的访问我的网站在九月。我的开始日期是9月1日,我的截止日期是9月30日我的指标是考察 - 所谓的“GA:探访”由API - 和我的尺寸是它们的来源 - 被称为“GA:来源。”
我将进一步细化查询得到我的前10个推荐人:
$getData(id,开始)日期=“2013-09-01”,结束。date="2013-09-30", metrics =" ga:visits", dimensions =" ga:source", sort =" -ga:visits", start = 1, max = 10)
下面是查询的明细:
- GA $的getData在使用我が谷歌Analytics(分析)API的访问对象的GetData方法。
- 第一个参数id是我的帐户的配置文件号,我已经将其存储在一个名为id的变量中。
- 接下来是我查询的开始和结束日期,然后是我想要的度量(“ga:visits”))。
- 因为我想知道由源的访问,我指定的尺寸作为“ga.source”。
- 我只希望在排名前10位的引荐,所以我需要排序的GA:考察结果降序排列。我做的下一行通过将在GA的前面减号:设置排序标准时访问。
- 最后,我特别要求从第一个结果开始,最多返回10个清单。
结果存储在变量myresults。类型
myresults
在R终端窗口的R提示符处,查看返回了哪些数据。
从查询检索的网站的排名前10位的引荐的结果。
如果我想看看访问的总体数量没有打破下来的来源,我将不包括尺寸,排序,启动或最大的查询。相反,我只是用一个简单的:
myresults < - ガ$的getData(ID,start.date = “2013年9月1日”,end.date = “2013年9月30日”,指标= “GA:访问”)
返回一个每天的访问数量的上市。我可以把它加入我的选择的时间维度返回按不同时间段的结果 - 通过周例如:
$getData(id,开始)日期=“2013-09-01”,结束。日期=“2013-09-30”,度量=“ga:访问量”,维度=“ga:周”)
或者,我可以得到每月一整年页面访问量:
<- ga$getData(id,开始。日期=“2013-01-01”,结束。date="2013-12-31", metrics =" ga:pageviews", dimensions =" ga:月")
您可以寻求在同一时间超过一个指标:
myresultsPVsVisits < - ガ$的getData(ID,start.date = “2013-01-01”,end.date = “2013-12-31”,指标= “GA:访问次数,GA:网页浏览”,尺寸=“GA:月”)
(对于那些知道R并习惯使用R的concatenate c()函数组合项的人,在组合ga$getData查询中的项时不使用该函数。)
只想看到来自,比如说,谷歌新闻每月今年互访?添加过滤器,如
myresultsGNvisits < - GA $的getData(ID,start.date = “2013-01-01”,end.date = “2013-12-31”,指标= “GA:探访”,过滤器=“GA:源=〜新闻.google.com”,尺寸= “GA:月”)
我使用=~而不是==,因为后者会将过滤器设置为那些完全等于news.google.com的引用。通过使用=~操作符,它使用了更强大的功能正则表达式搜索,在这种情况下将匹配包含news.google.com什么。(正则表达式允许更健壮模式的搜索。)
和以前一样,对于这些查询,类型
myresults
(或适当的结果变量)在您的R窗口的提示中查看返回了什么。
查询已细化到显示,从谷歌新闻来每个月一年的访问。
步骤4:操作数据
现在,你有你的数据,你还能做什么呢?
如果你不是的R发烧友,最简单的就是将结果保存到CSV文件。的r write.csv()函数,你想保存,然后将文件名列表第一。到myresults变量保存到一个名为data.csv,类型的文件:
写。csv (myresults、文件= "数据。csv”,row.names = FALSE)
可选row.names = FALSE消除了行号一个额外的列,只是为了保持整洁的文件。生成的文件看起来是这样的(但希望有更多的访问):
“月”、“访问”“01”,625年“02”,790年“03”,395年“04”,219年“05”,927年“06”,151年“7”,231年“08”,244年“09”,231
然后,您可以在您选择的电子表格或绘图程序中使用这些数据。
您还可以分析R内数据对的,当然,没有出口到电子表格。让我先拉了一些真实的数据 - 访问和页面访问量 - 从个人网站,我几年前,我不再倾向于但是仍然得到稀客设置:
MYDATA < - ガ$的getData(ID,start.date = “2013-01-01”,end.date = “2013-12-31”,指标= “GA:访问次数,GA:网页浏览”,尺寸=“GA:月”)
每月浏览网站的数据。
您均可以使用的STR()函数来找出MYDATA对象是如何构成的。
这显示了mydata对象的结构。
像上面的其他结果,它与字符串作为月份数和号码为数据的R数据帧。这使得它容易运行简单的分析和生成基本图表内R,如
barplot(mydata$visits, main=" month by month", xlab=" month",姓名。arg = mydata美元月,拉斯维加斯= 1,坳=彩虹(9))
您可以生成R内基本图形,比如这一个,这表明访问每个月站点的数量。
上述用途将R barplot()命令用于将图表的y轴的访问次数轴值(可以参考一个特定的列与所述语法dataframename $ COLUMNNAME的数据帧),并作为names.arg在x轴的名称。该命令主要指定的图形标题,xlab是x轴标签和col =彩虹(9)告诉R键选择从它的彩虹色调色板九种颜色来着色条。的不直观的命令拉斯= 1告诉r,以设置两个x轴和y轴标签水平地(0使得它们平行于轴线,2垂直于轴线,和3个垂直)。
欲了解更多关于自R的数据帧创建图表,请参阅我们的文章“初学者指南R:无痛数据可视化。”
结论
谷歌Analytics(分析)是一款功能强大的工具,但Web界面并不总是易于浏览。如果您想了解更多可自定义的工具来提取数据 - 和数据的请求更容易自动化 - 考虑使用与谷歌Analytics(分析)API的编程方法。如果你还没有为API工作最喜欢的语言,R是一个不错的选择。
本文,如何提取从谷歌Analytics(分析)自定义数据,最初发表于Computerworld.com。
莎朗·马克利斯是在线管理在Computerworld主编。她的电子邮件地址是smachlis@computerworld.com。您可以按照自己的Twitter@ sharon000, 上Facebook的, 上Google+的或订阅她的RSS频道:文章|博客。看到更多信息由Sharon Machlis在Computerworld.com报道。
阅读更多关于商业智能/分析的内容在Computerworld的商业智能/分析主题中心。
这个故事,“如何从谷歌Analytics(分析)中提取自定义数据”最初发表计算机世界 。