09 April 2011

GA是被广泛用来测量和评估网站的分析工具之一。GA团队努力让它更简单更直观。但是,你可能仍会感到使用GA的初始功能有一些局限性。

如果是这样的话,你应该学习一下正则式以及如何在GA中使用正则式。

什么是正则式?

在计算机科学中,正则式(正则表达式)是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。(以上内容引自百度百科

为什么要在GA中使用正则式?

正则式是强大的模式匹配工具,利用正则式可以完成许多常规查询无法完成的任务。例如利用默认过滤器查找百度和Google的流量、重写URI、过滤IP段、创建复杂的高级细分……以及其他你能想到的奇妙功能。

GA中哪里可以使用正则式?

据我所知,目前GA(不是指测试中的新版本)中可以使用正则式的地方主要有报告列表中的默认过滤器及高级过滤器(是的,报告列表中的查询条件是正则式,如果你需要查找的内容包含元字符,而你的查询条件未使用转义符将其转义,那么你很可能看不到想要的条目)、目标及渠道设置(你会发现正则式匹配有时比前向匹配、完全匹配更加方便快捷)、高级细分(高级细分支持更复杂条件及布尔逻辑,即使没有正则式,通过多个条件的组合查询也可以获得想要的结果,但是正则式的使用能给你更大的灵活性)和过滤器(过滤器的查询也是正则式模式,正则式+过滤器可以完成非常奇妙的作用,比如重写URI,内容分组、关联电子商务订单与具体的流量来源等)。

注:元字符是指在正则式中有特殊含义的字符。比如“.”可以匹配任意一个字符,而“+”可以匹配一个或多个它之前的那个字符。转义符是指“”,在元字符前使用转义符可以将元字符转化为普通字符,比如“?”匹配的是“?”。

如何学习正则式?

相信您和我一样也不是技术出身,对我们而言,能够理解正则式的基本原理,可以编写和测试一些简单的正则式就OK了。因此,让我们看一些例子,进行一些自己的尝试,并且最终理解和书写自己的正则式。

对于正则式,你不使用它的话,不会真正理解它;没有真正理解它,也无法使用它。因此,你应该学一点使用一点。

对于正则式,还有一点,你会发现每一个元字符都很简单。但是,将它们放在一起会变得有些复杂。因此每学习一点,就应该进行一些练习,犯一些错误是正常的。给大家推荐一个正则式测试的小软件http://www.weitz.de/regex-coach/

这篇文章就到这吧,我会在以后的系列文章中介绍一些GA常用的正则式。如果您对正则式在GA中的应用有任何疑问可以给我留言。



分享到: 更多
友荐云推荐