正则表达式(regular expressions)可能让你望而生畏。但真正当你去使用它的时候,你会发现它是多么的强大!这个教程可能会花些时间,但一定值得。
文章来源:https://online-metrics.com/regular-expressions/
正则表达式对营销人员(marketers)和技术导向的人都非常受用。当你设置GA账号和查看报表的时候,正则是你武器库中的一把尖刀。
这个教程简明扼要的讲解了GA中应该如何使用正则。它基本上包含了一切你需要成为GA Regex 大师的要素!
正则表达式综述
GA中总共有13中正则表达式符号,包含了大多数常见的正则表达式。
其中有一些你基本上用不到,但是有部分你可能需要日常使用。
竖线(|)
竖线是最简单的,它代表或(or)
一个例子:

GA-Behaviour-Site Content-All Pages
在这个案例中,我试着匹配两个页面,/ebooks/ 和 /tools/ 。
实际上这里只要url中包含字符串 /ebooks/ 或 /tools/ 都会被筛选出来,例如 /ebooks/Harry-Potter-and-the-Order-of-the-Phoenix 和/tools/hammer 。下面会有如何用正则更准确的匹配url。
点(.)
点匹配任意字符,它更像是一个通配符。
一个例子:
.ide 可以匹配 wide、guide,但是它不能匹配 ide。
星号(*)
它表示前一个字符串的0个或多个。
一个例子:
damo*n 可以匹配damn、damon、damoon、damooon
点星号(.*)
这是一个强大的组合,因为它代表了任意字符串组合。
.* matches everything!
例如如果你要匹配所有漫画书目录下的页面:
try:/comic-books/.*
注意:这个表达式的解析时间很长,因此不要滥用它。
反斜杠(\)
前面介绍了这么多符号,如果你要匹配这些符号呢,例如你要匹配”235.25.128.2″这个IP怎么办呢?
点(.)是匹配任意字符的,怎么去匹配“.”呢?
235\.25\.128 即可,相当于反斜杠(\)是告诉机器,你要把我后面的字符当做普通字符处理。
上标(^)
它表示一段字符串的开头。
^book 匹配 books,bookworm,bookcase……
美元符号($)
它表示一段字符串的结尾。
book$ 匹配 buybook,sellbook,storybook……
问号(?)
星号(*)代表前一个字符的0个或多个,那么问号(?)代表的是前一个字符的0个或1个。
mar?ks 匹配mars和marks
括号(())
假设你有三个目录列表:
- /products/men/shirts/
- /products/women/shirts/
- /products/children/shirts/
你可以粗暴的应用 .*
^/products/.*/shirts/$
它表示以/products/开头,/shirts/结尾的所有字符串(好好温习一下之前的知识)
但是这样更加精确:
/products/(men|women|children)/shirts/
方括号([])
方括号([])帮助更快的构建列表
r[aei]d 匹配rad、red、rid
短横线(-)
它帮助创建更高级的列表,如纯数字,字母列表,通常与方括号([])搭配使用:
[0-9]
- [a-z] 匹配所有单个小写字母
- [A-Z] 匹配所有单个大写字母
- [0-9] 匹配所有个位数字,0到9
- [a-zA-Z0-9] 匹配任何单个数字或字母
例如你有这样几款产品,它们的SKU分别是:
- 11002
- 11003
- 11004
- 11005
1100[2-5]可以匹配以上4款产品
加号(+)
加号(+)表示前一个字符的一个或多个。
bo+k 匹配bok,book,boook
花括号({})
the last one,you made it!
{1,2} 表示前一个“item”至少一次,并且不超过两次
{2}表示前一个“item”重复两次
12[0-9]{3} 匹配12000到12999的自然数。
下面我还会更新一篇正则表达式在GA的具体应用场景,让你的GA应用如虎添翼!
http://xzh.i3geek.com
Be First to Comment