GA正则表达式regex终极攻略 – Damon Analytics Skip to content

GA正则表达式regex终极攻略

正则表达式(regular expressions)可能让你望而生畏。但真正当你去使用它的时候,你会发现它是多么的强大!这个教程可能会花些时间,但一定值得。

文章来源:https://online-metrics.com/regular-expressions/

正则表达式对营销人员(marketers)和技术导向的人都非常受用。当你设置GA账号和查看报表的时候,正则是你武器库中的一把尖刀。

这个教程简明扼要的讲解了GA中应该如何使用正则。它基本上包含了一切你需要成为GA Regex 大师的要素!

正则表达式综述

GA中总共有13中正则表达式符号,包含了大多数常见的正则表达式。
其中有一些你基本上用不到,但是有部分你可能需要日常使用。

竖线(|)

竖线是最简单的,它代表或(or)

一个例子:


GA-Behaviour-Site Content-All Pages

在这个案例中,我试着匹配两个页面,/ebooks/ 和 /tools/ 。

实际上这里只要url中包含字符串 /ebooks/ 或 /tools/ 都会被筛选出来,例如 /ebooks/Harry-Potter-and-the-Order-of-the-Phoenix 和/tools/hammer 。下面会有如何用正则更准确的匹配url。

点(.)

点匹配任意字符,它更像是一个通配符。

一个例子:

.ide 可以匹配 wide、guide,但是它不能匹配 ide。

星号(*)

它表示前一个字符串的0个或多个。

一个例子:

damo*n 可以匹配damn、damon、damoon、damooon

点星号(.*)

这是一个强大的组合,因为它代表了任意字符串组合。

.* matches everything!

例如如果你要匹配所有漫画书目录下的页面:

try:/comic-books/.*

注意:这个表达式的解析时间很长,因此不要滥用它。

反斜杠(\)

前面介绍了这么多符号,如果你要匹配这些符号呢,例如你要匹配”235.25.128.2″这个IP怎么办呢?

点(.)是匹配任意字符的,怎么去匹配“.”呢?

235\.25\.128 即可,相当于反斜杠(\)是告诉机器,你要把我后面的字符当做普通字符处理。

上标(^)

它表示一段字符串的开头

^book 匹配 books,bookworm,bookcase……

美元符号($)

它表示一段字符串的结尾

book$ 匹配 buybook,sellbook,storybook……

问号(?)

星号(*)代表前一个字符的0个或多个,那么问号(?)代表的是前一个字符的0个或1个。

mar?ks 匹配mars和marks

括号(())

假设你有三个目录列表:

  • /products/men/shirts/
  • /products/women/shirts/
  • /products/children/shirts/

你可以粗暴的应用 .*

^/products/.*/shirts/$

它表示以/products/开头,/shirts/结尾的所有字符串(好好温习一下之前的知识)

但是这样更加精确:

/products/(men|women|children)/shirts/

方括号([])

方括号([])帮助更快的构建列表

r[aei]d 匹配rad、red、rid

短横线(-)

它帮助创建更高级的列表,如纯数字,字母列表,通常与方括号([])搭配使用:

[0-9]

  • [a-z] 匹配所有单个小写字母
  • [A-Z] 匹配所有单个大写字母
  • [0-9] 匹配所有个位数字,0到9
  • [a-zA-Z0-9] 匹配任何单个数字或字母

例如你有这样几款产品,它们的SKU分别是:

  • 11002
  • 11003
  • 11004
  • 11005

1100[2-5]可以匹配以上4款产品

加号(+)

加号(+)表示前一个字符的一个或多个。

bo+k 匹配bok,book,boook

花括号({})

the last one,you made it!

{1,2} 表示前一个“item”至少一次,并且不超过两次

{2}表示前一个“item”重复两次

12[0-9]{3} 匹配12000到12999的自然数。


下面我还会更新一篇正则表达式在GA的具体应用场景,让你的GA应用如虎添翼!

Published inCategorytec

Be First to Comment

发表评论

邮箱地址不会被公开。 必填项已用*标注