・Googleアナリティクスで正規表現って使えるのかな?
・使い方を教えてほしい!
そんな悩みにお応えします。
Googleアナリティクスで「正規表現一致」という言葉を見たことがある方もいるのではないでしょうか。
正規表現って何?という方も少なくないでしょう。
正規表現とは特定の記号と文字列を組み合わせることで複雑な検索を可能とするものです。
今回はそんな正規表現をGoogleアナリティクスで使用する方法と使える正規表現について解説します。
目次
正規表現とは
正規表現とは先述した通り「特定の記号と文字列を組み合わせることで複雑な検索を可能とする」ものです。
例えば、20220101、20220115、20220216、20220201と文字列が並んでいた時に、202201から始める文字列だけ抽出したい場合は「202201*」と表現することでまとめることができます。
正規表現はGoogleアナリティクスだけでなく、ExcelやWord 等幅広いツールでも使用することができるので覚えておくと便利な時が多々あります。
Googleアナリティクスで使える正規表現とは
ではGoogleアナリティクスで使える正規表現を紹介します。
※Googleアナリティクス4では正規表現の使用はできませんのでご注意ください。
Googleアナリティクスでは下記の正規表現を使うことができます。
. | 任意の 1 文字(文字、数字、記号)に一致します | 「1.」で一致するデータ:10、1A 「1.1」で一致するデータ:111、1A1 |
? | 直前の文字が 0 回または 1 回出現する場合に一致します | 「10?」で一致するデータ:1、10 |
+ | 直前の文字が 1 回以上出現する場合に一致します | 「10+」で一致するデータ:10、100 |
* | 直前の文字が 0 回以上出現する場合に一致します | 「1*」で一致するデータ:1、10 |
| | OR 条件を作成します。 正規表現の末尾では使用しないでください |
「1|10」で一致するデータ:1、10 |
^ | 隣接する文字が文字列の先頭である場合に一致します | 「^10」で一致するデータ:10、100、10x |
$ | 隣接する文字が文字列の末尾である場合に一致します | 「10$」で一致するデータ:110、1010 「10$」で一致しないデータ:100、10x |
() | 囲まれた文字が同じ順序で文字列に含まれる場合に一致します。 他の正規表現をグループ化する場合にも使用します。 |
「(10)」で一致するデータ:10、101、1011 「([0-9]|[a-z])」で一致するデータ:すべての数字と小文字 |
[ ] | 囲まれた文字が任意の順序で文字列に含まれる場合に一致します | 「[10]」で一致するデータ:012、120、210 |
– | 角かっこ内の文字範囲が文字列に含まれる場合に一致します | 「[0-9]」で一致するデータ: 0~9 のすべての数字 |
\ | 隣接する文字を正規表現のメタ文字としてではなく通常の文字として解釈するよう指定します | 「\.」と指定すると、隣接するドットがワイルドカードとしてではなく、ピリオドや小数点として解釈されます。 「216\.239\.32\.34」で一致するデータ:216.239.32.34 |
正規表現についてある程度知見がある方は、知っているものもあるかと思いますが、
初めて触れる方はどういう意味なのか全く分からないでしょう。
使えそうだと思ったものだけ覚えるのがおすすめです。
次の章では具体的にGoogleアナリティクスで正規表現が使える機能と使い方を紹介します。
Googleアナリティクスのどの機能で使えるのか
Googleアナリティクスで正規表現が使えるのは下記の機能です。
・ビューフィルタ
・目標設定(CV)
・セグメント
・ユーザーリスト
・コンテンツグループ
・チャネルグループ
セグメントを正規表現によって絞り込んだり、グルーピングすることができます。
具体的事例については次章で解説します。
正規表現の使い方
今回は下記の2つの正規表現の使い方を紹介します。
①正規表現を使ってデータを絞り込む場合
②IPアドレスを除外する場合
順に解説します。
①正規表現を使ってデータを絞り込む場合
実際にセグメントを作って、データを絞り込む方法を紹介します。
1.ユーザー > 概要 からユーザーサマリーを開きます。
2.ユーザーサマリーを開いたら、「セグメントを追加」から「新しいセグメント」を押します。
3.「新しいセグメント」を押すとユーザー属性などの条件を指定する画面に遷移するため、左下の「条件」をクリックします。
条件画面では
・セッション or ユーザー
・セグメント
・「含む」などの条件
を選択できます。
今回の例では下記のように指定します。
・セッション
・セグメント ⇒ ランディングページ
・正規表現に一致
「正規表現に一致」と書かれたリストの右に入力欄があるため、正規表現を入力します。
例えばページのURLが「/GoogleAnalytics/」から始まるカテゴリの記事だけをピックアップしたい時は入力欄に「^/GoogleAnalytics/」と入力します。
入力後、セグメント名を入力して保存すると正規表現を使用したセグメントの完成です。
レポートを確認するとURLが「^/GoogleAnalytics/」から始まるページのみが抽出されたレポートを見ることができます。
②IPアドレスを除外する場合
先程はレポートを見る際の条件を指定しましたが、フィルタでも正規表現を使用することが可能です。
アナリティクスでは社内や自分、一緒にサイト運営をしているパートナーのIPアドレスを除外する設定が可能です。
除外することで、アクセスに反映されることなく、正確なアクセス解析を行うことができます。
設定方法としては管理 > フィルタからIPアドレスを指定して除外しますが、このIPアドレスも正規表現を使った指定をすることで、特殊な条件に対応することができます。
フィルタ画面より「フィルタの追加」を選択します。
フィルタの種類が「カスタム」となっていることを確認して、次の設定を左から「除外」「IPアドレス」が選択されていることを確認します。
次に入力するフィルタパターンで正規表現の入力が可能です。
例えばIPアドレス「123.456.78.〇〇〇」が付く対象を除外したい場合、「123.456.78.[0-9][0-9][0-9]」と入力します。
上記を設定して保存すれば完了です。
Googleアナリティクスで使える正規表現とは|まとめ
今回はGoogleアナリティクスで使うことができる正規表現について紹介しました。
初めは馴染みがなくて意味が分からないかもしれませんが、正規表現を使うことで特殊な検索条件にも対応ができるということさえ覚えていれば、調べることでいつでも使えます。
一度設定してしまえば後はGoogleアナリティクスが自動的に計測して集計してくれます。
様々な用途に使える設定ですので、ぜひとも覚えておきましょう!