GA4とBigQuery!連携について考えてみる

A4とBigQuery!連携について考えてみる

2023年7月に従来の Google アナリティクス (ユニバーサル アナリティクス、以下 UA)でのデータ収集が停止となることが発表されました。また、そのデータの利用についても7月1日以降、少なくとも 6ヶ月間アクセスできることとなっていますが、それ以降の利用は難しくなるものと思われます。
そのため、これまで様子見であった企業も、GA4導入に向けて動き出すことになるかと思われます。また、GA4を活用する中で、BigQueryの活用も合わせて検討する必要が出てくることあるかと思われます。
そこで、本コラムではGA4とBigQueryの連携について考えてみたいと思います。

GA4とは?

GA4とは、Googleアナリティクス 4プロパティの略称で、2020年10月にリリースされた新しいGoogleアナリティクスのことです。
詳細については、別コラム「【2022年版】GA4とは?Googleアナリティクス4プロパティの仕組みを解説」にて説明がありますので、そちらを見ていただければと思います。

BigQueryとは?

BigQueryとは、Google Cloud Platform から提供されているクラウド上のデータベースのことです。
SQLというデータベース言語を使用してデータを扱うことができ、BigQuery ML などの機械学習モデルを使って分析を行うことができます。
数テラバイトや数ペタバイトというビッグデータ出会っても、超高速で解析することができるのが特徴です。

BigQueryを使う際の処理の流れについて

これまでは、以下のように「データ収集」-「データ蓄積」-「データ分析」まですべてGoogleアナリティクスで行ってきたと思います。このため、Googleアナリティクスの中でほぼすべてが完了していたものと思います。
しかしながら、提供されるデータは既に集計されたデータであったため、Googleアナリティクスで提供されるフォーマット以外での分析は難しいものがありました。

GAによるデータ連携の流れ

GA4ではBigQueryへ詳細な明細データをエクスポートすることが可能になりました。その場合、GA4は「データ収集」機能を担い、「データ蓄積」-「データ分析」の部分はBigQueryにて実装することができるようになりました。
蓄積されるデータはイベントごとに発生するデータの明細であるため、訪問者の行動の詳細な行動情報の取得が可能になります。そのため、自分の好きなような集計・分析・解析が行えるようになりました。また、BigQueryにてサポートされている機械学習モデルを使用することで、より高度な分析を行うことも可能となりました。

GA4+BigQueryでのデータ連携の流れ

BigQueryを使うメリット

BigQueryを使うメリットはいくつかありますが、今回はその中で以下の3つに絞ってお話したいと思います。

過去データの保持期間について

これまでのUAでは、データの保持期間は最大50か月でした。しかし、GA4では最大14か月と大幅に短縮されてしまいました。
前述の通り、UAは2023年7月に停止してしまうことが発表されています。そこで、今後はGA4を使っていくことになると思います。そのため、過去データを参照したくても最大で14か月となってしまいます。
これにより、前年同期比や前年比などの14か月以上の過去データとの比較などはGA4の画面では見ることができなくなってしまいます。
しかし、BigQueryへデータを連携しておけば、GA4からデータが消えても、BigQueryのデータは保持されますので、過去データの参照は可能となります。
14か月以上前のデータの参照、比較などを重要視している場合は、BigQueryを使う必要があるかと思われます。

GA4のレポートに実装されていない分析ができる

GA4のレポートは基本的にはUAの流れを汲み、あらかじめ用意フォーマットに基づくデータが表示されています。そのため、明細データを元に自分で分析するのではなく、あらかじめ用意された分析データが表示されています。
GA4のデータをBigQueryにインポートした場合、そのデータはイベントレベルの明細データとなっています。そのため、どのユーザーが、いつ何をした(ページを見た、クリックした、スクロールしたなど)かのデータが1件ずつ蓄積されています。
そこで、これまではできなかった複雑なセグメンテーションでの分析も可能となり、自由な分析を行う事が可能となりました。

BigQueryの機械学習モデルを使用し、より高度な分析が可能になる

BigQueryでは機械学習モデルが導入されています。
これにより、収集したデータの高度な解析が可能になりました。例えば、「特定のアイテムの売上の予測」「顧客のリコメンデーションの分析」「今後のサイトのPV」などを予測することができます。
このような、機械学習モデルを使った高度な分析を行えることがBigQueryを使うメリットの1つだと思われます。

BigQueryを活用するにあたって検討すること

GA4とBigQueryを連携して活用するにあたり、検討すべき点がいくつかあります。以下に、その点についてまとめていきます。

費用について

BigQueryについては、使用が少ない場合は無料でも対応可能ですが、一定のレベルを超えると費用が発生します。費用については、分析料金とストレージ料金の2種類があります。

BigQueryの料金

いずれも、少量であれば無料対応が可能ですので、トライアルする際には、あまり意識しなくてもよいかもしれません。
しかし、データがある程度蓄積され、分析も複雑になった場合、費用が掛かることを認識しておく必要があると思います。

データベースの運用について

BigQueryでのデータ分析においては、SQLというデータベース言語を用いて実施します。
そのため、そのスキルをもった人材がいるのであれば問題ないのですが、そのような事はなかなか難しいと思います。
そこで、「人材を育成する」か「スキルを持った人材を雇う」か「外注に頼む」か、となってくると思います。スキルを持った人材を雇うにしろ、外注に頼むにしろ、判断が難しいと思います。
そこで、まずは自社でトライアルを行い、そこで得た経験を元に検討をすすめるのが良いと思います。

機械学習モデルについて

BigQueryでは、あらかじめ用意された機械学習モデルを用い、高度な分析を行うことができます。
しかし、どのような機械学習モデルを用い、どのような指標を導き出すかという点については、機械学習モデルについての知見がないと難しいところがあります。
そこで、上述の“・データベースの運用“と同様、人材をどうするかという問題が出てきます。
そこで、こちらもネット上の参考事例などを元に自社でトライアルを行い、そこで得た知見を元に検討をすすめるのが良いと思います。

最後に

GA4とBigQueryでは、これまでのような枠にとらわれず、様々なことができることがわかりました。
しかし、実行するには、それなりのスキルが必用になることも分かっています。
今後は、これまで通りのやり方で進める企業と、GA4とBigQueryを活用し、より高度な分析をおこなう企業の2極化が進んでいくのではないかと思われます。
自社のリソースを検討し、今後の方針を検討される際にぜひ参考にしていただければと思います。