こんにちは。KIYONOエンジニアの平田です。
前回の記事(BQMLを使って顧客分類をやってみた(エンジニア編))に引き続き、顧客分類に関する情報をお伝えいたします。
前回の記事では、GA4のデータ✖️BigQueryMLで顧客のページ閲覧パターンを分類しました。
今回は「結局、機械学習した後にどう分析すれば良いの?」にお答えしたいと思います。
初めてこの記事を読んでいる方はぜひ前回の記事BQMLを使って顧客分類をやってみた(エンジニア編)から読んでいただくことをお勧めします。
サマリー
- 機械学習の後は一般的な指標と組み合わせて傾向を確認しよう
- 分析の後は”分析の結果”を伝えるのではなく”分析のゴールに対する答え”をお伝えしよう
対象者
マーケター/分析者
以下を調べている方を対象としています。
- 自社のサイトに来る人はどういう使い方をしているのか?
- リテンションレートの高い人たちはどういった使い方をしているか
分析のゴール
ここでも改めて、今回の分析のゴールをおさらいします。
ゴール:GA4のデータを使って訪問ユーザーのアクセスページパターンを分析し、訪問回数が多い人はどんな記事を閲覧しているか?
前の記事では、BigQuery MLを使ってページごとのPV数を使ってユーザーを3パターンにクラスタリングしました。
今回は、そのクラスタの行動の違いを分析したいと思います。
分析の内容
「KMEANSでクラスタリングを実行した後に何を見るか」
分析の目的によって異なりますが、まずは一般的な指標を確認することをお勧めします。
1. 一般的な指標
一般的な指標を確認することで、以下のことがわかりました。
❶ ユーザーが一番多いクラスタは「3」であり、全体の98%を占めている。
❷ 「1,2」は一人当たりの訪問回数、一人当たりのセッション数が多い。
ユーザーの比率から見ても、1,2は何かしらの特徴があるユーザー群、3は一般的なユーザー群であることが想定されますね。
2. クラスタ1,2の深掘り
それでは、クラスタごとにどのページを閲覧しているのか、全体と比べて確認しましょう。
ここからわかることは
- ページAは全体で最もPV数の多いページであり、クラスタ3がよく閲覧している
- ページBは全体で3番目にPV数が多いページである。
- ページBはクラスタ2によく閲覧されている。
- ページCはクラスタ3によく閲覧されている。
※ページA,B,Cは機械学習の結果クラスタの特徴的なPVとして判断されている
今回はページA,B,Cについて具体的な内容はご提示できないため、簡単なページ概要を紹介します。
ページA:一般的かつエンジニア寄りな記事
ページB:初学者向けコンテンツ
ページC:かなりインフラに寄った具体的な技術紹介記事
3. 考察
前段の情報をもとに、今回分析したサイトの特徴を整理していきます。
- 圧倒的にページAを閲覧する一般ユーザーが多い。
これまでの分析の結果をまとめると「一人1回、ページAを訪れるユーザー」が全体の9割以上を占めていることがわかりました。
次に、
2. 初学者向けコンテンツであるページBを読んでいるユーザーがおり、ユーザーは1割未満と少ないものの、一人当たり2日程度訪問している。
3. インフラエンジニア向けコンテンツであるページCを読んでいるユーザーがおり、ユーザーは1割未満と少ないものの、一人当たり2日程度訪問している。
上記2つがわかりました。
分析の結果(よくある間違った伝え方)
今回の結果を受け、このような報告を耳にする機会があります。
なるほど!
では今回の分析の結果は
- 圧倒的にページAを閲覧する一般ユーザーが多い。
- 初学者向けコンテンツ/インフラエンジニア向けコンテンツを閲覧する少数のユーザーがいる
と言うことですね!
うーん確かに発言の内容に誤りはないですが、、、
これをクライアント様にそのまま伝えた場合、分析の結果としてこれは「良くない報告の例」になります。
確かに今回の分析のゴールは
「訪問回数が多いユーザーはどんな記事を閲覧するか」
とは記載されていますが、
本質的に明らかにしたい題目は「どうすればユーザーの訪問回数を上げられるか?」です。
それでは、以下に正しい分析の結果をお伝えします。(具体的な数値の明言は避けていますので、その点はご了承ください。)
分析の結果(正しい伝え方)
分析の結果、ユーザーの継続率を向上させるにおいて理想である状態と現状に不足している要素が大きく2つあります。
- 新規獲得
- 継続率向上のための方針
❶ 新規獲得
「ページAはほぼ全てのユーザーが訪れている一方、一般的なサイトの閲覧数と比較するとPV数はかなり少ないです。今回のテーマは「ユーザーの継続率を向上させる」でありますが、そもそも訪問者数が少なすぎるためこのサイトを十分に機能させるのに必要な母数が足りていないと考えられます。」
と私なら言うかもしれません。
もちろん、サイトの特性やサイト運営に関する費用対効果によっては結論は変化しますので明言はできませんが、一般的なサイトのPVから考えても年間5000PVは少なすぎます😭
まずはしっかり数を確保しましょう!
PV数から見るにページAがユーザーの入り口となっているので、ページAの「コンテンツ・汎用性」を軸に記事を拡張すると良いでしょう。
❷ 継続率向上のための方針
機械学習をした結果、求められる記事の傾向が「初学者向け or インフラエンジニア向け」の記事であることがわかりました。
とはいえそもそものPV数がかなり少ないので、「ページAからの送客のための導線」は早めに用意したいですね。
また、「初学者向け or インフラエンジニア向け」の記事以外にも様々な記事はあるようですが、傾向としてはあまり好んで閲覧されてはいないようです。
「初学者向け or インフラエンジニア向け」の記事以外の記事を拡張することは優先度を落としてみても良いと思います。
- 流入を担うページAを活かした導線作り
- 対象を定めたコンテンツの拡充による継続率向上
2つを掛け合わせましょう
まとめ
いかがだったでしょうか。前回の記事と合わせて以下の内容について解説しました。
- BigQuery MLを使ったクラスタリング
- クラスタリングを使った分析結果の解説
- 分析結果の正しい伝え方
分析者はエンジニアとしてデータを解析する役割と、クライアントに情報を伝えるデータの翻訳家としての2つの役割があります。
いかに正確な予測や分類ができてもクライアント様に伝わらなければ意味はなく、それまでの努力が無駄になります。
「機械学習した後にどうすればいいの?」
この後の作業は単純で、これまで見てきた指標と組み合わせてその背景を考察するだけです。
本当に難しいのは「いかにアクションにつながる表現ができるか」ですね。
終わりに
2022年にUAからGA4に移行され、お客様からGA4のデータを使ったマーケティング支援をお求めいただく機会が増えてきました。
GA4では無料でデータを出力する機能があります。まだGA4を十分に使えていない方、ある程度GA4を使っているけれどこれといった分析ができていないと感じる方はぜひ我々にご相談ください。
コメント