データ分析が、ドラッグ&ドロップ中心で簡単にできる”Alteryx”
マーケティングプランを立てる際や、顧客分析(顧客セグメンテーション)を実施する際によく使われる手法である「RFM分析」
AlteryxDesignerを使った分析ワークフローをご紹介いたします。
こんにちは、PR担当Saoriです。
”Alteryx”は、処理ツールをドラッグ&ドロップし、
線をつなげていくことで「ワークフロー」という処理の履歴を構築し、再生ボタンを押すことで、処理が実行できるため、
とても分かりやすいのが強みの統計ツール
今日はマーケティングを実施するのには欠かせない、顧客分析の手法である
「RFM分析」をAlteryxを使って、分析の流れ(ワークフロー)を作ってみたいと思います。
ワークフローを一度作ってしまえば、データ量が増えても設定を変更する必要はほとんどなく、様々な視点で簡単に分析を行うことが可能になってくると思います。
すごく便利ですので、参考にいただければ幸いです。
※今回ご紹介している設定画面のキャプチャは、 AlteryxDesigner2019.1 日本語版 を利用しています。
利用しているデータは架空のサンプルデータを作成してご紹介しております。
ダイレクト・マーケティングに欠かせない RFM分析とは
RFM分析の説明
R F M は頭文字をとっています。
Recency(最新購買日):直近いつ購入したのか?
Frequency(購買頻度):どの程度購入してくれているのか?
Monetary(購買金額):いくら購入してくれているのか?
この3つの要素の組み合わせで顧客にランク付けを行います。その後比較を行い、顧客の状況を明らかにし、ステータスによって行動を検討し、対応を行っていきます。
RFM分析を行うメリット
顧客セグメンテーションごとに、適切なアクションを行うことが出来るようになります。
例えば
・ダイレクトメールを顧客セグメント別に送付する。
・最も効果が出そうなセグメントのみにカタログを送付する。
・各ブランドごとにRFM分析を行い、傾向を分析する。
等です。
他にも、セグメンテーションごとの顧客ボリュームが分かるため、
・単発購入者が多いのか?
・優良顧客が多いのか?
についての分析を行うのにも適している分析手法かと思います。
RFM分析をするためのワークフロー作成
それでは、ワークフローをご紹介いたします。
①事前準備
まず、分析するためのデータを準備します。
必要最低限必要なデータは、
・お客様が識別できる(会員IDなど)のデータ
・購入した金額
・購入した日付
があれば、AlteryxDesignerを使って基礎集計を行うことが出来ます。
・お客様別の合計購入金額(Monetaryの素)
・お客様別のの購入回数(Frequencyの素)
・お客様別の直近購入日 (Recencyの素)—こちらは算出する日を基準に最終購入日から何日経過しているか?を求めます。
例として、お客様ごとの売上データを使います。
※AlteryxDesignerを使って集計する部分は黄色く枠で囲っています。
では各会員IDごとの必要データを集計するためのワークフローはこちらです。
②基礎集計
まずはデータを分析するために集計を行います。
・Formula(フォーミュラ)ツールを使って合計金額を算出し、
[単価]*[数量] ※[ ] はフィールド名です。
・Summarize(集計)ツールを使って会員IDごとの合計金額、最終購入日、購入回数 を算出します。
・再びFormula(フォーミュラ)ツールを使って、最終購入日から何日経過しているか?を計算します。
関数は具体的にこちらになります。
DateTimeDiff(DateTimeToday(),[Max_購入日],”days”) ※[ ]はフィールド名です。
DateTimeDiff関数:日付Aと日付Bが何日間差があるか?を算出する関数
DateTimeToday関数:今日が何日か?を日付型で計算してくれる関数
これで計算するための基本が完成しました。
※詳しい日数計算方法は過去ブログ(こちら)を参照ください。
③RFM分析の実践(Tileツールを使ったワークフロー)
具体的にR・F・Mを分けていきます。
今回はTile(タイル)ツールを使って分けていきます。
Tile(タイル)ツール
Tile(タイル)ツールは、データの範囲に基づいて値(タイル)を割り当てます。このツールを使うことで、簡単にデータを区分ごとに分けることが出来ます。
<<Tile(タイル)ツールでできること>>
・等しいレコード数
・等しい合計値
・標準偏差に基づくランク付け(スマートタイル)
・マニュアル設定
・固有の値
全部の行数を数えて、等しく分割するために番号を付けて・・・
という手順を踏むことなく、設定した条件によって投入したデータを分けることが出来ます。
Tile(タイル)ツールを使ったワークフロー(設定内容)
では具体的なワークフローをご紹介します。
まず、R・F・MごとにTile(タイル)ツールを使い、区分を分けていきます。
以下のようなワークフローを作ります。
設定方法は簡単です。
・分け方:分割方法を何にするか?(どうやって分けるか?)
・フィールド選択:どのデータを対象にするか?
・出力方法:結果をどのように確認したいか?
をプルダウン形式になっていますので、クリックして設定させるのみです。
今回は標準偏差に基づくランク付け(スマートタイル)を使いました。
★スマートタイルの説明★
指定したフィールドの値の標準偏差に基づいてタイルを作成します。
割り当てられたタイルは、レコードの値が平均範囲内か(=0)、平均を上回るか(1)、平均を下回るか(-1)などを7段階で示します。※AlteryxDesignerのTile(タイル)ツールHELPページより抜粋
「便利に賢く分けてくれる設定」だと理解いただければいいと思います。
出力画面を見てみます。
こちらは、経過日数(R)の出力画面(一部)です。
今回の計算では、直近で来られた方々は8日以内ということになりました。
このように全体のデータを元に、閾値が決まっていくため、戦略設定の際(特に初期)には大変便利かと思います。
★Tile(タイル)ツールで計算後のBrowse(閲覧)ツールからのアウトプット★
なお、
TileSeq……タイル内のレコードの位置のレコード番号
TileNum……全データを元に割り当てられたタイル(スコア)の値
です。
TileNumの区分名称(平均以上か、以下かなど)と根拠がSmartTile_Nameに出力されます。
R・F・Mそれぞれの結果を見るだけでも様々な議論ができそうです。
RFM分析
最後にR・F・Mそれぞれに算出されたスコアを計算し、全体を眺めていきます。
まずは3つの結果をJoin Multiple(複数ジョイン)ツールを使って結合します。
その後、R・F・Mそれぞれに割り当てられたスコアをFormula(フォーミュラ)ツールを使って計算していきます。
今ご説明したワークフローはこちらになります。
最終的に以下のように出力しました。
どういったお客様が来られているのか、または来ていないのかを1つの指標だけでなく、複数の指標で確認することが出来そうです。
最後に、今回ご紹介したワークフローの全体はこちらになります。
★サンプルワークフロー★
まとめ
今回は、RFM分析をAlteryxで実現する方法のご紹介を、Tile(タイル)ツールを使ってご紹介いたしました。
IF文(FormulaツールのIF関数)を使って分類することも可能ですが、今あるデータがどのようになっているか?
という顧客の市況環境を手軽に知るには良い方法ではないかと思います。
この結果を元に閾値を決めていくこともできると思います。
また、結果をTableauやPowerBIなどのBIツールへ出力し、
よりビジュアル化されたデータを見て、会議などで戦略を立てていくことも可能です。
ダイレクト・マーケティングを検討されている方、顧客の状態を分析したい方、
参考にされてください。
※参考:AlteryxCommunity
Alteryx(アルテリックス)を14日間無料でご体験いただけます。
今回のワークフローをそのままご紹介いたします、お気軽にご連絡ください。
トライアル期間中もサポートいたします、ご不明な点がございましたらお気軽にお問い合わせください。
14日間のフリートライアルはこちらから
Alteryx(アルテリックス)のお見積りや、データ分析に関するご相談は「問い合わせページ」にて承っております。
お気軽にご相談ください。
お見積もり依頼などのご相談はこちらから