数あるAlteryx Predictive Toolsで何を使えばいい??~「教師あり学習」と「データの概要把握」のことを少しだけ~~ロジスティック回帰と決定木のことについて~

Alteryxには、予測に関するツール(Predictive Tools)が多く用意されています。
どのツールを使うのが適切なのか? 専門家に聞いてみたいと思うのではないでしょうか。
本ブログでは、決定木分析と重回帰分析の概要と、どのように活用しているかを概要にはなりますがご紹介します。

こんにちは。Saoriです。

処理アイコンをドラッグ&ドロップし、線でつなげていくことで「ワークフロー」という処理の履歴を構築し、
再生ボタンを押すことで、処理が実行できるため、とても分かりやすいのが強みの統計ツールである”Alteryx”。

AlteryxDesignerのPredictiveツールを使って予測統計(予測分析)をしたいが、具体的にはどう使うのか?
と疑問に思うこともあると思います。
私も、どのツール(予測モデル)を使えばいいのかわからず、ちょっと調べてみたもののドツボにはまり結果何もできずじまい・・・という事が多々ありました。

今日は弊社のデータアナリストAさんが、今回は決定木分析と重回帰分析をどう活用しているのかついてご説明します。

※今回ご紹介するワークフローの画像はAlteryxDesigner 2020.3 英語版 を利用しています。

数あるAlteryx Predictive Tools 何を使えばいい??

概要と利用場面

まず最初に、予測することのゴールとそれを使う施策について、ご説明します。
予測する際には、どの分析手法を使うか?予測値を出すことよりもゴールや施策、つまり課題と解決したいことについて
考えることが大事だと思ってます。

【ゴール】
教師ありの学習モデル(目的変数と説明変数を利用)を構築し、算出されたスコアを利用して施策に落とし込むこと。

※教師ありの学習モデル・・・・予測や学習をさせる際に「答えや正解」を与えて学習させることを言います。

 

【施策】
・離反者を予測して説明変数から裏付けられた施策を打つ
・売上の予測を行い、目標に達していない場合、効率の良い活動を説明変数から裏付けられた施策を実行する
・ロイヤリティの高い顧客を予測して施策を打つ

※離反者・・・残念ながらお客様にならなかった方々の事

 

では、今度は皆さんに質問です。

目的変数はどういったものになるか何かイメージ付きますでしょうか。

目的変数とは、求めたいゴールです。
予測する対象であったり、予測したい値 と考えるとイメージがしやすいかもしれません。

具体的には 売上目標であったり目標コンバージョン数をイメージします。
そういった数値を総称してKGI(Key Goal Indicator の略 最終的なゴールの指標)を目的変数することが多いです。

なお、説明変数は、
1つのKGIに対して、複数の要因(KPI:Key Performance Indicators の略 個別の指標)があるとします。
その複数の要因が説明変数となります。

ではその目的変数と説明変数を使って決定木分析、重回帰分析を行うのはなぜでしょうか?

【決定木分析を行うことで得られること】
KGI(KPI)の値を分割するための役立つ変数を大まかに捉えます。
予測の側面では、グループ単位でスコアを算出します。

【重回帰分析を行うことで得られること】
どの変数がどの程度KGI(KPI)に影響を与えているか捉えます。
予測の側面では、計算式に基づくスコアを算出します。
( モデル式のイメージ y=b1X1 + b2X2 ・・・ + b0 )

片方だけではぼんやりでしか分からないため、両方行うことでより角度の高い予測が出来るようになると今は思っていただければと思います。

利用場面

それでは決定木分析、重回帰分析の利用する場面を紹介します。

決定木分析の利用する場面

■利用場面
決定木分析では、目的変数を分割するため、有効な説明変数を抽出する場合に利用します。
出力結果に重要な説明変数が出力されます。
その説明変数と目的変数の散布図で確認すると関係性が良く分かります。

数表、図などで確認後に関係性がありそうな、説明変数をKPIと定めるなどの対応が可能です。

*** 決定木分析ワークフローとアウトプット***

Model Summaryに重要な説明変数とその条件が出力されます。

ワークフローの説明など、詳しい説明は後日、別記事でご紹介します。

重回帰分析の利用する場面

重回帰分析では、目的変数を説明変数で説明するモデル式が出力されます。
目的変数に説明変数がどの程度影響しているのか?重要度を数値で表すことができます。
複雑なモデル式となった場合、シンプルに重要度の高い説明変数だけでモデル式を作成し直すなどモデル式の調整も可能です。
もし、組織を動かすモデル式とする場合には極力シンプルな式にするなどの対応が必要なケースもあります。
なお、決定木分析と同様に散布図で確認すると関係性が良く分かります。

※Alteryx では重回帰分析を行う際、線形回帰ツール Alteryx アイコン 画像 Predictive関連線形回帰分析にステップワイズツール Alteryx アイコン 画像 Predictive関連ステップワイズ分析を使って分析します。

 

*** 線形回帰分析のワークフローとアウトプットサンプル***

こちらも、ワークフローの説明など、詳しい説明は後日ブログで解説します。

まとめ

今日は予測統計をするにあたってのとっかかりになればいいなと思い記事を書きました。

いかがでしたでしょうか?
弊社Aさんは「抽象的な説明ではないでしょうか?」 と不安になっておりましたが、データ予測が初心者マークのSaoriにはとても分かりやすくイメージがつきました。
どのアルゴリズムを使ったらいいかとつい考えがちですが、そうでは無くて目的や施策が大事なんですよね。数値を出せばいいってもんじゃないんだなという事にも気づかされました。

AlteryxDesignerは、Predictiveツールを置くだけで分析することが出来ます。
今回の記事を参考に、KPI・KGIを決めていただき、
皆様が持っているビジネス上の課題について解決する糸口となれば幸いです。

ありがとうございました。


今日のような基礎的な分析の他、データ分析に関わる高度な分析も長年行っております。
データに関するお悩みや課題がありましたら、お気軽にご連絡頂ければと存じます。

Alteryx(アルテリックス)を14日間無料でご体験いただけます。
TableauやSalesforceとの連携についても、体験期間でご確認いただけます。
トライアル期間中もサポートいたします、ご不明な点がございましたらお気軽にお問い合わせください。
14日間のフリートライアルはこちらから

Alteryx(アルテリックス)のお見積りや、その他データ分析に関するご相談は「問い合わせページ」にて承っております。お気軽にご相談ください。
お見積もり依頼などのご相談はこちらから

 

関連記事

  1. リリース情報(Alteryx Desinger 2018.3)|Pyt…

  2. 【事例紹介】Alteryxを使った激戦区調査(地図分析)

  3. コマンドラインを使ってAlteryxを動かしてみる

  4. Alteryx Community イメージ画像

    【Alteryx Community】のご紹介

  5. データ民主化とAlteryx

  6. Alteryx機能紹介 Preparation(準備)

フリートライアル(14日間の無料試用)