Alteryxを活用したデータ分析の大まかな流れ・手順・方法を解説

Alteryx Designer はデータ分析に関わる工程すべてを完全に網羅する「すばらしい」と思わせるツールです。
ここだけの話ですが、ある企業様が有名な分析ツールからの乗り換えを検討している際に比較検討のお手伝いをしました。
その際にAlteryxを使ってみて、ホントに優れたツールだと感心しました。
「すばらしい」と思ったので、今ではAlteryxの正規代理店を行っています。

さて、本ブログでは、データ分析の大まかな流れ・手順・方法とそれに対応するツールを紹介したいと思います。

こんにちは、PR担当Saoriです。

AlteryxDesignerとは・・・
セルフサービスで高度なデータ分析が可能なプラットフォーム。
プログラミング言語を使うことなく、アイコンをドラッグ&ドロップし、つなげていくことで集計や、統計解析・機械学習も行うことが出来る
データ分析ツールです。

今回は、データ分析の大まかな流れと、手順及び方法、また、それに対応するAlteryxDesignerのツールをご紹介します。
ステップは下記の通りとなります。
※クリックすると別ブラウザで開きます。



▼【データ分析5つのステップ】

  1. ・ ① データ収集(入力)
  2. ・ ② データ整形(加工)
  3. ・ ③ 基礎集計(変数作成・集計)
  4. ・ ④ 深堀分析(モデル構築・予測など)
  5. ・ ⑤ レポーティング(共有など)
  6. ・ ⑥ 番外編:高速で各ステップができることが重要

① データ収集(入力)

データに必要な情報を収集します。

データ分析で大事なことは、ミスが起きないようプロセスを単純にすることです。
そのためには、一つの分析ツールですべてのインプット情報を読み込むことが重要です。
Alteryxでは85種のデータソースに繋ぐことが可能です。
(詳細はこちらを参照ください Alteryx公式HELPページへ行きます。)

——————–(入力)に関する主なツール ——————–
Input Data Tool データ入力ツール Alteryx アイコン画像 InputData(データ入力)ツール
Alteryx Designerへデータを取り込むツールです。
xlsx,csv,json,sas7bdat,txt,zip,xml,各種DB(Oracle/MySQL/等)などの接続が可能です。

Connect In-DB アイコン画像Connect In-DB(接続 In-DB)ツール
Alteryx Designerへデータを取り込むツールです。ワークフロー内でデータベース内の接続をする点で先ほどのデータ入力ツールと異なります。
AlteryxDesignerのIn-DB機能とは・・・事前にDB内で処理をしてから出力することで、ローカルPCへの負荷の削減や、処理時間の短縮を実現します。

また、AlteryxDesignerはAPIを使ったデータ取り込みが出来ます。
・Salesforceとの連携
・Microsoftサービスとの連携(One Drive/Azure など)との連携
・Googleサービス(Analytics/MAP/Bigquery/Sheets など)との連携
・その他APIサービスとの連携(Downloadツールを利用)

主なツールをいくつかご紹介します。 どのツールも、AlteryxDesigner内に簡単にデータの取り込みが出来るようになります。
一度データを取得しcsvなどに保存して・・・とすることなく取り込める点が大変便利です。
Alteryx Google Analytics ツール アイコン 画像Google Analytics (Googleアナリティクス)ツール
Alteryx GoogleBigQuery出力ツールGoogle BigQuery Input/Output(GoogleBigQuery入力/出力)ツール
GoogleSheetsInputTool Alteryx アイコンGoogle Sheets Input/Output Tool(GoogleSheet入力/出力)ツール
SalesforceOutputTool Alteryx アイコンSalesforce Input/Output Tool(セールスフォース入力/出力)ツール
Alteryx Download Tool ダウンロード ツール アイコン 画像 2019.1 開発社Download(ダウンロード)ツール
APIを使ってのデータダウンロードやwebスクレイピングが可能です。
また、よく使われる サービスについてはツールとなって提供してくれています。

APIとは?やその他ツール、使い方に関しての詳細はこちらの記事(データ連携に便利なAPI Alteryxで使えるツールの紹介)をご覧いただければ幸いです。

▲目次にもどる

② データ整形(加工)

集めたデータを結合して意味を持たせます。また、データを分析可能な状態にします。

データを収集しただけでは分析できません。生データに区分値(マスタ)を結合して意味を持たせることが必要です。
また、データ欠損はどの程度存在するのか、データの分布はどのようになっているのか確認を行います

——————–(加工)に関する主なツール ①データの状況を把握する——————–
Browse(閲覧)ツール
AlteryxDesignerのバージョンが2020.1以降の方であれば、データを取り込んだ後こちらのツールを接続いただければ
簡単にデータの内容を確認することが出来ます。

Summarize サマライズ Tool Alteryx アイコン画像Summarize(集計)ツール
Alteryx Excel 関数 一覧 対比 Field Summary Tool フィールドサマリー ツール アイコンField Summary(フィールドサマリー)ツール
BasicDataProfile_基本データプロファイルツール AlteryxBasic Data Profile(基本データプロファイル)ツール

これら3つのツールも、データの概要を知ることが出来ます。
それぞれのツールで確認出来る内容は以下です。参考にされてください。
Alteryx基礎統計一覧ツール

——————–(加工)に関する主なツール ②データを加工する——————–
Select Tool Alteryx アイコン画像Select(セレクト)ツール
データのフィールド選択/順番変更/フィールド名変更/データ型変更
データ型の変更を行うことが出来るツールです。
Sort Tool Alteryx アイコン画像Sort(ソート)ツール
データの並べ替えを行います。
Filter フィルタ Alteryx toolFilter(フィルタ)ツール
条件を指定して抽出します。
JOIN(結合)ツール
共通のフィールドまたはレコード位置に基づいて、2つのデータセットを結合します。
※LEFT JOINを行う場合はUNION(ユニオン)ツールを後続に接続して使います。
DataCleansing データクレンジング Alteryx アイコンDataCleansing(データクレンジング)ツール
Nullや不要な空白の削除、0への変換等、データを集計・分析するにあたっての不要な文字をいくつかのパラメータを使って一括で修正にします。
Summarize サマライズ Tool Alteryx アイコン画像Summarize(集計)ツール
テーブルのキーの確認や、区分値の値確認に利用します。
RecordID レコードID Alteryx ツール アイコンRecord ID(レコードID)ツール
連番振り当てをするためのツールです。

▲目次にもどる

③ 基礎集計(変数作成・集計) 

仮説から検討した変数を作り、基本となる項目とのクロス集計を実施します。
また、仮説で設定した値との相関を確認することで関連性を確認します。

Alteryx Designerはデータ加工に特化したツールといっても良いと考えています。
データ分析のステップの中で時間を要するのが(② データ整形(加工) / ③ 基礎集計(変数作成・集計) )となっています。
Alteryx Designerでは簡単にデータ加工・集計できるだけでなく、加工集計と同時にデータの中身が分かるようになっています。
ぜひ使って体験してください!

——————–(変数作成・集計)に関する主なツール——————–
Summarize サマライズ Tool Alteryx アイコン画像Summarize(集計)ツール
キー項目別の最大値、最小値など集計を行います。
Formula 式 フォーミュラ ツール Alteryx アイコンFormula(フォーミュラ)ツール
SQL構文、VBAのような関数が使えます。 非常に使いやすいですが、多少の関数知識は必要です。しかし、HELPページで関数の使い方と例が書いてありますし、
弊社のブログExcelユーザーのためのAlteryx関数変換表ExcelユーザーのためのAlteryx関数変換表2や、
他社様のブログなど、具体的な使い方についてはインターネット上に多くありますので是非探してみてください。
CrossTab クロスタブ Alteryx ツール アイコンCrossTab(クロスタブ)ツール
Transpose 転置 Alteryx ツール アイコンTranspose(転置)ツール
データを縦持ちや横持ちにするためのツールです。店舗別や顧客別などの集計では必要になってきます。
はじめは難しく感じますが、すぐ慣れます。

▲目次にもどる

④ 深堀分析(モデル構築・予測など)

Predictive Tools を利用することで、データを要約することができます。

・データを機械学習により分類するクラスタリング(多変量を利用した閾値の検討)
・上位顧客の判別スコアの算出するスコアリング(多変量を利用したスコアリング・モデリング)などでは、
良い状態(条件)をモデル化することが出来るため、傾向把握が可能です。
使い方によって未来の予測も可能です。

——————–(モデル構築・予測など)に関する主なツール ——————–
Alteryx Decision Tree 決定木 予測 Predictiveツール アイコン 画像Decision Tree(決定木)ツール
 結果が分かりやすいため、傾向把握に適しています。
Alteryx ロジスティック回帰 Logistic Regression 予測 Predictiveツール アイコン 画像Logistic Regression(ロジスティック回帰)ツール
良い・悪いを判別するのに適しています。 例:Aさんは将来優良顧客となる可能性が〇%ある。等々。
Forest Model Tool フォレストモデル ランダムフォレスト アイコン alteryxForest Model(ランダムフォレスト)ツール
アンサンブル学習により精度の高い結果を導くことができます。※場合によっては、精度が出ないこともあります。
・・・ その他モデルはこちらの記事(Alteryx機能紹介 Predictive(予測))をご覧ください。

▲目次にもどる

⑤ レポーティング(共有など)

データ分析から得られた結果などをレポーティングします。

分析結果を共有し、施策などに落とし込む必要があります。
弊社では、初回の分析では、出力結果をExcelやパワーポイントでレポートすることが多いです。
会議で報告し、今後の活用イメージを共有し、価値あるアウトプットと認められてから、
データ生成の自動化、tableauなどの可視化ツールへの直接アウトプットを検討するのが良いと考えています。

——————–(レポーティング)に関する主なツール——————–
レンダリング ツール RenderRender(レンダリング)ツール
Alteryx Designerを使って集計したデータの結果をPDF、HTML、XLSX、DOCXなどの形式でレポートとして出力します。

Microsoft Power BI Tool Publish to Power BI Tool Alteryx アイコンMicrosoft Power BI (Publish to Power BI)(PowerBIへの公開)ツール
Power BI REST APIを使用して、AlteryxワークフローからPower BI Webアプリケーションにデータテーブルをアップロードします。

Publish to Tableau Server Alteryx ToolPublish to Tableau Server(Tableau Serverへの公開)ツール
AlteryxのデータストリームをTableauのデータソース(.tde)ファイルとしてTableauのインスタンスに公開します。

▲目次にもどる

(番外)高速で各ステップができることが重要

仮説・検証のスピードを上げることが重要です。

データ分析を行う際に、データ収集やデータ加工・集計に時間が掛かってしまうと仮説を検証できる数も減ってきてしまいます
そのため、データを扱うスピードは重要です。
当然、CSV形式データから読み込んだ、Alteryx形式のデータセットも高速に処理できます。
また、すべてインメモリで実行されるため、非常に高速です。
また、幾つかのDB(Oracle,MySQL,Amazon Redshift,PostgreSQL等)では、In-DBという技術が使えるため、DBからデータを取得するのにも時間を要しません。

▲目次にもどる

まとめ

最後に、Alteryx Designerは非常に使いやすく、ミスを減らすことができ、処理速度も速い、「すばらしい」分析ツールです。
皆様のデータ分析業務の役に立つと考えています。
導入検討の際は、ご説明にあがりますので、下記ボタンから、お問い合わせページへ飛んでいただき、ご連絡いただければと存じます。

TOP画像はyacco_photoさんによる写真ACからの写真を利用させていただきました。

Alteryx(アルテリックス)を14日間無料でご体験いただけます。
TableauやSalesforceとの連携についても、体験期間でご確認いただけます。
トライアル期間中もサポートいたします、ご不明な点がございましたらお気軽にお問い合わせください。
14日間のフリートライアルはこちらから

Alteryx(アルテリックス)のお見積りや、その他データ分析に関するご相談は「問い合わせページ」にて承っております。お気軽にご相談ください。
お見積もり依頼などのご相談はこちらから

 

関連記事

  1. 事例|Alteryxを使った働き方改革(ルーチンワーク自動化)

  2. Alteryx 全種類 機能説明 TOP画像

    Alteryx機能紹介 In-DB(データベース入力)

  3. Alteryx Excel Convet

    ExcelユーザーのためのAlteryx関数変換表2

  4. リリース情報(Alteryx Desinger 2020.2)

  5. Google Maps APIを使い、住所から緯度経度を取得しAlte…

  6. Alteryx アイキャッチ画像

    Alteryx ロードショー & ユーザーグループ会参加レポート

フリートライアル(14日間の無料試用)