データ分析初心者がAlteryxを2年使ってみて

データ分析超初心者が、Alteryxを2年間使い続けて、出来るようになったことと、Alteryxの良い点をご紹介します。

こんにちは、PR担当Saoriです。

”Alteryx”は、処理ツールをドラッグ&ドロップし、
線をつなげていくことで「ワークフロー」という処理の履歴を構築し、再生ボタンを押すことで、処理が実行できるため、
とても分かりやすいのが強みの統計ツール

今日はAlteryxを2年使のい続けて感じたAlteryxの良さや、データ分析初心者がどれだけ出来るようになったかをご紹介します。
Alteryx、とてもいい製品です!

データ分析の超初心者が2年間Alteryxを使って感じた点

2年前のレベル

2年前、メーカーで生産管理の仕事をしていた私はデータ分析の仕事をしたくて、入社をしました。
レベルはこちらです。
・SQLって何。
・Excelは、簡単なピボットと簡単な関数は使える。
・コマンドは “ipconfig /all”  だけたたいたことがある

簡単に言うと素人同然の状態です。

今のレベル

2年間、毎日Alteryxを使ってきました。
レベルはこちらです。
・データ型の違いや集計の基礎が分かる。
・簡単なSQL文なら読める、書ける。
・API、正規表現などのツールやPyhon、Rの言語を抵抗がなく使える。
・コマンドを活用してデータ集計(とエラーチェック)を自動化できる。

広く浅くですが、できることは日々増えています。

Alteryxを使って感じた良い点

ここからは、2年間ほぼ毎日のようにAlteryxを使ってきた担当が感じた良い点をご紹介します。

①早い

Alteryxは、早いです。
行数やデータサイズを気にして仕事をすることが減ります。
また、プレビュー画面の確認することも出来ますし、少量データを流すことやデータのキャッシュも出来ます。
よってひとつの処理に何十分も待つことなく、処理を進めることが出来ます。

 

②データ集計のプロセス毎の進捗確認がしやすい

Alteryxは、データ集計を進めていくにあたり、プロセス毎のデータ内容を細かく確認することが可能です。
データ分析初心者は特にデータの確認をしない傾向があると思います。(エラーにならなければ合ってるだろって思って痛い目を見たこともありました・・・)

例えば、Alteryxのこちらのツールでは、全データに対する処理結果を確認することが出来ます。
フィルタ Filter Tool Alteryx アイコン画像フィルタ(Filter)ツールで”T”と”F”
Unique ユニーク Alteryx アイコン画像ユニーク(Unique)ツールでの”重複”と”一意”で
Join ジョイン Alteryx アイコン画像結合(JOIN)ツールで”LEFT”、”INNER”、”RIGHT”
よって、処理が正しいかどうかを簡単に確認することが出来ます。

↓重複したデータと、一意にしたデータの中身が見えるので、自分の処理が正しかったかどうかの確認がしやすいです。

Alteryx Auto Unique ユニークツール 事例紹介画像

 

③データ分析の仕事の基礎が分かりやすい

Excelを使って仕事をしていると意識しづらい”データ型”
SQLやデータ集計の仕事をすると、つまづくポイントにもなります。
Alteryxは、Select セレクト 選択 ツール アイコン Alteryxセレクト(Select)ツールを使うことで簡単にデータ型を確認することが出来、また型変更も簡単です。

また、AutoField オートフィールド Alteryx アイコンオートフィールド(AutoField)ツールはおくだけでデータ型を最適化してくれますし、
DataCleansing データクレンジング Alteryx アイコンデータクレンジング(DataCleansing)ツールは見えない敵である空白やNull値の置き換えを簡単にしてくれます。

Select セレクト 選択 ツール アイコン Alteryxセレクト(Select)ツールひとつで、データの中身が分かり整理が簡単に出来ます。

Alteryx Select 選択 セレクト 設定画面

 

④他のシステムやプログラムとの親和性が高いので、拡張性が高くスキルアップにつながる

Alteryxは、様々なデータが同じファイルのように扱えます。
どこかにひとつデータがまとまっていればいいのですが、そうもいかないのが現状です。
そのため、多くのデータをいちどcsv(など)に保存してから、データ集計を行うこともあるかと思いますが、Alteryxはその手間が不要です。
Salesforce、GoogleSheet、SharePoint、MicrosoftOffice365、AmazonS3、などのデータを簡単に連携することが出来ます。

 

また、Alteryxは処理を24時間365日行うことも可能です。(DesktopAutomationライセンスが必要)
毎朝、データを集計するようにコマンドラインでバッチを作成し、その結果を別NWへ(FTPへ)連携する、という事をするようになりました。

様々なデータを、様々なツールと連携することを日々行っていった結果、以下のことが出来るようになりました。
・API(SalesforceやGoogleMAPなど)
・GoogleBigQuery
・FTPとの自動連携
・R言語やPythonを使った集計
・正規表現
・コマンドラインを使った処理プロセスのエラーチェックと自動化

Alteryxを軸に、スキルアップが期待できます。

⑤Alteryxを使ってSQLの勉強が出来る。

Alteryxには、In-DB機能(事前にDB内で処理をすることが出来る、ローカルPCへの負荷軽減や処理時間の短縮が出来る機能)があります。
まず、Connect In-DB アイコン画像ConnectIn-DB(接続In-DB)ツールで、データベースとの接続を行います。
このツールはビジュアルクエリエディタを使うことで、クエリが書けない方でもDB接続が簡単に出来てしますのですが、
(下記のように、テーブルを選択後、カラムを選択してデータを取り出します。)
Alteryx In-DB 2 QueryBuilder2 選択画像

実はクエリをそのまま書いても処理が可能です。

Alteryx 接続In-DB クエリ

そのため、超初心者だった私は、

①まずクエリを書いてもらい、
Connect In-DB アイコン画像ConnectIn-DB(接続In-DB)ツールにクエリを貼り付け、
③ビジュアルクエリビルダでクエリの内容を理解し
④Alteryxのワークフローに落とし込む

という作業を繰り返し行い、SQL文の中身を理解していきました。

 

 

⑥再現性が高い

仕事柄、データ抽出(集計)の依頼をもらうことが多いのですが、
それらのデータを一度集計した後、プロセスをまとめておきます。
その後、ある処理方法について以下のようにパッケージ(っぽく)しておけば、
それらをあとは使いまわすことで、t処理時間が早くなっていきます。

↓私はこのように、よく使うものをTool Container Tool ツールコンテナ ツール Alteryx アイコン 画像Tool Container(ツールコンテナ)を使い事前にまとめておき、ワークフローに組み込んでおきます。
別で使うときはこのコンテナをコピー&ペーストして利用します。

Alteryx Findreplace 検索置換ツール データクレンジングツール 事例ワークフロー

 

まとめ

今回は、いちユーザーのリアルな声を書いてみました。

Alteryxは難しいことがなく、高度な分析や大量のデータを処理することが出来ます。
とても便利です。
初心者が学ぶには最適なツールだと思ってます。

なお、Alteryxにはforループや変数などのプログラミングによくある概念があると少しやりづらい点があるようです。
(Alteryxはグローバル変数の概念がない模様)

私にはforループや変数の理解が無かったため、最初のころ会話が成立せず苦労したこともありました。

ですが、データ分析の基礎を学ぶには最適なツールだと思ってます。

是非使っていただきたいと思います。

Alteryx(アルテリックス)を14日間無料でご体験いただけます。
お気軽にご連絡ください。
トライアル期間中もサポートいたします、ご不明な点がございましたらお気軽にお問い合わせください。
14日間のフリートライアルはこちらから

Alteryx(アルテリックス)のお見積りや、データ分析に関するご相談は「問い合わせページ」にて承っております。
お気軽にご相談ください。

お見積もり依頼などのご相談はこちらから

 

関連記事

  1. Alteryxをダウンロードしてみました。【14日間お試しが可能】

  2. Alteryx対応可能ファイルと概要一覧

  3. 事例|Alteryxを使った働き方改革(ルーチンワーク自動化)

  4. Alteryx機能紹介 Parse(解析)

  5. Alteryx 全種類 機能説明 TOP画像

    Alteryx機能紹介 Spatial(空間)

  6. 外部プログラムをAlteryxプロセスとして実行できる!【Run Co…

フリートライアル(14日間の無料試用)