実演|Alteryxへの様々なデータ取り込み(BigQueryなど)

Alteryxは91種ものデータを取り込むことが出来ます。
その中から、
・複数ファイルの一括読み込み
・Google BigQuery
・Google Analytics
・Google ドライブ

からの取り込み実演を行ってみます。

こんにちは、PR担当Saoriです。

”Alteryx”(アルタリクス)は、処理ツールをドラッグ&ドロップをし、複数つなげていくことで「ワークフロー」
という処理の履歴を構築し、再生ボタンを押すことで、処理が実行できるため、とても分かりやすいのが
強みの統計ツール。

ETLツールとしてAlteryxを検討されている場合、
データの取り込みのしやすさについては気になるところかと思います。
Alteryxを日々使っているのですが、本当にデータの取り込みがしやすいです。
その使いやすさを実感いただきたく、
今日はさまざまなデータ取り込みの方法をご紹介します。

▼目次

データ取り込みのしやすさ紹介① 複数ファイルの一括同時取り込み

Alteryxは、”同形式の多量ファイル”についても一括で簡単に取り込むことができます。
例えば、「Data_YYYYMMDD.xls」のような、「毎日、データが日別に出力される」場合などに大変有効です。

この機能は大変便利です!

一括データ取り込み 実演

今回はcsvファイルを取り込みます、Alteryxが取り込める拡張子であればどれでも取り込み可能です!

Input Data Tool (データ入力ツール) をAlteryxのキャンバス上にドラッグ&ドロップします。
Input Data Tool データ入力ツール Alteryx アイコン画像 

取り込んだ後、Configuration画面(設定)画面で何のファイルを取り込むか。
について指定をします。
Alteryx Input Data データ入力 一括取り込み設定画面1

その後、ワイルドカードを入れます。
今回は日付の末尾を ”*”とし、5月のみのデータを取り込みたい。としてみました。
Alteryx Input Data データ入力 一括取り込み設定画面2

【ワイルドカード解説】
全てのもしくは一部のパターンにマッチする文字列を意味する特別な記号のことです。
Alteryxでは、
”*” 長さ0文字以上の任意の文字列、
“?” 長さ1文字のみ任意の文字列

と規定されており、
“7?*”や”?9??”という 組み合わせ利用も可能です。

count_2018-05-*.csv と指定しました。
では実行ボタンを押してみます。
AlteryxのResult(結果)画面では取り込めているようです。

Alteryx Input Data データ入力 一括取り込み設定画面3

取り込めたデータを見てみます。
想定していたファイルのみが、取り込まれていました。
このように、フィールド名が同じで内容の異なる複数のファイルでしたら、
データ部分のみが結合され、この先の集計が大変扱いやすくなります。
Alteryx Input Data データ入力 一括取り込み設定画面3

ワイルドカードを指定することで、Alteryxは効率よく簡単にデータを取り込むことができます。

▲目次にもどる

データ取り込みのしやすさ紹介② Google BigQuery

GoogleBigQueryからもデータが取り込めます。

Google BigQueryからのデータ取り込み実演

事前にODBCドライバツールをインストールいただき、設定をしていただきます。
(リンクはこちらです。)
※ODBCドライバのインストールと接続方法は後日ご紹介します。

Input Data Tool (データ入力ツール)
Input Data Tool データ入力ツール Alteryx アイコン画像 
を使いAlteryxのキャンバスへドラッグ&ドロップします。

次に、取り込むデータを選択する際にODBCを選択します。
Alteryx Input Data Google Big Query 接続方法1

事前に接続設定をしているので、
あとはGoogle BigQueryを選択するのみ!です。
事前にODBCドライバにてキーを入力し、接続確認をしているのでIDとPASSの入力は不要です。
Alteryx Input Data Google Big Query 接続方法2

選択すると、プロジェクトとテーブルが見れるようになりますので、ドラッグ&ドロップし、必要なデータをチェックして選択します。
こちらもSQL文を書かずに、ドラッグ&ドロップで
Alteryx Input Data Google Big Query 接続方法2
なお、ビジュアルクエリビルダ を使っており、こちらもドラッグ&ドロップでテーブルを取り込み、チェックでフィールドの選択が可能です。
またSQL文を直接書くことも可能です。
(BigQueryは通常と異なり、通常書いている文法通りにはいかない現状があります。こちらは今後に向けて改善中!と本国より聞いています)

そして実行を押すと無事データが取り出せます!
(今回は秘匿情報にあたるため、写真がありません。)

SQLが苦手な私は、SQL文を(作ってもらい)Alteryxで翻訳し、
どうなっているか中身を理解したうえで、
Alteryx上にワークフローとして落とし込むという、方法を取っていました。
SQLが得意でないという方でも、ちょっと遠回りですがそういう方法もあります!!!!!

▲目次にもどる

データ取り込みのしやすさ紹介③ Google Analytics

ツール(マクロ)を使えばAlteryxへGoogleAnalyticsの集計もAlteryxに取り込むことが出来ます。

Google Analytics集計 実演

GoogleAnalyticsツールを利用します。
Alteryx Google Analytics ツール アイコン 画像

こちらをAlteryxにドラッグ&ドロップして取り込むと、2方法での接続設定が選べます。
・都度ログインが必要なオンライン
・APIの情報を使い、定期実行が可能になるオフライン
Alteryx Google Analytics ツール サインイン画面

今回は簡単なオンラインで集計してみます。
ログイン画面に遷移しますので、ID(Gmailアドレス)とパスワードを入力します。
Alteryx Google Analytics ツール サインイン画面 オンライン

ログイン後は、どのサイトに関する集計か、を選択します。
Alteryx Google Analytics ツール 選択画面

次は日付の範囲を指定。
Alteryx Google Analytics ツール 日付選択画面

ディメンションとマトリクスを設定して
Alteryx Google Analytics ツール マトリクス選択画面
Alteryx Google Analytics ツール ディメンション選択画面

セグメントも指定可能です!
Alteryx Google Analytics ツール セグメント選択画面

最後に何を見るかを確認することもできます。
Alteryx Google Analytics ツール 選択サマリー画面

実行を押すと・・・・

集計結果が出てきます。(数字は秘密にさせてください)
Alteryx Google Analytics ツール 結果画面

すごく簡単ですね、この先にツールをつなげて集計をすることももちろん可能です。

▲目次にもどる

データ取り込みのしやすさ紹介④Google Drive(スプレッドシート)

都度都度、PCにダウンロードして作業をするというのは面倒ですね。
その作業が不要になります。
今回は例として
・各部署ごとの交通費データ【excel形式】
・Google ドライブにスプレッドシート形式として保存(または日々更新されている)
部署コードと部署の一覧表
を付け合せ(検索置換)してみたいと思います。

Google Drive(スプレッドシート)取り込み実演

GoogleSheetsInput Tool(Google Sheets入力ツール)を使います。
Alteryx GoogleSheetsInput ツール アイコン画面
ドラッグ&ドロップをし、
・Googleアカウントのアカウント情報を使用してログインするユーザーログイン
・APIを利用した開発者ログイン
Alteryx GoogleSheetsInput ログイン画面

どちらかを選択します。
今回は簡単なオンラインで接続します。
IDとPASSを入力します。

あとはスプレッドシートの情報を取り込んでくれるので、
必要なシート名を選択し
Alteryx GoogleSheetsInput シート選択画面

必要なテーブル名を選択すれば、
Alteryx GoogleSheetsInput テーブル選択画面

簡単に取り込めます。
Alteryx GoogleSheetsInput 出力結果画面

その後、別で取り込んでいた各部署ごとの交通費データを取り込みます。
念のためデータ形式を選択ツールで確認の上、探索変換ツールで置換します。
(FindReplace 探索変換ツールは、”文字型”でないと検索・置換が出来ません。)

結果、ちゃんと置換が出来ています!!
Alteryx GoogleSheetsInput FindReplace 付け合せ結果画面

今回、作成したワークフローはこちらになります。
Alteryx GoogleSheetsInput FindReplace 付け合せワークフロー画面

部署がころころ変わる会社などで、他部署が一括管理をしている場合、
都度連絡して情報を取得するというのは不便ですよね。
スプレッドシートが閲覧できている、など前提条件は必要ですが、
直接接続できることで手間が省けて便利!だと思います。
▲目次にもどる

データ取り込みについてご紹介しました。
特に私は一括取り込みをよく使います、これは本当にお勧めです!

Alteryx(アルタリクス)を1か月間無料でご体験いただけます。
2018年7月より対応した日本語版での体験も可能です。
また、トライアル期間中もサポート対応実施中!ご不明な点にお答えします。
1か月間のフリートライアルはこちらから

説明会(質問会)も定期的に開催しております。(説明会内容はこちら)今すぐお申込みください。
↓セミナー申し込みはこちらです↓
お申込みページ
「セミナーに関して」にチェックいただきセミナー希望と明記の上お申込みください。

関連記事

  1. Python Tool を使ったLoop処理|Alteryx Desi…

  2. Alteryx入出力対応フォーマット詳細一覧

  3. ビックデータを効率よく抽出し分析する方法 『In-DB処理』

  4. IoT本格時代の膨大なデータをalteryxで整理する(json解析)…

  5. データ分析はじめの一歩①【データ型】

  6. 事例 | Alteryxからメッセージをリアルタイムに投稿する

フリートライアル(1か月間の無料使用)