データソース:元データを指定する
データソースとは何か?
データソースとは、データを取り込む元となる生データのことです。(「ソース(Source)」は出所の意味)
Power Queryは、以下のプロセスでデータをExcelに内部に取り込みますが、データソースの指定はこの最初のステップになります。
データソースの指定
↓
加工
↓
Excelにインポート
Excelでは以下のメニューから選択します。
データ ⇒ 取得と変換 ⇒ 新しいクエリ
データソースの種類
新しいクエリをクリックするとデータソースを選択することができます。
データソースの種類には以下のものがあります。
ファイルから
おそらく一般的な業務ユーザーにはもっとも使用頻度が高い選択肢で、物理的なファイルを選択します。
ブックから
単一のExcelファイルからデータを取り込みます。Excelファイルはその中に複数のシートを持っていますので、①ファイルを選び、②シートを選ぶという2段階のプロセスになります。
CSVから
社内システムから出力される形式ではもっともポピュラーな「,(カンマ)」区切りのデータです。
なお、区切り記号はカンマに限らず、スペースやコロン、そのほか任意の文字を指定できます。
取り込みに当たっては、①文字コードの指定、②区切り記号の指定がキーポイントになります。
XMLから
XML形式のファイルを取り込みます。
テキストから
区切り記号が「タブ」になっただけで、実は「CSVから」と同じ動作です。
フォルダーから
これは特定のフォルダーの中のファイルをまとめて取り込んでしまう、とても強力な機能です。ただし、使い方にクセがあるので注意が必要です。
基本的にCSVならCSVのみ、ExcelならExcelのみ、そしてフォーマットが共通のファイルを取り込みます。さらに、取り込んだ時のファイル名も属性として再利用できますので、フォルダー内のファイル名を支店や日付にしておくなど、あらかじめ命名ルールを決めた運用が望ましいでしょう。
なお、そのフォルダーの中のサブフォルダーの中もまとめて取り込みます。
以下、記事を参考にしてください。
データベースから
主にマイクロソフト製品のデータベースです。
オンラインサービスから
クラウドサービスをデータソースとして指定します。
こちらの画面にはありませんが、Salesforce.comのデータも制限付きですが取得できます。
Facebookから
その他のデータソースから
上記以外のデータソースです。
Webから
WebサイトのHTMLで記載されたテーブルを取得します。
ODataフィードから
ODBCから
ORACLE Clientをインストールすることで、ORACLEデータベースに直接接続することができます。接続の際は、TNSNAMES.ORAの設定が必要です。
空のクエリ
まったく何もない状態からクエリを作成します。つまり、Mというプログラミング言語で取り込みプロセスを作るときに使用します。データソースはプログラムの中で指定します。
テーブルから
Excelのワークシートテーブルから取得します。手で管理するマスタデータなどをワークシートテーブルとして定義し、それを他のデータソースとマージして結合するときに使うとよいでしょう。いわゆるVLOOKUP関数の代わりとなる使い方ができます。
クエリの結合
クエリの結果をデータソースとして使用するパターンです。クエリの結合の仕方、つまり横にくっつけるか、縦にくっつけるかで二つのパターンがあります。
マージ
クエリを横にくっつけるパターンです。つまり、何らかのキー項目(照合列)を通じて別なクエリを列として連結するときに使用します。VLOOKUPの代わりにもなります。
以下記事を参照してください。
追加
クエリを縦にくっつけるパターンです。つまり、全く同じ項目を持った(同じフォーマットの)クエリを、新しいレコードとしてクエリの最後に連結して一つのテーブルにする方法です。
実際には、異なるデータソースのデータを別々のクエリで同じフォーマットに整形し、縦に連結するような場合に使用します。例えば、過去の実績データと、将来の予測データのフォーマットが異なるとき、個別のクエリで項目、およびその並び順を合わせ、仕上げとして縦に連結するときに使います。