【初心者でもわかる製造業向けBI活用講座】PowerBIのデータ読み込み•加工方法

どーも、豆腐メンタルです。

視聴者様から「実際のデータ整理の方法を教えて欲しい」とのご要望がありましたので、第3回はこれまで使用していたレポートの作成方法をご紹介します。

レポート作成は大きくわけて①データの加工、②図表およびレポート作成、③レポートの更新および配布の3段階に分かれます。

今回はデータの加工についてまとめます。

データ読み込み

まずはデータの読み込み。

ツールバーの「データを取得」をクリックして、データの種類を選択しましょう。今回はエクセルファイルですが、データサーバーにも直接アクセス可能です。

f:id:tofumentalpapa:20240730084513p:image

続いて、エクセルファイルの保存場所を選択すると、下記の画面に飛びます。

左にエクセルのシート名称が出てくるので、読み込みたいシートにチェックを入れたら、「データの変換」をクリック。

f:id:tofumentalpapa:20240730084836p:image

すると、データが読み込まれます。エクセルの画面と大きな差はありません。
f:id:tofumentalpapa:20240730084843p:image

2.データの加工

データが読み込めたので、加工を開始。

①ヘッダーの設定

青枠で囲まれた部分は、ヘッダー。

この列にその列の名称を入力しましょう。

スライサーなどの設定をする際に必要となるため、わかりやすい名前を入力しましょう。

f:id:tofumentalpapa:20240730084812p:image

②列および行の削除

エクセルデータの場合、解析に不要なデータが含まれていることが多いです。文章や単位など、必要ない情報はこのコマンドで削除します。

緑の枠の列を選択し、列の削除をクリック!
f:id:tofumentalpapa:20240730084816p:image

1-10行も不要な情報なので、同じ流れで行を削除しましょう。

③データのフィルタリング

今回のデータでは、随所に小計の列が含まれていますが、全て読み込むと二重カウントになり、正しく集計されません。

そこで、フィルター機能を使って不要なデータを削除します。

例えば緑枠の部分は総数になっていますが、総数=男+女の人数なので、このままでは二重カウントになります。

f:id:tofumentalpapa:20240730084826p:image

赤枠をポチッとすると、男、女、総数が出てくるので、男と女にだけチェックを入れると、総数は非表示になります。
f:id:tofumentalpapa:20240730084859p:image

この他にも、業種にも総数が存在しているので、同じ方法で削除します。
f:id:tofumentalpapa:20240730084831p:image

④テキストデータの修正

続いてテキストデータの編集。

例えば赤枠列に都道府県が入力されていますが、「01000-北海道」と入力されています。

しかし、欲しいのは「北海道」で、見栄えが良くないので、不要な情報をカットしてみます。

赤枠の「抽出」をクリックすると、テキストの抽出方法が出てくるので、適したものを選択。

今回は_後の文字のみを抽出する方法を選択。

f:id:tofumentalpapa:20240731003940p:image

赤枠に_を入力すると、一番右の列に県名の列が追加されます。列はドラッグ&ドロップで移動可能なので、2列目に移動しておきましょう。

f:id:tofumentalpapa:20240731003936p:image

⑤シートのコピー&ペースト

続いてシートのコピペの方法。同じデータを使って、異なる加工をしたいときは、シートをコピーしておけばOK。

シート名をクリック→右クリック→コピー→貼り付けでシートが追加されます。
f:id:tofumentalpapa:20240730084808p:image

⑥ピボットテーブルの解除

続いてピボットテーブルの解除。

ピボットの解除が何かわからない方は下記の図を参照ください。

f:id:tofumentalpapa:20240731133830j:image

左が人間に理解しやすいデータの並びですが、ピボットの解除をすると、全ての分析値が縦に並びます。要するに、人間の理解しやすいデータの並びを解除して、数値を縦に並べ直しています。

解除の方法は、対象の列をクリックして選択肢たら「列のピボット解除」をクリック。
f:id:tofumentalpapa:20240730084848p:image

すると、ヘッダーの項目が「属性」列に移動し、数値は「値」列に移動します。
f:id:tofumentalpapa:20240730084903p:image

⑦値の型変更

最後に値の型を変更します。データには数値、テキスト、時間などの種類があります。

グラフにプロットする場合、数値データに型を変更しないとプロットできないため、下記の方法で数字(今回は10進数)に変換します。

f:id:tofumentalpapa:20240731215027p:image

以上が、基本的なデータ加工方法になります。いかがでしたでしょうか。そこまで難しい操作はないと思います。

ちなみに、データ加工の履歴は右の青枠に表示されますので、後で確認も可能です。
f:id:tofumentalpapa:20240730084803p:image

さて、ここまでくればあとはグラフを書くだけ·····というわけで次回、グラフ作成編。

※BIカテゴリーの記事

次の記事

前の記事