どーも、豆腐メンタルです。
視聴者様から「実際のデータ整理の方法を教えて欲しい」とのご要望がありましたので、第3回はこれまで使用していたレポートの作成方法をご紹介します。
レポート作成は大きくわけて①データの加工、②図表およびレポート作成、③レポートの更新および配布の3段階に分かれます。
今回はデータの加工についてまとめます。
データ読み込み
まずはデータの読み込み。
ツールバーの「データを取得」をクリックして、データの種類を選択しましょう。今回はエクセルファイルですが、データサーバーにも直接アクセス可能です。
続いて、エクセルファイルの保存場所を選択すると、下記の画面に飛びます。
左にエクセルのシート名称が出てくるので、読み込みたいシートにチェックを入れたら、「データの変換」をクリック。
すると、データが読み込まれます。エクセルの画面と大きな差はありません。
2.データの加工
データが読み込めたので、加工を開始。
①ヘッダーの設定
青枠で囲まれた部分は、ヘッダー。
この列にその列の名称を入力しましょう。
スライサーなどの設定をする際に必要となるため、わかりやすい名前を入力しましょう。
②列および行の削除
エクセルデータの場合、解析に不要なデータが含まれていることが多いです。文章や単位など、必要ない情報はこのコマンドで削除します。
緑の枠の列を選択し、列の削除をクリック!
1-10行も不要な情報なので、同じ流れで行を削除しましょう。
③データのフィルタリング
今回のデータでは、随所に小計の列が含まれていますが、全て読み込むと二重カウントになり、正しく集計されません。
そこで、フィルター機能を使って不要なデータを削除します。
例えば緑枠の部分は総数になっていますが、総数=男+女の人数なので、このままでは二重カウントになります。
赤枠をポチッとすると、男、女、総数が出てくるので、男と女にだけチェックを入れると、総数は非表示になります。
この他にも、業種にも総数が存在しているので、同じ方法で削除します。
④テキストデータの修正
続いてテキストデータの編集。
例えば赤枠列に都道府県が入力されていますが、「01000-北海道」と入力されています。
しかし、欲しいのは「北海道」で、見栄えが良くないので、不要な情報をカットしてみます。
赤枠の「抽出」をクリックすると、テキストの抽出方法が出てくるので、適したものを選択。
今回は_後の文字のみを抽出する方法を選択。
赤枠に_を入力すると、一番右の列に県名の列が追加されます。列はドラッグ&ドロップで移動可能なので、2列目に移動しておきましょう。
⑤シートのコピー&ペースト
続いてシートのコピペの方法。同じデータを使って、異なる加工をしたいときは、シートをコピーしておけばOK。
シート名をクリック→右クリック→コピー→貼り付けでシートが追加されます。
⑥ピボットテーブルの解除
続いてピボットテーブルの解除。
ピボットの解除が何かわからない方は下記の図を参照ください。
左が人間に理解しやすいデータの並びですが、ピボットの解除をすると、全ての分析値が縦に並びます。要するに、人間の理解しやすいデータの並びを解除して、数値を縦に並べ直しています。
解除の方法は、対象の列をクリックして選択肢たら「列のピボット解除」をクリック。
すると、ヘッダーの項目が「属性」列に移動し、数値は「値」列に移動します。
⑦値の型変更
最後に値の型を変更します。データには数値、テキスト、時間などの種類があります。
グラフにプロットする場合、数値データに型を変更しないとプロットできないため、下記の方法で数字(今回は10進数)に変換します。
以上が、基本的なデータ加工方法になります。いかがでしたでしょうか。そこまで難しい操作はないと思います。
ちなみに、データ加工の履歴は右の青枠に表示されますので、後で確認も可能です。
さて、ここまでくればあとはグラフを書くだけ·····というわけで次回、グラフ作成編。
※BIカテゴリーの記事
次の記事
前の記事