データ分析の前に

毎日膨大なデータと格闘している方は多いことでしょう。物流においても定量的に把握するために、各種データを分析することは欠かせません。

例えば、1ヶ月分の出荷データをエクセルやCSVのデータを入手できたとして、すぐに集計や各種分析手法に基づいた分析を始めてしまいますか?各種のデータ分析手法について、説明した本は多くあると思うのですが、実はその手法にたどり着くまでのデータの整理が 時間がかかるということがありませんか。

さて、1ヶ月分の出荷データについてまずは下記をチェックしましょう。

(1)項目の一覧を確認して、わからない項目や不明確な項目はありませんか。
(2)中のデータに1ヶ月分以外のデータはないですか。
(3)必ず数字が入っていなくてはならない項目に空白がありませんか。
(4)必ず数字が入っていなくてはならない項目に0やマイナスはありませんか。
(5)周りのデータとかけ離れた数値(10ほどの数値であるはずなのに99999などの数値)はありませんか。

例外などを解決し、中のデータがどのようなデータなのかがわかったら、次に

(1)そのデータの容量(例えば、何レコード(行))はどのくらいですか。
(2)1ヵ月のトータル物量はどのくらいありますか。
(3)カテゴリなどの分類項目はどのくらいありますか。

など一番大まかなレベルでの集計を行います。これをすることで、後の集計時に結果が間違っていないかどうかのチェックができます。また、大きなレベルでの把握ができます。データ以外で何らかの情報を知っていれば、その情報とかけ離れてはいないか確認することもできます。データ以外の情報と数値がかけ離れていた場合には、その後の詳細分析でそれらを 明らかにしていきますが、詳細分析に入る前にも「数値が少なすぎた場合にデータが抜けていることに気づく」など二度手 間を省けるかもしれません。

何らかの設定数値などを使用した場合には、どのような設定を行ったのかを記述しておくことをお勧めします。集計や分析を行った場合に、使用したデータや設定方法などをまとめておくと後々振り返るときに便利ですし、分析者本人以外の方 にも確認していただくことができます。

上記では1ヶ月分の出荷データを例にとりましたが、他のデータでも同様のチェック方法が可能だと思います。また、デー タを入手する前段階で何を目的とした分析なのか、項目として何が必要なのか事前確認ができれば分析するときにスムーズ に行うことができます。

もし、分析結果に不安があったり、異常値を示した場合には上記のようなことを振り返ってはいかがでしょうか。

(文責:真壁)

このようにロジ・ソリューションでは、定量的にお客様のデータを分析し、最適なご提案につなげております。ぜひお声掛けください。(お問い合せはこちら

━━━━━━━━━━━━━━━━━━━━━━━━━━━━

★掲載された記事の内容を許可なく転載することはご遠慮ください。

(ロジ・ソリューション(株) メールマガジン/ばんばん通信第39号 2009年7月8日)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です