データ分析の考え方について説明します。
目次
データ分析を行うには目的を明確にする
データ分析を行う上で一番大事なことは目的を明確にすることです。目的とは下記の様なものです。
- 過去のデータから今月の売上高を予測し、仕入れ数量の計算に役立てる
- 顧客のデータから再購入に至る可能性の高い顧客を抽出する
- 顧客データから興味がある商品カテゴリーを予測する
これらの目標はいずれも具体的です。具体的な目標を持っていると次のアクションに生かすことができます。むしろ、次のアクションに生かすためにデータ分析を行うべきです。
私は会議資料の作成を自動化したことがありますが、ムダでした。月に一度定例で行う会議で、先月の実績を共有する為の会議です。「なるほどー」で終わり。会議資料を作ること自体が仕事になってしまっていて、具体的に次のアクションに結びついていません。このように、単に実績をまとめただけのグラフを作るのはデータ分析とは言いません。そもそもグラフを自動化していますし、そこから何かの知見を得ようともしていません。グラフはデータ分析を強力に推し進めてくれる便利なツールですが、やはり目的がないと宝の持ち腐れとなってしまいます。
帰納的にデータ分析し演繹的に予測するのがデータ分析
帰納的とは実績データを分析して法則を見つける、傾向を見いだすという考え方です。演繹は帰納で見いだした法則に当てはめて、予測することです。「西の空が曇りなら明日は雨になりやすい」という法則が見いだせたら、「きょうは西の空が曇りなので明日は雨になるだろう」と応用できますね。この応用部分がやりたいことです。何をしたいのかを明確にすることで、帰納を行う場合にも軸がずれないデータ分析ができます。
定点観察により変化点や異常値を検知する
冒頭で会議資料の自動化をしたことがムダ、と書きましたが、毎日、あるいは毎月など予め決めた間隔で同じデータを取得し続け、それをグラフ化することは目的があれば有意義な場合があります。それは変化点異常値を検知する事が目的の場合です。正常に稼働している事を担保する、何か変化の兆候があればそれを抽出すると言った場合には価値がある分析となります。異常が無いのに「きょうも以上はありませんでした」という事を説明するためのグラフを作成するのはムダです。
ある時点でのデータを分類する
特定の顧客に対してこれまでの購買履歴から傾向を掴み、どのような商品カテゴリに興味があるかを予測する事ができればそれは売上拡大につなげることができる可能性が高くなります。これは有意義なデータ分析と言えるでしょう。よく人工知能が予測というような言葉を聞きますが、人工知能が持ち出されたら、この統計的な手法でもっとも可能性が高いカテゴリーを抽出しているだけなのだと思う様にしましょう。結局データ分析をしているだけです。
データ分析のプラットフォーム
異常検知もカテゴリーの分類も、予測(回帰)もエクセルで相当の分析ができます。データサイエンスという言葉で毎回と言っていいほど話題に上るPythonでもデータ分析を行う事ができます。エクセルがいいのかPythonがいいのかは場合によって使い分ければ良いでしょう。Jupyter Notebookを使う事ができる環境であれば、ソースコードやグラフごと共有することができます。一方、Windowsが入っているPCなら面倒な設定など全くなくエクセルデータの共有が可能です。環境や目的に応じたツールを使えば良いと思います。Pythonがエクセルよりエライと言う事はありません。
データ分析の考え方まとめ
- 帰納的にデータ分析し演繹的に活用する
- 定点観察により変化点や異常値を検知する
- 人工知能と呼ばれている技術はデータ分析の分類と同じ
- データ分析のプラットフォームはエクセルでもPythonでも何でもいい
グラフをつくる事そのものが仕事ではなく、何かの目的を持って知見を見い出すためにデータ分析を行う。そのための補助ツールがグラフなのだ、と言う事を意識して、データ分析に取り組んでいきましょう。