←目次 企業データ活用のデータサイエンス入門

企業内には様々な部局にデータが蓄積されており、オープンデータなど外部に活用できるデータも増えている。第1回はデータをどのように集約して分析できるように磨き上げるのかを、実データと簡単な操作例で見ていく。

分析のサンプルデータ
分析に使うサンプルデータ:上場企業3030社の有価証券報告書から生成した各社の簡易的な決算書データ(2010年~2012年の3期分で変則でない有価証券報告書を公開している9090件)/データ出典:「EDINET」 ダウンロード:データ

 「顧客データ分析」や「CRM分析(顧客関係管理)」といったキーワードでグーグルを検索すると、2017年10月現在で100万件以上のウェブサイトがヒットするように、今や顧客データの分析は企業のマーケティング戦略に必要不可欠な要素の1つとなっている。しかし、企業の各担当者が自分の業務にあった、顧客データを分析するのはハードルが高いように思われているのではないか。

 そこで本連載では、公開されている上場企業のデータを実際に扱って、企業データを分析したり、可視化したりして活用するために必要なアプローチを紹介する。3K(気合・根性・勘)営業の脱却のためにまずは顧客データの分析を始めてみたい、CRM分析は専門業者に外注しているが実際に自分の手でも実施してみたい、といった担当者の方に参考になれば幸いである。

 実際に手を動かして読み進められるよう、金融庁の有価証券報告書などの電子開示システムである「EDINET」に公開されている上場企業3030社の有価証券報告書から生成した各社の簡易的な決算書データ(2010年~2012年の3期分で変則でない有価証券報告書を公開している、9090件)をダウンロードできるようにした(pub_comp.csv、本記事の最初と最後にダウンロードのリンク)。手を動かしながらご覧いただければ幸いである。

分析は前処理が“8割”

 まず社内に蓄積されている顧客データの状態を確認いただきたい。もし未整備ならば、分析が実行できる状態にまで磨き上げる必要がある。「分析は前処理が“8割”」と言われるのは実際にそうだ。ここに多くの労力が費やされるので、この段階で挫折するケースも少なくない。次の3ステップを意識し、なるべく高品質なデータを整備したい。

企業データを使えるようにする処理の流れ