←第3回 セグメント化したデータが有効か検証する

企業内には様々な部局にデータが蓄積されており、オープンデータなど外部に活用できるデータも増えている。第3回はそれらのデータとRを活用して、売り上げが拡大する企業を予測する判別モデルを構築した。

分析のサンプルデータ
分析に使うサンプルデータ:上場企業3030社の有価証券報告書から生成した各社の簡易的な決算書データ(2010年~2012年の3期分で変則でない有価証券報告書を公開している9090件)。加工後のデータは記事末尾に掲載/データ出典:「EDINET」(データ

 マーケティングにおいて将来どの程度の効果を得られるかを予測するために使われているのが、回帰分析と呼ばれる手法である。

 回帰分析は、ある事象x(説明変数)から分析の目的となるy(目的変数)を推定しようとするもので、数式ではaやbを定数としてy=ax+bのような関係で示される。

 ただし、説明変数の設定で結果が異なることがあるため、丁寧に分析を行う必要がある。本稿では企業データを用いてその注意点について触れていく。前回に引き続き統計解析ソフトのRを用いて解析手順を紹介するので、データをダウンロードしていただき、手を動かしながらご覧いただければ幸いである。