あなたは解析プロセスを知らずにデータ解析を行っていませんか?

参考資料:
データ解析の実務プロセス入門

著者:あんちべ

出版社: 森北出版

解析プロセスを学ぶ意義

素人を専門家から区別するものは、 ただ素人がこれと決まった作業方法を欠き、したがって与えられた思いつきについてその効果を判定し、評価し、かつこれを実現する能力を持たないというだけである。
―マックス・ウェーバー、職業としての学問

なぜデータ解析の一連のプロセスについて最初に学ぶかと言うと、データ解析において初心者が行き詰まってしまう一番の難関は、データ解析にかんせるここの要素がわからないことよりもデータ解析のプロセスを俯瞰できないことであるからです。
何事も「一体何から始めて次にどうすれば良いか」がわからないと、 ゴールにたどり着くどころか最初の一歩すら踏み出せません。
闇雲に目についたデータを分析ツールに放り込んだり、威勢のいい言葉で飾り立てたプレゼン資料を作成しても価値はいられません。

現在、統計学や分析ツールに関する良書はたくさんありますが、 業務におけるデータ解析プロセスを1から十分に説明している本ははとんどありません。
そして、それこそがデータ解析な事項を妨げていると考えます。
データ解析のプロセスを知ることによって、自分がゴールに向かう道の今どこにいるのか、困難にぶつかった際にどこまで立ち返ってやり直せばよいか、あとどれだけの道のりが残っているのかを把握できます。
次のプロセスは反復するものです。
その反復の過程で必要に応じて順番を入れ替えたり省略することもあります。
プロセスを把握しておけば、状況に合わせてどれとどれを入れ替えれば良いか、何を省略するべきかを意識して決定することができます。

意識してステップを入れ替えたり省略することと、ついうっかり入れ替えてしまったりそもそものステップの存在すら知らずに省略したりすることとは大きく異なります。
後者では、何か失敗か発生した際、その失敗要因を取ろうとしてもどのステップを改善するべきなのかが分からなくなってしまいます。
また、データ解析のプロセスを知らぬまま、「たまたま自社のデータベースの格納されていたビッグデータを適当に取り出して分析ツールに放り込んでみたら有用な知見が得られた」などという幸運が実現することは、宝くじに当たるくらい起こり得ないものなのです。
仮にそんな幸運があったとしても、それでは継続的な結果が得られず、成果を積み上げて向上していくことができません。
得られた知見のうち、単発の偶然によるものと恒常的な仕組みとして発生するものを選り分け、 その偶然の度合いや現象の仕組みを解き明かすことで、ビジネスで研究に活かすことができます。

データ解析を成功させるために最も大切なことは、このプロセスにデータ解析者だけが関わるのではなく、データ解析の結果を受けて意思決定をしたり施策を実施したりする担当者と協力して実行することです
分析結果自体は価値ではないため、そこで終わってしまっては意味がありません。
分析の結果から提案、そして実践へとつなげることによって初めて価値を得ることができます。
そのため、データ解析のプロセス分析結果の解釈、提案、実施、運用を含みます。
分析結果を全て出した後になってから依頼者を巻き込むということではなく、 各プロセスにおいて適宜な依頼側に細かい粒度でフィードバックをすることが肝心です。
それにより、 迅速な軌道修正が可能になり、より高速かつ高精度のデータ解析プロセスを反復改善できます。
それでは、各プロセスとその流れを学び、実践データ解析をするためにとるべき行動を次回の記事にてご紹介ていきましょう。

参考資料:
データ解析の実務プロセス入門

著者:あんちべ

出版社: 森北出版