実践で役立つデータ分析のプロセスをご紹介。1冊で一生使えるスキルが身につく!

マーケティングや経営戦略など、ビジネスのあらゆる場面でデータ分析スキルは重要になっています。

しかし、統計学やAIなど、部分的なスキルを身につけたからといって、実用的なデータ分析ができるとは限りません。

土台となる分析のフレームワークを理解してこそ、そういった知識が役立ちます。

本記事では、一冊の本をもとに実践で役立つデータ分析のやり方をご紹介します。

本物のデータ分析力が身に付く本で学ぶ分析のやり方

本物のデータ分析力が身に付く本は、実際に効果を出せるデータ分析のやり方が身につくワークブックです。

最強のデータ分析組織を持つ企業として有名な、大阪ガスのワークショップが元となっています。

おすすめポイントは3つあります。

①データ分析の正しいプロセスが学べる

データ分析をしていて、正しいやり方ができているか不安に思った経験はありませんか?

自己流で集計し、それらしく意味づけをしても、本当にそうなのか自信がもてないときがありました。

それもそのはずで、現実世界の課題を解決する手段としてデータを利用するため、正しい結果かどうかはわからない。正解かどうかを問うのはナンセンスであるといいます。

著書には、データ分析の正しさは結果ではなくプロセスで評価すると書かれています。

何か分析したい課題があって、必要なデータが手に入ったとします。このとき、あなたはまず何をしますか?すぐに平均値を出す、集計表を作るといった「計算」を始めたりしていませんか?これは多くの方が陥る過ちです。計算をする前に、やるべきことがあります。どんなデータ分析でも踏むべき「共通のプロセス」があるのです。

本物のデータ分析力が身につく本 プロローグ

プロセスは以下のとおりです。

①データ分析の設計

②データの事前チェック

③分析方法の選択

④分析実行

⑤分析結果の評価・解釈

⑥分析結果の表現

この本の最大のメリットは、分析手法ではなく、データ分析のプロセスを身につけられることです。

正しいプロセスさえ身につければ、どこでも通用するデータ分析ができます。

②実際に手を動かして体感できる

プロセスにそった解説とともに、すべてにワークがついています。

“会社が新しく開発した3種類のシャツを、それぞれ3店舗にどのように売るべきか”など、ビジネス場面でありそうな問題が設定されています。

データの事前チェックから分析結果の評価・解釈では、エクセルもしくはスプレッドシートを利用します。エクセルデータはウェブで公開されており、本に記載されているパスワードでダウンロードできます。

あとは紙とペンがあれば問題ありません。

現実にありそうな課題に対してプロセスにそったワークを行えば、データ分析のイロハが身につきます。

③エクセルもしくはスプレッドシートで完結する

先述したとおり、ワークにはエクセルを利用します。

統計ソフトやプログラミングは必要ありません。エクセルがなくても、Google アカウントがあれば利用できるスプレッドシートで代用可能です。

簡単だからといって実務で役に立たないわけではありません。

平均値や中央値といった代表値の正しい使い分け、クロス集計を使う条件、標準偏差とP値を利用した結果の確からしさなど、アカデミックでも通用する分析の大切な基礎がつまっています。

押さえておくべき分析手法も、パソコンさえあれば誰でも使えるツールで身につけられます。

本のワークショップを行えば、なんとなくの分析から、自信をもった分析に変わります。

データ分析のプロセス

本で紹介されているデータ分析プロセスの各ステップをご紹介します。

データ分析の設計

プロセスの中で土台となるステップがデータ分析の設計です。

本での分析設計とは、分析の概念図を描き、データ分析ストーリーを作ることをさします。

分析の概念図では、課題を設定し(問題領域)、課題解決の軸を決め(評価軸)、軸の構成要素(要因)を図にして表します。

データ分析ストーリーは、概念図を以下のような文章に落としこみます。

「会社貸与のスマホをどの機能にするか」を問題領域とします。

それを「機能の充足」と「経済性」と「作業効率」の3つの評価軸で決定します。

機能の充足については「ボイスメモ機能の有無」を、経済性については「本体価格」と「月額料金」を、作業効率については「処理速度」を、それぞれ要因として、各機種の優劣を比較します。

本物のデータ分析力が身に付く本 第1章 データ分析を設計する

何を知るためにデータ分析を行うかを明確にし、それをどういった基準でどんなデータで実施するかを文章にして表します。

土台がしっかりしていれば、無駄なデータ収集をせず、分析の目的を見失いません。

逆にストーリーがあやふやだと、手当たり次第にデータを集めてしまったり、そもそも課題が違かったなんてことも起こり得ます。

ストーリーを作る前に概念図を描く理由は、こうしたあやふやな要素をなくすためです。

概念図を描く手順は

“問題領域の決定→評価軸の決定→問題の具体的記述→要因の列挙→要因の選択→部品の配置・連結”

で行います。

本ではワーク形式でこれらの手順をふんで、実際に概念図を作ります。

データの事前チェック

分析設計で決めた必要なデータを集めたら、必ずデータの事前チェックを行います。

データの信憑性と傾向を把握して、誤ったやり方をして間違った結論に導くのを防ぎます。

チェックポイントは4つあると書かれています。

①データの出所

 5W1H, 一次情報かどうか

②データの全体概要

 サイズ, 並び, 意味合い, 値の大きさ・単位, 欠損値、外れ値の有無・多少, その他目立つ特徴

③個別の値

 欠損値, 外れ値, データの方向, クレンジング

④データの傾向

 値の範囲, 分布の形

本物のデータ分析力が身に付く本 第2章 データを事前にチェックする

ワークではエクセルの関数やヒストグラムを使って、欠損値やデータの傾向をみる方法を学びます。

分析方法の選択

ここでは平均値、中央値、最頻値の3つの代表値の意味と使いわけの方法、クロス集計の有用な使い方が紹介されています。

どれもシンプルな分析方法ですが、正しく活用できるかと問われると、自信のない方もいるのではないでしょうか。

平均値が有効なのは正規分布のデータ、クロス集計は分布がふたこぶのときの潜在的な要因を見つけるのに役立つなど、有用な活用方法を身につけられます。

最適な分析方法を選択するために、データの傾向をつかむ必要性があるのも納得できます。

分析実行

データ分析の設計から分析実行までをワーク形式で実施します。

一連の流れをおさらいし、データ分析プロセスの定着につなげます。

“3種類のシャツを、それぞれ3店舗にどのように売るべきか”の課題に対して、分析設計、事前チェック、分析方法の選択、分析実行を行います。

分析はクロス集計を利用し、得られた結果を次の評価・解釈ステップで検証します。

分析結果の評価・解釈

分析を実行して得られた結果の評価に、標準偏差と危険率(p値、有意水準)を利用する方法が解説されています。

標準偏差はデータのバラつき具合、危険率はグループ間の平均値に差がない確率を指します。

例えば、郊外と都内の店舗で売上の平均値が7万円、7万5千円だったとき、都内の方が売上が良いと言えるでしょうか?5千円の差はたまたま生じた差かもしれません。

立地条件が売上の平均に影響すると言いきれるかどうか、数値で表して説得力を持たせます。

エクセルやスプレッドシートで計算でき、標準偏差はデータの外れ値をチェックする際にも利用可能です。

実際の分析結果をもとに丁寧に説明されており、手を動かして習得できます。

分析結果の表現

分析結果を聞いたり報告する際に気をつけるべきポイントが紹介されています。

結果を受け止めるときの注意点

  • 仮設確証バイアス
    ある仮説を持って解釈に臨むと、仮設に合うことばかりに注目する
  • アンカリング
    数字を提示されると、その数字に意味がなくても、判断がその数字に影響される
  • フレーミング
    同じ意味でも、表現で判断が変わってしまう
  • プライミング
    先にポジティブな事象を提示することで、ネガティブな事象を目立たなくしている
  • 擬似相関
    2つの現象が、共に観測されるだけで、一方が他方の原因だと思い込みやすい
本物のデータ分析力が身に付く本 第7章 分析結果の受け止め方と伝え方

結果を表現するときの注意点

  • データの集め方
    割合で表現しているが、調査人数がわからない etc
  • グラフの見せ方
    縦軸の範囲を操作している etc
  • 言葉の表現の仕方
    統計的な数字も、相手に刺さる実質的な意味合いを伝えないと、説得力を持たない etc
本物のデータ分析力が身に付く本 第7章 分析結果の受け止め方と伝え方

分析結果を報告するときはもちろん、情報の信憑性をはかる際にも役立つスキルです。

まとめ

本物のデータ分析力が身に付く本で紹介されている、データ分析プロセスを解説しました。

プロセスを身につけてこそ、さまざまな分析手法が効果を発揮します。

分析のやり方に自信が持てない方や、これから分析業務を始める方におすすめの本です。

実際にワークを行えば、正しい分析プロセスを習得できます。

興味を持たれた方はぜひ、お手にとってみてください!