データ分析プロジェクトの進め方~必要なスキルなどわかりやすく解説!~
2020年8月25日
目次
データ分析プロジェクトの概要
ここでは、データ分析プロジェクトの構成メンバーや大まかな流れについて解説します。
データ分析プロジェクトのメンバー構成の例
メンバーは「事業側」と「分析側」の2チームに分けられます。事業側はマネージャーと現場担当者で構成されます。ビジネスの観点で仮説を立ててデータ分析を依頼し、結果を判断するチームです。分析側はプロジェクトマネージャーとデータサイエンティストで構成され、データ分析作業を担います。
マネジャーとデータサイエンティストが、両輪となって活動することがプロジェクト成功の鍵であり、双方のデータ対応能力が高いことが重要になります。
データ分析プロジェクトの大まかな流れ
データ分析プロジェクトの大まかな流れを考えるときは、PPDACサイクルが活用できます。
PPDACサイクルは、
「Problem:課題設定」
「Plan:計画」
「Data:データ収集」
「Analysis:分析」
「Conclusion:結論を出す」
の頭文字を取ったフレームワークです。ここでは、データ分析プロジェクトに合うように、さらに詳細なステップに分けて解説します。
▼Problem:課題設定
・課題の設定
達成したい目標や解決したい問題を、中立・公平な視点で明確にします。マネジャーを中心にまとめますが、分析側や他部署からも課題を出しやすいように、オープンにしておくことが望ましいです。
・プロジェクトの大まかなスコープの設定
課題を設定したら、収集するデータ項目や範囲、分析方法などの計画を立てます。特にデータの項目・量・質は、分析結果に大きく影響します。
細かい事柄は別にして、「データは入手可能なのか」「収集・分析できる量なのか」などを調査しておきましょう。このステップでプロジェクト全体の方向が決まるため、課題の解決とずれないように大まかなスコープを明確にすることが大切です。
・企画書の作成・予算の確保
プロジェクトの大まかなスコープの設定を文書に落とし込み、企画書を作成します。企画書ができたら、それをもとに予算を見積もります。企画書と予算案は、プロジェクトメンバーやスケジュール、予定工数、分析環境(ソフト・ハードの両方)などを具体的に決めて文書化します。
このステップでは、何にいくらの費用が必要で、何日の期間が必要なのか、分析結果を活用することでの効果などを明確にすることが大切です。費用や金額などがはっきりしているほど、企画に説得力を持たせられます。また、達成できることだけにフォーカスするのではなく、達成できないことも明確にして、企画に対する期待値を調整することも大切です。
▼Plan:計画
・分析プランの作成
ビジネス上の課題をどのように分析課題として落とし込むのか、また、どのようなアプローチで分析するのかなどを決めます。事業側のデータ評価プランも、このステップで決めておきましょう。
・キックオフミーティング
プロジェクトに参加するメンバー全員を集めて、設定した課題や分析プラン、スケジュールなどを共有します。士気を高めたりコミュニケーションを深めたりするために、食事会や意見を出しやすい形式のミーティング機会を設けるのもよいでしょう。
▼Data:データ収集
・データ収集・整理
企業で扱われるデータは大きく分けると、SCMやERP、CRMなどの業務ソフトウェアのデータベースで利用される「構造化データ」と、従業員の日常業務やユーザーへのアンケートで生成されるワード、PDFエクセルや、設計図面、画像、動画などの「非構造化データ」に分けられます。
これら全てをデータの蓄積対象とする必要はありませんが、データ分析プロジェクトによって何を実現したいかによってソースを、将来の拡張性も考慮に置きながら選択/設計していくことが必要となります。このステップの工数は、「情報ソースをどうするか」「情報ソース同士の結合や正確性をどのように担保するか」「データ収集するために企画/システムの両面でどのようなフックを用意するか」など考えなくてはならないことは非常に多岐に及んでおり、当初の予定にくらべて増えやすいため注意が必要です。なお、個人情報を取り扱う場合は十分に注意しましょう。
・データ集計による可視化・仮説出し
データ集計による可視化は、仮説が正しいか検証するために行いますが、その前段階としてデータが正しいかの精査や、データの概観の理解がそもそもの目的です。たとえば、平均から著しく離れたデータは、収集や整理の段階でのミスが疑われるかもしれません。しかし、原因によっては、本当のデータということもあるため、ノイズなのか事実なのか見極めることも必要です。
こうした精査を通過したデータは、散布図や相関分析などの手法を使ってさらに加工します。そして傾向や特徴を分析して仮説を出すところまで進めます。
▼Analysis:分析
・分析作業
このステップで本格的なデータ分析作業が行われます。具体的には、統計/機械学習モデルを使ってデータの解釈や原因の追究、将来の予測などを行います。訓練用データとモデリングを実施し、テスト用データでモデルの精度検証やチューニング/精度向上を図っていきます。
この精度向上の営みは所謂「職人技」の領域でして、やろうと思えばどこまででもやれるものではあります。勿論当該プロジェクトの目的にも拠りますが、通常ビジネスの現場においては、シミュレーションを繰り返すことよりも、一旦出た解をもとに施策化をし、結果のFBからの改善サイクルを回すことの方がより重要性が高いケースが多々あります。分析作業にどこまでリソースをかけられるか、どの段階で施策化への移行を判断するか、この辺りも本ステップにおいては考慮すべきファクターとなります。
▼Conclusion:結論を出す
・アウトプットの作成・納品
分析結果が確定したら、企画書や分析・評価プランで目標としていた結論を作成します。ビジネス活用を主眼とした場合は、データサイエンティストが理解できるのではなく、ビジネス現場が理解できるアウトプットが必要です。他社から依頼を受けたデータ分析である場合、納品作業に移ります。成果が達成できなかった場合は、必要に応じて前のステップに戻ることも検討します。
データ分析プロジェクトにおいて起こりやすい問題
「収集したデータを使えば何かしらの新しい知見が出てきて施策ができるはず」
データ分析プロジェクトはしばしば魔法の杖のように扱われることがあります。しかしそのようなことは決してなく、データを使ってどのような課題感を設定し、どのように解き、どのような活用をしていくかの明確な計画がない限り、往々にして迷宮入りしやすい側面をもっています。また、分析プロジェクトは扱っている事象から複雑化しやすく、ややもすると「一部の人間が行っている良く分からない取り組み」と捉えられることもあります。そうならないためにも、分析プロジェクトをリードする人間(プロジェクトマネージャー)のビジネス/統計知識・経験やコミュニケーション能力が重要となります。
また分析チームの実務は高度に専門的で属人化しやすく、メンバー間でのスキル共有や引継ぎがしにくくなる傾向があります。これを避けるためにも、実施内容/知見のドキュメント化やコードのgit管理、定期的な口頭ベースでの共有会の開催など、如何に組織知としてナレッジを蓄積していくかということにもプロジェクトマネージャーは気をつけていくべきです。
データサイエンスの分野においては、技術者が不足しているのが現状です。データベースやプログラミングの知識に加え、統計学や統計アルゴリズムの知識を持つ人材を確保するのは簡単ではないでしょう。この問題の解決策としては、自社より効率的な人材育成が可能な外部サービスを利用する方法があります。
データ分析プロジェクトを成功させるために必要なスキル
データ分析プロジェクトを成功させるには優秀なメンバーが必要です。どのようなスキルが求められるのでしょうか。
集めたデータから知見を導き出せる
従来のデータ分析は単なるサイエンスでした。来店数や売上など、データを収集・集計すれば、それが結論となるケースが多かったといえます。しかし、分析対象となるデータが多くなると、データの整理だけでなく、そこから仮説や洞察を導き出すスキルが必要となります。
たとえば、製造業においては不良品の検出に、画像データを認識するAIが活用されています。こうした技術は、画像データが人件費の削減や検品作業の効率化に役立てられるのではと考えたうえで分析しなければ、なかなか実現できません。
こうした取り組みには、顕在化している課題を「解く力」だけでなく、潜在的なビジネス課題を「見つける力」が重要です。また、業務PPDACを活用して成果を創出するために、ビジネスドライブやコミュニケーション能力などを駆使した分析結果を「使わせる力」も求められます。
ビジネスを理解している
データ分析プロジェクトでは、データ分析を直接行う人以外の人材も大切です。優秀なデータサイエンティストを集めれば、成果が上がるというわけではありません。高度なデータ分析技術は持たないものの、一定の知識や経験があり、データサイエンティストと事業側をつなぐスキルを持つ人材が欠かせません。
このような人材は、分析側のプロジェクトマネージャーや、事業側の現場担当者にふさわしいといえます。あくまでビジネスとして成果を出すためのプロジェクトであることを忘れず、専門家の意見も聞き取って調整できる存在です。
データ分析で付加価値を生み出すことができる
ビジネスにおける付加価値とは、売上から原価を引いた利益のことです。データサイエンティストはものを生産するわけではありませんが、付加価値を生んでいることは、他の職業と変わりません。
分析プロジェクトにおける付加価値とは、新たな知見の発見や、予測モデル構築を通しての施策実施、およびそれによる利益貢献にあります。分析組織を作るために社員育成を考える際、SQLやR、Pythonといったプログラミング言語やそれを使った機械学習モデル構築といったハードスキルに目が行きがちですが、本来的な目標は施策化/利益化にあるので、ハードスキルを活かしてどのようにビジネスの利益貢献に寄与するかのマインドも重要となります。
データサイエンティストの採用・育成
データサイエンティストを採用するべきか、自社で育成するべきか悩んでいる人事担当者もいることでしょう。この場合の主な検討項目は、コストと所要期間、成果を出せる可能性・リスクの3つです。
短期的なコストが安いのは育成です。優秀なサイエンティストを採用するには、給与・待遇で高い条件を提示しなければならないためコストがかかります。成果を出すまでの期間で考えると採用のほうが短く、また、経験者なので失敗するリスクも低いと考えられます。
採用を検討する場合は、分析プロジェクトやプログラミング言語の経験や実績があるに越したことはありませんが、この辺りのハードスキルについては研修などを通して身に着けさせることは十分に可能です。それよりもそもそもの企業文化や、分析の対象となるサービスとのマッチング(ソフトスキル)についてプライオリティを置いた方が、結果的には良いチームビルディングに繋がることが多いです。採用する際はハード・ソフトのバランスを考えての見極めをおすすめします。
採用計画や選考には、データサイエンティストやエンジニアを加えることが必要です。専門知識や実務能力は人事担当者だけでは判定しにくいため、協力を求めましょう。
まとめ
データ分析プロジェクトは、事業マネージャーとデータサイエンティストが中心となることで成果を上げやすくなります。PPDACサイクルも導入しながら、計画的にプロジェクトを進めていきましょう。また、スキルを持つ人材の育成や採用も重要です。
ブレインパッドは実践的なデータ活用の人材育成プログラムを提供しています。個人・企業向けの研修プランも幅広く用意しており、累計60社・38,500名以上の実績があります。データサイエンティストの人材育成やビジネス課題解決に、ぜひご活用ください。