DOORS DX

ベストなDXへの入り口が
見つかるメディア

データ分析を成果につなげるための「はじめの一歩」

公開日
2023.07.14
更新日
2024.02.21

株式会社ブレインパッドデータサイエンティストとして働いています、大和田智士と申します。

本記事では、「これからデータ分析のビジネス活用を進めよう」としている「企業担当者の方」を主な対象とし、データ分析を成果に繋げるために知っておくべき情報、および初めに取り組むテーマ案について紹介します。

これまでデータサイエンティストおよびプロジェクトマネージャーとして、企業のデータ分析プロジェクトに複数関わってきました。その中で、初期の取り組みの重要性を感じる場面が度々あります。

例えば、「データがある」という前提条件でプロジェクトを開始したのに、いざデータを確認すると商品IDがユニークに紐づけられず、分析に活用できるようなデータの設計と再取得作業から改めて実施する、というケースもあります。

別の例で、とりあえず機械学習による予測結果を出したけれども、予測対象の設定が実際の状況と違った、システムに組み込むことが想定されていない実装になっていたなどの理由で、ビジネスに活用されないまま放置されてしまう、といった事例を耳にすることもあります。

そこで今回は、データ分析によるビジネス改善に取り組み始めて「成果に繋がる」分析をするために、①「データ分析プロジェクトにおいて、共通して押さえておきたいポイント」を整理した上で、②「初めに取り組む案として、データ分析を用いたいくつかのテーマ」を簡単に紹介したいと思います。データ分析を推進したいけど何から始めたらよいのか悩んでいる、といった方々の一助となれば幸いです。

なお本記事は「入門編」のような位置づけで、各手法やテーマの概要のみを説明します。より詳細に知りたい方は、各章中および記事末尾のリンク先や書籍をご参照ください。

①データ分析プロジェクトで押さえておきたい共通ポイント

多くのデータ分析プロジェクトには、押さえておくべき共通のポイントがあります。ここでは、私が重要と感じる5つのポイントを取り上げます。

ポイント1:プロジェクトの目的・ゴールを明確にして共通認識として持つ

プロジェクトを開始するにあたり、何のために分析を行うのか(目的)、何を実現すれば目的を達成できるのか(ゴール)を最初に明文化することは非常に重要です。ここが曖昧なままプロジェクトを進行すると、目の前の分析作業やデータ収集に躍起になってしまい、最終的なアウトプットが本来必要とされるものや解決すべき課題からずれてしまう可能性が高まります。結果、実施した分析や構築したシステムがビジネスの現場で使われず、「データ分析はコストがかかるだけで成果に繋がらない」という認識が広がることにもなりかねません。

目的とゴールを明文化した上で、それを自身だけではなく関係者間で共通の認識として持つことで、やりたいこと、やるべきことに即したプロジェクトの進行に一歩近づきます。

マーケティングの観点であれば、目的の候補とては「売上を増やす」ことなのか、その前段階として「ユーザーを増やす」ことなのか、売上は一定のまま利益を上げるために「コストを下げる」ことなのか、など挙げられます。コストを下げるための分析をした結果人件費を削減したとしでも、本来の目的が売上の向上である場合それを達成できるとは限りません。

ポイント2:まずはスモールデータを収集・活用する

最近は耳にする機会も減っていますが、「ビッグデータ」という単語が世に広く出回った時期がありました(代わりと言えるか怪しいですが、今はDXという概念が広く知られていますね)。文字情報をそのまま受け取ると「大きなデータ」という意味ですが、始めから「大きな」=「量」に囚われてしまうと、「質」が担保されないデータを集めてしまう可能性があります。

ここでいう質が担保されない状態とは、欠損値が多い、表記揺れ(空白有無、句読点有無、算用数字と漢数字が混在するなど)が多い、IDが紐づかないような、分析で利用するようなことが難しいデータを指します。

前述した目的・ゴールに沿わないデータも同様に、質が担保できているとは言えません。東京に住む20代男性のデータしかないのに、日本全体の傾向について分析するのには限界があります。夏服の売上データを使って冬服の売上を予測することも簡単ではありません。

分析に十分な「質」が担保されたデータを集めるために、まずはデータの質を少ないデータ(スモールデータ)で確認した上で、データの量を増やしていく、といった順序を推奨します。少量でデータを確認せず、データを大量に集めてから実は活用できないことが判明するような場合、コストやリソースを無駄に消費してしまいます。

一方、意味のあるデータ分析をするにはある程度のデータ量も必要になります。少なくとも、例にあげたデモグラ情報や季節性が網羅されているだけの量は取得しておきましょう。とはいえ、目的にもよりますが、最初の一歩目の分析に100万、1000万といった単位のデータは必須では無いことが多いです。

また、スモールデータを確認が完了しデータの量を増やすフェーズに入った場合でも、データ収集システムの意図しない挙動などにより、分析の前にはデータ前処理が必要になることが多いです。プロジェクトのスケジュールを検討する際は、データ確認や前処理の工数をしっかり確保しておきましょう。

ポイント3:定義を定めて共通認識として持つ

一例として、CVR(コンバージョン率)はtoCサービスにおいて重要な指標として広く知られています。しかし、どういうアクションが行われた時に「コンバージョン」とするか、関係者内で定義されていないと、ある人が見たらCVRが向上しているのに、別の人が見たらCVRが低下している、といったことが発生する可能性があります。(一般的には「購入」とコンバージョンと定義することが多いかと思います)

このような認識齟齬を発生させないために、定義を明文化し、共通認識として持つことが重要です。

この際、定義の共通認識を持つ関係者の範囲をどこまでにするか、検討する必要があります。関係部署、あるいは全社的に共通の定義を持つのが理想ですが、周知のためにはコストがかかります。まずは分析に関わる人の範囲で、決めた定義で問題なく分析を進められることを確認できてから、周知の範囲を広げていくのか、それとも決めた定義をトップダウン的に共通認識として広げていくのか。組織の状況や分析担当者の立場によって、検討する必要があります。

ポイント4:運用を見据えた設計をする

事業を運営する際、売上やユーザー数などの指標は日次、週次、月次などの単位で振り返りをし、今後に活かすためのアクションを検討するのが一般的かと思います。

データ分析を進める場合も同様に、例えば将来の売上を予測するような行う場合、一度分析結果を出して終わりではなく、定常的に予測結果を出し、現場担当者が日々それを参考に施策を検討・修正し、施策実施後振り返りを行う、というフローが有効と考えられます。要するに、データ分析を価値に繋げるには「運用」まで考える必要があります。

分析作業自体はデータ分析官が中心になって実施しますが、運用はマーケティング担当者や事業担当者とすり合わせていくのが肝要です。「予測結果はいつ、どういうフォーマットで、なんのソフトを使って受け渡されるのか」などを初めに整理しておき、各担当者と擦り合わせておくことで、分析結果を日々のビジネスに直接活用できる可能性が高まります。

最初の段階で100%運用を見据えた設計をすることは難しいですが、少なくとも考えられる範囲ではルールなどを定めておき、運用のイメージを関係者間で共通認識として持っていると、最終的に運用の方針が固まるのが早くなるはずです。

ポイント5:「1回の分析で良い結果が出るわけではない」という共通認識を持つ

1回の分析だけでビジネスに効果が出ることは少なく、分析結果を出す度に都度改善策を検討・実施していくことが多いものです。関係者はこのことを認識し、分析結果がすぐに出ないことを踏まえたスケジュールを組んでおくことを推奨します。

一方で、何か根本的な原因がある場合がいくら分析のサイクルを繰り返しても良い結果が出ないこともあります。判断基準は難しいですがどこかのタイミングで作業を打ち切り、「良い結果がでないことも一つの結果」とし、次回以降の分析プロジェクトを進めるための知見を貯めるような進め方をするのも一つの手です。


②初めに取り組む分析テーマ案

ここからは、分析テーマ案と押さえておきたいポイントを紹介します。

テーマ案1:KPIマネジメント

KPIマネジメントでは、「売上5%アップ」というような最終目標をKGI(Key Goal Indicator)として設定し、ユーザー数1,000人アップ、ユーザー単価500円アップなど、KGIを達成するために必要な中間目標をKPI(Key Performance Indicator)に分解します。KPIの達成状況をダッシュボードなどでモニタリングし、改善/悪化したKPIがあればその原因を把握し施策の検討に役立てたり、逆に施策の効果を継続的に確認するために活用したりします。

KPI策定の方法は1つではありませんが、ここでは代表的な手法であるKPIツリーを用いた策定の流れを紹介します。

まず初めにKGI(Key Goal Indicator)を決めます。事業として達成したい数値目標が設定されることが多いです。ここでは「売上5%アップ」としましょう。

続いてKGIの指標を四則演算で分解します。ECサイトの売上であれば、

売上 = サイト訪問数 × CVR × 購入単価

といった式で表現できます。

右辺の指標を元にKPIを設定します。上記例ですと、3つの指標に対してデータを元に優先順位をつけた上で、それぞれどの程度向上させればKGIが達成できるか検討します。

購入単価は過去データを見ると向上されることが難しかったので、サイト訪問数を1日当たり1,000件、CVRを3%ptアップさせよう、という具合に設定します。

KGI、KPIの設定後はそれらをBIツールなどでダッシュボードとしてグラフ化し、分析者と現場担当者が継続的に数値をモニタリング、施策の検討や評価などを実施していきます。

大切なのは、KPIを施策に活用できるように設計することです。

例えば、データを見ると、初回訪問よりも2回目訪問のほうがCVRが高くなる傾向が見えたとします。だとすれば、2回目訪問率が高くなるような施策を考えることになりますが、とはいえ初回訪問者の数が少ないのであれば、2回目訪問者も当然少なくなるので、初回訪問をある程度増やすか維持することも大切です。

初回訪問を増やすにはマス広告を増やせばいいだろう、2回目訪問を増やすにはベネフィットを感じてもらえるようなアフターフォローが大事だろう、といった仮説を立てて、実際に実行します。

その結果、KPIがどう変化するかを見て、実際に売上向上につながるのであれば、本格的に取り組むことになります。(この時、テーマ案4として後述するABテストを導入すると、施策の効果をより確からしく計測することができます。)

ここまでの内容は簡単な例でしたが、実際にKPIを策定するには対象とするデータへの深い理解に加えて、深いドメイン知識が必要です。そのビジネス特有の制約や内部/外部要因が考慮されずにKPIツリーを作成すると、施策の検討に役立てられない机上の空論のようなものになってしまい、最終的に誰も使わなくなってしまう可能性があります。

分析官は現場部門と十分に意見交換しながら、KPIをブラッシュアップしていくのが望ましいと考えます。

また、KPIツリー作成の際、正確性を求めるがために粒度を細かくし過ぎると、施策に活用できないKPIになる危険性があります。一方で、現場の意見を取り入れ過ぎると今度は正確性に欠けて、どの指標がKGIに影響しているのかわかりにくくなります。

あくまで「KPIツリー」を活用する場合ですが、実ビジネスへの適応度と正確性をうまくバランスさせることを意識しましょう。

【関連】

テーマ案2:ユーザー行動分析(離脱分析、F2転換分析)

新規顧客の定着率が低い、既存ユーザーが徐々に減っているといったユーザー行動に関する課題は、多くの事業で直面しうるものです。これらの原因や理由を把握し改善策を検討する際に実施されるテーマの中から、ここでは「離脱要因分析、F2転換分析」として紹介します。

例えばマーケティング分野ではLTV(Life Time Value)という指標がよく利用されます。「あるユーザーがそのサービスに対して、合計でどれだけの利益をもたらすか」という意味の指標ですが、これを向上したいのであれば各ユーザーの購入回数を増やすことが有効な一手として考えられます。

別の言い方をするなら、新規顧客が初回購入の段階でサービスから離れないようにし、2回目購入、3回目購入につなげるための施策を考える必要があります。

そこで、1回しか購入していないユーザーと2回以上購入しているユーザーのデータを比較・分析して、2回目購入者にのみ見られる特徴を把握していきます。初回購入者の内2回目購入に至った割合をF2転換率と呼び、これを継続的にモニタリングすることでサービスの健康状態を把握するという事例も多くあります。

ユーザー行動分析に必要となるデータについても簡単に触れておきます。

年齢、性別、職業、年収、ライフステージといったユーザー属性(デモグラフィック)データを集めることももちろん必要ですが、ユーザー行動の決め手(2回目購入をする/しない)の差になっている要因に仮説を立てて、それを検証するためのデータを検討、収集することが重要になります。

例えば、「最近Web広告による宣伝に力を入れたため、商品を目にする人が増えて商品売上が伸びたのではないか」という仮説を立てた場合、ユーザーがどこでどの広告を見たのか、クリックしたのか、最終的に商品を購入したのかしていないのか、というようなデータを利用することで、仮説が検証できるはずです。

上記のような分析が実現できたら、次の段階として「離脱しそうなユーザーを予測したい」というところまで踏み込むのも選択肢になります。この場合、機械学習によって離脱確率を予測し、確率の高いユーザーを自動で定期的にCSV出力するようなシステムを作るなど、より施策に紐づくデータ活用が可能になります。

【関連】

テーマ案3:需要予測 

これから発売する新商品の売上をできるだけ正確に予測した、在庫を適正量に保ち在庫コストを削減したいという思いは、何かを売る事業を行う企業の多くが望むことかと思います。これを実現するために行う分析が需要予測です。

需要予測はその名の通り将来の需要を予測する分野です。まず、販売個数や売上高など予測対象とするデータと、その商品のトレンド度や価格帯、その日の天気の情報などの購入行動の要因となる要素のデータをそれぞれ収集します。前者を目的変数、後者を特徴量や説明変数として、LightGBMなどの機械学習モデルに学習させて、目的変数の予測値を算出する、というフローがよく採用されます。

出来るだけ正確な需要量を予測したいですが、その際に必要となる機械学習の基礎知識は割愛します。

需要予測の特徴の一つとして、商品の売上データだけでは精度の高いモデルを作ることが難しく、外部要因を表現するデータが必要になる場合が多いことが挙げられます。

例えばコンビニにおける傘の販売個数を考える場合、その日が雨(もしくは雪)であるか否かにより販売個数が大きく変わるのはイメージしやすいと思います。もちろん、その店舗の普段の客数、傘の販売個数、立地、季節などは関係がありそうですが、晴れの日と雨の日をモデルが区別出来ないと、より正確な予測をすることは難しいです。

この現象は需要予測意外の機械学習モデルでも同じことが言えますが、需要予測では特に注意しておきましょう。

分析結果をオペレーションに適応させる設計も、需要予測では非常に重要です。予測結果をどのようにビジネス活用するか検討してから分析を実施しないと、「ただ分析しただけ」でプロジェクトが終わってしまうことになりかねません。

ここでは購買個数の予測結果をもとに今期の生産計画を変える設計を考えたとします。予測された購買個数が予定されている生産量を上回った場合、生産量を減らすようなオペレーションをするのが妥当です。しかし、例えば予測結果が出たタイミングで既に今期分の生産が完了していた場合、時すでに遅しということになってしまいます。この場合、今期の生産計画に変更を加えるのはまにあわないので来期の計画に活用できるようなモデルを作る、といった設計をするのが適切です。

各種制約や出来ること・出来ないことを把握した上で、成果に繋がるような分析を目指しましょう。

【関連】

テーマ案4:施策の効果検証(ABテスト) 

ビジネスの中では、特定のターゲットへ向けて広告を出す、ある商品を買ってくれたユーザーにクーポンを発行する、購入数が増えるようにサイトのUIを変更するなど、売上向上などを目的として施策を実施する機会は多いです。とはいえ折角施策を実施しても、それが本当に売上に対して効果があったのかどうか把握(効果検証)できていないと、極端な例ですが売上に対してあまり効果のない施策を打ち続けることに繋がりかねません。

施策の効果検証によく使われる代表的な手法として、ABテストと統計的因果推論があげられます。

ABテストは、施策を実施する前に施策を実施するグループと実施しないグループに分け、施策実施後にグループごとの売上を比較することで効果を推定する手法です。効果を出来るだけ確からしく推定するためには、施策グループ間の特性(ユーザー属性、行動パターンなど)ができるだけ同質になるように分けることがポイントです。

統計的因果推論を利用する場合は、施策を実施した後に施策を実施したグループと実施しなかったグループからユーザーを選定し、対象ユーザーの売上を比較することで施策の効果を推定するイメージです(ここではあくまで表面上のイメージにとどめます)。

統計的因果推論を用いて施策実施後に効果を推定しようとする場合、各グループからのユーザーの選定条件が難しく、推定結果の確からしさの保証にも高い専門性が求めらます。そのため最初の一手目としては、施策実施前に適切にグループを分けて施策を実施するABテストの枠組みを推奨します。

世の中にはABテストを自動化してくれるツールも多くあるため、導入を検討されるのもよいかと思います。弊社の提供しているRtoasterにもABテスト自動化の機能は搭載されています。

【参考】Rtoaster レコメンド・パーソナライズ|action+

テーマ案5:数理最適化

ビジネスでは売上向上のための施策と同様に、効率性向上やコストダウンのための施策も重要です。

スタッフのシフト調整を例にあげると、あるスタッフはこの日時はNG、あるスタッグはこの日時に絶対に勤務したいといった個々の事情がスタッフの数だけ存在します。これらを出来る限り考慮しつつ、「全ての時間に誰かがいなければいけない」という最低条件も満たす必要があります。更に理想的には、平等性の観点からスタッフごとにシフトの回数の差が広がらないようにしたいです。

数理最適化の手法を用いると、制約条件を満たした上で、ある指標(目的関数と呼びます)を最大化 or 最小化するようなシフトを組むことが可能になります。今回の例では、制約条件である「シフト可能/不可能日」「全ての時間帯に1人以上のシフト」を満たした上で、シフトの平等性、言い換えると「一番シフトが多いスタッフと一番シフトが少ないスタッフのシフト数の差分」を最小化するようなシフトを、数式から導くことができます。

【関連記事】数理最適化とは?機械学習・AIとの違いやビジネス活用事例をわかりやすく解説

制約条件や目的関数は分析担当者が目的に合わせて定義するため、例えば最小化したい指標を「各曜日&時間帯ごとの人数の偏り」と設定することで、人数の安定したシフトを組むこともできます。

数理最適化には上記で示した「シフトスケジューリング」問題での活用の他に、運送業にて荷物を配達する順番や経路を最適化する「配送最適化」問題などの使い道もあります。

【関連】配送ルート最適化プロジェクトの現場実装

数理最適化に取り組もうとした際、制約条件および目的関数の設定が最初のハードルとなります。近年では優秀なツールが増えており、問題を「解く」部分への苦労は多くないかもしれません。しかし、業務要件を数式として定義して制約条件に落とし込み、目的に合わせた目的関数を数式で表現するのには、数理の知識と業務に対するドメイン知識が必要となります。どちらが欠けても良い分析結果を得るのが難しくなるため、事業に関わる人と分析官が協力し、上記課題に向かっていくことを推奨します。

【関連】

1111111
「2024年問題」で日本の物流になにが起きるのか、より深く知りたい方はこちらもご覧ください。

おわりに

ここまで、データ分析を成果に繋げる最初の一歩として、①共通したポイントと②いくつかの具体的な手法やテーマをご紹介しました。自社にとって解決優先度の高い課題は何かを検討した上で、分析の目的とゴールを明確にし、適切なテーマや手法を選定しましょう。

冒頭の繰り返しになりますが、本記事はあくまで各手法やテーマの表面的な紹介にとどめています。それぞれ具体的な名前(KPIマネジメント、需要予測など)を記載しましたので、いざ実施する際にはこれらをキーワードとして検索、または書籍等をあたっていただき理解を深めることで、データ分析を成果に繋げる可能性が更に上がるかと思います。

最後に、データ分析を進めるにあたり参考となりうる、弊社のオウンドメディアや公開資料をいくつか紹介します。本記事と併せてお役立ていただければ幸いです。

関連記事


このページをシェアする

株式会社ブレインパッドについて

2004年の創業以来、「データ活用の促進を通じて持続可能な未来をつくる」をミッションに掲げ、データの可能性をまっすぐに信じてきたブレインパッドは、データ活用を核としたDX実践経験により、あらゆる社会課題や業界、企業の課題解決に貢献してきました。 そのため、「DXの核心はデータ活用」にあり、日々蓄積されるデータをうまく活用し、データドリブン経営に舵を切ることであると私達は考えています。

メールマガジン

Mail Magazine