メルマガ登録
近年、新たな学び直し=リスキリングという言葉がバズワード化しており、特に日本においては、IT・DX人材の慢性的な不足から、リスキリングによる、「データ解析・データ分析」ができる人材=データサイエンティストの確保が注目されています。
そこで、異業種からデータサイエンティストへとジョブチェンジを果たしたブレインパッドのメンバーに声をかけ、「リスキリング×データサイエンティスト」を存分に語るシリーズを企画しました。
▼リスキリングの意義などをより深く知りたい方はこちらもご覧ください。
なぜ今「リスキリング」が必要なのか?DX時代に生き残るための、人材育成の考え方と3つのステップ
ブレインパッド代表の高橋が代表理事を務める、一般社団法人データサイエンティスト協会では、データサイエンティストに必要なスキルを「ビジネス力」「データエンジニアリング力」「データサイエンス力」と定めています。本記事では、特にこの3つのスキルをどのようにして身に着けたのかに焦点を当てました。
シリーズ第1回となる今回は、公認会計士からデータサイエンティストへ転身した、アナリティクス本部アナリティクスサービス部、中山英樹さんです。
連載記事
■登場者
2016年6月に株式会社ブレインパッドに入社。前職は監査法人にて10年ほど勤務、会計監査業務やデータ分析業務に携わる。株式会社ブレインパッドにおいては、ネット業界における広告の分析、配信の最適化、アパレル業界の需要予測・画像分析、人材業界の人事分析・自然言語の分析などのプロジェクトに携わる。
データサイエンティストの中山です。私はブレインパッドに入社して7年になります。これまで、小売会社のデータ活用の支援や需要予測、ウェブ関係会社における広告予算配分の最適化、広告販売の営業活動におけるデータ活用の支援などを行ってきました。
入社前の経歴は、大学・大学院で機械学習の研究をした後、会計やファイナンス分野に興味を持ち、公認会計士試験を受験し、卒業後に合格して監査法人に就職しました。7年程度会計監査業務に従事し、上場企業の決算や有価証券報告書等の開示資料のチェックや、クライアントへの会計に関するアドバイスを主に行っていました。
当時(2014年)、世間的に「データサイエンス」という言葉が騒がれ始めていました。大学・大学院での経験や、また社内において不正取引をデータ分析により抽出する仕事の部署の募集があったため、興味を持ちその部署に異動しました。
その部署ではTableauというツールを使用してデータを可視化したり、PythonやRでデータをクラスタリングするということを行っていました。ただし、社内にデータ分析に詳しい人がいなかったため、独学によりデータ分析を学ぶも自己流に終始してしまい、十分な成果を出せないような状況に陥っていました。
具体的には、データを分析して可視化してプレゼンしても「ふーん」といった興味のなさそうな反応をされることや、例えばクラスタリングでK-Meansなどのアルゴリズムを使用したとしても、それがデータ分析として本当に正しいものなのか、顧客に見せて良いものなのか、ということがよくわかず、自分の成果物に自信が持てないという状況が発生していました。
そこで、正しいデータ分析手法を身につけるために、当時株式上場していて、業界としては会社の規模が大きかったブレインパッドに転職しました。
私がキャリアの中でデータサイエンティストになろうと自ら行動したことのはじまりは、監査法人における部署異動でした。そのきっかけは、「自分自身のきっかけ」「世間的なきっかけ」「会社のきっかけ」の3つにまとめられます。
「自分自身のきっかけ」としては、当時会計監査の仕事に7年程度従事して一通り会計や監査に関する仕事が出来るようになり、新しいことにチャレンジをしたくなったということと、今後のキャリアを考えた時に会計監査の仕事をそこまで長く続けたいと思わなかったということがあります。その中で新しいチャレンジとして、以前大学・大学院で研究していたデータ分析関係の業務に戻るということを考えました。
「世間的なきっかけ」としては、当時「ディープラーニング」や「データサイエンティスト」といった言葉が流行しておりその影響を受けたということがあります。
「会社のきっかけ」としては、当時不正会計の事例が増加し始めておりその中で実験的な取り組みとして不正取引をデータで分析するという取り組みが始まっていました。それに関して会社がデータ分析関係の部署で異動を募集していたということがあります。
このような経緯もあり、私はデータサイエンティストになろうと決心しました。
データサイエンティストになると決心し、社内で異動したあと、ブレインパッドに転職したのですが、そこでは大きな苦労がありました。
特に苦労したのは、前職とは「仕事のタイプが異なる」という点でした。以下で、仕事のタイプ、それぞれに求められるスキル、そのバランスについて、順を追って解説します。
世の中にある仕事のタイプの定義はたくさんありますが、ここでは「仕事の主体が自分にある仕事」と「仕事の主体が自分にない仕事」に分類します。「仕事の主体」とは、仕事において何をすべきか、いつすべきか、どのように進めるか、そして最終的にどのような成果を出すべきか(社内のマニュアル等に頼らず)と定義します。
仕事において何をすべきか、いつすべきか、どのように進めるか、そして最終的にどのような成果を出すべきか(社内のマニュアル等に頼らず)などを自ら定義して考える仕事とします。具体的には、世の中やその会社に存在しない事業や業務を生み出す仕事などにあたります。
上司や社内のマニュアルにある指示に基づいてその通りにする仕事とします。具体的にはマニュアルに基づいて作業する仕事などになります。
最終的にどのような成果を出すかを描いた上で、それを達成するためにどのように仕事を進めるか、どのように人を巻き込むか、何をすべきかを考えて実施する力が必要と考えます。
※世の中や会社において存在しない仕事をすることが多いため、意思力の強さも必要。
上司に言われたことやマニュアルで定められている内容を正確に効率よくこなす力が求められます。
多くの仕事において、上記の仕事の2タイプのバランスが「100:0」または「0:100」となるケースはほとんどなく、どちらのタイプも含まれるケースがほとんどです。ただし、私のキャリアチェンジにおいてはこの割合が大きく異なっており、「この事実自体に気づくこと」「気づいた後に対応するために自らで改善すること」に苦労しました。
具体的には、前職の仕事のタイプのバランスは、「仕事の主体が自分にある:仕事の主体が自分にない=20:80」でした。一方データサイエンティストに求められるタイプのバランスは、その人の立場やミッションなどによって異なりますが、「仕事の主体が自分にある:仕事の主体が自分にない=80:20」だと言えます。
転職当初は「仕事の主体が自分にある:仕事の主体が自分にない=20:80」だった前職での経験に根付いたバランスで仕事をしていたため、上手くいかないケースなどもありました。具体的には、次のような仕事の進め方をしていました。
顧客から何かしらのデータ分析の依頼があった場合、顧客の概要や依頼の背景のみを確認します。その後、顧客とのMTGにおいて実施したいことを確認し、その場でそれが出来そうかどうかなどを確認して、例えば、顧客の実施したいことを満たすように、「分析で購買者像を明らかにする、ペルソナ分析をします」という提案をします。分析した結果を顧客に説明し、これからどのように活用しましょうか?と議論して、活用に進んだり、一方で進まなかったりします。
一方、データサイエンスの仕事などで求められる仕事の進め方は以下です。
顧客から何かしらのデータ分析の依頼があった場合、顧客の概要や依頼の背景を確認した上で、「自分が顧客に何を提供したい」か、そしてデータ分析の結果をどのように使えば顧客にとって価値が生まれるものになるのかを考えます。いわゆる自分で「プロジェクトの絵」を描きます。同時に、技術的に実現するためにはどのようにすべきかを考えます。
顧客とのMTGにおいては、顧客が実施したいことと自分が考えたアイデアの差分を確認するに留め、自分の考えたアイデアの方が顧客にとってより良いものであればそれを提案することもあります(例えば、ペルソナ分析を依頼されたとしても、レコメンドのほうが良ければそちらを提案するなど)。同時に、最終的に分析結果を施策に活かし、使ってもらうという点が重要であるため、どのように使っていくかという議論についても早い段階から開始します。
このような仕事の進め方においては、当初描いた「プロジェクトの絵」とは異なるものの、最終的に分析結果を活用して価値を生み出すという形に落とし込まれることが多いです。分析結果が活用されるという点については、当初から分析結果を活用することに対して問題意識を持ち活動をするということも必要だと考えます。
「仕事の主体が自分にある:仕事の主体が自分にない=80:20」の仕事の進め方が求められる理由としては、データ分析という仕事の分野が比較的新しいため、必然的に新しい業務を生み出す結果になることや、社内に理解のある人が少なく、「新しい仕事」として距離を感じられやすい点などがあげられます。
この点について深掘りをすると、顧客はビジネスには詳しいものの、データ分析に関してプロフェッショナルではないことが多いため、データ分析やAI等を使って何かを実現したいという想いはあっても、その目的が多少ずれていたり、進め方が誤っていることがあります。このようなプロジェクトを推進するには、顧客にのみに任せるのではなく、データサイエンティスト自ら、プロジェクトが目指すものは何で、自分は何をすべきで、周りにどのような協力を求めるのか等を考えて行動する必要があります。
このように、仕事を進めるにあたって、自ら何をすべきかを考えて行動するという点が多く求められることになり、「仕事の主体が自分にある:仕事の主体が自分にない=80:20」の仕事の進め方が求められることとなります。
当初、データ分析結果が活用まで進むプロジェクトが多くなかったこともあり、その理由について改めて考え直したところ、自分には何かが足りないなということに気づきました。その中で、経験豊富なブレインパッドの他のデータサイエンティストの方への相談や、「仕事の主体が自分にある:仕事の主体が自分にない=80:20」の仕事の進め方が上手くできている人の本を読んだ結果、具体的に改善すべき点が明らかになり、「仕事を進めるにあたって、自ら何をすべきかを考えて行動する」というスキルが不足していると定義しました。その後は実際のプロジェクトにおいて、「仕事の主体が自分にある:仕事の主体が自分にない=80:20」の仕事の進め方を体現していくことにより改善しました。
データサイエンティストとは、一言で表すと「データを活用して価値を生み出す人」です。ビジネスの現場に限定すると「ビジネスの現場においてデータを活用して経済的価値を生み出す人」になります。「価値を生み出す」とは、データ分析の結果を基に「誰かに意思決定」してもらう、いわゆる「使ってもらう」ということになります。「誰かに意思決定」してもらう、に関しては、ビジネス上において3つのパターンがあります。具体的には「意思決定の選択肢を生み出す」「最適な意思決定の選択肢を選択する」「データにより根拠づけを行うことにより組織内での円滑な意思決定に貢献する」です。そしてそれぞれ経済的価値を生み出すものです。以下でそれぞれ詳しく見ていきます。
1つ目は「意思決定の選択肢を生み出す」パターンです。これは例えば「ある製品の組み立てにおける配合パターンを考えていて、現状は部品Aの配合をしているが、部品Aに似ている部品をデータ分析により明らかにした結果、部品Bや部品Cも使えそう等の意思決定者が認識していなかった意思決定の選択肢を提案するものです。
Stable-Diffusionなどの画像生成やChat-GPTなどによる文書生成も、何らかの意思決定の選択肢を増やすものと考えられます。このパターンが生み出す経済的価値は、考えていなかった選択肢を提示することによる意思決定のリスクを軽減するものであります。
2つ目は「最適な意思決定の選択肢を選択する」パターンです。これは例えば、「広告を誰に表示するか」といった最適化問題を考えた場合において、「ユーザーに広告を表示した時にどれだけ商品の販売数量が上がるか」をデータ分析により明らかにし、販売数量の上がる順にユーザーを選択して広告を表示する、といったケースがあります。より良い選択肢を選択することで直接的に経済的価値が生まれます。
3つ目は「データにより根拠づけを行うことにより組織内での円滑な意思決定に貢献する」パターンです。こちらも事例を紹介します。「商品の発注数量を決めるプロジェクトにおいて、その発注数量が適切であるかを、上位者含めて十分に時間をかけてチェックしている」とします。その際、「ある程度過去の傾向を考慮しながら発注数量を予測する需要予測システムを導入することになり、社内において、ある程度信頼できる需要予測システムが出した数値だからということで、発注数量に関してある程度心理的な合意が形成され、チェック内容が減ることとなった」とします。その結果、チェックにかかる時間が軽減されることに繋がり、特に貴重な資源である上位者の時間を他の有用な業務に活用する、といった経済的価値が生まれます。また、このパターンは属人化しており暗黙知とされている業務を形式知化し、属人化から解き放つということにも繋がります。
この3つの意思決定のパターンに貢献し、ビジネスにおいてデータ分析の結果を活用してもらった結果、データ分析結果を活用した企業において経済的価値を生み出せる人こそがデータサイエンティストと呼べると、私は考えています。
このデータサイエンティストとして経済的価値を生み出すためのスキルとして、ビジネス力、データエンジニアリング力、データサイエンス力があります。このスキルについて、私は以下のように身につけました。
冒頭でも触れましたが、データサイエンティスト協会では、データサイエンティストに必要な3つのスキルを「ビジネス力」「データエンジニアリング力」「データサイエンス力」と定めています。
ビジネス力・データエンジニアリング力・データサイエンス力の3つは、もちろんブレインパッドの日々の業務においても求められるため、主に業務を通して身につけています。
その他には統計検定やKaggleなどのデータ分析のコンペティションに参加したり、また、代表的なアルゴリズムのソースコードを読むことや論文なども読むことで、3つの力を身に着け、アップデートすることに努めています。以下に具体的な方法を示します。
「4.データサイエンティストとなり苦労した点」に記載した内容にはビジネス力が多く含まれています。ビジネス力を身に着ける方法としては、プレゼンに付随する業務や、本や研修で身につけることがある程度は出来ますが、それはあくまでも一部です。日々のデータ分析に関する業務において身につけていくことが重要です。また、分析結果を活用した結果としてそこに経済的な価値が生まれるかどうかの判断について私の前職の公認会計士としての経験が活きていると考えています。
SQLやPython、AWSの基本等、基本的な内容については入門書などで身につけました。そのあとは、Kaggleなどのコンペティションに参加し、再現性があり、かつ効率の良い分析をするための分析環境の構築や日々の業務においてスキルを磨いています。
日々の業務において、顧客の課題に向き合うことにより磨ける点が多いです。その他には、統計検定のカリキュラムは基本的なデータサイエンスを業務として進めていくための内容が網羅されており、勉強する内容としては良いものと感じています。また、scikit-learnやLightGBM、Pytorch等の代表的なアルゴリズムのソースコードを読む、論文にあたるということを行っています。数理最適化の分野は重要ですが、勉強しにくい分野であり、入門書などの内容を有償の最適化ソルバーに解かせたりしています。また、「4.データサイエンティストとなり苦労した点」に記載した内容の中で「プロジェクトの絵を描くスキル」はビジネス力との複合的な分野となっており、データサイエンス力も求められます。
データサイエンスの分野はまだまだ開拓されていない分野が多い(どうやって活用するか、どうやって価値を出していくか、アルゴリズムという分野は特に)のでチャレンジしがいがあります。また、現在あるビジネス分野において、経験と知識を備えた人がデータサイエンス力を持った場合、その分野に関してのデータ活用に関して、今までにない価値を生み出す可能性があるものと考えています。ハードルは低くはないと思いますが、やる気があればチャレンジしてみてはどうでしょうか。
「私が考えるデータサイエンティストとは」に記載したように、ビジネスにおいてより多くの経済的価値を生み出せるようなデータサイエンティストを目指して日々努力したいと考えています。また、特にデータを実際に活用して経済的価値を生み出すことについてはまだまだ開拓出来る部分が多い分野でもあり、新しいデータ活用の方法やあり方、それによる価値といったものを生み出すことにチャレンジしていきたいと思います。ありがとうございました。
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説