データサイエンティスト育成講座 株式会社ブレインパッド

イベント通信

2019年11~12月度の公開講座・開催レポート【前編】


2020年01月09日


みなさん、こんにちは。ブレインパッド教育講座事務局です。

2020年を迎え、今週から新たな気持ちで仕事や勉学に取り組まれている方も多いのではないでしょうか。
まだまだ寒い日が続きますので、くれぐれも体調に気をつけてお過ごしください。

本日は、昨年11~12月にかけて開催された「公開講座」の模様をダイジェストでお伝えするとともに、各講座でお伝えしているポイントも一部公開する特別版でお送りします。今回はその【前編】となります。

======================================================

これからはじめるデータサイエンス入門 2019年11月28日(水)

 

まずは身の回りにあるデータを認識することから:

11月に開催した同講座は、8名の受講者に参加いただき、そもそも「データサイエンスとは」という疑問に答えるところから始まり、データを活用した問題解決プロセス、データを集計・可視化するテクニック~総合演習までリアルなデータサイエンスの現場の空気を感じていただける講座プログラムとなっています。
さて、身の回りにあるデータってどんなものがあるのでしょうか。

データの性質はいろいろ分け方がありますが、ここでは「量的データ」と「質的データ」の2つに分けて説明します

ここでいう量的データとは「直接、数値ではかることができるデータ」であり、質的データとは「性別、職業、配偶者の有無など、一般に数や量で測れないデータ」です。この違いを理解しているかしていないかによって、データの扱い方の基本が問われます。近年、簡単にデータを可視化したり、統計モデルを作成できるツールはたくさんありますが、データを論理的に掴むことが重要といえます。

 講座では、ビジネスパーソンに最も身近なアプリケーションである「エクセル」を活用して、多様なデータを加工して、集計・可視化するプロセスをざまざまなテーマとともに解説・実践していきます。

 

意外と知らないデータ加工から可視化へのプロセス:

講座の前半ではデータを可視化するための練習として

・SNSの口コミデータ

・食料品の売上データと気温データ

・株価データ など

を使用したデータの可視化方法を徹底的に学習します。

 普段の仕事では触れることのないデータもあるため、はじめのうちは苦労される方もいますが、慣れてくると徐々にコツが掴めてきて、自分の思い通りのグラフを作成できるようになります。目の前のデータの性質や特徴を確実に把握して、何を目的にどう可視化するかを自分で組み立てられるようになると、どんなデータが相手でも怖がらずに対峙できるようになります。

 総合演習まで含めるとアッという間の1日間の講座ですが、受講者の受講後の感想を見ると、実際に手を動かしてデータを集計・可視化し、そこから課題発見をしていくプロセスは、とてもエキサイティングで充実した講座になったようです。

講座の後半になるとグループに分かれての「総合演習」が始まります。

テーマは「小売店舗における売上最大化」のための分析プロジェクトです。

各グループで分析設計を実施し、データを加工~可視化するプロセスを進行していきます。演習を体験いただくことで、おぼろげだった知識や何となくしか理解していなかったことを定着させることができ、これが実務に活かせる力に繋がります。

 

講座でお伝えしているポイント:

 1.データ分析の目的や目標(ゴール)を明確にすること

 2.問題を構造化して、大きい対象から小さなものに細分化すること

 3.比較する指標の差や割合・比率を基準にスコープを絞り込むこと など

 

受講者の感想:

入門編ということでしたが、初心者にわかりやすく丁寧に教えていただきました。
今後触っていくいいきっかけになりました。これからも勉強を続けていきたいと思います。
(男性・30代・マーケティング職)

初心者で受講にあたり心配していましたが、一緒に参加された方にも助けられ、大変ためになる時間でした。
(女性・30代・IT企画)

 

「データサイエンス」というと何となく仰々しいイメージがありますが、今後のビジネスパーソンにとってデータをもとに集計・可視化、モデリングなどを行い、何かしらに生かしていける能力は非常に重要になってくると言われています。

 データサイエンティストにはほど遠いけど、これから学習を深めていきたいという方には大きな一歩となるカリキュラムとなっています。ぜひ受講をご検討ください。

 

======================================================

SQLによる集計・分析 2019年12月9日(月)~10日(火)

 

SQLでデータ分析を実践する2日間:

12月度の講座では13名の受講者に参加いただき、SQLの基礎的な動作や仕組み、アソシエーション分析やデシル分析といった応用的な分析手法のアプローチの紹介から総合演習まで熱い2日間の講座が繰り広げられました。

当たり前の知識から再確認:

 講座前半の座学パートでは、データベースの知識から、機能、SQL構文の基礎など、当たり前の知識から全員で確認していきます。エンジニアの方であれば、普段からデータについて詳しいという方も多いのですが、データベース上に蓄積されているデータ分析に適した形式に抽出・加工・編集するという経験をしたことがある人は少ないようです。

 講座では、データベースの構造や中身について、初心者・上級者を問わず、受講者全員が一から学びます。理由は、データ分析の側面からデータ分析に改めて触れてもらい

抜け漏れのない基礎知識を受講者全員で共有するためです。

 

SQLでできる分析の可能性の広がり:

 講座内ではSQLを活用してデータ分析するとなると、クロス集計や平均・中央値のような統計値を算出するだけというイメージを持つ方が多いのですが、それ以外にも実装可能な分析手法があることは、あまり広く知られていないようです。

 ウィンドウ関数やJOIN(複数のテーブルを結合するコマンド)をフル活用することにより、SQLでできるデータ分析の可能性は大きく広がり、単純な集計だけではなく、業務KPIや一部の統計的な分析もできるようになりました。講座内では、手法の一部を時間が許す限り紹介していきます。

 

講座でお伝えしているポイント:

 1.データベースやSQLの機能構造や可能性を理解すること

 2.データの意味合いをキチンと理解して、適切なデータに加工すること

 3.データ分析の目的を理解した上で、ドメイン知識に基づく分析設計の方法 など

 

受講者の感想:

基本的なSQLの構文だったので、どのように分析できるのかと疑問に思っていましたが、
かなり複雑な分析もSQLで実施できることを知ることができたので良かったです。
(男性・20代・エンジニア)

座学で学んだ知識をその後すぐに総合演習という形で実際に手を動かして学ぶことができてよかったです。
(20代・女性・企画職)

 

======================================================

Rによる統計解析 2019年12月11日(水)~13日(金)

 

統計解析をより身近なものに:

12月度の講座では20名の受講者に参加いただきました。この研修では統計解析の全体像を難しい数学記号や微分積分などの数学知識を極力使わずに学習していきます。この「簡素化」は一見すると学習の妨げになりそうですが、我々がこの方法を選んでいるのは 「統計学の本質な理解は、数学記号や数式を使わなくとも伝えることができる」というコンセプトに基づいています。当然ながら、確率や微分積分の知識があるに越したことはないのですが、 数学アレルギーの方でも参加いただけるように研修を設計していますので、初学者から中級者の方まで幅広い方々に安心してご受講いただけるのが特徴です。

 

素朴な疑問も、全員で共有して理解を深める:

そんな数学的要素を排除した講座ですが、少し難しい単元にさし掛かると、忽ち受講者から多くの質問が寄せられます。

Q. 検定、分散分析 など手法の使い分け方はどうしたらよいか?

Q.  同じ予測モデルでも、時系列解析回帰分析の違いや使い分けってあるの?

Q.  多変量解析をする際に どのくらいのデータ量 があるとよいのか? など

 このような質問が寄せられるのは、受講者の中で実践を念頭においた明確な目的意識があるからです。当社の講座では、受講者からの素朴な疑問やちょっと突っ込んだ質問も積極的に受け付けています。なぜなら、そのとき質問をされた方が1名だったとしても、いずれは他の受講者が同じ疑問にぶつかることがありえると考えているからです。

 そして、中でも特に多い質問が「実務ではどうするのか?」という現場視点の質問なのですが、ビジネス実務の観点から適切な回答ができるのも現役のデータサイエンティスト集団を中心とした 講師陣がいる、我々の強みといえます。

 

統計解析を実践するからこそ見えてくるもの:

 講座が3日目にさし掛かると、いよいよ総合演習が始まります。グループ毎に分析目的に沿って分析設計をして、具体的な作業に入っていくのですが、この時間帯になると受講者の皆さんの表情が生き生きとしてきます。

 総合演習に取り組んでみるとわかるのですが、どれだけ統計解析の知識や理論を習得していたとしても、目の前のビジネス課題に対してどのような分析課題を設定し、そのうえで何を目的に統計解析を導入するかということがとても重要であり、そこで様々な工夫が求められます。これがデータ分析をやっていて一番難しいところである反面、もの凄くエキサイティングで楽しい場面でもあります。

 

講座でお伝えしているポイント:

 1.データの性質や特徴を理解に役立つデータ加工や可視化のテクニック

 2.モデル(予測、分類、連関、時系列)の作成方法や評価方法

 3.分析プロジェクトの中で統計解析・数理モデルを適切に使うポイント など

 

受講後の感想:

全くの未経験でも基礎からわかりやすく解説していただき、良かった。
(男性・30代・IT企画職)

R・RStudioの使い方から、実際の分析の流れも体験することができた。
不明点のフォローもしっかりしていた。(男性40代・エンジニア)

今必要な知識がしっかり身についたと思う
(男性40代・企画職)

 

開講スケジュールはこちらからご確認ください。

https://school.brainpad.co.jp/schedule

 

======================================================

いかがでしたでしょうか。次回は【後編】ということで上位2講座の模様を紹介します。

当社がご提供する講座の特徴は、 データ分析をビジネスで実践する力を養えることです。
そのため、講座構成はカリキュラム全体の過半数がグループ演習となっています。

Kaggleや一般のデータ解析コンペティションでは味わえないブレイクスルーを体験できること間違いなしです。
普段、データ分析の学習をしていて、何となく達成感やビジネスとの繋がりが体験できずにつかめずに悶々としている方、ぜひ当社の講座プログラムをご利用ください。

 

それではまた。