メルマガ登録
こんにちは。データサイエンティストの奥田です。
各企業が多種多様なデータを収集し、ビジネスへの利活用を試みている昨今、オルタナティブデータへの注目が高まっています。元来、投資家やクオンツアナリストが分析に用いることの多かったオルタナティブデータですが、近年の生成AIなどの技術発展により、データ活用へのハードルが低下しつつあります。オルタナティブデータの活用を検討されているものの、具体的な活用方法が不明確な分析担当者の方も多いのではないでしょうか。
本記事では、オルタナティブデータの活用における現状と、その展開場所として頭角を現しているSnowflakeマーケットプレイスの存在、またブレインパッドが取り組んでいるSnowflakeを用いたオルタナティブデータ活用の可能性探索について解説いたします。
オルタナティブデータとは、従来の財務諸表や市場データといった伝統的な金融データに対して、それ以外の非伝統的なデータソースから得られるデータの総称です。
技術発展によって日々生成されるデータの収集ハードルが下がり、また会社の意思決定にデータを活用する機運が高まっていることから、資産運用のために分析対象として利用していた投資家やクオンツアナリストだけでなく、事業会社や公的機関など、様々な場面での活躍が求められ、近年注目が集まっています。
オルタナティブデータの代表的な例として、以下のようなものが挙げられます。
特に近年は生成AIの発展により、外部テキストデータの活用を望んでいる方も多いように思います。
オルタナティブデータの活用価値は、主に以下の2点に集約されます。
1.リアルタイム性:
従来の財務データや決算報告は実際の事象よりも遅れて開示されるため、よりリアルタイムで取得できるオルタナティブデータは、迅速な意思決定を可能とし、市場の変化を早期に捉えることができます。
活用例:
2.独自性:
従来のデータでは見えてこなかった観点や要素をオルタナティブデータで測定・観測することが可能です。また、これが競合他社が持ち得ない独自の視点での分析である場合、差別化された意思決定を行うことができます。
活用例:
実際、一般社団法人オルタナティブデータ推進協議会(Japan Alternative Data Accelerator Association (以下「JADAA」という。))公表のオルタナティブデータFACTBOOKによると、オルタナティブデータを活用する利点についてのアンケート結果として、「既存データとの差別化(53%)」が最多で、「既存データとの補完性(47%)」、「速報性(34%)」という回答が得られています。
しかしながら、オルタナティブデータの活用には、いくつかの重要な課題が存在します。
1.データ選定の難しさ:
オルタナティブデータは種類が膨大であり、利用シーンに最適なデータの選定が困難です。実際の使用前には価値判断が難しく、データの信頼性評価も容易ではありません。
2.品質担保のためのコスト:
前処理や基盤連携など、データの品質を担保するための人的コストに加え、データ取得にかかる金銭的コストが利用のハードルになります。自身で収集する場合はデータの購入費用はかからないものの、前処理に必要なコストがその分増えていきます。
3.データ人材の不足:
上記2点にも関係しますが、データを取り扱う人材の不足も活用を妨げる要因となっています。データの安全性や信頼性を担保できる人材が不足しているため、コストをかけてまで活用するという意思決定に至らないケースが多く見られます。活用人材が少ないゆえ、日本での活用事例が少ないことも要因のひとつと考えられます。
こちらもJADAA公表のオルタナティブデータFACTBOOKを参照すると、活用にあたっての課題に対して、「データの利用コストが高い(50%)」、「データを取り扱う人員や組織がない(39%)」、「データの正確性、信頼性・継続性が担保されない(39%)」といった回答が挙げられています。
オルタナティブデータを利用するには、WebスクレイピングやAPIといった技術を用いてWebサイトから自身でデータを収集する、もしくは、データを収集して販売するデータプロバイダ企業から購入することが一般的です。
元々は欲しいデータを探し出すのに直接データプロバイダ企業とコンタクトをとる必要がありましたが、最近では世界有数のデータプロバイダ企業が、自身でマーケットプレイスと呼ばれる売買プラットフォームを展開しています。データカタログとして自社データやサードパーティデータを一覧化し、販売することで利用者が欲しいデータを見つけやすくし、より利用が促進されるように取り組んでいます。
データプロバイダ企業のマーケットプレイスの例:
そんな中、GCPやAWSなどのクラウドベンダーもデータマーケットプレイスを提供し始めています。購入したデータをAWSのS3やGCPのGCSに直接連携できる点が特徴です。
特に、AIデータクラウドサービスを展開するSnowflakeのマーケットプレイスが注目を集めています。Snowflake導入企業は日本でも増え続けており、最近では株式会社QUICKや株式会社日本取引所グループ(JPX)など日本の有数な金融データプロバイダ企業がSnowflakeのマーケットプレイスへのデータ取り扱いを始めるなど、日本のマーケットプレイス市場にも注目が高まっています。
Snowflakeについての詳細は、こちらの記事を参照ください。
【関連記事】
クラウドプラットフォーム・クロスファンクショナルチーム(Snowflakeチーム)の活動紹介 ~Snowflakeの紹介編~
ブレインパッドでは、この注目が高まっているSnowflakeマーケットプレイスが、オルタナティブデータ活用の鍵になると考えています。Snowflakeのマーケットプレイスには、世界各国のデータプロバイダ企業がデータセットやアプリケーションを公開しており、2025年5月現在、約3,000以上のデータセットが存在しています。
Snowflakeマーケットプレイスの特徴を紹介しながら、オルタナティブデータ活用の可能性を探っていきます。
Snowflakeには独自のデータシェアリング機能があり、本来であれば外部データを活用する際に必要とされていたFTP(File Transfer Protocol)やAPI(Application Programming Interface)、ETL(Extract・Transform・Load)といった処理が必要ありません。
マーケットプレイスに存在する外部データを共有データセットとして自社のSnowflake上に取り込み、自社データと組み合わせて利用することが可能になります。さらにマーケットプレイス上のデータの更新はプロバイダ側で常に行われており、その更新は共有されたデータセットにも反映されるため、最新時点でのデータを毎度ダウンロードするといった手間も必要ありません。
自身でデータ共有する範囲も柔軟にコントロールでき、
といったことも可能です。
安全性も担保されており、Data Clean Roomという機能を用いて個人情報を共有せずにコラボレーション先とデータ共有を行うこともできます。処理済みのデータを社内全体で共有することで、同じような処理を重ねて行う必要はありません。
こういったセキュアでシームレスなデータ共有ができる観点から、特にデータの取り扱いが厳しい金融業界でもSnowflakeが導入され始めており、ブレインパッドとしても基盤構築だけでなく、Snowflakeのマーケットプレイスを用いた外部データ活用を支援しています。
Snowflakeマーケットプレイスのデータ利用形態としては3つの種類があります。
無料のデータセットはもちろん、有料のデータセットに関しても支払い形式を設定しておくことで、マーケットプレイス上で利用したいデータを見つけたら、ワンクリックですぐに使えるようになります。すぐにデータベースが連携され、面倒な手続きや前処理などは必要なくほんの数秒で社内のデータと連携する準備が整います。このすぐに使えるというポイントが非常に魅力的です。
しかしながら2025年4月現在、日本のデータプロバイダ企業の有料データに関しては、リクエスト形式をとっていることが多いです。
ただしリクエストが必要なデータでも無料でのトライアル利用期間を設けていることが多く、一定期間お試しでデータの中身を確認することが可能になります。トライアルに関しては無料データと同じように、画面上で利用ボタンをクリックするだけで問題ありません。
ブレインパッドとお付き合いのあるデータプロバイダ企業をご紹介し、コミュニケーション支援をすることも可能です。
先ほども言及したように、Snowflakeのマーケットプレイス上には約3,000以上のデータセットが公開されており、Snowflakeで整理されているカテゴリとして「人口統計」「コマース」「地理空間」「金融」…と様々なデータが存在します。
決算情報といったトラディショナルな金融データはもちろん、天気データや人流データなどのオルタナティブデータもあり、搭載されるデータセットは今後も増え続けていくことが予想されます。Snowflakeアカウントを持っている方は、ぜひ一度自社で使えるデータがないかをご確認ください。
ただ種類があまりにも多く、全部のデータを見きれないという方や、そもそもSnowflakeアカウントを持っていない方など、どんなデータが存在するかわからないという方のために、ブレインパッドでは日本の金融業界で活用しやすいデータセットをまとめたデータマップを作成しました。
これは我々も実際にマーケットプレイスを確認した際、あまりにも種類が多く、どんなデータがあるのかを探すのに苦労したためです。ある時点でのマーケットプレイスデータ一覧を取得し、機械的にタグ付けを行った後、人の目で確認・議論しながら、複雑になりすぎないよう一定の大きなカテゴリ別に再マッピングを行いました。
下記はマスクをした画像ですが、原本ではすぐにどんなデータか確認できるようにSnowflake上に飛ぶリンク付きのフォーマットとなっております。マーケットプレイス上の情報は日々アップデートされるため、あくまで断片的な情報にはなってしまいますが、下部にダウンロードフォームがございますので、必要な方はぜひお問い合わせください。
またブレインパッドでは、実際のマーケットプレイスデータを用いた分析活用アイデアや、ビジネス適用の事例を作る取り組みを行っています。整理したデータマップをもとに自社内だけでなくお付き合いのある様々なクライアントのビジネスに使えないかアイデアを募り、Streamlitを用いて汎用的なアプリ化を行うなど、社内やクライアント内での適用を見据え日々活用に向けて動いています。
現在取り組み中の事例をいくつかご紹介します。
地域の人口統計データや人流データ、天気データを活用し、地域ごとの特性を数値化することで、店舗ごとのキャンペーンや出店戦略を最適化します。
利用データ例:
企業の決算情報、企業間の出資情報やM&A情報から、業界トレンドや市場動向を分析します。盛り上がっている市場やキーワードを把握することができます。
利用データ例:
オープンデータを用いて自社取引企業に法人番号を付与し、様々な外部データと紐づけることで、Snowflake上に独自の企業マスタを構築します。
利用データ例:
不確実性の高い現代のビジネス環境において、オルタナティブデータの活用は、もはや選択肢ではなく必須となりつつあります。そしてSnowflake AI データクラウドのような統合プラットフォームの登場により、その活用の敷居は大きく下がっています。自社データをそのまま眠らせておくのではなく、オルタナティブデータといった外部データを活用することでより価値を高め、ビジネス活用の幅を広げてみてはいかがでしょうか。
ブレインパッドでは皆様のデータ活用パートナーとして、Snowflakeの基盤導入だけでなく、その後の活用までご支援させていただきます。
オルタナティブデータの活用やSnowflakeにご興味のある企業様、Snowflakeを導入しているものの、マーケットプレイスデータも含めたさらなる活用を望まれる企業様は、ぜひお問い合わせください。
以下のフォームより、弊社作成のSnowflakeマーケットプレイスデータマップ(金融業界向け)をダウンロードいただけます。
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説