メルマガ登録
本日もSnowflake Summit Day3の様子を現地からレポートしていきたいと思います。
本日は最後のKeynoteがある日でした。Keynoteのほかにもいろいろと参加してきたので、そちらを中心にお伝えしようと思います。
本日のKeynoteはSnowflakeのビルダーコミュニティに焦点を当てた内容となっています。
50万人のメンバー、5万人のアクティブユーザー、82のアクティブグループが存在するSnowlfakeのコミュニティは非常に活発なものとなっており、日本でもSnowVillageというコミュニティが有名です。弊社メンバーも参加しており、SlackでSnowflakeユーザーとコミュニケーションを取ることができる貴重な場です。
メインの講演内容としては、AIがソフトウェア開発ライフサイクル、特にデータアーキテクチャに与える影響について語り、PLAN、ARCHITECTといった各STEPに分けてSnowflakeの機能についてデモを交えながら説明する形で進みました。
具体的なKeynoteの内容であるBuilders Keynote Resoucesは下記にまとめて公開されていますので、気になる方はご一読ください。
【参考】
https://snowflake.com/en/summit/resources/developers/?utm_source=snowflake&utm_medium=qrcode&utm_campaign=summit25builderkeynote
その中でも気になったものをひとつあげるとするならば、OpenAI compatible APIになります。OpenAI SDKと互換性のあるエンドポイントを提供すると発表があり、これにより既存のOpenAI SDK用に書かれたコードを最小限の労力でSnowflake環境に移行することができます。
既存のコードをSnowflake Cortexで動作させるためには、APIキー、ベースURL、および必要に応じてモデル名と、わずか3行のコード変更で済みます。OpenAI SDK用に書かれたどのようなコードでも、Snowflakeから直接実行できるという点が強調されていました。
ほかにもvLLMやDeepSpeedへの投資、シリコンバレーAIハブの設立など、広範なビルダーコミュニティと連携しながらAIイノベーションを推進していくというメッセージが全体を通して感じ取れたように思います。
Keynoteが終わった後、日本のSnowflakeコミュニティによる企画に参加してきました。
こちらは、Data Superheros※ がお勧めするブースを回るツアーになっていて、注目のソリューションや、現地でしか体験できないSnowflakeブースなどを案内してもらえるツアーとなっています。
※Data Superheros:情熱的なデータエキスパートが集まるグローバルコミュニティ。
【参考】
https://www.snowflake.com/en/data-superheroes/
今回は以下の4チームで募集があり、応募し参加してきました。
【第1回】6月4日(水) 11:30~13:00
【第2回】6月4日(水) 15:30~17:00
各チーム20名(計80名)
ブレインパッドからは1名の参加でしたが、今回は「「レッドチーム」今後目を離せない、最新のプロダクトを一足先にチェック!」に参加してきました。
ブースは全部で4つ回りました。日本人で集まって回ることができるので、安心感がありました。
ツアーらしく、Snowflakeの旗を持っている人についていく形でした。
回ったブースは以下の通りです。
1.dbt Labs
2.Fivetran
3.Sigma
4.hightouch
1から3についてはそれぞれの企業から日本語で説明いただき、4については、コミュニティの方々が説明や翻訳をしながら質疑応答にも対応されるなど、英語が苦手な方でも参加しやすい素晴らしいツアーでした。
Snowflakeはコミュニティが強いのが魅力と聞いていましたが、このような場面でも実感できる良い機会でした。来年など参加される際はぜひ申し込んでみてください。ただ、人数制限で申し込みはすぐ終わってしまうので注意が必要です。
ツアーで回った際に、dbt LabsとSigmaの2社からTシャツをいただきました。こういうのもうれしいですね。また次回参加できるなら必ず申し込みたいと思います。
昨日のKeynoteで発表され、我々のDay2レポートでも取り上げたCortex AISQLについてPdMのRenee Huang氏が詳細を説明するセッションに参加しました。
改めて説明すると、Cortex AISQLとはSQL内でLLMへのクエリをそのまま自然言語入力することができ、画像や音声などの非構造化データに対してSQL文で生成や要約、分類などのタスクを実施できる機能です。
AISQLが生まれた背景として、
という課題感があるなか、よりシンプルに非構造化データを分析するためにも、SQLライクでの機能が求められていたようです。実際にSnowflakeは様々な機能をSQL上で実行できるように機能を追加してきた背景があります。
AISQLの利用例として、例えば「再生可能エネルギー業界において、直近でCEOが交代した企業の年間利益成長率とその市場における見通しを知りたい」場合を考えます。
ただしデータは日本の有価証券報告書にあるような企業概況や事業状況、といったテキストしかありません。
通常であれば、再生可能エネルギー:業界のタグやCEO交代フラグを何かしらの条件で付与してフィルターし、今後の見通し成長率や今後の見通しを抽出するのが一般的です。できないわけではないですが、いくつかのsytep-by-stepの処理が必要になります。
対して、このタスクをAISQLで実装すると以下の画像のようなSQLクエリになります。
このSQLクエリにより、単一の文書でこれらのタスクを実行できるようになります。昨日のレポートで言及したように、JOINの精度には懸念があるため、確実な結合方法を用いるのが賢明でしょう。しかし、LLMを使用してこれほど容易に集計できるのであれば、通常数時間かかるアンケートレポート業務が、わずか数クエリで完了する可能性を秘めています。
AISQLで用意されている関数はいくつかがパブリックプレビューとなり、すでに使えるものもあれば、まだプレビューになっていないものもあるようです。引き続きウォッチしていきたい機能のひとつです。
Snowflake社のTechnology Partnerで、Modern Data Catalogサービスを提供するAtlan社の創業者のセッションに参加しました。
ブレインパッドのビジネス現場感と合致しており、非常に共感できる内容だったので、ご紹介させていただきます。
Atlanの根底にあるのは「In the AI era, context is king」という信念であり、ビジネスとデータを繋げて成果を出すためには、Contextの共有が人間のアウトプットを最大化するという考え方です。
現代においてAI活用が想定より本番への移行へ進んでいないのは、結局3つのAI Value Chasmがあるからだと整理しています。
1.Data:分散したデータの発見と理解の難しさ
パイロット段階では小規模なデータセットでモデルを訓練するのは容易です。しかし、本番環境では企業内に多くのシステムが散在し、人間の属人知識といった多様な場所にコンテキストが分散しているため、必要なデータを網羅的に発見し、その意味を正確に理解することは極めて困難です。
2.Meaning:ビジネス上の意味の統一とAIへの教育
人間同士でも言葉の定義が各部門で異なってしまうように、ビジネス用語の解釈にはばらつきがあります。大規模言語モデルは言語を理解しますが、企業固有のビジネス定義や用語のニュアンスを正確に教え込むことは非常に難しい課題です。
3.Governance:AIと基盤となるデータのガバナンス
特定のAIアプリケーションで使用するデータは厳密に隔離し、他の組織データとの接触を禁止したいといったケースはよくあります。しかし、予測不可能な利用、広範なデータアクセス、変化する規制、多様なユーザーが存在する本番環境で、これらのデータガバナンスとAIガバナンスを確実に適用することは非常に困難です。
これらの3つのAI Value Chasmを乗り越え、AI Native Companyを創出するために、「Context Bridge」を果たすソリューションを提供しています。
A.Unify:データとAIの環境を統一する
組織全体のデータ、意味、ガバナンスを統合し、スケーラブルな基盤を構築する。
<主要機能>
B.Collaborate:データとAIのライフサイクル全体で人間がコラボレーションするのを助ける
データとAIのプロダクトライフサイクル全体で、異なる役割、システム、ポリシー、プロセスを持つ人々が効果的に協力できるオペレーティングモデルを構築する。
<主要機能>
C.Activate:多様な人間とAIのユースケースを活性化する
人間の行動をAIで拡張し、Atlanをユーザーのワークフローに埋め込み、AIネイティブな体験を可能にする。
<主要機能>
セッションの最後には、AIネイティブな世界のためにゼロから再構築する「メタデータレイクハウス」が必要だと主張しています。Atlanは、データ活用人材がAIと協力し、今後10年間に直面すると考えている問題に取り組んでいくことを使命として企業活動を行っていくとのことです。
ブレインパッドは「Data-driven as Usual」をビジョンに掲げており、Atlan社が提唱する今後の展開に深く共感しています。日本でともに何かを始めるのも良い方法だと感じました。
Snowflake Summit は参加者も活発でアツい空気感が流れており、3日目にして興奮も最高潮に達しています。Swagの購入を控えていたメンバー1名も我慢ができなかったようでした。
Day3も終わり、ついに明日でSummit最終日となります。
最後まで集中して楽しみたいと思います!
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説