生成AI導入でデータエンジニア(DE)・データサイエンティスト(DS)の役割はこう変わる──AIエージェントが担う業務と人間が専念する新たな価値領域

執筆者
公開日
2026.06.08
更新日
2026.06.04

「AIツールの導入を進めたいが、メンバーの役割がどう変わるのか見通せず、適切な方針を示せていない」「どの業務からAI Agent活用を始めればよいか判断できない」──こうした悩みを抱えるマネージャー・組織長は多いのではないでしょうか。

AI Agentの急速な進化により、データエンジニア(DE)とデータサイエンティスト(DS)の業務も大きく変わろうとしています。特にDatabricksのGenie Codeに代表されるAI Agentは、コード補完を超えた自律的なタスク実行を実現し、チームの仕事の仕方そのものを変えようとしています。

組織長が直面している最大の課題は、「どの業務が自動化され、どの部分に人間の価値が残るのか」を見極め、メンバーを適切に導くことです。

Databricksのレポートを紐解き、データ活用に深く関わるDE・DS業務を例にこれからの役割を提示します。

こんな方にオススメ!

  • DE・DSチームを率いるマネージャー・組織長
  • AI Agent導入により業務がどう変わるか見通したい方
  • メンバーの役割再定義・スキル転換戦略を模索している方

この記事で得られること

  • AI Agentが実際に担える業務範囲の具体的なイメージ
  • DE・DS業務のBefore/Afterの詳細な変化
  • AI導入後に人間が専念すべき価値領域の整理
  • バイブコーディング時代に新たに生まれる業務と必要な専門知識

本記事の執筆者
  • データエンジニア
    首藤 知紀
    Tomonori Shudo
    会社
    株式会社ブレインパッド
    所属
    データエンジニアリングユニット ビジネス開発
    役職
    副リード
    SIerを経て、2015年にブレインパッド入社。前職では基幹システムやDWHシステムの開発および運用を担当。ブレインパッドでは各種業界で機械学習モデルや最適化アルゴリズムを活用したMLopsシステムの開発のプロジェクトの設計/マネジメントを担当。

AI Agentの台頭がDE・DS業務に突きつけている変化

「AIツールの導入を進めたいが、メンバーの役割がどう変わるのか見通せず、適切な方針を示せていない」「どの業務から自動化に手をつければよいか判断できない」──こうした悩みを抱えるDE・DSチームのマネージャー・組織長は多いのではないでしょうか。

AI Agentの急速な進化により、従来のDE・DS業務は大きく変わろうとしています。特にDatabricksのGenie Codeに代表されるAIエージェントは、コード補完を超えた自律的なタスク実行を実現し、チームの仕事の仕方そのものを変えようとしています。

組織長が直面している最大の課題は、「どの業務が自動化され、どの部分に人間の価値が残るのか」を見極め、メンバーを適切に導くことです。


AI Agentは今、何ができるのか──Genie Codeを例に

Q&A型からタスク委譲型へ

従来のAIアシスタントは、ユーザーがSQLクエリの生成やコード説明を依頼すると結果を返し、次の指示を待つ「Q&A型」の動作でした。

一方、Genie Codeのような現行のAIエージェントは「タスク委譲型」です。「不正検知パイプラインをMedallion Architectureで構築して」といった高レベルの指示を受けると、自動でステップを分解し、テーブル発見・コード生成・実行・検証まで自律的に完遂します。Unity Catalogに深く統合されており、テーブルのセマンティクス・リネージ・アクセスポリシーをコンテキストとして理解した上で動作するのが特徴です。

DE業務において自動化される領域

業務カテゴリエージェントが担う具体的な処理
パイプライン構築自然言語指示から、Bronze/Silver/Goldの完全なMedallion Architectureを自律生成・テスト・実行(公式デモで確認済み)
ジョブ定義・オーケストレーションタスク・依存関係・スケジュールを含むLakeflow Jobsを自然言語から構成。変更・デバッグも自然言語で対応
障害対応パイプライン・ジョブ失敗時にエラーを分析し、関連ファイル全体の修正をdiff付きで提案。スキーマ不整合の根本原因特定から検証・解決策提案まで自律実行

DS業務において自動化される領域

業務カテゴリエージェントが担う具体的な処理
データクレンジング・前処理欠損値補完・外れ値除去などのルーティン処理を自動化。Unity Catalogのコンテキストを活用してデータ品質問題を自動検出・処理
統計分析・可視化EDAにおける基本統計量算出・分布可視化・相関分析を自動生成。適切なグラフタイプ選択やインサイト抽出を支援
SQLクエリ生成定期レポートや標準的な分析で使用するクエリを自動生成。複雑な集計・JOINロジックも自然言語指示で実装

結果として、DE・DSが専念する業務はこう変わる

定型的な実装・障害対応・品質チェックの多くをAIが担う分、人間は「何を・なぜ作るか」のビジネス判断と設計に集中するようになります。

DE業務のBefore / After

DE(データエンジニア)の業務は、バイブコーディング(AI Agentへの自然言語指示)の普及により、定型的なパイプライン実装・障害対応・品質チェックの多くが自動化されます。一方で、「何を・なぜ作るか」のビジネス判断と設計は、引き続きヒトに残る核心的な責務です。

カテゴリBefore:現在の主要業務After:AI導入後にヒトが専念する責務
パイプライン開発・保守• ソースシステムからのデータ取り込み設計(API連携、CDC、ファイル連携)• ETL/ELTジョブの開発(Spark/SQL/Python)
• スケジューリングと依存関係管理
• Medallion各層でどの変換ロジックを適用するかの設計判断(例: 返品を売上に含めるか)• ネスト構造のフラット化方針• ジョブ設計のビジネス要件判断(いつ実行・何に依存・どの頻度)
• コスト vs. 鮮度のトレードオフ判断
障害対応・トラブルシューティング• パイプライン失敗のアラート対応• データ遅延・欠損の原因調査• 上流システム変更(カラム追加・削除、型変更)への緊急対応• リトライ・バックフィル実行• 上流仕様変更が「意図的か、バグか」の判断(ビジネスプロセス変更の文脈理解)
• ループ検出と強制停止の判断
データ品質管理• データバリデーションルールの定義と実装(dbt tests、Lakeflow expectations)• 異常値検知ルールの調整• データリネージの維持• SLA管理• バリデーションルールのビジネス要件定義(「何が正しいデータか」の判断基準策定)
• リネージ上の上流変更がビジネスに与える影響の判断
インフラ・性能管理• クエリ性能のチューニング(パーティショニング、Z-ordering、キャッシュ戦略)• コスト最適化(クラスタサイジング、Spot/Reserved、ストレージ階層管理)• コスト vs. パフォーマンスのトレードオフ判断
• ビジネス要件に基づくSLA・可用性要件の設計
権限・ガバナンス管理• Unity Catalog/IAMでのテーブル・スキーマ・ボリュームの権限設定• PIIマスキングルールの実装• 監査ログの確認• 新規ユーザー・チームへのアクセス権付与• ガバナンスポリシーの設計と承認判断• PIIデータの取り扱い方針の決定
• コンプライアンス要件の解釈と適用
コミュニケーション・要件定義• DS/DAからのデータ要件のヒアリング• 問い合わせ対応(「このデータどこにありますか」「この数字なぜ変わりましたか」等)• ドキュメンテーション• 発見されたデータのビジネス妥当性判断
• ビジネス要件の技術的翻訳と優先度判断
出典(Before): https://www.databricks.com/blog/what-is-data-engineering
https://docs.databricks.com/aws/en/lakehouse-architecture/scope

DS業務のBefore / After

DS(データサイエンティスト)の業務でも同様に、データ準備・モデル開発のルーティン作業はAIが代替します。ヒトに残る価値は、「何を予測すべきか」「その結果をどうビジネスに活かすか」を判断するドメイン固有の知識と洞察力です。

カテゴリBefore:現在の主要業務After:AI導入後にヒトが専念する業務
データ準備・探索(EDA)• SQLクエリでのデータ抽出• Notebookでの分布確認・欠損値分析・相関分析• 特徴量候補の探索・可視化• 「このデータ使えるか?」の判断• 因果 vs. 相関の判断(統計的相関があっても疑似相関の可能性、季節性 vs. 構造変化の判断はドメイン知識)• データリーケージ検証
• 「このデータは将来も利用可能か」の判断(例: リリース後にしか得られない特徴量の識別)
モデル開発・実験• 特徴量エンジニアリング• モデル選択・学習・チューニング• ハイパーパラメーターチューニング(Grid/Bayesian)• MLflow実験管理• ベースラインとの比較評価• 「何を予測すべきか」の問題設定(ビジネス課題→データ課題への翻訳)• 精度の十分性判断(「精度85%は十分か」=失敗コスト vs. 成功利益のROI計算)• 解釈可能性の要否判断(規制環境ではブラックボックス不可)
• 推論速度・コスト要件の判断
モデル運用・監視• 本番モデルの精度モニタリング(ドリフト検知)• 再学習パイプラインの運用• 推論レイテンシ・コスト管理• 障害時のロールバック対応• 「何が正しいか」のPass/Fail基準設計(Agent品質分析)• どのスコアラーを追加すべきかの判断
• 評価データセットの初期構築(ドメイン固有Q&A=「正解」の定義)
ステークホルダーコミュニケーション• 分析結果のプレゼンテーション(「この数字は何を意味するのか」の翻訳)• 経営層・事業部への示唆出し• ビジネス要件のヒアリング• ビジネスKPIの設計(「何を見るべきか」の判断)• 可視化の解釈と意思決定への接続
• ビジネス価値としてのデータ活用戦略立案
出典(Before): datascience-pm.com/wp-content/uploads/2024/12/CRISP-DM-for-Data-Science-2025.pdf

AI導入で新たに生まれる業務(DE・DS共通)

バイブコーディングの普及により、DE・DS双方に従来存在しなかった新たな業務が生まれています。それは、AIに「何を・どのように指示するか」を設計し、その出力品質を管理・評価する役割です。

新たな責務・業務具体的に何をやるか求められる専門知識
コンテキスト
エンジニアリング
• UCメタデータ品質基準策定(命名規約、カラム記述、PK/FK)• SQL Expression定義(Measure/Filter/Dimensionでビジネス用語をSQL化)• Entity Matchingや Join Relationships定義• Benchmark設計(500問、言い換え2-4パターン)• Example SQL作成・検証• ドメイン知識 × SQLモデリング• セマンティックモデル設計• ビジネス用語体系の構造化
• データオントロジー設計
エージェント
評価設計
• Pass/Fail基準設計(ドメイン固有ガイドラインルールを自然言語で定義)• 評価データセット構築(ドメイン固有Q&A:「正解」の定義)• Custom Scorer実装(例: 生成SQLのテストDB実行検証)• 本番トレースの体系的エラー分析と改善優先順位付け• LLM-as-a-Judge設計• 非決定的出力の品質定量化• ドメイン固有の「正解」定義能力
• MLflow 3 GenAI Evaluation
Agent Skills /
Custom Instructions設計
• Custom Instructions: コード規約・禁止事項等の永続ルール設計• Agent Skills: ドメイン固有ベストプラクティス(PIIマスキング、予測ロジック、会計規則等)をMarkdownで定義し関連時に自動ロード• スキル粒度設計• MCP連携設計(外部ツール接続とポリシー策定)• 暗黙知の構造化・文書化• テクニカルライティング• ツール設計(入出力スキーマ)
• MCP/API設計
エージェント出力の
ビジネスレビュー
• 生成コードのビジネスロジック検証(diff承認/却下判断)• 非決定的出力のTrusted Assets設計(検証済みクエリパターン整備)• 無限ループ検出と強制停止の判断基準策定• コンテキスト分離・アクション確認ポリシー設計• ビジネスロジックの深い理解• コードレビュー→出力レビューの質的転換• リスク判断(不可逆操作の識別)
• エージェント行動の監査設計
エージェント
コスト最適化
• モデルルーティング設計(frontier vs. 軽量モデルの使い分け)• トークンバジェット設計(コンテキストウィンドウの経済的利用)• AI Gatewayによるレート制限・コスト上限設定• コスト/品質のパレート分析と継続モニタリング• LLMコスト構造の理解(トークン課金、推論レイテンシ)
• FinOps
出典: docs.databricks.com/aws/en/genie/best-practices
docs.databricks.com/aws/en/genie-code/skills
docs.databricks.com/aws/en/mlflow3/genai/eval-monitor/concepts/scorers

まとめ

AI時代におけるDE・DSの役割変化は、技術的実装から戦略的判断・設計業務への移行として整理できます。

  • DEが専念するのは:「何を・なぜ作るか」のビジネス判断──変換ロジックの設計、ガバナンスポリシーの策定、コスト対パフォーマンスのトレードオフ判断
  • DSが専念するのは:「何を予測すべきか」「結果をどうビジネスに活かすか」──問題設定、精度の十分性判断、KPI設計、ステークホルダーへの示唆出し
  • DE・DS共通で新たに担うのは:AIへの指示設計(コンテキストエンジニアリング)、出力品質の評価・管理、エージェントとの協働プロセス設計

変革を成功させる最重要要因は、技術変化を脅威ではなく機会として捉え、メンバーと共に新しい価値創出の方法を探求し続ける姿勢です。

FAQ

Q1: AI導入によってDE・DSの人員削減は必要になりますか?

A1: 人員削減ではなく、より高付加価値業務への移行による組織価値向上の観点で捉えることが重要です。定型作業の自動化により生まれたリソースを、戦略的な設計・判断業務や新しい価値創出領域に振り向けることで、組織全体の生産性と市場価値を向上させることができます。

Q2: 従来の技術スキルは無駄になってしまうのでしょうか?

A2: 従来の技術スキルは無駄になりません。むしろ、技術的基盤知識があることで、AI生成されたコードやソリューションの適切性を判断し、ビジネス要件に合わせてカスタマイズする能力が向上します。技術理解を土台として、戦略的思考や設計判断といったより高次の能力に発展させることが、AI時代のデータプロフェッショナルに求められる姿です。


このページをシェアする

あなたにオススメの記事

株式会社ブレインパッドについて

2004年の創業以来、「データ活用の促進を通じて持続可能な未来をつくる」をミッションに掲げ、データの可能性をまっすぐに信じてきたブレインパッドは、データ活用を核としたDX実践経験により、あらゆる社会課題や業界、企業の課題解決に貢献してきました。 そのため、「DXの核心はデータ活用」にあり、日々蓄積されるデータをうまく活用し、データドリブン経営に舵を切ることであると私達は考えています。

メールマガジン

Mail Magazine