Yahoo! JAPAN

AI開発の75%を占めるデータ準備を効率化、「データの列処理」を実現したDataForge

TECHBLITZ

企業が扱うデータ量が爆発的に増加するなかで、データ活用のためのパイプラインの設計や管理は年々複雑化している。AIプロジェクトの75%もの時間がデータエンジニアリング、変換、統合といった「準備作業」に費やされ、肝心のAI開発に集中できない状況だという。こうした課題に挑むのが、米シカゴ発のスタートアップDataForge(データフォージ)だ。同社の強みは、AIが支援する独自のデータ管理アーキテクチャにある。従来のテーブル単位ではなく項目単位での変換処理により、複雑な処理をシンプルな宣言で完結させ、開発チームがより迅速かつ柔軟にデータを活用できる環境を実現している。共同創業者でCEOのマシュー・コソヴェック(Matthew Kosovec)氏に、AI時代のデータエンジニアリングの未来を聞いた。

<font size=5>目次
最大の技術的特徴は「データの列処理」
AIアシスタント「Talos AI」を構築した背景
前職で生まれたアイデアをカーブアウト
グローバル製造企業での導入成功事例
Databricksなどとの連携拡大、新たな成長局面に
「複雑な企業構造を持つ企業」との協業を模索

最大の技術的特徴は「データの列処理」

 データフォージが解決しようとする課題は、現代のAI開発における根本的なボトルネックだ。「今日、誰もがAIや新しいAIソリューションの構築に興奮していますが、最も高コストで時間のかかる作業は依然としてデータの移動、データの取得です」とコソヴェック氏は指摘する。

 しかし、データエンジニアリング分野では大きなイノベーションが起きていなかった。「基本的に同じコンセプト、同じプロセスの反復で、より現代的な技術、より現代的なプラットフォームが基盤で動いているだけです。データエンジニアのワークフローや構築方法は、過去20年間変わっていませんでした」

Matthew KosovecDataForgeCo-Founder & CEO米ミシガン大学で電気工学の理学士号を取得後、2014年にWest Monroe(M/C Partnersが2020年買収)に入社。分散コンピューティングシステムの専門家として大企業向けコンサルティングやプライベートエクイティの技術デューデリジェンスを担当。後にイノベーション部門を率い、現CTOのVadim Orlov氏と共にデータ・当たりティクス領域でのソリューションを開発。2023年に同事業をカーブアウトしてDataForgeを創業、CEOに就任。

 データフォージは、この停滞を打破する2つの革新的アプローチを採用している。

 第1に、従来分散していた複数のツールを統合したことだ。「データの抽出には専用プラットフォーム、変換には別のツールセット、公開にはまた別のツールが必要でした。データフォージは、これらすべてを統合フレームワークに統一し、異なるシステム間の統合や相互運用について心配する必要をなくしました」

 第2に、そしてより革新的なのが、処理レベルの根本的変更だ。従来のデータ処理では、複数のデータテーブルを段階的に変換していく必要があった。元データを取得し、変換用の中間テーブルを作成、さらに次の段階用のテーブルを作成といった具合に、データが複数のテーブルを経由して最終形態に到達する仕組みだ。

 これに対しデータフォージは、1つのテーブル内で項目(列)レベルでの変換を実現した。「技術面での最大の特徴は、テーブルレベルではなく列レベルでの処理です」とコソヴェック氏は語る。

 例えるなら、複数のExcelファイルを順番に加工していく従来の方式に対し、1つのファイル内で必要な項目だけを直接編集できるような仕組みを実現したのだ。

 複数テーブル間でのデータ移動が不要になることで、従来は数カ月かかっていた複雑な処理を大幅に簡素化できる。この革新により、開発者が大企業でのソリューション展開や継続的な構築・成長に必要な作業の大部分が不要になるという。

image : DataForge HP

AIアシスタント「Talos AI」を構築した背景

 この独自アーキテクチャは、もう1つの重要な優位性をもたらしている。強力なAI支援だ。

「我々が最初の2つの問題(高速性と拡張性)を解決するために構築したすべてが、偶然にも非常に強力な対話インターフェースやLLM(大規模言語モデル)、AIエージェントを構築するために必要なものと一致したのです」

 同社のAIアシスタント「Talos AI」は、OpenAIのモデルをベースとしながら、他社にはない精度を実現している。

「競合他社よりもはるかに低いレベルで構造化することで、LLMが混乱したり、ハルシネーションを起こしたり、何か間違ったことをするのを防いでいます。そのため、我々は現在最高のAIソリューションを持っています」

 同システムでは、メタの「Llama」など他のモデルでのテストも実施済みだという。コソヴェック氏は「様々なベンダーに対するリスク軽減も実現できています」と説明した。

 収益モデルについて、データフォージは業界標準とは一線を画すアプローチを採用している。「プロセスと呼ばれる概念に基づいています」とコソヴェック氏は説明する。

「ソースからレイクハウス(DatabricksやSnowflakeなどのデータプラットフォーム)、ターゲットまでのフローにおいて、データを移動するためのプロセスが複数存在します。ソースからレイクハウスへの『取り込み』が1プロセス、レイクハウス内の中間段階から次の段階への移動が別のプロセスといった具合です」

 従来のコンピュートやストレージへの追加マージンモデルとは異なり、データフォージはインフラとは無関係な価格設定を採用しているのだ。また、段階的ボリューム価格制により、利用量が増えるほど単価が下がる仕組みを導入している。

「月次利用プロセス数が多いほど安くなります。より多くの構築を阻害したくないからです。時間の経過とともにより多くを追加できる能力は、我々の主要な価値の一つです」

前職で生まれたアイデアをカーブアウト

 コソヴェック氏の経歴は、技術コンサルタントとしてのキャリアから始まった。「私の技術的バックグラウンドは分散コンピューティングシステムにあります。1つのサーバーではなく、大容量・大規模処理にスケールアウトするための多数のサーバー運用が専門でした」

 同氏は米Fortune 500企業向けに、アプリケーションデータベースから分析データベースまで幅広くコンサルティングを提供。金融サービス、ヘルスケア、保険仲介業など多様な業界で大規模展開を手がけた後、プライベートエクイティ(PE)業界に転身した。

「PE企業が買収を検討する際の技術デューデリジェンスを担当していました。技術の複雑さを投資判断のために翻訳する役割です。例えば、小さな会社を大企業に統合する場合、小さな会社の技術が大量のデータ処理に耐えられるかなど、成功に向けた解決策を提案していました」

 この多様な経験が、現在のデータフォージ創業につながる転機となった。West Monroeのイノベーション部門を率いていたコソヴェック氏は、技術メンターでもある現CTOのヴァディム・オルロフ(Vadim Orlov)氏とともにデータ・アナリティクス領域での画期的なアイデアを発案。社内での成功を経て、2023年に同事業をカーブアウトし、データフォージとして独立させた。

グローバル製造企業での導入成功事例

 コソヴェック氏は、最近の大規模導入事例を紹介した。

「大手グローバル製造企業で、ツールを作るツールを製造しています。買収も頻繁に行っており、米国、カナダ、欧州、一部アジアの企業を買収し、70超の子会社を傘下に持っています」

 この企業は約40の共通システムに加え、SAP等の異なるシステムや顧客追跡システムなど複雑な構成を抱えていた。

「通常、このタイプの大規模展開では、すべてに接続して統合するだけで何ヶ月もかかります。我々は2ヶ月以内にすべてのシステムからデータを抽出し、最初のデータモデルを提供できました」

 さらに注目すべきは、この企業グループがクラウド環境すら持たない状態からの短期間での移行成功だ。

「ゼロからクラウドを立ち上げ、Databricksとクラウドにすべてを導入し、データフォージを使用してそのエコシステム内の強力なツールを活用し始めました」

 通常であれば数年規模のプロジェクトが、わずか2ヶ月で完了した事実は、データフォージの技術力を如実に示している。

Databricksなどとの連携拡大、新たな成長局面に

 事業成長について、コソヴェック氏は着実な拡大を報告している。「我々の規模のビジネスに相応しい、年率約100%の一貫した成長を続けています。まだ成長フェーズにあり、収益性よりも急速な成長に重点を置いています」

 特に直近3カ月で新たな成長の勢いを感じているという。

「Databricksとのパートナーシップ拡大や、いくつかの経営コンサルティング企業とのパートナーシップ、そしてSnowflakeエコシステムへの拡大により、新しいレベルの成長と勢いに到達し始めています」

 同社のSnowflake版製品は2025年11月リリース予定で、既にSnowflakeとの連携も進行中だ。「すべてが順調に進めば、今後3ヶ月*でビジネスを倍増させる可能性があります」

 この成長見通しを受け、同社では大型資金調達も検討している。「現在は主に創業者による資金提供ですが、機関投資家からの資本も限定的に受けています。より大規模な資金調達を真剣に検討していますが、まだ実行していません」

 成長と並行して、同社は運営効率性でも優秀な実績を示している。「過去1年間、チームメンバー数を非常に安定的に保っています」とコソヴェック氏は説明する。

 この効率性は、製品設計に起因している。「我々の製品は、その動作方式により非常にサポートしやすいのです。我々のセグメントの他製品で通常発生する問題の多くに対し、開発者が問題やサポートチケット、運用上の課題を引き起こす可能性のあることを防ぐガードレールと防御機能を製品・ソフトウェアに組み込んでいます」

 結果として、「過去1年間で100%の顧客継続率を実現しています。成長にもかかわらず、チームサイズを同じに保ったにもかかわらず、顧客離脱はゼロでした」という驚異的な数値を達成している。
*本記事は2025年10月に実施したインタビューを基に構成

「複雑な企業構造を持つ企業」との協業を模索

 日本企業とのパートナーシップについて、コソヴェック氏は「パートナーの観点から、実装に焦点を当てた専門サービス企業との協業を好みます」と語る。

 特に、分散したビジネスモデルを持つ組織への支援に強みを発揮するという。

「多数の子会社や複雑な企業構造を持ち、そのビジネスを支えるデータシステムが分散・サイロ化している企業、またはそうした問題を抱える企業を支援する対象とするコンサルタント企業が、我々が連携したいパートナーのタイプです」

 技術的価値を事業価値へ転換するにあたり、業界専門性を持つパートナーも重視している。

「我々のチームは技術側面、データの入出力においては優秀ですが、顧客が実際に解決しようとしているビジネス問題や、ビジネスでのデータ活用に対し、我々の技術的価値、速度、提供、コスト削減などを翻訳してもらうため、パートナーに大きく依存しています」

 5〜10年の長期ビジョンについて、コソヴェック氏は自然な事業拡張を描いている。「現在はデータオペレーション(データエンジニアリング)に焦点を当てていますが、我々のソリューションは自然にMLオペレーション(機械学習システムの運用管理)に拡張できます」

 同社の基盤技術は、データサイエンティストがエージェントやLLM等を構築する際にも活用可能というのだ。

「我々が持つ基盤構造は、そのスペースに容易に拡張できます。そして、数ステップを経てAIがAIを構築することを支援する領域に到達します」

 この展開により、究極的には非技術者でもエンタープライズグレードのAIソリューションを構築できる環境の実現を目指している。

 AIによってデータがますます重要となる世界において、データフォージが提唱する技術は企業のAI活用を根本から変革する可能性を秘めている。

 コソヴェック氏は最後に「我々は、AIを構築する上で最も困難な部分である基盤データの課題を既に解決しています。GPUに数十億ドルを投じて最良を願うのではなく、異なるアプローチで競争できるのです」と自信を示した。

従業員数なし

【関連記事】

おすすめの記事

新着記事

  1. 【12/6~】岡山市の西大寺緑花公園で「ガーデンイルミネーションIN西大寺2025」開催。今年は「ひかりとあそぼう!きらきらガーデンナイト」がテーマ

    ひろしまリード
  2. 12月定例月会議に53議案 伊賀市

    伊賀タウン情報YOU
  3. 【バリアフリーお笑いライブプロジェクト『目で楽しむお笑いライブ』】視覚だけで楽しめるお笑いライブを開催|新潟市西蒲区巻

    日刊にいがたWEBタウン情報
  4. もちづきさん、カロリーを低く表記し謝罪 読者に“チェック”呼びかけ

    おたくま経済新聞
  5. 【豊富な焙煎レベルが高評価】ダイニチのコーヒー豆焙煎機、「家電批評」の「年間総合ベストバイ2025」を受賞

    にいがた経済新聞
  6. 【京都2歳S】少頭数の新馬を勝った馬は危険信号!? 過去10年の傾向から考える攻略ポイント

    ラブすぽ
  7. 岡村孝子、ソロデビュー40周年企画で1980年代発表5作のジャケットをキャンバス地の木製アートボードとして発売

    SPICE
  8. 奥州三名湯「飯坂温泉」の小さな宿からあふれ出る大きなおもてなし(後編)【福島県福島市】

    ローカリティ!
  9. 【新選組】土方歳三や山南敬助の息づかい残る「旧前川邸」一般公開に向けた挑戦(画像多数)

    ロケットニュース24
  10. 店主も惚れた香川食材の魅力とは?元町のイタリアンバル『of』で香川の絶品オリーブ牛を堪能 神戸市

    Kiss PRESS