「クローズドな組織」OpenAIが満を持して新モデル公開へ!日本の開発者に与えられたチャンスとは?
約一週間前の4月1日。
サム・アルトマンは自身のXで、こんなポストをした。
私たちは数ヶ月以内に、推論能力を備えた強力な新しいオープンウェイト言語モデルをリリースすることに胸を躍らせています。開発者の皆さまに、このモデルを最大限に活用する方法についてお話したいと考えています。
サム・アルトマンX投稿
これは「GPT-2以来、初のオープンウェイト言語モデルのリリース」になるとのことで、開発にあたり、いくつかの課題点を解消するべく、開発者から直接フィードバックをもらうイベントを開催するとして参加を呼びかけている。
そもそも、オープンウェイト言語モデルとは何か。
日本の開発者や研究者でも参加チャンスはあるのか。
この募集から透けてみえるオープンAIの狙いを含め、AI研究者の今井翔太さんに読み解いてもらった。
『生成AIで世界はこう変わる』著者
AI研究者,博士(工学,東京大学)
今井翔太さん(@ImAI_Eruel)
1994年、石川県金沢市生まれ。東京大学大学院 工学系研究科 技術経営戦略学専攻 松尾研究室にてAIの研究を行い、2024年同専攻博士課程を修了し博士(工学、東京大学)を取得。人工知能分野における強化学習の研究、特にマルチエージェント強化学習の研究に従事。ChatGPT登場以降は、大規模言語モデル等の生成AIにおける強化学習の活用に興味。生成AIのベストセラー書籍『生成AIで世界はこう変わる』(SBクリエイティブ)著者。その他書籍に『深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版』(翔泳社)、『AI白書 2022』(角川アスキー総合研究所)、訳書にR.Sutton著『強化学習(第2版)』(森北出版)など
ーー今回のOpenAIの発表には、どんな狙いがあるのでしょうか?
「私たちは、GPT-2以来初となるオープンな言語モデルを、今後数か月のうちにリリースする予定です。開発者、研究者、そして幅広いコミュニティの皆さまと協力しながら、ご意見を取り入れてこのモデルをできるだけ有用なものにしていきたいと考えています。OpenAIチームにフィードバックを送りたい方は、以下のフォームにご記入ください。」と書かれている。参照元
おそらく、1月に話題を呼んだDeepSeekの公開とほぼ同じことを行うのでしょう。
最近の生成AIで注目されている「推論機能」というのは、AIが問題を解く際に、まるで人間のように「思考過程まで出力させて、問題について長く考えさせる」ように強化学習することで推論性能を上げたAIモデルのことを指します。
例えば、OpenAIのo1やDeepSeek-R1といったモデルは、難しい問題に対して、答えだけでなく、どうやってその答えにたどり着いたかの過程も示すことができます。
対して、従来のChatGPT(GPT-4など)は、膨大な知識を持つ「物知り」な生成AIです。例えば、医師国家試験や司法試験といった知識集約型の問題を容易に解決し、学術分野において大学生レベルの知識を示す能力を持っています。
しかし、東京大学の数学の入試問題などにあるような、高度な思考力を要する問題への対応は困難でした。
これに対し、o1やDeepSeek-R1といった推論能力を備えたモデルは、東大の数学入試でも解くことができ、昨今話題となっているAIエージェントの中核技術としても使えることから重要視されています。
ーー「初のオープンウェイト言語モデルのリリース」とあります。あまり聞きなれない単語ですが、どういうモデルなのでしょうか?
現在のAI技術は、生成AIも含めて基本的にはニューラルネットワーク(人間の脳の神経回路を模倣した数理モデル)を使っていますが、このニューラルネットワークの数値データは、ニューロン間の繋がり(接続強度)の強さ、つまり重み(ウェイト)とパラメータの集合体である数値データによって構成されています。
AIにおける「学習」とは、この重みや、パラメータを調整していく過程を指し、学習が完了したAIは、ChatGPTなどのような強力な性能を持ちます。
オープンウェイトとはすなわち、生成AIとして学習されたニューラルネットワークのデータを全て誰でもダウンロードできる形で公開することを指します。
ChatGPTやGeminiなどの有名な生成AIは、ブラウザやアプリケーション、APIを使って誰でも出力にはアクセスできるわけですが、その出力をしている生成AIのニューラルネットワークそのものを手に入れることはできません。
DeepSeek-R1の公開時にあそこまでの騒ぎになったのは、オープンウェイトで誰でもAI本体を使い放題な形で公開したためです。
まとめると、OpenAIは、o1、あるいはDeepSeek-R1のような強力な推論性能を持った生成AIを、誰でも使えるような形で公開しようとしているのだと分かります。
ちなみに、OpenAIは「オープンAI」という社名であるにも関わらず、世界のAIの研究機関の中では最も「クローズド」な組織であり、2019年のGPT-2以降オープンなLLMは基本的には出していませんでした。
ーーここにきて急に方針転換して、オープンウェイトな推論特化モデルを提供する背景には、どんな狙いがありそうですか?
主に四つの意図を感じます。
(1)批判の回避
AI技術の透明性に対する批判をかわす目的
(2)開発コミュニティーでの覇権争い
DeepSeek、GoogleのGemma、MetaのLlamaといった競合モデルに対抗し、開発コミュニティにおける優位性を確立する目的
(3)推論特化型モデルの使い道の開拓
高度な推論能力を持つモデルの潜在的な用途を探求し、新たな市場を創造する目的
(4)政治的意図
特にDeepSeekや中国のAI技術に対抗する意図に基づいた行動
まず、(1)の「批判の回避」ですが、その効果はかなり大きいと考えられます。
すでに述べた通り、OpenAIは名前に反してオープンではないと、ここ数年間ボロクソに言われてきた訳ですが、そうした批判がピークだったのがDeepSeekショックの前後でした。
実際、サム・アルトマンがモデルのオープン化について触れるのは今回が初めてではありません。DeepSeekショック直後にも「モデルをオープンにしようと思ってるんだけど何がいいかな?」とXでアンケートを取っています。
私自身も、OpenAIの優れたプロダクトにリスペクトはあるものの、一応はオープンなモデルを出してくれているGoogleやMeta、Microsoftのモデル開発の方針やアプローチを支持しています。
ーー(2)の「開発コミュニティーでの覇権争い」についてはいかがでしょうか?
OpenAIほどクローズドな会社はめずらしく、最近は大体どの機関もオープンなモデルを公開し、開発コミュニティー内で一定の支持を得ています。
オープン性、基本性能、そして何よりオープンモデル開発の先駆けであるMetaのLlama、小型だけど性能が高くて扱いやすいGoogleのGemma、小型モデルに特化したMicrosoftのPhi、さらに今年の1月に生成AI分野で大きな注目を集めたDeepSeekなどがそれにあたります。
特に、MetaとDeepSeekに関しては、「オープンである」ことが生成AI開発競争における価値の源泉となっています。両社とも、性能だけを見ればOpenAIを超えているとは言えない状況ですが、オープンであることが価値となってOpenAIに匹敵するプレイヤーとして競争力を維持しています。
もし、OpenAIがそれらを超えるAIを公開してしまえば、MetaとDeepSeekの価値の源泉が折られてしまうわけで、両社に与えるダメージは小さくはないでしょう。実際、DeepSeekショックの後にMeta社内はパニック状態になったという報道も見かけました。
ーー(3)の「使い道の開拓」については、アルトマン自身がXで「開発者が何を構築し、大企業や政府がそれをどのように使用して、自らモデルを実行するかを見るのが楽しみです」とポストしていますから、期待感が伺えます。
はい、OpenAIも想像しないような有効な推論特化モデルの使い方を探りたいという意図が伝わってきますよね。
現状、推論モデルは研究者やエンジニアなどの高度な使い方をする層に限定された利用が主流であり、一般ユーザー向けのAIプロダクトとしては未成熟だと言えます。
最近注目を集めているAIエージェント『Deep Research』では、o1やo3に相当する推論特化型モデルが中核技術として採用されていることが明言されていますが、このように使い方次第で一般ユーザー層にも届くプロダクトの可能性を、オープンモデルの利用動向をみながら探りたいのでしょう。
ーーちなみに、生成AIのモデル公開に関して、開発者からのフィードバック募集はめずらしいことなのでしょうか?
いえ、このようなプロセスを取ることはそこまでめずらしいものではありません。一般的に募集されていたかどうかはともかくとして、大体の有名なモデルは事前に一部の企業などに優先アクセスを付与してフィードバックを募っています。
今回はわざわざ一般向けのフォームを作るくらいなので、相当に広いフィードバックが欲しい、あるいはある種のお祭り騒ぎにしたいという意図がありそうです。
私の経験上ではありますが、今回に関しては、応募さえすればフィードバックに参加できる可能性はそれなりに高いように思います。このようなフォームには、ガチなユーザーを募っているものもあり、論文の出版履歴や所属する研究機関の記入が必須であるケースもあるのですが、今回はそのようなものが見当たらないため、エンジニアや一般ユーザー層まで参加させたいのかもしれません。
OpenAIは日本での展開を優先してきた歴史もあるので、日本人が応募しても、少なくとも冷遇されることはないでしょう。
補足として、この手のものは、SNSのフォロワー数を結構見ており、インフルエンサーが優遇される傾向があります。例えば、OpenAI、Anthropic、Googleなどが開催する非公開の生成AI開発イベントでは、インフルエンサーが招待されるケースが少なくありません。今回のイベントでも、参加者のSNSアカウント情報の提供が求められていることから、同様の選考基準が用いられる可能性が考えられます。
編集/玉城智子(編集部)