「児童文学×AI」が創る新しい「読書体験」 ウラ側を大公開! 「怪盗クイーン」著者・はやみねかおる×AI研究者・赤間怜奈
はやみねかおる公式FC「赤い夢学園」発、人気児童文学作品「怪盗クイーン」シリーズに登場するAIキャラ「RD」と会話ができる、夢のAI育成プロジェクトがスタート。開発監修を担当した東北大学・赤間怜奈助教と、原作者のはやみねかおる先生による対談の第二弾。プロジェクトを進める中でぶつかった壁と、そこから見えてきたこととは?
【▶画像】「夢のAIプロジェクトの理想と現実」赤間怜奈(AI研究者)×はやみねかおる対談話題を聞かない日はないくらい、生成AIは急速に私たちの身近なものになりつつあります。児童文学の世界でも、AIを駆使した新しい挑戦が始まっていることをご存知でしょうか。はやみねかおる公式ファンクラブ「赤い夢学園」は、2025年9月17日に「RD(アール・ディー)育成プロジェクト」を公開しました。
RDとは、はやみね先生のヒットシリーズ「怪盗クイーン」に登場する「世界最高の人工知能」のこと。素早く、正確に、膨大な情報を処理し、主人公である怪盗クイーンの活躍をスマートに手助けするキャラクターです。
20年以上前から作中で描かれていたこのAIキャラクターに、現代の生成AI技術はどこまで迫ることができるのか。「RD育成プロジェクト」は、ユーザーがRDのAIチャットボットと会話を重ねながら、RDをできる限り原作に近い会話ができるキャラクターに育てていく、ユーザー参加型企画です。
プロジェクトを監修したのは、小学生のときにはやみね作品と出会い、「怪盗クイーン」シリーズを愛読していた、東北大学言語AI研究センター助教の赤間怜奈先生です。
AI研究者の赤間先生と、RDを生み出した原作者のはやみね先生が、「RD育成プロジェクト」について語る対談インタビュー。
今回はキャラクターをAIで再現することの困難や問題点、それをどう乗り越えたか、など開発秘話を中心におうかがいしました。
「RD育成プロジェクト」開発監修・赤間怜奈先生
<赤間怜奈・プロフィール>
愛知県生まれ。自然言語処理研究者。東北大学言語AI研究センター助教。博士(情報科学)。小学生のころに「怪盗クイーン」シリーズを読んで“歌って踊れる人工知能“に興味を抱いたことがきっかけになり、AI研究の道へ進む。東北大学工学部時代より自然言語処理・人工知能の研究に従事、とくに自然言語文生成や対話などの研究領域に精通。国立国語研究所次世代言語科学研究センター助教、理化学研究所革新知能統合センター客員研究員も務める。はやみね公式FC「赤い夢学園」の倉木研究所特別研究員として、「RD育成プロジェクト」の開発監修を務める。趣味は、コーヒー、音楽、旅行。
児童文学作家・はやみねかおる先生
<はやみねかおる・プロフィール>
1964年、三重県に生まれる。三重大学教育学部を卒業後、小学校の教師となり、クラスの本ぎらいの子どもたちを夢中にさせる本をさがすうちに、みずから書きはじめる。「怪盗道化師」で第30回講談社児童文学新人賞に入選。「名探偵夢水清志郎事件ノート」「怪盗クイーン」「都会のトム&ソーヤ」「少年名探偵虹北恭助の冒険」などのシリーズのほか、『バイバイ スクール』『オタカラウォーズ』『ぼくと未来屋の夏』『令夢の世界はスリップする』(以上、すべて講談社)『モナミシリーズ』(角川つばさ文庫)『奇譚ルーム』(朝日新聞出版)などの作品がある。子ども自身が選ぶ、うつのみやこども賞を4回受賞。漫画版「名探偵夢水清志郎事件ノート」(原作/はやみねかおる、漫画/えぬえけい 講談社)で第33回講談社漫画賞(児童部門)受賞。第61回野間児童文芸賞特別賞受賞。
AIはキャラクター性を獲得できるのか? 可能性に賭けた方向転換
──プロジェクトが始まった当初は、どのような目標を掲げていましたか?
赤間 最初にお声がけいただいたタイミングで聞いた目標は、ファンに「RDと話す」という体験を提供するために「RDを再現する」ことでした。
──その時点で、目標達成の見込みはどの程度あったのでしょうか?
赤間 それを調べるためにも、とりあえずシンプルな方法でできるところまでやってみようと。そこで、当時とても性能が良いと言われていた最新のモデルをベースとして、【はやみね先生が文字として生み出した「RDのふるまい」に関する言語データ】をうまく使うことで、それらしいシステムを作ってみました。
はやみね 自分が【文字として生み出した「RDのふるまい」に関する言語データ】というのは、つまりぼくの書いた原稿ということですよね。それを全部、集めたんですか!
赤間 そのとおりです。このシステムの挙動を観察してみると、「RDの再現」に至るまでに解決しなくてはならない、いくつかの課題が浮き彫りになりました。主要なものを挙げると、以下のようになります。
① 学習していない情報に対応できない
② 間違いを生成する(ハルシネーション)
③ 回答がRDらしくない
赤間 ①や②は、生成AI全般で見られる現象で、言ってしまえばよくある問題です。十分な学習をした話題については、非常に流暢に会話を続けられますが、それ以外の話題については「経験が不足していてあまりうまく話せない」ということが起こると知られています。
今回のRD……ファンとしてはRDにプロトタイプはないですし、本来のキャラクターとは乖離があるので、本音ではまずRDと呼びたくないのですが(笑)、「RDをつくろうと思ってつくったシステム」に関しても、実際に「与えられた話題にうまく答えられない」状況がしばしば観察されました。
ここには、このプロジェクトならではの難しさもあります。
RDは、現実世界の知識のみを学習するだけでは不十分で、「怪盗クイーン」固有の世界観の知識も必要になります。既存のモデルが学習済みの「現実の世界」と、今回再現したい「フィクションの世界」には、どうしても乖離が生じるため、かなりの頻度で「RDらしくない」回答が出てきてしまいました。私はここがどうしても気になるところで、一番どうにかしたいポイントでした。
──ファンとして、納得できないという状態だったんですね。
プロジェクト公開前の開発画面。RDが搭載されている大型飛行船「トルバドゥール号」については設定を正しく回答することができていますが、「クイーンが好きなお寿司」については、正確な情報が取り出せずに、おかしな回答になっています。
赤間 でも「可能性はあるよね」という話を、開発チームのみなさんとしました。そこで思い切って、目標を「みんなで育てる」という方向に変えたんです。たとえ納得がいかない部分があったとしても、ユーザーが楽しみながら参加して、おもしろいフィードバックをしてもらえたらいいのではという方向で、まとまりました。
はやみね 今のAI技術では、キャラクターを再現するのはすごく難しいということですね。
赤間 そうですね。キャラクターらしさを一貫して表現することもそうですし、特定の世界観──今回は「怪盗クイーン」ひいては「赤い夢」の世界観を保持することは挑戦だといえます。
はやみね 解決方法はあるんですか?
赤間 まずは、モデルの学習に使うデータを増強したいと思っています。より網羅的で具体的なデータをたくさん集めて、質の良いデータをモデルに十分学習させることを考えています。ユーザーからのフィードバックを活用することで、学習を効率化することについても検討しています。ここからは数の力も大事になってくる、ということで、今の形のプロジェクトになりました。
はやみね ひとつ質問です。人工知能がいろんな学習をして賢くなっていくというのはよく聞きますが、RDの場合はフィクションの経験が多いですよね。その場合は、その経験をどうやって学習させるんですか?
赤間 今回は、入出力に自然言語文をとるタイプのモデルを使っています。
モデルは与えられた自然言語文、つまり人間が使うことばで構成された文章を見て、そこで表現されている内容を“経験”します。世界観や常識、知識も言語化されたものが存在すれば、ことばを介して学習することは可能です。性格やキャラクター性、それから感情も、ことばとして見えているものは学習できることになっています。
つまり裏を返せば、ことばになっていないものは、学習することが難しいということです。私たちが普段ことばにするまでもないと考えている、超基礎的な知識や暗黙的な前提、今回の場合に関しては、はやみね先生がまだ作品の中で明かしていない設定や世界観などは、モデルにとっては扱いづらいものである可能性があります。
はやみね おっしゃるとおりで、本当に難しいことをお願いしてすみません。でも楽しみです。
赤間 とても挑戦的でやりがいがあります、楽しみながら試行錯誤しています。
RDらしさとはなにか?
RDの開発は以下の5つのステップで進められました。講談社の開発担当者が解説します。
〈RDの開発ステップ〉
① キャラクターの基本設定を学習させる
↓
②「怪盗クイーン」シリーズのRDのセリフテキストを学習させる
↓
③ RDのキャラクター設定情報をテキストで学習させる
↓
④「怪盗クイーン」シリーズ全作品、全テキストを学習させる
↓
⑤ RDらしい回答を出せるように調節する
──キャラクターの基本設定をした後に、「怪盗クイーン」シリーズのRDのセリフテキストを学習させた理由はなんですか?
開発担当 RDのしゃべりかたを生成AIに学習させて、セリフを模倣させるためです。ある程度までは、しゃべり方や単語選びの模倣ができますが、やはりそれだけでは情報が足りず、キャラクター性や背景情報が抜け落ちてしまいました。
そこで、次にRDのキャラクター設定情報、たとえばRDはこんなキャラクターである、こういうバックグラウンドがあるということを、テキストとして教えました。
でもそれだけでは、クイーンやジョーカーなど、RDに関わりのある他のキャラクターについての質問についてうまく答えられないので、「怪盗クイーン」シリーズ全冊の本文を読みこませて、作品全体の知識を持たせました。
現状のRDは⑤の段階で、まさにこの調整部分を、ユーザーのみなさんにお手伝いしていただくというのが、「RD育成プロジェクト」の始まりになります。簡単にやり方を解説しましょう。
RDの会話画面イメージと、ユーザーの関わり方のイメージ
開発担当 ユーザーが質問をすると、RDが回答を返します。その回答が「RDっぽい」と思ったら「Good」を、違うなと思ったら「Bad」で評価をしていきます。回答に対して「Good」の割合が高くなるほど、「RDらしさ」が高まっていく、というイメージです。
──まさにそのRDらしい回答を出せるようにする、というのが一番難しいところだと思いますが、赤間先生が考える「RDらしい答え」の理想型はありますか?
赤間 「らしさ」の感じ方は人によって異なると思うので、明確に定義するのはとても難しいです。おそらく「RDらしさ」というのは、ユーザーの数だけバリエーションがあると思っています。
私の中でのRDは、情報自体は正確だけど、話し方にユーモアがある。軽やかで賢くて、本当に「知的」なんですね。ことばづかいや言い回しがオシャレだなと思うところがあって。正確だけど堅物ではない、ふざけているけれど軽薄ではないというところが、私の中ではちょうどいいバランスだと思っています。
開発チームの方と「RDらしさ」について検討していく過程で、「この応答は“普通のモデル”の出力だな」と感じたところは、私が思うRDとしての理想の答えをフィードバックしました。これをRDに学習してもらおうという魂胆です。その一部がこちらになります。これをはやみね先生やファンのみなさまに読んでいただくのは、ちょっと恥ずかしいのですが(笑)。
左列が質問、右列が赤間先生によるフィードバック
赤間 このために、「怪盗クイーン」シリーズを読み返しました。ユーザーのみなさんも、回答の評価や「こう答えてほしい」と思うテキストを入力してフィードバックができるので、はやみね作品や「怪盗クイーン」が大好きで詳しいみなさんに、どんどんフィードバックをしていただきたいのです。
──冗談を含んだことば選びを、AIができるのですか?
赤間 一般的には、ある程度調整しないと出てこないものだと思っています。
このAIの裏側には、確率の計算に基づいて動く「言語モデル」と呼ばれる仕組みがあります。ざっくり言うと「頻繁に見ることばの並びを優先的に出力する」ものです。これまでに学習したデータの中で、「頻繁に見た」かどうかを手がかりにしながら、次に出力することばを確率的に選んでいます。
つまり、普通にしているとあまり出てこないことばの並び、例えば言葉選びや言い回しに特徴があるようなものは、がんばらないと出てこない可能性が高いです。「特徴」になり得るような表現は「一般的でない」ため、「頻繁に見る」ようなものではありませんから。
──そうすると、RDの特徴や独特の言い回しをスムーズに出したいのであれば、違うなと思った回答に対して、根気強く「こういう回答をして」という具体的なテキストを入力してフィードバックするのがよい、ということでしょうか。
赤間 そうですね。できればまったく同じものよりも、表現に多少のバリエーションがあるほうが、より望ましいです。
──開発チームにより調整された後のRDに同じ質問をしてみました。回答の内容はほぼ同じですが、最後に自慢げな一言が入っていて「RDらしさ」を感じます。こんなに進化するものなのですね!
調整後のRDに同じ質問を投げかけたところ、よりウィットに富んだ回答が返ってくるようになりました。
はやみね先生もRDと会話してみた! 結果は……!?
はやみね ぼくも開発段階でRDと会話してみました。
はやみね 「倉木博士についてどう思う?」ときいたら、RDは倉木博士のことを「彼」と表現したので、「コイツもまだまだやな」と思いました(笑)。これからいっぱい勉強せなあかんですね。
──倉木博士を「彼」と表現する原因はなんでしょうか?
赤間 きちんと検証していないので、実際のところはわかりません。考えられる原因のひとつは、学習データに含まれる事例の中で、「博士」と呼ばれる人物が「女性」よりも「男性」が多かったということがあり得そうです。「博士」を「彼女」ではなく「彼」と呼ぶ事例をより頻繁に見ていたのなら、倉木博士を「彼」と表現するほうがより自然だと判断したのでしょう。
※文部科学省 科学技術・学術政策研究所による「博士人材追跡調査―第4次報告書―」2022年1月発表によると、博士課程入学者の女性の割合は、2018年で約17%となっている。(赤い夢学園調べ)
──では倉木博士を「彼女」と表現させるには、具体的にどうすればよいのでしょうか?
赤間 方法はいくつかありますが、前述の開発ステップの③で設定情報を与えるときに、「倉木伶博士の名前は伶で、性別は女性、年齢は50歳くらい」であることとあわせて、「RDは倉木博士のことをなんと呼称するか」も明確に教えておく、ということはできそうです。
とはいえ、あらかじめ整理して与えておく情報にも限度があるので、やはりこのプロジェクトの鍵を握るのは、⑤の「調整」の部分になってくると予想しています。フィードバックを通して細やかな修正を繰り返すことで、どんどん「RDらしい」振る舞いに近づけていければと思っています。
はやみね 自分はさっき「RDはまだまだやな」って思っていましたが、「博士」と聞いて「男性」と頭の中に入ってくるっていうのは、自分らみたいな昭和のジイさんといっしょやなって(笑)。そう考えると「すごいやん」と考え直しました。
こんなレベルまで来てるのかって思うと、人間がAIに抜かれそうな怖さを感じて、今ゾクッとしましたね。ただ単に「知らない」というわけではなく、たくさんの知識を獲得した上で自分の人格を持つという怖さにゾワッとしました。AIはすごいですね。
赤間 普段研究しているときは、単純に「モデル」と「データ」という認識しかないのですが、“たくさん見ている・知っている”のは、確かにそうだなと思いました。
最近の言語モデルの学習には、何百億、何千億という規模の言語データが用いられます。これは人間が生涯で目にするものと比べて、どの程度の量といえるのでしょうね。もしかしたら、クイーンのお師匠さまくらいでようやく到達できるレベルの量だったりするのかもしれませんね。
「怪盗クイーン」シリーズのキャラクター・皇帝。
──ありがとうございます。今回のRDが倉木博士のことを「彼」と呼んでしまうのは、学習が進んでいないわけではなく、むしろ多くの情報を取りこんでいて、その中で一番多い情報を答えてしまうということがよくわかりました。AIの学習や会話が生成される仕組みは、人間とはまったく違うのですね。第3回目は、AIが今後どのように進化していくのか。「RD育成プロジェクト」が目指す未来について語っていただきます。
今すぐ人工知能「RD」との対話を試すには「赤い夢学園」検索 ➡︎はやみねかおる公式ファンクラブサイト「赤い夢学園」で体験できます。