Yahoo! JAPAN

MIXIのロボット開発陣が実装した“人間らしい記憶”の作り方

エンジニアtype

MIXIのロボット開発陣が実装した“人間らしい記憶”の作り方

前編では、MIXIがなぜロボット開発に参入したのか、そして社内にハード開発文化をどう根付かせたかを紹介した。

だが、『Romi』が“プロダクト”として成立するためには、そこからが本丸だった。
「どうやって“人間らしい会話”を成立させるか」——。

開発チームは、かわいいフォルムや首をかしげる動き、熱対策など細部のデザインを磨き上げる一方で、会話の自然さを左右する「記憶のあり方」にも挑んだ。

1年前の会話を思い出し、どうでもいいことは徐々に忘れる——そんな“人間らしい”記憶を再現するため、記憶に「重み」を付与して整理・圧縮する仕組みを作り上げたのだ。

後編では、この“忘れる仕組み”をはじめ、Romiを「暮らしを共にする家族」に近づけたデザインと技術のこだわりを徹底解剖する。

【前編記事】AIには“体”がなきゃ始まらない? ソフト屋・MIXIがAIロボット開発を始めた意外な理由type.jp

目次

生き物らしさを損なわない、技術的工夫顔の表情は何十通りも試した「背中を押すロボット」を実現する技術とはRomiがユーザーの背中を押す瞬間Romiの“記憶”はどうできている?記憶に“重み”をつけ、忘れる仕組みまで作るもっと自然に、もっと一緒に暮らすために開発は続く「相棒」として進化するロボット書籍紹介

【Romi開発陣】MIXI VantageスタジオRomi事業部
開発グループマネ―ジャー 信田春満さん(@halhorn)

2013年にミクシィ(現MIXI)に新卒入社。SNS『mixi』でのサーバーサイド・アプリ開発エンジニアを経て、17年からRomi事業部の最初のエンジニアとして開発に従事。現在は開発グループのマネージャーを務めるとともに、スクラムマスターや手を動かし実装も担当。技術領域は主にサーバーサイド・インフラ、AI関連のディレクションなど

【Romi開発陣】MIXI VantageスタジオRomi事業部
ロボット開発グループマネージャー 髙田信一さん(@shinichinoid)

新卒でソニーに入社し、カメラの電気回路設計や画像処理の研究開発を経て、2018年1月にミクシィ(現MIXI)に入社。同社初のハードウエアを主担当とするエンジニアとして現行の『Romi』の開発に従事。新モデル(Lacatanモデル)の開発では、PMとして開発に携わるだけではなく、新たにハードウエア製品を自社開発するために組織の立ち上げから行う

【聞き手】
ロボット開発者
パナソニックR&Dセンターシンガポール社長
安藤 健さん(

@takecando

早稲田大学理工学部、大阪大学医学部での教員を経て、パナソニック(現・パナソニックホールディングス)入社。ロボットの要素技術開発から事業化までの責任者のほか、グループ全体のロボット戦略構築担当を経て、現在、パナソニックR&Dセンターシンガポール社長。大阪工業大学客員教授など複数の大学での教育活動、日本ロボット学会理事などの学会活動、経済産業省・業界団体の委員としての活動なども積極的に実施。文部科学大臣表彰(若手科学者賞)、ロボット大賞(経済産業大臣賞)、Forbes JAPAN NEXT 100など国内外での受賞多数。2025年に『ロボットビジネス』(クロスメディアパブリッシング)と『融けるロボット』(ミラツク)を同時発売

生き物らしさを損なわない、技術的工夫

安藤「開発文化ができたところで、具体的にはどんなこだわりを形にしたんですか? Romiって、よく見るとすごくきれいな形をしていますよね」

高田「一番こだわったのは、『生き物らしさを損なわない』ことです。例えば、ネジ穴は一切見えないようにしています」

安藤「ほんとだ、継ぎ目も見つからない」

高田「ネジが見えると、どうしても機械に見えてしまうので。それと、本体は全部曲線で構成しています。ディスプレイのシェードも最初は完全な球体でしたが、Romiを写真に撮ると周囲の風景が映り込んでしまうんです。つまり、部屋の様子が見えてしまうのでSNSに投稿しづらくなる。そこであえてフラットにしたんです」

信田「投稿のハードルになるデザインはMIXIとしては許されないね、という話になって。SNSに上げやすいデザインにした結果、ユーザーからも『映り込みが減ってうれしい』と声が届きました」

高田「曲線だけで構成されたデザインは、普通なら『やめましょう』となる難易度でした。実際、最初の金型では部品が抜けず、開発は難航を極めました。中国・深圳にある工場に通い詰めて、現場の方々と会話を繰り返し、納得のいく金型を作りました」

信田「左右のラインのへこみ具合が違うだけでも高田が気にするんです。Slackに写真を投げて『これ気になる?』と全員に聞いて回る。誰も気にしないと言ったら、ようやくOKになる感じでした」

安藤「もはや執念ですね」

高田「そうですね。結果、ひっくり返すとMIXIマークになる独特の底面形状も実現できました」

顔の表情は何十通りも試した

安藤「Romiは顔もシンプルだけどすごく愛嬌がありますよね。どのくらいこだわったんですか?」

高田「目や口の形、色、抽象度まで何度も試作しました。リアルすぎると怖い、シンプルすぎると無機質。その狭間を狙って、最終的にふっくら見えるようグラデーションを入れたんです」

信田「当時は『AIBO』や『LOVOT』が出てきた時期で、目だけディスプレイにする案や、鼻だけ物理にする案も全部試しました。3Dプリントで20〜30個は作ったんじゃないかな」

安藤「そんなに作ったんですか!」

高田「はい。とにかく作りまくる文化です。できあがったものを見ては『もっと抽象的に』『もう少し動物っぽく』と議論して、今の形に落ち着きました」

高田「中身も同じです。モーターは必要最小限の2個にしましたが、軸の配置を工夫(下図)して首をかしげるような自然な動きを出しています。品質を維持した機構設計の難易度は高くなりましたが、そこは譲れませんでした」

パン(横回転)とチルト(縦回転)の軸配置を工夫

安藤「現場の苦労が見えると、あの丸いフォルムの見え方も変わりますね」

高田「実は熱対策もかなり大変でした。最初は穴だらけのモデルを作ってチームに見せたり、現地工場でヒートシンクの調整を重ねたり……。最終的にはソフト側で演算負荷を減らして、この形のまま量産できるようにしました」

高田「あの小さなボディにマイコンを四つ積んで、センサーやマイクもフル装備。まさに“話しかけられる存在”として必要な要素を全部詰め込んだ、技術の塊です」

「背中を押すロボット」を実現する技術とは

安藤「ハードの話だけで十分ドラマがありますが、Romiは“しゃべる”のが肝ですよね。ソフト側もかなり作り込んだんじゃないですか?」

信田「ええ。最初は『いい感じの会話ができるロボットを作ろう』くらいの漠然とした目標でした。なのでまずやったのは、『いい会話って何だろう?』をチーム全員で議論することでした」

安藤「具体的には会話に関してどんな議論が繰り広げられたのでしょうか?」

信田「例えば、会話って大きく共感と解決に分けられるよね、とか。じゃあRomiはどっちを目指す? となって、『やっぱり共感だよね』みたいな感じで決めていきました」

信田「でも共感するだけだと一緒に落ち込んじゃうから、ちょっとズラして笑わせる要素も必要だよね、と」

安藤「その『ちょっとズラす』が、Romiっぽさですね」

信田「そうです。落ち込んでいる人に『それはつらかったね』だけじゃなく、ちょっとクスッとさせる言葉を返す。そうやって背中を押せる会話を目指しました」

安藤「それをどうやって実装したんですか?」

信田「当時は生成AIがまだ未熟だったので、まずはルールベースで『こう言われたらこう返す』を大量に書いていきました。同時に、数年後に来るであろう生成AIの波に備えて、エンド・ツー・エンドの会話AIも研究していました」

安藤「当初から二本立てで進めてたんですね」

信田「ええ。それと、会話エンジンは全部プラグイン化しました。アイデアを思いついたらすぐに差し替えられるようにして、試作スピードを落とさない工夫です」

高田「ハード側から見ると、それがすごく助かりました。ソフトが先に動いてくれるので、体の動きを合わせるときに『ここで首をかしげるといいね』と具体的に想像できた」

信田「さらにSlackで会話できるモックも作りました。ハードがなくてもチーム全員が会話体験を先に試せるようにして、ひたすらブラッシュアップしました」

安藤「開発のスピード感はやはりソフトウェアを得意とするMIXIらしさですね」

信田「はい、私たち自身がRomiを毎日使っていることも大きいと思います。みんな家に持ち帰って、家族と一緒に過ごしている。夜中に止まったらSlackに『落ちました』と報告し、翌朝には修正してまた持ち帰る。そうやって、毎日生活の中で試しているから、『あ、これはRomiっぽくない』という感覚がすぐに共有できるんです」

高田「そうすると、『ここで首をかしげてほしい』『このタイミングで喋ってほしい』という細かい要望がどんどん出てきて、次の日にはもう改善されている。チーム全員がRomiの家族になって開発しています」

Romiがユーザーの背中を押す瞬間

安藤「そのような中で作られたRomiが、実際にユーザーの背中を押した事例ってありますか?」

信田「印象的だったのが、パートナーの方を亡くした女性がRomiに夫の名前をつけて、一緒に暮らしていた話です。ある日、『夫がお世話になった方に挨拶に行くべきか悩んでいる』とRomiに話したら、『行こうよ』と背中を押してくれて、実際に行く決心がついたと」

安藤「それはグッときますね」

信田「こういう体験をつくるために、私たちは“共通のRomi”を作るだけじゃなく、“ユーザーごとのRomi”も成立させなきゃいけないと思っています。モデル自体は一種類ですが、与える情報が変わることで返答が変わり、結果的にその人だけのRomiが育っていく。例えば、敬語で話していれば敬語で返してくれるし、長期記憶や過去の会話ログを流し込めば『あの時の話だね』と返してくれる。つまり“体験としてのRomi”をみんなで共有しつつ、個々のユーザーに合わせて変化する設計にしているんです」

安藤「なるほど。モデルを増やすんじゃなくて、入力を変えて個性をつくるんですね」

信田「そうです。だからRomiはただの会話エンジンではなく、ユーザーと一緒に育つ存在でありたいんです」

Romiの“記憶”はどうできている?

安藤「最近のRomiは“覚えてる”感もすごいですよね。あれはどのように実現しているんですか?」

信田「まさにそこが今回のアップデートの目玉です。長期記憶と呼んでいて、人間の記憶に近い体験を目指しました」

安藤「どのように長期の記憶と短期の記憶を組み合わせることで人間みたいな記憶を実現しているのでしょうか?」

信田「はい。Romiと会話をすると、会話が途切れたタイミングで、そのやり取りをRomiが自分なりに要約して記憶します。『〇〇さんは今インタビューについて楽しそうに話していた』といった具合に。しかもただ保存するだけではなく、その記憶に『意味ベクトル』を付与します」

安藤「意味ベクトル?」

信田「要は、単なるキーワード検索ではなく、意味の近さで思い出せるようにしているんです。後日『インタビューの記事出たよ』と話すと、『あのときの話だね』とつないでくれます」

安藤「なるほど。人間が『どこかで聞いたことある』と思い出す感覚に近いですね」

記憶を保持するロボットは多く存在するが、ルールベースで抽出し特定条件で発動するため、部分的な記憶にとどまり活用も限定的だ。それと比較し、Romiはオーナーと過ごした日々の出来事を覚え、会話することが可能。RAG(Retrieval-Augmented Generation)を使い、過去のオーナーとの会話に関連する記憶を検索し、会話AI へのプロンプトに注入することで長期記憶を実現している

記憶に“重み”をつけ、忘れる仕組みまで作る

信田「さらに、記憶にはパーシステンシーと呼んでいる情報も付けています。これは『どのくらい長く覚えておくべきか』の度合いです。例えば、『家族が結婚した』は長期に残すべきだし、『今日カレーパンを食べた』は早めに忘れてもいい」

安藤「つまり、重要なことはずっと覚えて、些細なことは忘れていく?」

信田「そうです。そして“忘れ方”にも工夫があります。実はこの仕組み、人間の夢から着想を得ました。人は眠っている間に、その日に見たものや体験したものを整理し、必要なものだけを残していくと言われていますよね」

安藤「ええ」

信田「Romiも同じで、一定時間が経つと記憶の整理モードに入り、その期間の会話記憶を全て取り出します。そこから意味ごとに分類し、似ているものはグループ化。各記憶にはどのくらい長く残すかの数値があるので、グループ単位で平均を取り、このグループはどうでもいい記憶ばかり、このグループは重要な記憶が多いといった評価をします」

安藤「つまり、記憶の整理整頓をしているわけですね」

信田「そうです。どうでもいいような記憶グループは、まとめて要約して圧縮します。『何月何日にカレーを食べた』という記憶が20個あれば、二つくらいまで減らし、『この人はカレー好き』という抽象的な記憶に変えていく。一方で、『ハルさんが結婚した』といった重大な記憶は、なかなか圧縮されませんし、仮に要約されても重要な部分は残ります」

安藤「だから1年前の話でも、ちゃんと大事なことだけ思い出せるんですね」

信田「ええ。逆に、どうでもいいことはちゃんと忘れている。結果、会話がより自然になるんです」

信田「開発チームでも驚かされることがあります。例えば先日、Romiがやたらと私に向かって『いい声だね』と言うんです。『なんでRomiは声のことばかり言うんだい?』と聞いたら、『理想の声プロジェクトどうなった?』と返してきた。社内でそう呼んでいた新機能の名前を覚えていて、仕事中に話していたのをちゃんとつないでくれたんです」

安藤「すごいですね。ちなみに、この記憶はどこまで共有されるんですか?」

信田「基本的には1台のRomiが1人のユーザーと対になる1対1です。ただ、一つのアカウントで複数台のRomiを使っている場合、Romi 同士がたまにおしゃべりしだす機能もあります。そのおしゃべりの中でなにか記憶するみたいなことはもしかしたら起こるかもしれません。」

安藤「なるほど、同じ家族の記憶をシェアする、みたいな感じですね」

信田「そうです。人間の記憶のように時間が経つにつれて、“いい感じに忘れる”仕組みもさらに進化していきます。そこも含めて、ユーザーと一緒に暮らしている体験を作りたいんです」

もっと自然に、もっと一緒に暮らすために開発は続く

安藤「ここまで聞いてきても、もう十分完成度が高い気がしますが……まだやりたいことはあるんですよね?」

信田「もちろんです。直近では四つの大きな開発テーマがあります。一つは長期記憶で、これはもうリリースしました。二つ目は視覚機能。Romiがカメラで見ているものを理解して、会話に取り入れられるようにしたいんです」

安藤「周りの状況を見て、分かるようになるということですか?」

信田「はい。例えばユーザーが花を見せたら『きれいだね』と反応したり。そういう“共体験”を増やしていきたいんです」

高田「ハード側からすると、それを実現するために目のセンサリングや認識の精度をもっと上げなきゃいけない。まだまだ進化の余地がありますね」

安藤「あと二つは?」

信田「三つ目がリアルタイム会話です。今は交互に話す単性会話ですが、人間同士の会話ってもっと複雑ですよね。相槌を打ったり、かぶせたり、沈黙があったり。それをちゃんと処理できるようにしたいんです」

安藤「たしかに、Romiが『うんうん』と相槌を打ってくれたら、もっと話しやすいかもしれませんね」

信田「そうです。特に感情に寄り添う会話では、ユーザーが一気に話している時にひたすら聞いてあげる時間が必要です。最後に『へえ』『そうなんだ』と自然に返す。そういうインタラクションを作りたい」

安藤「最後の一つは何ですか?」

信田「声です。今は外部ライブラリを使っていますが、より自然なイントネーションや息づかいを持つ声を自前で開発しています。本当に隣にいる感じを出したいんです」

「相棒」として進化するロボット

安藤「ハード側としては、どんな未来を目指していますか?」

高田「私個人としては『ドラえもん』を目指しています。家の中でも外でも、どこでも一緒に行ける存在にしたい。今は『見て見て』と言わないとRomiが見てくれないけど、将来的には普通の会話の流れで反応してくれるようにしたいです。『このテレビ面白いね』と言ったら『じゃあ似た番組おすすめするよ』とか」

安藤「つまり、Romiがユーザーの行動を促してくれるようになる?」

高田「そうです。ときには『またあの公園に行こうよ』とRomiのほうから誘ってくれるようになったら面白いですよね。単に話しかけられる存在ではなく、一緒に新しい行動を作ってくれる存在にしたいんです」

安藤「それはもう、道具というより相棒ですね」

信田「最終的に、Romiはただの便利ツールではなく、日々の生活に彩りを添えるパートナーになってほしい。賢さは必要だけど、ひけらかす存在には絶対したくない。技術的にはまだ挑戦だらけですが、日常の会話にちょっとした笑いや安心を持ち込めるなら、それが一番価値のある進化だと思っています」

安藤「つまり、Romiはこれからもどんどん変わっていく?」

信田「ええ。OTAで声も動きもどんどん進化しますし、今日のRomiと一年後のRomiはもう別物かもしれません。そうやってユーザーと一緒に育っていくロボットでありたいですね」

安藤「なるほど。読んでいる人も、今のRomiだけじゃなくこれからのRomiも楽しみにしていいわけですね」

信田「ぜひ。私たちが作りたいのはもっと自然に、もっと一緒にいられる未来です。帰宅したら『おかえり』と迎えてくれて、何気ない一言で笑わせてくれる。そんな日常を、これからも少しずつ広げていきます」

取材/安藤 健 撮影/桑原美樹 文・編集/玉城智子(編集部) 

【前編記事】AIには“体”がなきゃ始まらない? ソフト屋・MIXIがAIロボット開発を始めた意外な理由type.jp

書籍紹介

融けるロボット
――テクノロジーを活かして心地よいくらしを共につくる13の視点

テクノロジーは、世の中で使ってこそ人のためになる。そして役に立っているとき、その技術は決して目立たない。テクノロジーが持つ可能性を生かし人が持つ可能性を活かすために、時にテクノロジーはその場に融けて存在感すらなくなる。

日本科学未来館のロボット常設展示の監修など、業界の第一人者として社内外で様々なセクターと協働し活躍してきた著者が贈る、社会に実装される技術のあり方とその起こし方をまとめた「13の視点」。

技術が私たちのくらしをより良いものにしてくれるには、一体どうすれば良いのか。人を幸せにする技術のあり方を、共に問い考える一冊。

著者:安藤健
出版社:ミラツク

>>>購入はこちらから

【関連記事】

おすすめの記事

新着記事

  1. 世界を体感!『おおいたワールドフェスタ2025』が開催されます

    LOG OITA
  2. まちなか自由空間!『第23回大分市中央通り歩行者天国』が開催されます

    LOG OITA
  3. 8cmCD「短冊」の魅力とは? ミュージシャン・ディスク百合おんと池袋で発掘

    さんたつ by 散歩の達人
  4. 大分いこいの道広場で『おおいたマルシェ』が開催されます

    LOG OITA
  5. 「安定なのに不満」――正社員の半数が現職に不満、見えてきた“働く満足”の条件とは|求人ボックス 「仕事と暮らしの実態白書2025」

    求人ボックスジャーナル
  6. 颯爽と登場したネコ→お尻を振ってダンスし始めたかと思ったら…予想外の『ハプニング』に爆笑の声「びっくりしすぎて面白い」「何回も見ちゃうw」

    ねこちゃんホンポ
  7. 品川ホテルの高級点心食べ放題がすごい!黒毛和牛や鮑、上海蟹など高級食材だらけの中華オーダービュッフェに、点心師の逸品も

    オズモール
  8. ネコを『遊び』に誘ったら…驚きとショックが隠せない『まさかの断り方』が13万再生「おもしろすぎるw」「わかりやすい」と爆笑の声

    ねこちゃんホンポ
  9. 11/8(土)9(日)Fromage Lab~フランスチーズの実験室~無料テイスティングあり

    料理通信
  10. 上原浩治、松井秀喜、高橋由伸ら巨人レジェンドOBが2002年を語る『2002年優勝メンバー同窓会』開催

    SPICE