Yahoo! JAPAN

漫才・コントを「面白いまま」翻訳するAIサービス開発チームが明かす、言葉の“正しさ”よりも重要だったこと

エンジニアtype

漫才・コントを「面白いまま」翻訳するAIサービス開発チームが明かす、言葉の“正しさ”よりも重要だったこと

突然だが、「おかん」と聞いて何を想像するだろうか。

ゾクゾクするような寒気を指す「悪寒」かもしれないし、母を呼ぶ際の「オカン」かもしれない。関西弁なら「置かん」の可能性も考えられる。

このように、日本語には多くの同音異義語が存在する。この言葉を巧みに操り、表情や動きを交えて笑いを呼ぶのが日本の「お笑い」の文化だ。

ボケとツッコミ、面白さを高めるための「間(ま)」、関西弁や造語での言葉遊びーー日本特有のエンターテインメントであるが故に、そのネタの翻訳は決して容易ではない。従来の翻訳ツールでは、「正しくも面白くもない」ような翻訳になる可能性が高かった。

そんな中、お笑い芸人が多数所属する日本最大級の芸能プロダクション・吉本興業グループであるFANYが、お笑い特化型の翻訳AIサービス『CHAD 2』を開発。AIを用いたデータ分析やコンサルティング、ソフトウェア開発に強みを持つブレインパッドの協力のもと、前例のない翻訳サービスが誕生した。

2025年9月に大阪で開催された『OSAKA COMEDY FESTIVAL 2025』では、このサービスを用いたライブが上演され話題を呼んだのも記憶に新しい。

人気芸人のネタをAIで英語に吹き替えたら…あまりの自然さに衝撃! 「ロングコートダディが途中からブルース・ブラザーズに見えてきた」magazine.fany.lol

“人間味”が愛される今、ロングコートダディが貫くもの「先人を真似ない、自分たちだけの道を探したい」type.jp

『CHAD 2』は、お笑い芸人の漫才やコントの動画をAIが翻訳し、ネタの面白さが伝わるような字幕を生成。「笑い」を損なわずに翻訳することを可能にした。

出典:吉本興業株式会社プレスリリース

今回は、『CHAD 2』開発プロジェクトのプロジェクトマネジャーであるFANYの田中爽太さんに加え、開発を担当したブレインパッドのエンジニア三名の話から、前例のないサービス開発の裏側を探っていこう。

『CHAD 2』開発プロジェクト プロジェクトマネジャー
FANY
田中爽太さん

LLM開発&バックエンド担当
ブレインパッド
武井 廉さん

フロントエンド担当
ブレインパッド
湯川三郎 さん

バックエンド担当
ブレインパッド
小林友紀 さん

「面白さ」を保つために、正しさよりも大切だったもの

ーー翻訳サービスは数あれど、お笑い特化型となると前代未聞ですよね。プロジェクト発足の背景を教えてください。

田中さん:ここ数年で、海外に拠点を移して活動するお笑い芸人が増えてきました。その動きに刺激されて、海外進出を意識するようになった芸人も少なくないと聞きます。

ですが、そこで壁になるのが言語の問題。海外で勝負するためには、本格的に言語を学ぶか、言葉に頼らない笑いに変えるかの二択に絞られてしまうのが現状です。

こうした状況を踏まえ、日本のお笑い文化の面白さはそのままにグローバル展開できないか……と考えた結果、たどり着いたのがお笑い特化型翻訳AIサービスの開発でした。

ーーお笑い特化型として成立させるためには、「面白さはそのまま」で翻訳するのが重要なポイントですよね。ただ、翻訳結果の「言語の正確性」は計れても、「面白さの保持」を評価するのは難しそうです。

武井さん:おっしゃる通り、「言語として正しく翻訳されているか」は、一致率をパーセンテージで算出することで定量評価が可能です。一方で、「面白さ」は数値化できません。

そこで、定性評価を重視するべく、リアルな声を収集することにしました。

ーーリアルな声、とは?

武井さん:日本に長く在住している英語ネーティブの方にプロジェクトに参加してもらい、翻訳結果の確認とフィードバックをお願いしました。評価が個人の主観に偏らないよう、50人規模のネーティブスピーカーを対象にしたアンケート調査も実施して、きちんと「面白さ」が伝わっているかを検証していったんです。

加えて、お笑い関連の翻訳家や作家の方々にも繰り返しヒアリングを行い、机上だけでは得られないフィードバックを積極的に取り入れていきました。

ーー「面白さ」を保つためのヒントは見つかりましたか?

武井さん:翻訳の内容以上に「間の取り方」や「字幕を表示するタイミング」が重要だということが分かったことが大きな収穫でしたね。

海外向けのコメディショーを観た際も、「何を言うか」よりも「どのタイミングで言うか」が笑いにつながっていることが見て取れましたし、翻訳家にも「まずは字幕の出し方を突き詰めていった方がいいです」とアドバイスをいただきました。

ーーUI/UX設計にも工夫が必要そうですね。

湯川さん:開発チーム内に「字幕を表示させるタイミングが重要なサービスである」という共通認識があったので、そこにはこだわりました。

一般的な動画制作ソフトの中には、1秒単位でしか間(ま)がずらせないものもありますが、『CHAD 2』では、非常にシビアな字幕のタイミングが要求されます。なので、ミリ秒単位で細かくタイミングが調整できる仕様にしたんです。

もちろん、違和感なく使っていただけることが大前提なので、メジャーな動画制作ソフトに近い使用感を再現しています。

提供:FANY

「飛ぶ」は「fly」とは限らない。文脈を理解し、血が通った翻訳に

ーーでは、実際の「翻訳」の部分でこだわったポイントを教えてください。

武井さん:コントや漫才を翻訳する上では、文脈の理解が必要になるんです。

例えば、お笑いコンビ・レインボーさんの「史上最強に態度悪い店員」というコントの中に「バイトの子が飛んだ」というセリフがあるのですが、直訳してしまうと「飛ぶ」の部分が「fly」になってしまいます。ですが話の流れやシチュエーションを踏まえれば「ran away(逃げる)」と翻訳するのがベストです。

なので今回のサービスでは、状況を正しく読み取り、自然で伝わりやすい表現に翻訳できるようにする必要がありました。

※YouTubeより「設定」>「字幕」>「英語」を選択することで、字幕付きで閲覧可能

また、お笑い特有の「ボケ」や「ツッコミ」という立ち位置も、言葉だけでは意外と伝わりにくいものでして。ネタの文脈を理解してはじめて判断できる部分なので、そのためにもこだわるべきポイントでした。

出典:吉本興業株式会社プレスリリース

今回の翻訳AIサービスではGeminiを活用しているのですが、文脈理解の精度を高める上でもこの選択は正解だったと思います。

ーーなぜでしょう? Geminiを選んだ理由とあわせて教えていただけますか。

武井さん:Gemini採用の最大の理由は、マルチモーダルによる動画解釈が得意であることです。

今回のサービスは、漫才やコントの動画をアップロードすると自動で文字起こしと翻訳を行う仕組みになっています。元となるデータが動画である以上、音声情報だけでなく場面そのものを理解することが欠かせません

例えば「店員とお客さんのコント」で、店員が男性、お客さんが女性なら「he」「she」と判別できた方がいいでしょうし、ロケーションが「コンビニ」なのであれば、それを踏まえて翻訳した方がいい。これは、音声だけでは解釈が及ばない部分ですから。

ーー聞けば聞くほどお笑いの翻訳の難しさを感じますね。

小林さん:お笑い芸人さんの中には、ネタ中に言う「お決まりの一言」を持っている方がいますよね。その決め台詞も、一般的な翻訳サービスを使うと上手く翻訳されないことが多いんですよ。毎回同じ表現で出力されるべきなのですが、どうしてもブレてしまうんです。これもお笑い翻訳の難点ですね。

ーーどのようにしてブレを軽減させたんですか?

小林さん:多段階の翻訳を取り入れました。

まず第一翻訳で一般的な翻訳を行い、続く第二翻訳でお笑いのデータベースを参照して「お笑い的な観点」を加えた表現に仕上げていくんです。

武井さん:字幕として出す際に情報量が多すぎて伝わりにくい表現は簡潔に整え、日本語のままでは意味が取りにくい固有名詞は、現地の人にもすっと伝わる言い回しへ置き換える。こういった処理も第二翻訳で行っています。

ミルクボーイさんの漫才で、TBS番組『SASUKE』をモチーフにしたネタがあるのですが、『SASUKE』と言っても海外では伝わらないかもしれません。このネタを私たちが開発したサービスで翻訳すると、類似する海外の番組である『アメリカン・ニンジャ・ウォリアー』に変換して表示されるんです。

第二翻訳の思考プロセスでは、お笑い翻訳家が頭の中で行っている整理手順をデータ化して活用しています。

ーーさまざまな工夫を経て完成したサービスですが、現在の翻訳の精度をどう評価していますか?

武井さん:翻訳の質に関しては、現時点でやれることはやり切ったという手ごたえがあります。お笑い翻訳家の思考プロセスも徹底的に学習させたので、AIがお笑いを「理解している」と感じられるレベルまで精度を高められたのではないかな、と。

テストに参加していただいた英語ネーティブの方から「血が通った笑える翻訳になりましたね」という言葉をいただいたことも自信につながっていますね。

とはいえ、システムをもっと使いやすくしたり、多くの方に使っていただいたりするためには、まだ改善の余地があると考えています。

小林さん:今後は、リアルタイムでの翻訳を可能にしていきたいですね。

現状はバッチ処理を前提にしているので、バックエンド構造が異なるんです。そのため、まずは処理基盤をストリーミング型へ切り替え、映像と音声を受け取りながら、その場で順番に文字起こしと翻訳を進められるようにする必要があります。

遅延を抑え、ユーザー体験上のタイムラグを最小化できる方法を模索していきたいです。

日本のお笑い文化を世界に伝えるサービスへ

ーーお笑い特化型の翻訳AIサービスという前例のないプロジェクトに携わって、エンジニアとしてどう感じましたか? 率直な感想を聞かせてください。

湯川さん:それなりに長くシステム開発を経験してきましたが、今回のサービスはとにかく工夫できる部分が多く、「字幕」の奥深さを実感しました。字幕の出し方やタイミング、表現の工夫など、お笑いならではの難しさがありましたね。

「ネタの翻訳ってどうやるの?」という基本的な疑問から始まり、チームで試行錯誤しながら開発を進める。良い経験でした。

小林さん:最先端の取り組みなのでノウハウがないところからのスタートでしたが、ゼロからイチを生み出す面白さがありました。お笑いに関するリソースが豊富な吉本興業グループさんと協業できたことも、大きな強みだったと感じています。

武井さん:「お笑い」の翻訳には、大きな社会的意義があると思うんです。日本のアニメや漫画が海外で人気なように、お笑いも日本が誇る文化の一つとなり得ると考えています。その一端を担うサービスになったら嬉しいですね。

出典:吉本興業株式会社プレスリリース

ーー今後、サービスをどう展開していこうと考えていますか?

田中さん:7月に吉本興業グループ内でリリースして以降、「こんな使い方もできそうだ」という声が次々と上がっています。文字起こしの精度が高いため番組制作にも応用できそうですし、吹き替えと組み合わせればライブ形式でも成立するでしょう。当初は想定していなかった使い方もできるかもしれないと、可能性を感じています。

吉本興業には約6000人のタレントが在籍し、毎日たくさんの動画が投稿されていますから、それらが翻訳されるだけでも海外の方との接点は増えていくはずです。まずは社内での活用を加速し、潜在的な需要を探りながら、方向性を探っていきたいと考えています。

ただ、お笑いの文化は会社を越えて育てていくものです。いずれは社外にも開かれた形で提供できるようにしていきたいですね。

取材・文 /福永太郎 編集/秋元 祐香里(編集部)

【関連記事】

おすすめの記事