
OpenAIのYouTubeチャンネルにはAIに関する動画が多数。ただしすべて英語
YouTubeにはチュートリアル動画がいっぱい
なにかを学びたい時、なにかについての詳しい情報を知りたい時、あなたはどうするだろうか。分野にもよるが、ひと昔前は誰かに直接教わるか、入門書などを買って独学するしか手段がなかった。
だが今はYouTubeがある。YouTubeには「ニワトリの育て方」だろうが「ログハウスの建て方」だろうが「デイトレードの始め方」だろうが、ありとあらゆるチュートリアル・解説動画がアップロードされており、誰でも無料で見ることができる。
しかし、YouTubeを使った学習にはいくつか欠点がある。たとえば、動画は紙の本と違い、大事なところだけを飛ばし読みするといった使い方が難しい。分野によるが、日本語以外の言語、特に英語を使った動画が多いのもYouTubeの特徴だ。
もちろん日本語同様に英語もリスニングできる人なら問題ないが、そうでない場合は字幕に頼ることになる。「TED」のように翻訳者が作成した日本語字幕が用意してあればいいのだが、多くは英語の字幕、およびそれを元に作成した自動翻訳字幕に頼ることになる。自動翻訳の精度は初期に比べると改善されてきたとは言え、まだスムーズな日本語とは程遠い。
プラグインをインストールする
前置きが長くなったが、今回紹介したいのは話題のAI「ChatGPT」を使い、指定したYoutube動画の要約を自動で作成するChromeプラグイン「YouTube Summary with ChatGPT」だ。
ChatGPTは、マイクロソフトが数十億ドル規模の投資を決めたことで話題のOpenAIが開発した、対話に特化した言語モデルだ。大量のテキストデータを使用して学習することで、人間のように自然なテキストを生成することができるため、問い合わせ用チャットボットや検索エンジンのUIとして期待が集まっている。

では早速、chromeに追加してみよう。「chrome ウェブストア」で「YouTube Summary with ChatGPT」を検索し、見つけたら「Chromeに追加」ボタンをクリックする。

ダイアログが表示されるので「拡張機能を追加」をクリックする。

Chromeのツールバーに小さなアイコンが表示される
これで準備は完了だ。
ChatGPTで要約しDeepLで翻訳する

Chromeに「YouTube Summary with ChatGPT」をインストールしてからYouTubeを開くと、動画の右上に「Transcript and Summary」というボタンが表示されるのでクリックする。

するとその動画の文字起こし(Transcript)が表示される。ちなみに「37:20」といったタイムスタンプをクリックすると動画内の該当部分にジャンプして再生される。

字幕を要約するには、画面上部にあるChatGPTのアイコンをクリックする。

すると新しいタブにChatGPTが開き、動画の文字起こしテキストが自動的にChatGPTに流し込まれる。

作成された要約
すぐに、要約が作成される。これだけでも助かるが、今度はそれを日本語訳してみよう。


DeepL
作成された要約をコピーし、別タブでこちらもAIを活用した翻訳サービス「DeepL」を開きコピーした要約をペースト。すぐに右ウィンドウに日本語訳が表示される。動画の内容にもよると思うが、今回はほぼ完璧に意味の取れる日本語の要約が完成した。
ChatGPTに和訳もお願いしてみる

さて、ChatGPTは英語だけではなく日本語もかなりの精度で処理可能になっている。やり方もとくに考える必要はない。「日本語に訳して」と自然言語でお願いするだけで翻訳が開始される。
DeepLと比較しても遜色ない、いや、より洗練された翻訳に思える。もちろんChatGPTの得意分野であるAIの話題ということも大きいだろう。

作成された要約文だけでは物足りない場合は「続けて(英語の場合はContinue)」と入力してみよう。さらに詳しい文章が出力される。

さらに、「小学生にもわかるように」、「新聞記事のように」、「たとえ話で」といったリクエストにも応えてくれる。
日本語の動画を要約させてみる

次に日本語の動画を要約させてみよう。基本的に英語がメインで学習されているChatGPTは、果たして日本語コンテンツも要約できるのだろうか。

「YouTube Summary with ChatGPT」をインストールすれば、わざわざ動画を開かなくても、動画サムネイルの左上に表示されている「ChatGPT」アイコンをクリックするだけで要約はスタートする。

上部が文字起こしテキスト、下部が作成された要約
普段より気持ちゆっくりと要約テキストが表示された。

そのまま「日本語で」と入力して翻訳してもらった。100点満点とは言わないが、かなりがんばっているのではないだろうか。少なくともどんな話題が語られているのかはわかる。

だが、「続けて」と入力してそれ以上の情報を得ようと試みたが、「GYAO」の話題は既出なうえ、少し日本語も怪しくなってきた。文字起こし(日本語)>要約(英語)>翻訳(日本語)と、翻訳を2回繰り返しているせいだろうか。
アニメやドラマは要約できるのか?
さらに難易度をあげて、某アニメの1話分を要約させてみることにする。これはさすがに厳しいだろうか……。。

結果は惨敗。要約どころか意味すら取ることができない。最後に少し言い訳しているところがかわいい。

さらに別のアニメで試してみたがやはり日本語はかなり苦手なようだ。
英語なら十分実用的
いくつかの動画を要約させてみたが、やはり現時点で日本語の動画を理解するのはかなり難しいようだ。とは言えこれはChatGPTの学習データセットに日本語があまり含まれていなかったことが理由だろう。今後学習が進めば英語以外の外国語も扱えるようになっていくだろう。
一方、英語の動画は素早くかつ正確に内容を掴むことができるため、海外のカンファレンス動画やセミナー動画、ニュース動画などをチェックするには最適解だと言える。
次に英語で書かれた要約を翻訳する方法だが、ChatGPTは世界中からアクセスが集中していることもあり、現在かなり反応が遅い。

警告画面
何度も何度も利用していると「使いすぎ」と警告され、一定時間使えなくなることも多い。現時点では要約のみChatGPTに任せ、翻訳はDeepLでするほうがストレスが少ないと感じる。
ChatGPTを開発するOpenAIに出資するマイクロソフトは、近い内にChatGPTを「Bing」や「Officeスイーツ」といった同社の製品に組み込むことを明言している。また、YouTubeを運営するグーグルもOpenAIに負けじとAI開発にリソースを集中しているため、グーグル純正のYouTube要約ツールが提供されるかもしれない。
現在、AIによるツールの開発はまさに過渡期と言える。かなり効率がいいと思われる今回の方法も1年、いや半年後にはまったく古いものになっている可能性は高い。
■関連サイト
田口和裕