[No.8] Googleのチャットボットは人間より会話が上手い！！これからの検索エンジンは対話型AIに向かう

2021年5月21日 2022年3月9日

gdep

Googleは開発者会議「Google I/O」を開催し講演をライブビデオで配信した。
基調講演ではCEOのSundar Pichaiが研究開発の最新成果を幅広く紹介した。

話題はAI、検索技術、モバイル、コラボレーション、量子コンピュータ、クリーンエネルギーと多岐にわたった。この中でもAIに重点が置かれ、会話型AIであるチャットボットの研究でブレークスルーを達成した。(下の写真、Pichaiの基調講演。Googleの本社キャンパスに特設会場を設け講演はオンラインで配信された。)

言語モデルの開発

Googleは言葉を理解するAI技法「言語モデル(Language Model)」の研究を重点的に進めてきた。
言語モデルの応用範囲は広く、その代表が機械翻訳で、「Google Translate」として幅広く普及している。

また、言語モデルはチャットボットの基礎技術となり、AIアシスタント「Google Assistant」で使われている。また、チャットボットは検索技術と密接に関係し、Googleは対話型の検索エンジンの研究を進めている。

雑談できるチャットボット

Googleはチャットボットの研究でブレークスルーを達成した。
このチャットボットは「LaMBD (Language Model for Dialogue Applications)」と呼ばれ、人間のように会話する機能を持つ。

LaMDAは話題を定めないで会話するモデル(Open-ended Model)で、とりとめのない会話ができることが特徴となる。
人間は日々の生活で雑談するが、AIにとってこれは最も難易度が高いタスクとなる。

冥王星との会話

基調講演ではLaMDAが人間と会話するデモが紹介されたが、AIの話のうまさが印象的であった。
ここではLaMDAが準惑星である冥王星となり、人間と会話した(下の写真)：

人間：冥王星にいくと目の前にどんな光景がひろがるの？

LaMDA：巨大な渓谷や氷河や間欠泉を見ることができるよ

人間：面白そう

LaMDA：行く価値はあるよ。ただ寒いのでコートが必要。

人間：いままでに来訪者はあった？

LaMDA：色々な訪問者があったが、最近では宇宙船New Horizonが来たよ。

LaMDAの会話を聞くと

LaMDAの会話は自然な流れで、不自然さは全く感じなかった。
LaMDAは人間と区別がつかないというより、人間より会話が上手いと感じた。

LaMDAは事実を正しく把握してそれを伝えるだけでなく、人間の興味を引く技を理解しており、会話に引き込まれた。
これは高度な話術で、何げない会話で、人を惹きつける魅力を備えている。

なぜ会話に惹きつけられるのか

PichaiはLaMDAの魅力の手の内を紹介し、高度な会話能力の技術概要を説明した。
LaMDAの技量は三つに区分でき、「納得(Sensible)」と「具体性(Specific)」と「事実(Factuality)」となる。

納得とは、話を聞いて腑に落ちることを意味する。
また、具体性とは相手の発言に対し、曖昧な回答をするのではなく、スペシフィックな応答をすることを指す。
事実とは話の内容が事実に即し正しいことを指す。

ただし、デモの内容は成功事例で、上手く話せないことも多く、LaMDAの研究開発は続いている。

言語モデルのアーキテクチャ

Googleはこれまでに高度な言語モデルを開発してきた。
その代表が「BERT」で、人間の言葉を理解し、また、人間のように文章を生成する。
BERTは「Transformer」というニューラルネットワークで構成される言語モデルで、人間と同等レベルの言語能力を持つ(下のグラフィックス、単語の前後関係と重要度を把握する)。

また、OpenAIが開発した高度な言語モデル「GPT-3」もTransformerを使っている。

言語モデルの教育

LaMDAも同様にTransformerをベースとする言語モデルであるが、BERTとは教育方式が異なる。
BERTのアルゴリズムはインターネット上のテキストや書籍の文章で教育されたが、LaMDAは人間の会話データで教育された。

人間の会話は決まったパターンは無く、そのバリエーションは千差万別であるある。人間の会話は同じルートを通ることはなく(下のグラフィックス)、AIが会話の内容を理解することは極めて難しい。

検索エンジンとチャットボット

Googleがチャットボットを戦略技術と位置付けるには訳がある。
いま検索エンジンのアーキテクチャが曲がり角に来ている。

Googleの検索エンジンの骨格は「PageRank」で、Larry PageとSergey Brinが1996年にスタンフォード大学で開発した。
PageRankは引用される頻度の高いウェブページが重要だと判定するアルゴリズムで、検索結果の順位付けに使われる。

このアルゴリズムがGoogleの検索エンジンのベースになっているが、PageRankの特許は20219年9月に期限が切れている。

対話型検索エンジン

Googleは新しい検索方式としてAIによる対話型を目指している。
利用者が検索クエリーを入力すると、AIがその意味や意図を理解して回答をズバリと示す。
検索エンジンが数多くのリンクを表示するのに対し、会話形式のAIが人間のように対話しながら回答を示す。

Googleは会話型AIとして「Meena」を開発したが、その後継版としてLaMDAを開発した。
Googleが高度なチャットボットを開発する理由は検索エンジンをアップグレードするためである。

AIは人間より話が旨い

LaMDAのデモは印象的で、人間のように会話するだけでなく、話の内容が非常に魅力的であった。
LaMDAは人間と見分けがつかないだけでなく、人間より話し上手であるとも感じた。

話題が興味深く、意外な発見があり、表現力が豊かで、平均的な人間より会話のスキルは高い。

これからは、人間と話すよりAIと話すほうが楽しくなるのか、複雑な心境となる。

カテゴリ New Technology Report: GAFAM、音声認識

[No.8] Googleのチャットボットは人間より会話が上手い！！これからの検索エンジンは対話型AIに向かう

言語モデルの開発

雑談できるチャットボット

冥王星との会話

LaMDAの会話を聞くと

なぜ会話に惹きつけられるのか

言語モデルのアーキテクチャ

言語モデルの教育

検索エンジンとチャットボット

対話型検索エンジン

AIは人間より話が旨い

[No.7] Voice Cloning 誰でもプロのアナウンサーになれる、AIが発言者の音声を編集し言い間違いを修正する

[No.9] 個人のプライバシーを侵害するAIへ”リベンジ”、顔認識アルゴリズムを攻撃し身を守る技術