GoogleAIはコンテキストチャットボットMeenaを開発しました

ビデオ: GoogleAIはコンテキストチャットボットMeenaを開発しました

ビデオ: GOOGLEの新しいチャットボットは人間に近い会話が可能です 2022, 12月
GoogleAIはコンテキストチャットボットMeenaを開発しました
GoogleAIはコンテキストチャットボットMeenaを開発しました
Anonim
Image
Image

Google AIの開発者は、Meenaを発表しました。これは、あらゆるトピックについてコミュニケーションを取り、会話のコンテキストを考慮に入れることができるチャットボットです。チャットボットの中心には、ソーシャルメディアユーザーの会話からの40億語でトレーニングされたseq2seqベースのアルゴリズムがあります。さらに、研究者は、会話の詳細を測定し、返信が理にかなっているかどうかに基づいて、チャットボットの動作を評価する方法の指標を開発しました。Meenaのスコアは79%で、他のチャットボットよりも少なくとも23%高くなっています。そして人よりわずか7低い。チャットボットの動作について詳しくは、arXiv、orgのプレプリント、およびGoogleAIブログをご覧ください。

チャットボットは、ユーザーとの短い会話をサポートするのに十分成熟しています。ただし、これらすべてには大きな制限があります。通常、1つのチャットボットが通信できるトピックの数は非常に少なく、ユーザーがトピックを離れるとすぐに、システムは「私はしません。知る"。

この制限は、一方ではデータの不足に基づいており、他方では、チャットボットが会話のコンテキストを記憶できないという事実に基づいています。つまり、会話中、システムは最後の要求にのみ応答します。しかし、前の会話に戻ることはできません。これにより、会話が非特異的で不自然になります。

DanielAdiwardanaと彼のGoogleAIの同僚は、これらの制限の両方を回避することを決定し、Meenaを作成しました。このシステムは、リカレントニューラルネットワークに基づくseq2seqアルゴリズムに基づいており、その主なタスクは、個々の情報間の関係を見つけること、より具体的には、ある情報を別の情報に「変換」することです。

Meenaの中心にあるアルゴリズムは、ソーシャルネットワークのユーザーの実際の会話のスニペットでトレーニングされています。アルゴリズムの特徴は、トレーニングのための会話の別の部分では、レプリカとレプリカのペアではなく、各ユーザーからの7つのレプリカで構成されるダイアログ全体が取得されることです。したがって、これにより、会話のかなり広いコンテキストを考慮に入れることができます。さらに、かなり大量のデータがトレーニングセットに含まれていました。それは、約400億語の対話です。

チャットボットのパフォーマンスを測定するために、研究者は2つの別々のメトリックを作成しました。自動メトリックと実在の人々のメトリックです。 1つ目は、トレーニングサンプルの確率分布に基づいて、生成されたテキストに表示される後続の各単語の逆確率を計算するパープレキシティパラメーターの計算に基づいています。

つまり、このパラメーターは、最終レプリカが選択されたオプションの数を反映します。数が少ないほど、チャットボットの動作は向上します。実際の会話では、レプリカに応答するためのオプションは、会話のコンテキストとトピックによって大きく制限されます。したがって、研究者たちは、このスコアが概念的に人間がチャットボットに与えることができるものにかなり近いと正しく感じました。

次に、人間による評価の指標は、チャットボットのレプリカが意味をなすかどうかと、それがどの程度具体的であるかという2つのパラメーターの測定に基づいています。人間による評価では、これら2つのパラメーターは新しいレプリカごとに考慮され、評価自体はバイナリ(「はい」または「いいえ」)です。たとえば、ユーザーがチャットボットに「私は本当にパイが大好きです」と言って「素晴らしい!」と答えた場合、答えは理にかなっていますが、具体的ではなく、「今日は雨が降っています」と答えた場合-逆に。一方、答えが「詩か焼き菓子か」の場合。

Meenaの作品は、CleverBotやMitsukuなどの他のチャットボットや、チャット中の実際の会話と比較されています。人間が評価するために使用した指標では、Meenaは他のすべてのチャットボットの中で最も多くのスコアを79%で獲得しました。実在の人物との対話は86%で、CleverBotとMitsukuはそれぞれ56%でした。同時に、人間の測定基準と「混乱」は相関していました(係数-0.93)。このパラメーターが低いほど、人々の評価は高くなりました。

Meenaを個別に公開するのか、GoogleがAssistantなどの他のサービスに統合するのかは不明です。これまでのところ、同社はボットのパブリックインターフェイスを作成する予定はありません。さらに、研究者は、チャットボットが適切に機能するためには、アルゴリズムとの対話が、自動または非自動のメトリックによって実際の人との会話と区別できないため、アルゴリズムを改善する必要があることにも言及しました。

興味深いことに、チャットボットのトレーニングに実際の会話が常に使用されるとは限りません。たとえば、2018年にFacebookは、架空の人々に代わって実行された約16万件の会話のオープンデータベースをレイアウトしました。開発者によると、これはチャットボットが自分自身について話し続けるのに役立ちます。

トピックによって人気があります

人気の投稿