DeepMindニューラルネットワークは、「人間の」ルートの説明に従うことを学びました

ビデオ: DeepMindニューラルネットワークは、「人間の」ルートの説明に従うことを学びました

ビデオ: Deep Learning入門:ニューラルネットワーク学習の仕組み 2022, 12月
DeepMindニューラルネットワークは、「人間の」ルートの説明に従うことを学びました
DeepMindニューラルネットワークは、「人間の」ルートの説明に従うことを学びました
Anonim
Image
Image

The Next Webによると、DeepMindラボは、テキストベースのナビゲーション指示に従うように人工知能システムを教えています。プログラマーは、Googleストリートビューに基づいて作成された仮想環境でニューヨークへの旅行でアルゴリズムを送信することにより、アルゴリズムをテストしました。

最新の自動運転車は、オンボードコンピューターに組み込まれているGPSナビゲーションシステムに依存しています。乗客が指示リストを使用して特定の場所に到着するように車に要求した場合(たとえば、「2 km直進し、最初の交差点で右折」)、車は単純であるにもかかわらず、そのタスクに対応できません。事実、人間とは異なり、AIシステムには経験が蓄積されておらず、ナビゲーションの指示に従う方法がわかりません。

この問題に対処するために、GoogleのDeepMind部門は昨年Googleストリートビューマップを学習環境に変えました。それを使用して、研究者は、ルートや他のプロンプトを使用せずに、ポイントAからポイントBまで追跡するようにコンピューターをトレーニングしました。ただし、アルゴリズムの戦略は不便でした。目的地と外見上同一の場所が見つかるまで、マップを長時間移動するだけでした。実生活では、このアプローチは役に立たないでしょう。

arXiv.orgで公開された新しい論文で、研究者はニューラルネットワークにテキストベースのナビゲーション指示に従うように教えました。プログラマーは、ランダムに選択された開始点と終了点に対してGoogleマップからナビゲーションの方向を追加することにより、以前に作成した学習環境を補完しました。研究者たちは、新しい環境に名前が付けられたので、エージェントをStreetNavに配置し、彼に一連のコマンド(たとえば、「交差点で右折」)と、彼が適切な場所に到達するのに役立つはずの画像を与えました。コンピューターが目標を達成したか、正しい手順を踏んだ場合、報酬を受け取りました。このトレーニング方法は強化学習と呼ばれます。

Image
Image

アルゴリズムの観察結果は左側に示され、アルゴリズムに対して発行された指示は右側に示されています。

トレーニングとテスト中に、エージェントはマンハッタンのさまざまな場所に移動しました。このテストでは、アルゴリズムが命令のナビゲートにうまく対応していることが示されました。最良の結果は72.7%でした。しかし、プログラマーが不慣れな環境を旅して人工知能の能力をテストしたところ、46.6%の確率でしか成功できませんでした。

研究者自身は、彼らが作成したプログラムには重大な改訂が必要であると述べています。それにもかかわらず、DeepMindによって作成されたモデルは、他のより高度なナビゲーションアルゴリズムの基礎を形成し、無人車両を実際の生活により適合させることができます。

これまで、Google DeepMindラボは、プロセスを10倍効率化できる人工知能アルゴリズムをトレーニングするための新しいアプローチを開発しました。さらに、DeepMindは、DeepMindLab仮想環境用の一連の新しいゲームレベルもリリースしました。

トピックによって人気があります

人気の投稿