スーパーコンピューターは小さな言語の文法を研究します

ビデオ: スーパーコンピューターは小さな言語の文法を研究します

ビデオ: 第127回本田財団懇談会 村山 斉博士 2022, 十一月
スーパーコンピューターは小さな言語の文法を研究します
スーパーコンピューターは小さな言語の文法を研究します
Anonim
Image
Image

スーパーコンピューターオーエンス

オハイオ州立大学の言語学者は、スーパーコンピューティングセンターと協力して、緊急インシデントプロジェクトの低リソース言語に取り組んでいます。このプロジェクトの目標は、その後の災害や災害の監視のために、まれな言語の文法を効果的かつ迅速に学習することです。これは、オハイオスーパーコンピューターセンターのウェブサイトのプレスリリースで発表されました。

世界には約7000の異なる言語があります;それらの約半分は、世界の人口の0.2パーセント未満によって話されています。言語の一般性が低いほど、学習が難しくなります。体系的な文法分析に十分なコーパスがない可能性があり、フィールド言語学者は非常に時間とリソースを消費する可能性があります。ただし、最新のコンピューターテクノロジーは、プロセスを大幅に促進します。たとえば、Yandex.Translatorは、関連するより一般的な言語に関するデータに基づいて、小さな人工言語からの翻訳を学習します。それにもかかわらず、限られた天然資源(小さな言語の場合、まず第一にテキストについて話している)で文法を効果的かつ迅速に学習するために、コンピューターは非常に強力なものを必要とします。そのため、LORELEIプロジェクトの作成者はスーパーコンピューターを使用します。

言語学者のWilliamSchulerが率いる研究者チームは、小さな言語の文法を学習するためのコンピューターベースのアルゴリズムに取り組んでいます。このプロジェクトの主な目標は、入力テキストの言語の文法を迅速かつ効率的に定義することです。プロジェクトの枠組み内でのこの目標は、排他的に適用される価値があります:それは、少数言語が広まっている地域での結果のタイムリーな予防と排除のために、災害と大災害に関するメッセージとニュースの分析に使用されます。

開発者によると、自動文法学習に1台のサーバーを使用することは効果的ではありません。このようなコンピューターは、言語の10から15の文法範疇を分析できますが、スーパーコンピューターの60のグラフィックプロセッサーは50以上です。チームはまた、利用可能なリソースを使用して、統計モデルに基づいて、つまり多数のテキストを使用して、文法を効果的に学習することができます。

LORELEIプロジェクトは、米国国防総省の国防高等研究計画局によって管理されているため、調査の詳細や、開発された文法学習アルゴリズムをカスタム翻訳などに使用するかどうかはまだわかっていません。報告されました。

統計モデルは、機械翻訳にもよく使用されます。ただし、最近、より正確で改善されたニューラルネットワーク変換が置き換えられ、補足されています。たとえば、私たちの投稿では、ディープラーニングがGoogleが記録的な正確な翻訳モデルを作成するのにどのように役立ったかについて学ぶことができます。ここでは、Yandex.TranslatorのDavidTalbotの責任者へのインタビューを読むことができます。

トピックによって人気があります

人気の投稿