ニューラルネットワークは、写真から料理の栄養価を直接決定しました

ビデオ: ニューラルネットワークは、写真から料理の栄養価を直接決定しました

Отличия серверных жестких дисков от десктопных
ビデオ: 実寸大料理写真データベース 2023, 1月
ニューラルネットワークは、写真から料理の栄養価を直接決定しました
ニューラルネットワークは、写真から料理の栄養価を直接決定しました
Anonim
Image
Image

ドイツの研究者は、写真から料理の栄養価を決定するアルゴリズムを開発しました:それらのカロリー含有量とタンパク質、炭水化物および脂肪の含有量。他の多くの同様のアルゴリズムとは異なり、新しいアルゴリズムは、さまざまな製品の栄養価に関するデータベースを参照するのではなく、これらの指標を直接決定します。さらに、アルゴリズムは料理の材料を予測しようとします。アルゴリズムに関するレポートはICPR2020会議で発表され、プレプリントはarXiv.orgで入手できます。

体重を減らしたり、同じレベルに維持したりする人の中には、その栄養価に注意して食事を書き留める人もいます。このプロセスが部分的に自動化されているアプリケーションもあります。人が店の食べ物を食べた場合、カメラをパッケージに向けると、アプリケーション自体がすべてのデータを消費日記に追加します。しかし、これは自炊やカフェでの食事には適していません。前者の場合、人はすべての成分を知っているので、栄養価を計算することができます。後者の場合、これは非常に大まかにしか行うことができません。

コンピュータビジョンの研究者は、この問題を数年間解決しようとしています。原則として、栄養価を計算するためのアルゴリズムは同様の方法で機能します:それらは写真の中の料理を認識し、データベースから対応する値を返します。最近のアルゴリズムのいくつかは、カメラが標準部分の前にあるという仮定に基づいていますが、彼らはまた、カロリーをより正確に計算するために皿のサイズを考慮に入れることができます。このような多段階アルゴリズムは開発が難しく、あまり正確ではない、とカールスルーエ工科大学のRainerStiefelhageが率いる新作の著者は述べています。彼らは、ニューラルネットワークが写真から栄養価を1つのステップで計算するという別のアプローチを使用しました。

このアルゴリズムは、オブジェクト認識用の畳み込みニューラルネットワーク(著者は人気のあるResNetおよびDenseNetネットワークを使用)に基づいており、さまざまなImageNet写真の巨大なデータセットでトレーニングされています。事前にトレーニングされた畳み込みニューラルネットワークを使用することは、画像内の特徴を決定するのにすでに非常に優れているアルゴリズムを基礎として採用し、特定のタスクのために最後のレイヤーを再トレーニングすることを可能にする一般的な方法です。この場合、作成者は最後のレイヤーを再トレーニングするだけでなく、その構造を変更しました。分類の代わりに、回帰の問題、つまり、元の写真の一部への割り当てではなく、特定の値の選択を解決します。オブジェクトの固定クラス。最後の層の4つのニューロンは皿のカロリー含有量と基本的な成分(タンパク質、脂肪、炭水化物)の含有量を出し、別の100のニューロンは100の最も可能性の高い成分を出します。

Image
Image

アルゴリズム図

開発者は、2つのソースを使用して、アルゴリズムをトレーニングするためのデータセットを独自に準備しました。レシピサイトでは、ほとんどのレシピに材料のリストと完成した料理の写真があり、さまざまな製品の栄養価ベースがあります。レシピはさまざまな人によって書かれ、不要なデータが含まれているため(たとえば、同じ食品が栄養分析の同じ成分であるにもかかわらず、「タマネギ」、「タマネギ」、「タマネギ、さいの目に切った」と表示される場合があります)、データを半自動で処理する必要がありました。特に、不要な単語を削除し、概算値(「大さじ1杯」など)を具体的な値に変換しました。次に、前処理された2つのデータセットのデータを照合し、70,000のレシピと308,000の写真を含むデータセットにまとめました。

Image
Image

左の写真のアルゴリズムでまとめた栄養価カード

Image
Image

左の写真のアルゴリズムでまとめた栄養価カード

Image
Image

左の写真のアルゴリズムでまとめた栄養価カード

Image
Image

左の写真のアルゴリズムでまとめた栄養価カード

彼がトレーニング中に出会わなかったレシピでアルゴリズムをテストしたところ、皿100グラムあたりで計算された精度は46.7カロリー、2.51グラムのタンパク質、3.88グラムの脂肪、6.97グラムの炭水化物であることがわかりました。著者は、レシピからのテキストを前処理するためのより高度なアルゴリズムを使用することにより、結果を改善できると述べています。ライセンスの制限により、データセット自体を公開できませんでしたが、その形成のためのコードとニューラルネットワーク自体のコードをGitHubで公開しました。

以前、他の「料理」ニューラルネットワークについて話しました。たとえば、写真から料理のレシピを作成するアルゴリズムと、反対のタスクを実行するアルゴリズムについては、レシピに従って料理の写真を作成します。

トピックによって人気があります