TensorFlowの日本語まとめ

TensorFlowの公式サイトに書かれている英文を英語ど素人が翻訳(日本語訳/和訳)します。 間違いがありましたら、優しく教えていただけますと幸いです。 内容を理解したら、使ってみたい。

1.画像認識

ビジョンを作る私たちの脳は簡単に思えます人間はライオンジャガー離れて伝えるサインを読み取るまたはヒトの顔認識することに何も努力することはありません。しかし、これらは、実際にコンピュータで解決する難しい問題です:私たちの脳は、画像を理解するのが非常に優れているので、それらは唯一の簡単なように見えます。

 

スポンサーリンク

 

ここ数年では、機械学習分野では、これらの困難な問題に対処する上で驚異的な進歩を遂げています特に、私たちはディープ convolutional neural network と呼ばれるモデルの種類はハード視覚認識タスクでの妥当な性能を達成できることを発見しました-- いくつかのドメインにおける人間性能に一致するかもしくは、超えます。

 

研究者は ImageNet に対する自分の仕事を評価することによって、コンピュータビジョンの着実な進展を実証しています-- コンピュータビジョンのための学術的なベンチマーク。連続したモデルは、新しい最先端の結果を達成し、それぞれの時間を改善を示し続けます。QuocNet, AlexNet, Inception (GoogLeNet), BN-Inception-v2

Google内部と外部の両方の研究者は、すべてのこれらのモデルを記述した論文を発表しているが、結果はまだ再現するのは難しいです。私たちは今、私たちの最新のモデルに画像認識を実行するためのコードを放出することによって、次のステップを取っています。Inception-v3

 

Inception-v3は2012年からのデータを使用して大規模な視覚認識チャレンジ ImageNet のために訓練されています。モデルは1000 classesに画像全体を分類しようとするコンピュータビジョンにおける標準的なタスクです。"Zebra", "Dalmatian"そして "Dishwasher"のような。例えば、AlexNetがいくつかの画像を分類した結果は以下のとおりです。:

f:id:TensorFlow:20160213163005p:plain

モデルを比較するために、私たちはモデルがそのトップ5の推測の一つとして正しい答えを予測するために失敗した頻度を調べます-- 「トップ5誤り率」と呼ばれます。 AlexNetは、2012年に15.3%のトップ5誤り率の検証データセット設定に達成しました。BN-Inception-v2は 6.66%、 Inception-v3は、3.46%.です。

 

人間はどのようにうまくImageNet Challengeを行いますか?彼自身のパフォーマンスを測定しようとしたAndrej Karpathyによるblog postがあります。彼は5.1%、トップ5のエラー率に達しました。

 

このチュートリアルでは、 Inception-v3を使用する方法をお教えします。あなたは、PythonやC++ 1000 classesに画像を分類する方法を学びますまた、他の視覚タスクのために再利用することができるこのモデルから、より高いレベルの特徴を抽出する方法を説明します。

 

私たちは、社会がこのモデルで何をするか見て興奮しています

 

 

(原文サイト)

Image Recognition