TensorFlowの日本語まとめ

TensorFlowの公式サイトに書かれている英文を英語ど素人が翻訳(日本語訳/和訳)します。 間違いがありましたら、優しく教えていただけますと幸いです。 内容を理解したら、使ってみたい。

1.畳み込みニューラルネットワーク

このチュートリアルではTensorFlowの上級ユーザーを対象としており、機械学習の専門知識と経験を前提としています

 

概説

CIFAR-10分類は、機械学習における一般的なベンチマーク問題です問題は、10カテゴリ全体でRGB32×32ピクセル画像を分類することですairplane, automobile, bird, cat, deer, dog, frog, horse, ship, and truck.

 

スポンサーリンク

 

 

f:id:TensorFlow:20160111102439p:plain

 

詳細についてはCIFAR-10 pageAlex KrizhevskyさんによるTech Reportを参照してください

 

目的

このチュートリアルの目的は、画像を認識するための比較的小さな畳み込みニューラルネットワークCNN:convolutional neural network)を構築することです

プロセス中のこのチュートリアル

  1. ネットワークアーキテクチャ、トレーニング、評価のための標準的な組織強調表示します。
  2. より大きく、より洗練されたモデルを構築するためのテンプレートを提供しています。

CIFAR-10が選択された理由は、大規模なモデルに拡張するTensorFlow能力の多くを行使するのに十分複雑であるということでした同時に、モデルが早く訓練するのに十分に小さいですこれは新しいアイデアを試して、新しい技術を実験するのに最適です

 

チュートリアルハイライト

CIFAR-10チュートリアルでは、TensorFlowより大きく、より洗練されたモデルを設計するためのいくつかの重要な構造を示しています。

また、実証モデルのマルチGPUのバージョンを提供します。:

  • モデルを設定すると、並行して複数のGPUカード全体に訓練します
  • 複数のGPUの間で変数共有し、更新します。

私たちは、このチュートリアルではTensorFlowビジョンタスクに大きなCNNを構築するための出発点を提供することを願っています。

 

モデルアーキテクチャ

このCIFAR-10チュートリアルのモデルは、畳み込み非線形性の交互からなる多層アーキテクチャです。これらの層は、ソフトマックス分類子へ続く完全に接続された層が続いています。モデルは、上位のいくつかの層のいくつかの違いAlex Krizhevskyさんによって記述アーキテクチャを従っています

 

このモデルは、GPU上でのトレーニング時間の数時間以内に約86%の精度ピーク性能を実現しています。コードの詳細については 以下 を参照してください。それは1,068,298の学習可能なパラメータで構成され、単一の画像に推論を計算するため19.5Mの乗算 - 加算演算について必要です。

 

(原文サイト)

Convolutional Neural Networks