TensorFlowの日本語まとめ

TensorFlowの公式サイトに書かれている英文を英語ど素人が翻訳(日本語訳/和訳)します。 間違いがありましたら、優しく教えていただけますと幸いです。 内容を理解したら、使ってみたい。

1.リカレントニューラルネットワーク

導入

特に、リカレントニューラルネットワークLSTMsへの導入のためにthis great articleを見てみましょう

 

 

言語モデル

このチュートリアルでは、言語モデルのやりがいのある仕事にリカレントニューラルネットワークを訓練する方法を示します。問題目標は、文章確率を割り当てる確率モデルに合うようにです。これは、以前の単語の履歴を与えられたテキストの次の単語を予測することによってそうしますこの目的のために、私たちは小さく訓練する比較的高速である一方でこれらのモデル品質測定するための人気のベンチマークであるPenn Tree BankPTBのデータセットを使用します

 

スポンサーリンク

 

 

言語モデルは、音声認識機械翻訳または画像キャプションなど、多くの興味深い問題への鍵ですここを見て - それはまた楽しいです。このチュートリアルの目的のために、私たちはPTBデータセット上の非常に良好な結果を達成する Zaremba et al., 2014からの結果を再現します。

 

チュートリアルファイル

このチュートリアルでは、models/rnn/ptbから以下のファイルを参照します。

ファイル目的
ptb_word_lm.py コードは、PTBのデータセットで言語モデルを訓練します。
reader.py コードは、データセットを読み取ります。

 

データのダウンロードと準備

このチュートリアルに必要なデータは、Tomas Mikolov's webpageからPTBデータセットの data/ディレクトリにあります。:http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz

 

データセットは、すでに前処理文の終りのマーカーや珍しい単語の特殊記号<UNK>を含む全体の10000の異なる単語が含まれています。私たちは、ニューラルネットワークが処理することが容易にするためにユニークな整数識別子にreader.pyでそれらのすべてを変換します。

 

f:id:TensorFlow:20160130024759j:plain

 

(原文サイト)

Recurrent Neural Networks