飽きるまでやります。

私の私による私のためのメモ。内容に一切の責任を負えません。

論文メモ1

概要

論文読んで全文訳しました。ディープラーニングの事前知識はほぼないです。

[1705.02445] On human motion prediction using recurrent neural networks

 

粉ミカン

英語できないので接続詞が難しかったです。

逆に接続詞さえ読めれば英語の論文いける感ありました。

どこまで横文字使っていいのか悩みました。

 

特にためになったやつ

すごい https://www.slideshare.net/yukinoguchi999/ss-59238906

とてもすごい https://translate.google.co.jp

 

メモ

以下用語等大まかなメモ。だいたいぐぐってまとめただけ。

 

Recurrent Neural Networks(リカレントニューラルネットワーク)

NNは通常独立した状態の推定を行う。RNNsは前の時刻の状態を利用するNN。

これによって時系列を持つ対象の深層学習ができる。

RNNとRNNsの違いも謎。

 

work(研究)

まじでこんなんで最初は困った。仕事…。

 

baseline(ベースライン)

深層学習限定の語ではなくアルゴリズム(手法)的なものらしい。

もしくは論文が推す手法に対する既存の比較対象。

 

ground-truth(グラウンドトゥルース)

空中から見た際の地表物体の一般的特徴。

遠隔測定した地上の対象物について、現地調査から得た真実のデータ。

すなわち正解の実データ(多分)。

 

agnostic(…に依存しない、…に関わらず)

むずい。不可知論ではない。

 

curriculum learning(カリキュラムラーニング)

最初は簡単なサンプルを学習し、次第に学習の難易度を上げていく深層学習。

 

representation learning(表現学習)

画像や時系列データなどの要素を学習し特徴量を分散表現(ベクトル)として抽象化する手法。

 

encode, decode(符号化、逆符号化)

入力の次元と隠れ層の次元は異なる(エンコードされる)が、出力する際に入力と同じ次元に戻す場合がある。これがデコード。

 

quantitative, qualitative(定量的、定性的)

これに関しては英語の方が簡単なんでは感。

定量的とは数字で表すこと。数値的な話。

定性的とは数字で表せないこと。今回は多分品質(妥当な動作)の話。

 

open-loop(オープンループ)

制御理論用語?

現在の状態とNNのみで出力を決定する、みたいな意味。多分。

 

non-deterministic process(非決定的プロセス)

入力に対して複数の可能な結果があるため、出力を予測できないプロセス。

 

the first frame

文字通り1フレーム目だけなのか、最初のフレーム群なのか謎。

 

hidden representation(隠れ表現?)

隠れ層の入出力のことかな…。

 

drift(ドリフト)

ずれ、崩壊を意味する。

今回は誤差累積による結果のずれのことか。

 

residual architecture(残差アーキテクチャ)

Res-Net。

3桁層のディープラーニングを可能にした。

 

LSTM

長期にわたる依存関係を記録できる特別なRNN。

 

GRU

LSTMのバリエーションの一つ。LSTMにおける更新ゲートと忘却ゲートをひとまとめにし、結果としてLSTMを更に単純化した形になっている。

 

Gaussian-Process(ガウス過程)

Markov-chain Monte Carlo(マルコフ連鎖モンテカルロ法)

conditional restricted Boltzman machine(条件付き制限ボルツマンマシン)

元気があったらいずれ…。

 

random forest(ランダムフォレスト)

ランダムに選択したトレーニングデータから決定木を作成し利用する機械学習アルゴリズム

 

sequence(シーケンス)

順序、並び、配列…。文脈ですかね。

 

structural-RNNs

SRNNs。

状態遷移図の各遷移をRNNで表現する、RNNの集合のような感じ。

http://drive.google.com/file/d/0B2jjEPJ1cl_Ob204ZWZEdHhYY28/

 

semantic knowledge(意味的知識?)

謎。

 

End-to-End(エンドツーエンド)

固有の機能は、中間層でなく端(end)で実装されるべきという理論。

 

Gaussian pose

謎。

 

Kalman filter

離散的な誤差から変化量を推定するフィルタ。 

 

DAGGER

過去のすべての経路と正解の組を使って次の層の経路を学習する。次の層の経路も正解と組を作りその次の経路を学習する。模倣学習。

 

Human3.6M

人間の3Dポーズに関する誰でも利用できる最大のデータセット。 

 

one-hot vector(one-hotベクトル)

one-hotは1ビットだけ1を有し、残りは全て0であるビット列。

これをベクトル表現に用いたもの。

 

variant(変異体?)

提案手法の変形版のような意。 

 

clip the gradients to a maximum L2-norm of 5

今回一番わからない。

勾配をL2ノルムで制限してその最大値は5

という意味らしいありがとうございます。

 

untied weight(重み非共有)

tied weight(重み共有)とは、エンコード時とデコード時に使われる重みが転置行列の関係になっている。エンコーダの重みがWならデコーダの重みはW^T。

 

 

よくわからないので詳しい人教えてください(小声) 

 

 

高校生の英文法

while(しつつ/であるが一方で)

非制限用法which, where, as(and/but/becauseとか)