論文メモ1 - 飽きるまでやります。

概要

論文読んで全文訳しました。ディープラーニングの事前知識はほぼないです。

[1705.02445] On human motion prediction using recurrent neural networks

粉ミカン

英語できないので接続詞が難しかったです。

逆に接続詞さえ読めれば英語の論文いける感ありました。

どこまで横文字使っていいのか悩みました。

特にためになったやつ

すごい　https://www.slideshare.net/yukinoguchi999/ss-59238906

とてもすごい　https://translate.google.co.jp

メモ

以下用語等大まかなメモ。だいたいぐぐってまとめただけ。

Recurrent Neural Networks(リカレントニューラルネットワーク)

NNは通常独立した状態の推定を行う。RNNsは前の時刻の状態を利用するNN。

これによって時系列を持つ対象の深層学習ができる。

RNNとRNNsの違いも謎。

work(研究)

まじでこんなんで最初は困った。仕事…。

baseline(ベースライン)

深層学習限定の語ではなくアルゴリズム(手法)的なものらしい。

もしくは論文が推す手法に対する既存の比較対象。

ground-truth(グラウンドトゥルース)

空中から見た際の地表物体の一般的特徴。

遠隔測定した地上の対象物について、現地調査から得た真実のデータ。

すなわち正解の実データ(多分)。

agnostic(…に依存しない、…に関わらず)

むずい。不可知論ではない。

curriculum learning(カリキュラムラーニング)

最初は簡単なサンプルを学習し、次第に学習の難易度を上げていく深層学習。

representation learning(表現学習)

画像や時系列データなどの要素を学習し特徴量を分散表現(ベクトル)として抽象化する手法。

encode, decode(符号化、逆符号化)

入力の次元と隠れ層の次元は異なる(エンコードされる)が、出力する際に入力と同じ次元に戻す場合がある。これがデコード。

quantitative, qualitative(定量的、定性的)

これに関しては英語の方が簡単なんでは感。

定量的とは数字で表すこと。数値的な話。

定性的とは数字で表せないこと。今回は多分品質(妥当な動作)の話。

open-loop(オープンループ)

制御理論用語？

現在の状態とNNのみで出力を決定する、みたいな意味。多分。

non-deterministic process(非決定論的プロセス)

入力に対して複数の可能な結果があるため、出力を予測できないプロセス。

the first frame

文字通り1フレーム目だけなのか、最初のフレーム群なのか謎。

hidden representation(隠れ表現？)

隠れ層の入出力のことかな…。

drift(ドリフト)

ずれ、崩壊を意味する。

今回は誤差累積による結果のずれのことか。

residual architecture(残差アーキテクチャ)

Res-Net。

3桁層のディープラーニングを可能にした。

LSTM

長期にわたる依存関係を記録できる特別なRNN。

GRU

LSTMのバリエーションの一つ。LSTMにおける更新ゲートと忘却ゲートをひとまとめにし、結果としてLSTMを更に単純化した形になっている。

Gaussian-Process(ガウス過程)

Markov-chain Monte Carlo(マルコフ連鎖モンテカルロ法)

conditional restricted Boltzman machine(条件付き制限ボルツマンマシン)

元気があったらいずれ…。

random forest(ランダムフォレスト)

ランダムに選択したトレーニングデータから決定木を作成し利用する機械学習のアルゴリズム。

sequence(シーケンス)

順序、並び、配列…。文脈ですかね。

structural-RNNs

SRNNs。

状態遷移図の各遷移をRNNで表現する、RNNの集合のような感じ。

http://drive.google.com/file/d/0B2jjEPJ1cl_Ob204ZWZEdHhYY28/

semantic knowledge(意味的知識？)

謎。

End-to-End(エンドツーエンド)

固有の機能は、中間層でなく端(end)で実装されるべきという理論。

Gaussian pose

謎。

Kalman filter

離散的な誤差から変化量を推定するフィルタ。

DAGGER

過去のすべての経路と正解の組を使って次の層の経路を学習する。次の層の経路も正解と組を作りその次の経路を学習する。模倣学習。

Human3.6M

人間の3Dポーズに関する誰でも利用できる最大のデータセット。

one-hot vector(one-hotベクトル)

one-hotは1ビットだけ1を有し、残りは全て0であるビット列。

これをベクトル表現に用いたもの。

variant(変異体？)

提案手法の変形版のような意。

clip the gradients to a maximum L2-norm of 5

今回一番わからない。

勾配をL2ノルムで制限してその最大値は5

という意味らしいありがとうございます。

untied weight(重み非共有)

tied weight(重み共有)とは、エンコード時とデコード時に使われる重みが転置行列の関係になっている。エンコーダの重みがWならデコーダの重みはW^T。

よくわからないので詳しい人教えてください(小声)

高校生の英文法

while(しつつ/であるが一方で)

非制限用法which, where, as(and/but/becauseとか)