論文メモ1
概要
論文読んで全文訳しました。ディープラーニングの事前知識はほぼないです。
[1705.02445] On human motion prediction using recurrent neural networks
粉ミカン
英語できないので接続詞が難しかったです。
逆に接続詞さえ読めれば英語の論文いける感ありました。
どこまで横文字使っていいのか悩みました。
特にためになったやつ
すごい https://www.slideshare.net/yukinoguchi999/ss-59238906
とてもすごい https://translate.google.co.jp
メモ
以下用語等大まかなメモ。だいたいぐぐってまとめただけ。
Recurrent Neural Networks(リカレントニューラルネットワーク)
NNは通常独立した状態の推定を行う。RNNsは前の時刻の状態を利用するNN。
これによって時系列を持つ対象の深層学習ができる。
RNNとRNNsの違いも謎。
work(研究)
まじでこんなんで最初は困った。仕事…。
baseline(ベースライン)
深層学習限定の語ではなくアルゴリズム(手法)的なものらしい。
もしくは論文が推す手法に対する既存の比較対象。
ground-truth(グラウンドトゥルース)
空中から見た際の地表物体の一般的特徴。
遠隔測定した地上の対象物について、現地調査から得た真実のデータ。
すなわち正解の実データ(多分)。
agnostic(…に依存しない、…に関わらず)
むずい。不可知論ではない。
curriculum learning(カリキュラムラーニング)
最初は簡単なサンプルを学習し、次第に学習の難易度を上げていく深層学習。
representation learning(表現学習)
画像や時系列データなどの要素を学習し特徴量を分散表現(ベクトル)として抽象化する手法。
encode, decode(符号化、逆符号化)
入力の次元と隠れ層の次元は異なる(エンコードされる)が、出力する際に入力と同じ次元に戻す場合がある。これがデコード。
quantitative, qualitative(定量的、定性的)
これに関しては英語の方が簡単なんでは感。
定量的とは数字で表すこと。数値的な話。
定性的とは数字で表せないこと。今回は多分品質(妥当な動作)の話。
open-loop(オープンループ)
制御理論用語?
現在の状態とNNのみで出力を決定する、みたいな意味。多分。
non-deterministic process(非決定論的プロセス)
入力に対して複数の可能な結果があるため、出力を予測できないプロセス。
the first frame
文字通り1フレーム目だけなのか、最初のフレーム群なのか謎。
hidden representation(隠れ表現?)
隠れ層の入出力のことかな…。
drift(ドリフト)
ずれ、崩壊を意味する。
今回は誤差累積による結果のずれのことか。
residual architecture(残差アーキテクチャ)
Res-Net。
3桁層のディープラーニングを可能にした。
LSTM
長期にわたる依存関係を記録できる特別なRNN。
GRU
LSTMのバリエーションの一つ。LSTMにおける更新ゲートと忘却ゲートをひとまとめにし、結果としてLSTMを更に単純化した形になっている。
Gaussian-Process(ガウス過程)
Markov-chain Monte Carlo(マルコフ連鎖モンテカルロ法)
conditional restricted Boltzman machine(条件付き制限ボルツマンマシン)
元気があったらいずれ…。
random forest(ランダムフォレスト)
ランダムに選択したトレーニングデータから決定木を作成し利用する機械学習のアルゴリズム。
sequence(シーケンス)
順序、並び、配列…。文脈ですかね。
structural-RNNs
SRNNs。
状態遷移図の各遷移をRNNで表現する、RNNの集合のような感じ。
http://drive.google.com/file/d/0B2jjEPJ1cl_Ob204ZWZEdHhYY28/
semantic knowledge(意味的知識?)
謎。
End-to-End(エンドツーエンド)
固有の機能は、中間層でなく端(end)で実装されるべきという理論。
Gaussian pose
謎。
Kalman filter
離散的な誤差から変化量を推定するフィルタ。
DAGGER
過去のすべての経路と正解の組を使って次の層の経路を学習する。次の層の経路も正解と組を作りその次の経路を学習する。模倣学習。
Human3.6M
人間の3Dポーズに関する誰でも利用できる最大のデータセット。
one-hot vector(one-hotベクトル)
one-hotは1ビットだけ1を有し、残りは全て0であるビット列。
これをベクトル表現に用いたもの。
variant(変異体?)
提案手法の変形版のような意。
clip the gradients to a maximum L2-norm of 5
今回一番わからない。
勾配をL2ノルムで制限してその最大値は5
という意味らしいありがとうございます。
untied weight(重み非共有)
tied weight(重み共有)とは、エンコード時とデコード時に使われる重みが転置行列の関係になっている。エンコーダの重みがWならデコーダの重みはW^T。
よくわからないので詳しい人教えてください(小声)
高校生の英文法
while(しつつ/であるが一方で)
非制限用法which, where, as(and/but/becauseとか)