'RNN' 태그의 글 목록

2018. 8. 21. 16:52 Deep Learning/Read Paper

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 2

Data2Vis 논문에 대한 개념을 알아본 후 다른 곳에 응용을 하려면 어떻게 어떤 단계를 거쳐서 진행해야 할지 실험을 해본다.

준비

컴파일 환경

Python v3.7

Tensorflow v1.9

Anaconda기반에서 구동한다.

Step-1) 모델 환경설정

train_options.json 에 정의된 Model의 파라미터 내용

- Data2Vis는 Attention 메카니즘을 가지는 Encoder-Decoder 아키텍쳐이다.

- 2-layer bidirectional RNN encoder/decoder를 사용한다.

- GRU보다 LSTM이 보다 좋은 성능을 나타내서 LSTM을 사용한다.

Loss(Cost)와 Training 함수를 포함한 모델(Model)은 AttentionSeq2Seq를 사용하고, 해당 모델에 대한 환경설정 파일은 example_configs/nmt_large.yml에 정의되어 있다.

- 데이터: source와 target 정보의 위치를 지정한다.

- 가설/비용 함수: Encoder/Decoder 를 구성하고 inference 파라미터등도 설정한다. Encoder/Decoder의 Cell은 LSTMCell을 사용한다.

- Training 함수: Adam optimizer 사용

Step-2) Data 전처리

모델을 Training시키기 위해서 Dataset의 Field를 numeric, string, temporal, ordinal, categorical등으로 분류를 해놓는다. 이에 대한 Output(Labeled)으로 Vega-lite문법에 맞추어 환경파일을 각각 만든다.

- sourcedata/*.sources 또는 *.targets 파일중에 dev.sources와 dev.targets를 보면 dataset의 index당 vega-lite spec을 매칭했다.

- vega-lite문법에서 data 필드만 제외한다.

- 총 3가 성격의 sources, targets를 준비한다.

+ dev

+ train

+ vocab

- dataset의 필드를 특별히 str<index>, num<index> 로 변환한다.

- 데이터 전처리를 위한 스크립트는 utils/*.py에 있다.

- 데이터 전처리 전의 실데이터는 testdata/*.json에 vega-lite의 다양한 spec은 examples/*.json 에 있다.

//dev.sources

[{"num0": 0, "num1": null, "str0": "Small", "str1": "AMERICAN AIRLINES", "str2": "AUSTIN-BERGSTROM INTL", "str3": "Approach", "str4": "Day", "str5": "None", "str6": "Unknown bird - small", "num2": 0, "str7": "MD-80", "str8": "8/1/95 0:00", "str9": "Texas", "num3": 0}]

[{"num0": 0, "num1": 140, "str0": "Small", "str1": "US AIRWAYS*", "str2": "CHARLOTTE/DOUGLAS INTL ARPT", "str3": "Approach", "str4": "Day", "str5": "None", "str6": "European starling", "num2": 0, "str7": "B-737-300", "str8": "7/19/99 0:00", "str9": "North Carolina", "num3": 0}]

//dev.targets

{"encoding": {"y": {"field": "str0", "type": "nominal", "selected": true, "primitiveType": "string"}, "x": {"type": "quantitative", "field": "num2"}}, "mark": "point"}

{"encoding": {"y": {"field": "str3", "type": "nominal", "selected": true, "primitiveType": "string"}, "x": {"type": "quantitative", "field": "num0"}}, "mark": "tick"}

Step-3) 모델 생성하기

모델 환경설정과 Training을 위한 source, target 데이터가 준비되었다면 모델을 생성한다.

- procject-directory 위치를 변경한다.

- bin/train.py를 수행을 위한 파라미터이다.

- vizmodel로 ckpt파일을 생성되므로 별도 지정을 해보자. (data2vis에 이미 생성된 ckpt가 존재한다.)

Step-4) 추론 검증

Data2Vis는 Model을 미리 ckpt로 저장해 놓았고, WebDemo가 존재한다. webserver.py 는 Flask로 구성하여 간단하게 다음의 작업을 수행한다.

- 웹화면에서 Generate Example 버튼을 클릭하면 examplesdata/*.json에서 실제 dataset 을 random하게 읽어온다.

- 실데이터의 field를 str, num으로 바꾸어 inference에 넣은후 Vega-lite spec를 output로 받는다.

- 출력으로 나온 Vega-lite spec에 data 필드에 실데이터를 맵핑하여 최종 Vega-lite spec를 만들어 HTTP response를 한다.

또는 command console에서 직접 수행해 볼 수 있다.

<참조>

- 구글
tf-seq2seq 튜토리얼
seq2seq NMT 튜토리얼

- Data2Vis 논문

'Deep Learning > Read Paper' 카테고리의 다른 글

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 1 (0)	2018.08.16

posted by Peter Note

2018. 7. 11. 17:13 Deep Learning/NN by Sung Kim

[RNN] Basic & Training 하기

RNN Basic 강좌를 정리한다.

RNN Basic

cell단위로 다루어 Tensorfllow 코딩으로 OUTPUT이 다시 INPUT으로 들어오게 한다.

- xxxRNNCell 의 output 사이즈를 정해주고 cell을 만든다.

- cell을 dynamic_rnn에서 cell을 실제 구동시켜본다.

cell 학습: BasicRNNCell, BasicLSTMCell등을 바꾸어 사용할 수 있다.

Cell 만들기

문자를 one hot encoding 을 이용해 vector로 표현한다.

- input dimenstion

- hidden size를 우리가 정하기 나름에 따라 정해질 수 있다.

위 두가지는 cell을 만들 때 정의하는 것이다.

Tensorflow로 표현한다.

- BasicLSTMCell 사용

- outputs, states를 얻음

hidden_size 2여서 값은 2개의 shape 가 나온다.

Unfold 풀어놓기

이것을 풀어서 (unfold) 보자.

- sequence_length 5는 unfold 5개 한다는 것이다. 입력데이터의 모양에 따라 결정된다.

Tensorflow에서 h, e, l, o에 대한 변수를 만들어 np.array([h, e, l, l, o]..)를 생성한다. dimenstion 2개인 5개 output이 나옴. 이것은 입력을 줄 때 어떤 Shape이 나오는지 출력해 본 것이다.

Batch Size 만들기

문자를 다양하게 주어 (Batch Size)를 여러개 넣어서 만들어 본다.

Tensorflow 코드

Hi Hello Training 시키기

h를 입력하면 다음은 i 나옴을 학습시킨다.

훈련시킬 단어: "hihello" 에서 Unqiue한 Vocabulary를 만든다. 문자열에 대해 index를 표현한다. 해당 index를 one hot encoding으로 변환한다.

여기서 다음을 정한다.

- 입력 차원

- Sequence 갯수

- 출력(hidden) 차원

- Batch size 정하기

Creating NN Cell

cell의 size는 출력값 5로 정한다.

- rnn_cell.BasicRNNCell(rnn_size)

- rnn_cell.BasicLSTMCell(rnn_size)

- rnn_cell.GRUCell(rnn_size)

RNN Parameters

output from the LSTM : hidden_size = 5

one-hot size : input_dim = 5

one sentence : batch_size = 1

/ihello/ == 6 : sequence_length = 6

Data Creation

Feed to RNN

None은 batch가 많아도됨을 의미. cell을 만들고, batch_size주고, dynmaic_rnn을 호출한다.

Cost: sequence_loss

얼마나 Output이 정확한가를 sequence_loss를 사용하여 예측을 해본다. 예측값이 얼마나 좋은지를 loss값으로 알 수 있다.

모델을 만든다.

지금은 output을 간단히 logits에 넣어서 사용한다. 실제는 이렇게 사용하진 않는다.

Training을 시킨다.

결과

prediction한 charactor에 대해 시간이 지날 수록 그 다음 문자에 대한 예측(prediction) 이 높아진다.

참조

- 김성훈 교수님의 RNN Basic 강좌

- 김성훈 교수님의 RNN Training 강좌

- RNN Basic, LSTM 이해

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Reinforcement Learning] Q Network (0)	2018.07.13
[Reinforcement Learning] 강화학습 (0)	2018.07.12
[RNN] Recurrent Neural Network 개념 (0)	2018.07.11
[CNN] Class, tf.layers, Ensemble (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11

posted by Peter Note

2018. 7. 11. 15:43 Deep Learning/NN by Sung Kim

[RNN] Recurrent Neural Network 개념

RNN 기본 강좌를 정리한다.

RNN 개념

음성인식, 자연어 같은 Sequence data일 경우 처리 네트워크

- 이전의 결과가 다음 series에 영향을 미쳐야 한다.

해당 그림을 풀어 놓으면 결과 state가 다음 연산에 영향을 미침. Series data에 적합한 모델

계산식화 하면

- old state (ht-1) 과 x를 input로 사용하여 new state (ht)를 구한다.

가장 기초적인 (Vanilla) RNN을 만들때 Wx를 사용한다. tanh는 sigmoid다른 형태이다.

- ht는 다음 rnn로 넘기는 값

- y는 w x ht하여 값을 구함

Weight값으 전체 cell에 나 똑같은 값을 사용한다.

RNN 예측 사용

예) 예제에서 helo를 넣었을 때 예측으로 hello 라고 예측하는 시스템을 RNN으로 만듦

- h,e,l,o를 1또는 0값의 벡터로 만들고 이전과 현재를 계산한다. 처음에는 0을 사용한다.

여기서 y값을 구한다.

softmax의 label(결과)를 취한다. 두번째 자리는 error가 발생. output layer의 값을 가지고 learning 하고 예측을 한다.

- language model - 연관 검색어 찾기

- Speech Recognition

- Machine Translation

- Conversation Modeling/Question Answering

- Image/Video Captioning

- Image/Music/Dance Generation

RNN을 어떻게 사용하느냐가 관건이다.

Multi Layer RNN을 사용할 수도 있다.

RNN에서 Vanilla Model가 복잡하면

- Long Short Term Memory (LSTM)을 쓰거나

- GRU by Cho et al. 2014를 쓸수도 있다.

참조

- 김성훈교수님의 RNN 기본 강좌

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Reinforcement Learning] 강화학습 (0)	2018.07.12
[RNN] Basic & Training 하기 (0)	2018.07.11
[CNN] Class, tf.layers, Ensemble (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11
[CNN] Tensorflow CNN 기본 (0)	2018.07.11

posted by Peter Note

2018. 7. 9. 16:45 Deep Learning/NN by Sung Kim

[Neural Network] 종류

레고처럼 넷트웍 모듈 만들기 강좌를 정리한다.

Fast Foward

이전 Layer의 결과를 n layer 앞읠 input값으로 사용한다. 예) 2015년도 Image Net

Split & Merge

나누어서 합치거나, 처음부터 나누어서 나중에 합침등

Recurrent network

밑에서 위로 가면서 옆으로도 확장됨

오직 개발자의 상상력으로 CNN, RNN, FF등을 사용하여 NN을 구축해서 할 뿐이다.

참조

- 김성훈교수님의 네트웍 모듈 만들기 강좌

- Machine Learning 용어 정리

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[CNN] Convolution Neural Network (0)	2018.07.10
[Neural Network] Softmax에 NN 적용하는 순서 팁 (0)	2018.07.09
[Deep Learning] Dropout 과 앙상블 (0)	2018.07.09
[Deep Learning] Weight 초기화 잘하기 (0)	2018.07.09
[Deep Learning] TensorBoard 사용 및 ReLU 개념 (0)	2018.07.09

posted by Peter Note

AI Convergence

Publication

Tag

Category

Recent Post

'RNN'에 해당되는 글 4건

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 2

'Deep Learning > Read Paper' 카테고리의 다른 글

[RNN] Basic & Training 하기

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[RNN] Recurrent Neural Network 개념

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Neural Network] 종류

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

티스토리툴바

AI Convergence

Publication

Tag

Search

Category

Recent Post

'RNN'에 해당되는 글 4건

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 2

'Deep Learning > Read Paper' 카테고리의 다른 글

[RNN] Basic & Training 하기

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[RNN] Recurrent Neural Network 개념

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Neural Network] 종류

'Deep Learning > NN by Sung Kim' 카테고리의 다른 글

티스토리툴바