Mobile Convergence

2018. 7. 9. 16:33 AI Deep Learning/NN by Sung Kim

[Deep Learning] Dropout 과 앙상블

Dropout과 앙상블 강좌를 정리한다.

Overfitting의 제거

데이터를 꼬부리는 것: 아는 것을 넣었더니 accuracy가 0.99 였지만 한번도 못지 못한 것을 넣을 때 accuracy가 0.85로 낮으면 이것을 overfitting되었다고 한다.

Training Accuracy와 Weight n layer 관계도

overfitting이 되면 layer가 늘어날 수록 training은 잘되는 것 같지만 일정 시점에 test dataset의 정확도는 떨어지고 있다.

Overfitting 제거 방법

- 학습데이터를 더 많이 사용한다.

- Regularization을 사용한다. W의 제곱의 최소화 => L2 Regularization

- Dropout: Neural Network 에서 사용하는 방법, 그만두기(Dropout), 학습시에 Neural Network을 끊어버리자. Random하게 어떤 뉴런들을 제거하고 나머지를 가지고 훈련시킨다. 그리고 최종적으로 dropout시킨 것을 다 사용해 예측한다. (상당히 잘 된다.)

수식을 사용하면 다음과 같다.

- 훈련시에만 dropout_rate을 주고, 테스트/평가 시에는 1로 주어야 한다.

Ensemble (앙상블, 언셈블)

여러 모델을 만들어 보고 이것을 합친다. 성능향상을 높일 수 있다. 실전에서 앙상블 모델을 사용하면 좋다.

참조

- 김성훈교수님의 Dropout과 앙상블 강좌

- Ensemble Concept

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Neural Network] Softmax에 NN 적용하는 순서 팁 (0)	2018.07.09
[Neural Network] 종류 (0)	2018.07.09
[Deep Learning] Weight 초기화 잘하기 (0)	2018.07.09
[Deep Learning] TensorBoard 사용 및 ReLU 개념 (0)	2018.07.09
[Deirvative] 미분 정리 (0)	2018.07.06

posted by 윤영식

2018. 7. 9. 15:54 AI Deep Learning/NN by Sung Kim

[Deep Learning] Weight 초기화 잘하기

Weight 초기화 잘하기 강좌를 정리한다.

Deep Network의 문제점

- sigmoid를 ReLU(렐루)로 변경

- weight(초기) 값을 잘 못 사용하고 있다.

sigmoid를 사용할 때 layer가 깊어져도 cost가 전혀 줄어들지 않았다.

- 주의: 0 값은 절대 주지 말아야 한다.

RBM (Restricted Boltzmann Machine)

Hinton교수가 2006년 논문(A Fast Learning Algorithm for Deep Belief Nets) 에서 초기값을 잘 구하는 RBM을 소개함.

- forward: x (입력)값을 통해 w, b를 구한다

- backward: 생성된 w, b를 거꾸로 계산한다.

=> forward, backward의 결과를 보고 Weigth을 조정한다. 즉, Weight값을 학습을 통해 적절한 Weight값을 구한다.

Deep Belief Network

이전과 다음 Layer마다 RBM을 이용해 Weigth을 구하여 Multi Layer를 구성하 것을 Deep Belief Network이라고 한다.

- RBM통해 Weight값 얻는 Training을 Fine Tunning이라고 부른다.

RBM 보다 더 간단한 초기화가 나옴.

Xavier Initialization (샤이버)

- fan_in/2를 하면 쉽게 더 좋은 weight값을 얻을 수 있다.

정확도(Accuracy) 비교 테이블

- 최기화 메소드 쓰기

- ReLU 쓰기

등의 2가지 문제가 해결되었다.

참조

- 김성훈교수님의 Weight 초기화 잘 해보자 강좌

- 다른 강좌 정리 블로글

- ReLU 소개

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Neural Network] 종류 (0)	2018.07.09
[Deep Learning] Dropout 과 앙상블 (0)	2018.07.09
[Deep Learning] TensorBoard 사용 및 ReLU 개념 (0)	2018.07.09
[Deirvative] 미분 정리 (0)	2018.07.06
[Deep Learning] XOR 문제 풀기 과정 및 수식 (0)	2018.07.06

posted by 윤영식

2018. 7. 9. 14:46 AI Deep Learning/NN by Sung Kim

[Deep Learning] TensorBoard 사용 및 ReLU 개념

TensorBoard 사용하기 강좌를 정리한다

TensorBoard 사용하기

5개의 step 을 거친다.

1) 어떤것을 로깅할 것인지 정한다

2) all summary

3) summary 기록할 파일 위치 지정

4) session.run 실행

5) 별도 터미널에서 tensorboard --logdir=<지정폴더> 수행

Scalar (스케일러)

Histogram

다차원 텐서의 경우 사용함.

Graph

흐름도를 보고 싶을 경우 사용함.

- name_scope 사용하여 Layer를 구분하여 보기 좋게 한다. (접혔다 폈다 할 수 있음)

remote에 있는 tensorboard 보기

Multi run 하기

부모 폴더만을 지정하면 child folder를 자동으로 보여줌

9 Layer Tensorboard 구성시 문제점

Deep Network을 다음과 같이 구성하고 Learning을 시킨 것이 Deep Learning이다.

name_scope로 구분하여 Tensorboard에 표현 (강좌)

deep network를 구성할 때 코드로만 보면 어려울 수 있다. 이것을 시각화하여 다음과 같이 표현한다.

결과 : 서로의 연결과 가중치(Weight)를 쉽게 볼 수 있다.

9 layer를 거친다고 해서 정확도가 높아지는 것은 아니다. 2,3 layer는 잘 학습이 되지만 3 layer넘어가면 학습도가 떨어진다.

이유: 결과의 1보다 작은 소숫점의 값을 multiply할 수록 더 작은 소숫점 값이 되어 버려서 gradient값이 살라진게 된다.

Network으로 표현하면 좌측으로 갈 수록 점점 정확도가 떨어짐. 2006년까지 겨울이 찾아옮.

- 힌튼교수가 해결: Sigmoid를 잘 못 쓴것 같다.

- ReLU를 적용해 보자.

ReLU (Rectified Linear Unit, 렐루)

힌트 교수의 잘 못한 부분중 4번째

ReLU 사용

- z값이 커질수로 1보다 작다라는 sigmoid를 0보다 커질 수록 갈 때까지 커진다.

- 대신 0보다 작으면 무조건 0이 된다.

Sigmoid 대신 relu를 사용한다. 수식으로 표현하면 하고 앞으로 neural network에서는 최종 Layer를 빼고 hidden부분은 sigmoid를 사용하지 않고 relu를 사용해야 한다.

9 layer의 relu와 sigmoid 사용 예

Activation Function

sigmoid와 relu등을 activation function이라고 하는데 다른 것들도 있다.

- sigmoid

- ReLU

- Leaky ReLU: 0이하일 때 약간 값을 살려줌

- ELU: 0이하일 때 원하는 값으로 살려줌

- Maxout

비교하면 LeRU 계열의 정확도가 높다.

참조

- 김성훈교수님의 TensorBoard 사용 강좌

- 김성훈교수님의 Backpropagation (chain rule) 희석 강좌

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] Dropout 과 앙상블 (0)	2018.07.09
[Deep Learning] Weight 초기화 잘하기 (0)	2018.07.09
[Deirvative] 미분 정리 (0)	2018.07.06
[Deep Learning] XOR 문제 풀기 과정 및 수식 (0)	2018.07.06
[Tensorflow] Manipulation - matmul, reshape, zip, etc (0)	2018.07.06

posted by 윤영식

2018. 7. 6. 17:54 AI Deep Learning/NN by Sung Kim

[Deirvative] 미분 정리

미분 정리하기 강좌를 정리한다.

미분

아주 작은 값을 대입하여 순간변화율을 구하는 것이다. 변화율은 기울기로 표현할 수 있다. 미분은 Gradient Descent에서 필수적인 공식이다.

편미분 (Partial derivative)

내가 관심있는 값은 미분하고 나머지는 상수로 치환하여 계산한다.

- 상수 함수 미분하면 = 0

- 2x 는 x + x 이고 x를 각각 미분하면 각각 1 + 1 = 2가 됨

- x + 3 은 1 + 0 이므로 1이다.

Chain rule에서 x가 f에 영향을 미치는 값을 알고 싶을 경우 미분으로 표현한다.

참조

- 김성훈교수님의 미분강좌

- 칸아카데미의 Chain rule 강좌를 참조하자

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] Weight 초기화 잘하기 (0)	2018.07.09
[Deep Learning] TensorBoard 사용 및 ReLU 개념 (0)	2018.07.09
[Deep Learning] XOR 문제 풀기 과정 및 수식 (0)	2018.07.06
[Tensorflow] Manipulation - matmul, reshape, zip, etc (0)	2018.07.06
[Deep Learning] 역사 (0)	2018.07.05

posted by 윤영식

2018. 7. 6. 17:31 AI Deep Learning/NN by Sung Kim

[Deep Learning] XOR 문제 풀기 과정 및 수식

XOR 문제 풀기 강좌를 정리한다.

Neural Network (NN)

XOR 를 Linear한 선으로 구분을 지을 수 없었다. NN에서 어떻게 해결하는가? Y1, Y2 가 Y예측으로 수렴되어 계산하는 것을 풀어본다.

matrix를 곱하고, sigmoid function인 S(..)을 태워서 값이 0, 1중 어디에 근접하는지 살핀다.

나머지를 다 계산해 본다. 나머지까지 답이 맞으면 만들어 놓은 Network이 맞는 것이된다.

위의 3개 Network을 통해 XOR결과가 제대로 나왔다. 하나의 Neural Network을 만들었다.

Multinomiad Classification처럼 하나의 Vector로 만들 수 있다. W, B가 matrix화 된다.

위의 것을 수식으로 표현할 수 있다.

과제는 여기서 W1, b1을 어떻게 알 수 있을까? 이다. 다음 강좌에서 알아본다.

Deep NN for XOR (강좌)

여러개의 Layer를 만들어 INPUT, OUTPUT을 조절한다.

- 이전 layer의 OUTPUT은 다음 Layer의 INPUT이 된다. (소스)

Deep & wide (강좌)

처음 INPUT 이 2개이고, 마지막 OUTPUT 이 1개 이다.

- 최초 INPUT Layer

- 마지막 OUTPUT Layer

- 중간 HIDDEN Layer

HIDDEN Layer는 개발자 마음대로 넣으면 된다. 예로 9개의 Layer를 만들 경우는 다음과 같다.

- Deep Network을 만들고 이것을 학습시키면 Deep Learning이 된다.

참조

- 김성훈교수님의 XOR 문제 풀기 강좌

- 김성훈교수님의 XOR 문제를 NN으로 풀기 강좌

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] TensorBoard 사용 및 ReLU 개념 (0)	2018.07.09
[Deirvative] 미분 정리 (0)	2018.07.06
[Tensorflow] Manipulation - matmul, reshape, zip, etc (0)	2018.07.06
[Deep Learning] 역사 (0)	2018.07.05
[Training & Testing] Data set 구분 (0)	2018.07.05

posted by 윤영식

Mobile Convergence

Publication

Tag

Category

Recent Post

[Deep Learning] Dropout 과 앙상블

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] Weight 초기화 잘하기

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] TensorBoard 사용 및 ReLU 개념

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deirvative] 미분 정리

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] XOR 문제 풀기 과정 및 수식

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

티스토리툴바

Mobile Convergence

Publication

Tag

Search

Category

Recent Post

[Deep Learning] Dropout 과 앙상블

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] Weight 초기화 잘하기

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] TensorBoard 사용 및 ReLU 개념

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deirvative] 미분 정리

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Deep Learning] XOR 문제 풀기 과정 및 수식

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

티스토리툴바