나만의 Tensorflow flowchart for feedforward neural networks

on September 15, 2018

지금까지 만들었던 MLP와 CNN의 high level tensorflow 구조도를
한번 깔끔하게 정리해보고 싶었다.

몇 가지 말해보면

1. Batch normalization (BN) 및 Batch re-normalization (BRN) 과 관련된 "bn_param"의 parameters는 gradient descent로 optimize 하는 것이 아니고 그냥 update 만 한다. (assign 이용)

2. "nn_param"의 parameters는 gradient descent로 optimize 한다.
그래서 Tensorflow optimizer를 사용할 때 var_list에 "nn_param"만 넣어주게된다.

3. Feedforward 동작을 train mode와 test mode로 나눠주었다.
Train mode에서는 dropout과 각종 BN 및 BRN이 적용되는 반면에 test mode에서는 BN의 moving average만 적용된다.
그렇기 때문에 "nn_param"을 optimize 한 후 제대로 된 최종 cost를 계산하기 위해서는 test mode의 feedforward와 cost를 활용한다.

Comments

UnknownSeptember 17, 2018 at 9:15 PM
안녕하세요, 최근 머신러닝과 관련하여 공부를 시작한 학생입니다.

BN과 BRN의 차이점은 어떤것이 있는지 알 수 있을까요?

또한 BN을 하였을때 왜 성능이 더욱 좋아지는지도 궁급합니다.
ReplyDelete
Replies

Add comment

Moonchive

Search This Blog

나만의 Tensorflow flowchart for feedforward neural networks

Comments

Post a Comment