티스토리 뷰
[ML Andrew Ng] C2-Advanced Learning Algorithms 강의 (W2-1) Neural network Training
Life4AI 2024. 10. 16. 16:54Neural Network Training - TensorFlow implementation
신경망 훈련에 대해 알아보자.
입력값 X, 첫 번째 은닉 계층은 25단위, 두 번째 은닉 계층은 15단위, 그 다음은 출력 단위 1개이다.
X, Y로 구성된 훈련 예제 집합이 주어진다면, 이 신경망의 파라미터를 어떻게 훈련시킬 수 있을까?
TensorFlow에서 신경망을 훈련시키는 방법이자 코드이다.
1단계는 TensorFlow에 추론 계산 방법을 알려주는 모델을 지정하는 것이다.
2단계는 특정 손실 함수를 사용하여 모델을 컴파일하고,
3단계는 모델을 학습시키는 것이다. (2단계에서 지정한 비용 함수의 손실을 사용하여 1단계에서 지정한 모델을 dataset에 맞추도록 TensorFlow에 지시)
** epochs?
경사 하강법을 실행할 단계 수 또는 경사 하강법을 실행할 시간을 결정하는 기술 용어
Neural Network Training - Training Details
1단계는 입력값 X와 매개변수가 주어졌을 때 출력값을 계산하는 방법 지정하기,
2단계에서는 손실과 비용을 지정하고,
3단계에서는 경사하강법을 통해 학습한 비용 함수를 최소화한다.
TensorFlow에서 신경망을 훈련시키는 방법은 세 단계로 동일하다. 더 자세히 살펴보겠다.
첫 번째 단계에서는 입력값 x와 파라미터 w와 b가 주어지면 출력값을 계산하는 방법을 지정한다. 즉, 신경망의 전체 아키텍처를 지정한다.
두 번째 단계에서는 손실 함수가 무엇인지 지정해야 합니다. 이를 통해 신경망을 훈련하는 데 사용하는 비용 함수도 정의됩니다. (로지스틱 손실을 tensorflow에서는 binarycross entropy라고 함)
TensorFlow에 이 손실 함수를 사용하여 신경망을 컴파일하도록 요청하는 것이다.
분류 문제가 아닌 회귀 문제를 해결하려는 경우, TensorFlow에 다른 손실 함수를 사용하여 모델을 컴파일하도록 지시할 수도 있습니다. (MeanSquareError 등)
마지막 단계는 TensorFlow에 cost 함수를 최소화하도록 경사하강법을 하는 것이다. TensorFlow는 fit이라는 함수로 역전파를 모두 구현한다.
Practice quiz - Train a Neural Network in TensorFlow
'AI > Machine learning' 카테고리의 다른 글
- Total
- Today
- Yesterday
- CNN에서의 활성화 함수
- 머신러닝
- **
- 숏코딩
- 강의노트 정리
- **kwargs
- ML 학습 방법
- python
- 비용함수
- 딥러닝
- *
- 손실함수
- *args
- ML
- Sort
- 로지스틱 회귀
- 백준
- ML 프로세스
- 강화학습
- ML와 DL 차이
- Andrew Ng
- 경사하강법
- droput
- NumPy
- cnn
- sorted
- 머신러닝 프로세스
- 파이썬
- 앤드류응
- baekjoon
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |