
Activation Functions - Alternatives to the sigmoid activation 지금까지 은닉층과 출력층에서 시그모이드 활성화 함수를 사용해왔다면, 다른 활성화 함수를 선택함으로써 신경망의 성능을 향상시킬 수 있다. 그 방법을 자세히 살펴보겠다. 지난 번에 본 수요 예측 모델이다. 특정 제품이 베스트 셀러가 될지 예측하려고 한다. 이때, 티셔츠의 인지도를 이진 값(0 또는 1)으로 단순하게 모델링하는 대신, 인지도는 연속적인 값일 가능성이 크다. 즉, 인지도가 낮을 수도, 중간일 수도, 매우 높을 수도 있으므로, 인지도를 0과 1 사이의 확률로 추정하거나, 음수가 아닌 값으로 나타내는 것이 더 자연스럽다. 따라서 시그모이드 함수를 사용하여 은닉층의 활성화 값을 계산했다. ..

Neural Network Training - TensorFlow implementation 신경망 훈련에 대해 알아보자. 입력값 X, 첫 번째 은닉 계층은 25단위, 두 번째 은닉 계층은 15단위, 그 다음은 출력 단위 1개이다. X, Y로 구성된 훈련 예제 집합이 주어진다면, 이 신경망의 파라미터를 어떻게 훈련시킬 수 있을까? TensorFlow에서 신경망을 훈련시키는 방법이자 코드이다. 1단계는 TensorFlow에 추론 계산 방법을 알려주는 모델을 지정하는 것이다. 2단계는 특정 손실 함수를 사용하여 모델을 컴파일하고, 3단계는 모델을 학습시키는 것이다. (2단계에서 지정한 비용 함수의 손실을 사용하여 1단계에서 지정한 모델을 dataset에 맞추도록 TensorFlow에 지시) ** epo..

정책, 정책 함수 (Policy, Policy function) in MDP각 상태(state)에서 어떤 액션(action)을 선택할지 정해주는 함수를 정책 혹은 정책 함수라고 한다. 정책함수는 에이전트 안에 존재하며, 더 큰 보상을 얻기 위해 계속해서 정책을 교정해나간다.상태 가치 함수(state-value function) in MDP에이전트의 액션이 있으므로 agent의 정책 \(\pi\)에 따라서 return G가 달라진다. 즉, MDP의 value function은 정책 함수에 의존적이며, value function을 정의하기 위해서는 먼저 정책 함수 \(\pi\)가 정의되어야 한다. value function은 \(s\)부터 끝까지 \(\pi\)를 따라 움직일 때 얻는 리턴의 기댓값으로 정의..

의사결정트리 (Decision Tree) 란? 지도학습에 속하는 모델로, 분류와 회귀에 모두 사용 가능하다. 의사결정트리는 데이터에서 규칙을 자동으로 학습하여 이를 기반으로 트리 구조의 분류 규칙을 만든다. 쉽게 말해, 스무고개를 생각하면 쉽다. 일반적으로 가장 쉽게 표현하는 방법은 if/else 기반으로 나타내는 것이다. 의사결정트리의 기본 개념한 분기마다 변수 영역을 두 개로 구분한다. 이진트리의 개념으로 생각하면 된다.루트 노드 (Root Node): 트리의 시작점으로 전체 데이터를 포함하는 노드규칙 노드 (Internal Node): 나무 구조의 중간에 있는 노드끝 노드 (Leaf Node): 트리의 끝에 위치한 노드로 최종적으로 분류된 결과를 나타냄의사결정트리의 목표는 데이터를 잘 나눠서 lea..

Neural Network Implementation in Python - Forward prop in a single layer 단일 레이어 신경망의 순방향 전파(Forward Propagation) 구현에 대해 신경망의 입력에서 출력까지의 계산 과정을 이해하는 것이다.TensorFlow Implementation - Data in TensorFlow NumPy와 TensorFlow에서 데이터가 어떻게 표현되는지 알아보는 것은 신경망을 제대로 구현하는 데 필수적이다. 특히, 이 두 프레임워크에서 벡터와 행렬을 다루는 방식에 대한 차이를 이해해야 한다. (NumPy와 텐서플로우에서 데이터가 표현되는 방식 간에는 약간의 불일치가 존재함) 먼저 TensorFlow가 데이터를 나타내는 방법을 살펴보겠다. 이..

TensorFlow Implementation - Inference in Code TensorFlow는 딥러닝 구현에 널리 사용되는 강력한 프레임워크로, 신경망 추론을 쉽게 구현할 수 있다.(물론, PyTorch도 유용한 프레임워크이다) TensorFlow를 사용하여 추론 코드를 구현하는 방법에 대해 알아보자.신경망의 뛰어난 점은 같은 알고리즘을 다양한 응용 프로그램에 적용할 수 있다는 것이다. 이를 위해 coffee roasting 최적화의 예시를 사용해 보겠다. 커피 로스팅에서 제어할 수 있는 두 가지 주요 변수는 온도와 시간이다. 이를 통해 머신 러닝 모델이 좋은 커피를 예측할 수 있다. 예를 들어, 특정 온도와 시간 조합이 주어졌을 때, 그 결과물이 맛있는 커피가 될지 예측할 수 있다. (보라색..

Neural Network Model - Neural network layer 현대 신경망의 기본 구성 요소는 뉴런 계층(a layer of neurons)이다. 이번 설명에서는 뉴런 계층이 어떻게 작동하는지 단계별로 살펴보겠다. 이를 통해 신경망이 어떻게 계산을 수행하는지 이해하게 된다. 다음은 수요 예측 문제에서 사용되는 신경망의 예시이다. 이 신경망은 4개의 입력 특성을 받아들인 후 3개의 뉴런으로 구성된 은닉 계층을 통과하여, 최종적으로 1개의 뉴런이 있는 출력 계층으로 예측값을 보낸다. 먼저 은닉 계층을 확장해 그 계산 과정을 살펴보자. 이 은닉 계층에는 세 개의 뉴런이 있으며, 각 뉴런은 네 개의 입력 값(특성)을 받는다. 이 세 개의 뉴런은 각각 로지스틱 회귀 함수를 구현하며, 간단한 ..

Neural Network Intuition - Neurons and the brain 신경망(neural network), 특히 인공 신경망(artificial neural network)은 인간의 뇌가 학습하고 사고하는 방식을 모방하려는 동기에서 처음 개발되었다. 비록 오늘날의 신경망은 실제 뇌의 작동 방식과 크게 다르지만, 초기 목표는 생물학적 뉴런의 기능을 소프트웨어로 구현하는 것이었다. 신경망 연구는 1950년대에 시작되었지만, 한동안 관심을 받지 못하다가 1980~1990년대 초에 다시 주목받았다. 특히 손글씨 숫자 인식 등 일부 분야에서 성과를 내면서, 우편번호를 읽거나 수표의 금액을 인식하는 데 사용되기도 했다. 그러나 1990년대 후반에는 다시 인기를 잃었다. 그러다 2005년경 다시..
- Total
- Today
- Yesterday
- 로지스틱 회귀
- sorted
- 파이썬
- 숏코딩
- policy function
- numpy 배열 속성
- 비용함수
- 손실함수
- **kwargs
- numpy 배열 생성
- 경사하강법
- 강의노트 정리
- action value function
- *
- omp: error #15
- adrew ng 머신러닝 강의
- **
- computation graph
- *args
- NumPy
- Sort
- 앤드류응
- python
- 11870
- 백준
- Andrew Ng
- state value function
- 딥러닝
- baekjoon
- 강화학습
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |