본문 바로가기

728x90

Development/Deep Learning

(2)
[Deep Learning] 데이터 표현 최근의 모든 머신 러닝 시스템은 일반적으로 텐서를 기본 데이터 구조로 사용합니다. Google의 TensorFlow의 이름을 여기서 따왔습니다. 그럼 텐서는 무엇일까요? 텐서는 데이터를 위한 컨테이너(container)입니다. 거의 항상 수치형 데이터를 다루므로 숫자를 위한 컨테이너입니다. 또한, 텐서는 임의의 차원 개수를 가지는 행렬의 일반화된 모습입니다. 1. 스칼라(0D Tensor) 하나의 숫자만 담고 있는 텐서를 스칼라(scalar) (또는 스칼라 텐서, 0차원 텐서, 0D 텐서)라고 부릅니다. Numpy에서는 float32나 float64 타입의 숫자가 스칼라 텐서(또는 배열 스칼라(array scalar))입니다. ndim 속성을 사용하면 Numpy 배열의 축 개수를 확인할 수 있습니다. 2..
[Deep Learning] 활성화 함수(Activation Function)란? 딥러닝에서 중요한 활성화 함수에 대해 정리하겠습니다. 간단하게 말하면, 입력을 받아 출력값이 활성화가 될지, 비활성이 될지를 결정하는데 사용되는 함수입니다. 활성화 함수는 어떤 것을 사용하느냐에 따라 그 출력 값이 달라지기 때문에, 적절한 활성화 함수를 사용하는 것이 중요합니다. 데이터들의 흐름을 보면 Inputs -> Activation Function -> Output 로 이루어져 있습니다. 활성화 함수의 종류에는 여러가지가 존재합니다. 입력 값에 따라 출력 값의 모양이 어떠한가에 따라 선형과 비선형으로 나눌 수 있습니다. 그러나 신경망에서는 활성화 함수로 선형함수가 아닌 비선형함수를 사용해야 합니다. Hidden Layer를 여러 개 다층으로 구성하고 활성화함수로 모두 선형함수를 이용하는 경우 단층..

728x90