본문 바로가기

728x90

Development

(85)
[SQL] 데이터베이스의 개요 1. 데이터베이스 데이터베이스(DB: database)는 통합하여 관리되는 데이터의 집합체를 의미한다. 이는 중복된 데이터를 없애고, 자료를 구조화하여, 효율적인 처리를 할 수 있도록 관리된다. 이러한 데이터베이스는 응용 프로그램과는 다른 별도의 미들웨어에 의해 관리된다. 이를 관리하는 미들웨어를 데이터베이스 관리 시스템(DBMS: Database Management System)라고 한다. 데이터베이스의 특징 사용자의 질의에 대하여 즉각적인 처리와 응답이 이루어진다. 생성, 수정, 삭제를 통하여 항상 최신의 데이터를 유지한다. 사용자들이 원하는 데이터를 동시에 공유할 수 있다. 사용자가 원하는 데이터를 주소가 아닌 내용에 따라 참조 할 수 있다. 응용프로그램과 데이터베이스는 독립되어 있으므로, 데이터의..
[SQL] 데이터 무결성의 이해 여러 사용자가 규칙 없이 아무 데이터나 입력하면 데이터베이스는 엉망이 되어 사용할 수 없게 될지도 모릅니다. 이를 방지하기 위하여 관계형 데이터베이스 시스템은 데이터 무결성이라는 규칙을 만들었습니다. 데이터베이스에 저장된 데이터 값과 사용자가 의도한 데이터 값은 일치해야 합니다. 데이터는 정확성, 유효성, 일관성, 신뢰성이 지켜져야 하며 이를 어기는 잘못된 입력과 갱신 또는 삭제로부터 보호되어야 합니다. 데이터베이스 관리의 기본 규칙이 지켜지지 않으면 데이터베이스 시스템을 운영하는 데 어려움을 겪을 수 있습니다. 따라서, 데이터베이스 데이터는 사용자의 목적에 맞게 입력되고 저장되어야 하며 규칙을 위배하지 않아야 합니다. 이를 위해, 데이터베이스 시스템은 데이터에 접근하거나 데이터를 처리할 때마다 부적절한..
[Machine Learning] Voting Classifier Voting Classifier는 "다수결 분류"를 뜻하는 것으로, 두 가지 방법으로 분류할 수 있습니다. 1. Hard Voting Classifier 여러 모델을 생성하고 그 성과(결과)를 비교합니다. 이 때 classifier의 결과들을 집계하여 가장 많은 표를 얻는 클래스를 최종 예측값으로 정하는 것을 Hard Voting Classifier라고 합니다. 위와 같이 최종 결과를 1로 예측한 모델이 1개, 0으로 예측한 모델이 2개이므로 Hard Voting Classifier의 최종 결과(예측)은 0이 됩니다. 2. Soft Voting Classifier 앙상블에 사용되는 모든 분류기가 클래스의 확률을 예측할 수 있을 때 사용됩니다. 각 분류기의 예측을 평균 내어 확률이 가장 높은 클래스로 예측..
[Deep Learning] 데이터 표현 최근의 모든 머신 러닝 시스템은 일반적으로 텐서를 기본 데이터 구조로 사용합니다. Google의 TensorFlow의 이름을 여기서 따왔습니다. 그럼 텐서는 무엇일까요? 텐서는 데이터를 위한 컨테이너(container)입니다. 거의 항상 수치형 데이터를 다루므로 숫자를 위한 컨테이너입니다. 또한, 텐서는 임의의 차원 개수를 가지는 행렬의 일반화된 모습입니다. 1. 스칼라(0D Tensor) 하나의 숫자만 담고 있는 텐서를 스칼라(scalar) (또는 스칼라 텐서, 0차원 텐서, 0D 텐서)라고 부릅니다. Numpy에서는 float32나 float64 타입의 숫자가 스칼라 텐서(또는 배열 스칼라(array scalar))입니다. ndim 속성을 사용하면 Numpy 배열의 축 개수를 확인할 수 있습니다. 2..
[Deep Learning] 활성화 함수(Activation Function)란? 딥러닝에서 중요한 활성화 함수에 대해 정리하겠습니다. 간단하게 말하면, 입력을 받아 출력값이 활성화가 될지, 비활성이 될지를 결정하는데 사용되는 함수입니다. 활성화 함수는 어떤 것을 사용하느냐에 따라 그 출력 값이 달라지기 때문에, 적절한 활성화 함수를 사용하는 것이 중요합니다. 데이터들의 흐름을 보면 Inputs -> Activation Function -> Output 로 이루어져 있습니다. 활성화 함수의 종류에는 여러가지가 존재합니다. 입력 값에 따라 출력 값의 모양이 어떠한가에 따라 선형과 비선형으로 나눌 수 있습니다. 그러나 신경망에서는 활성화 함수로 선형함수가 아닌 비선형함수를 사용해야 합니다. Hidden Layer를 여러 개 다층으로 구성하고 활성화함수로 모두 선형함수를 이용하는 경우 단층..

728x90