Minseolog

[머신러닝] 6-3. 주성분 분석

오옹 주성분 분석! 저번에 이미 정리해둔 것이 있다. 행렬 분해와 차원 축소 - 주성분 분석 이것도 같이 참고해보도록! 차원과 차원 축소 데이터가 가진 속성을 특성이라고 한다. 머신러닝에서는 특성을 차원이라고도 부른다. 이 차원을 줄이면 저장 공간을 절약할 수 있게 된다 다차원 배열에서 차원은 축의 개수이지만 1차원 배열에서는 원소의 개수...

[머신러닝] 6-2. k-평균

k-평균 알고리즘의 작동 방식을 이해하고 과일 사진을 자동으로 모으는 비지도 학습 모델을 만들어보자 타깃값을 모르는 비지도 학습에서 어떻게 평균값을 구할까? k-평균 군집 알고리즘이 평균값을 찾아준다. 이 평균 값이 클러스터의 중심에 위치하기 때문에 클러스터 중심, 센트로이드라고 부른다. 클러스터의 사전적 정의는 집합, 군집을 말한다. 비슷한 공...

[머신러닝] 6-1. 군집 알고리즘

흑백 사진을 분륳기 위해 여러 가지 아이디어를 내면서 비지도 학습과 군집 알고리즘에 대해 이해하자 오옹 제가 좋아하는 부분이네요. 잘 소화해보도록 하겠습니다 타깃을 모르는 비지도 학습 사진을 종류별로 분류하고 싶다. 하지만 이게 뭔지는 알지 못한다! 이때 우리는 비지도 학습을 쓸 수 있다. 과일 사진 데이터 준비하기 코랩으로 다운로드 ...

[머신러닝] 5-3. 트리의 앙상블

앙상블 학습이 뭐야? 우와아 참 많이 달려왔다 좀만 더!! 파이팅!!!! 정형 데이터와 비정형 데이터 어떤 구조로 가지런히 정리 되어 있는 것을 정형 데이터라 한다. csv, 데이터 베이스, 엑셀에 저장하기 쉽다 반대는? 비정형 데이터! 우리 주변에 책, 글과 같은 텍스트, 사진, 음악! 이것이 비정형 데이터지 정형 데이터를 다루는 데 가장...

[머신러닝] 5-2. 교자 검증과 그리드 서치

검증 세트가 필요한 이유를 이해하고 교차 검증에 대해 배운다. 그리드 서치와 랜덤 서치를 이용해 최적의 성능을 내는 하이퍼파라미터를 찾자 검증 세트 테스트 세트를 사용하지 않으면 모델이 과대적합이닞 과소적합인지 알기 어렵다.테스트 세트를 사용하지 않고 측정하는 방법은 훈련 세트를 또 나누면 된다 이 데이터를 검증 세트라고 한다. import...