[머신러닝] 6-1. 군집 알고리즘
흑백 사진을 분륳기 위해 여러 가지 아이디어를 내면서 비지도 학습과 군집 알고리즘에 대해 이해하자 오옹 제가 좋아하는 부분이네요. 잘 소화해보도록 하겠습니다 타깃을 모르는 비지도 학습 사진을 종류별로 분류하고 싶다. 하지만 이게 뭔지는 알지 못한다! 이때 우리는 비지도 학습을 쓸 수 있다. 과일 사진 데이터 준비하기 코랩으로 다운로드 ...
흑백 사진을 분륳기 위해 여러 가지 아이디어를 내면서 비지도 학습과 군집 알고리즘에 대해 이해하자 오옹 제가 좋아하는 부분이네요. 잘 소화해보도록 하겠습니다 타깃을 모르는 비지도 학습 사진을 종류별로 분류하고 싶다. 하지만 이게 뭔지는 알지 못한다! 이때 우리는 비지도 학습을 쓸 수 있다. 과일 사진 데이터 준비하기 코랩으로 다운로드 ...
앙상블 학습이 뭐야? 우와아 참 많이 달려왔다 좀만 더!! 파이팅!!!! 정형 데이터와 비정형 데이터 어떤 구조로 가지런히 정리 되어 있는 것을 정형 데이터라 한다. csv, 데이터 베이스, 엑셀에 저장하기 쉽다 반대는? 비정형 데이터! 우리 주변에 책, 글과 같은 텍스트, 사진, 음악! 이것이 비정형 데이터지 정형 데이터를 다루는 데 가장...
검증 세트가 필요한 이유를 이해하고 교차 검증에 대해 배운다. 그리드 서치와 랜덤 서치를 이용해 최적의 성능을 내는 하이퍼파라미터를 찾자 검증 세트 테스트 세트를 사용하지 않으면 모델이 과대적합이닞 과소적합인지 알기 어렵다.테스트 세트를 사용하지 않고 측정하는 방법은 훈련 세트를 또 나누면 된다 이 데이터를 검증 세트라고 한다. import...
결정트리 알고리즘을 사용해 새로운 분류 문제를 다루어보자. 결정트리가 머신러닝 문제를 어떤헤 해결할까? 로지스틱 회귀로 와인 분류하기 import pandas as pd wine=pd.read_csv('https://bit.ly/wine-date') wine.head()//제대로 읽었는지 확인하기 위해 처음 5개 샘플 확인 판다스 데이터 프...
경사 하강법 알고리즘을 이해하고 대량의 데이터에서 분류 모델을 훈련하는 방법을 알아보자 점진적인 학습 이전에 훈련한 모델을 버리고 다시 새로운 모델을 훈련하는 방식! 훈련한 모델을 벌지 않고 새로운 데이터에 대해서만 조금씩 더 훈련할 수는 없을까? 이것은 점진적 학습, 온라인 학습이라고 부른다. 대표적인 점진적 알고리즘은! 확률적 경사 하강법...
로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률을 예측하자 럭키백의 확률 k-최근접 이웃은 주변 이웃을 찾아주니까 이웃의 클래스 비율을 확률이라고 출력하면 되지 않을까? 데이터 준비하기 import pandas as pd fish=pd.read_csv('https://bit.ly/fish_csv')# csv파일을 데이터 프레...
다중회귀분석 여러 개의 특성을 사용한 선형 회귀를 다중회귀라고 부릅니다. 적합한 변수가 누락되었을 때 다중회귀분석에 영향 중요한 변수가 회귀 모델에서 빠지게 되면 그 변수와 관련된 다른 변수들의 회귀계수 추정치가 왜곡될 수 있습니다. 모델이 실제 관계를 정확하게 반영하지 못하게 됩니다. 중요한 변수가 누락되면 상수항도 편향될 수 있습니...
여러 특성을 사용한 다중 회귀에 대해 배우고 사이킷런의 여러 도구를 사용해보자. 복잡한 모델의 과대적합을 막기 위한 릿지와 라쏘 회귀를 공부해보자 다중회귀 여러 개의 특성을 사용한 선형 회귀를 다중회귀(multiple regression)라고 부른다. 1개의 특성을 사용했을 때 선형 회귀 모델이 학습하는 것은 직선이다. 2개의 특성을 사용하면?...
k-최근접 이웃 회귀와 선형 회귀 알고리즘의 차이를 이해하고 사이킷런을 사용해 여러 가지 성형 회귀 모델을 만들기 k-최근접 이웃의 한계 혼공머신의 모델을 사용해 50cm 농어의 무게를 예측해보자 print(knr.predict([[50]])) #[1033.3333] 1033g 정도로 예측한다. 그런데 실제로는 이보다 훨씬 많이 나간다 무...
지도학습의 한 종류인 회귀 문제를 이해하고 k-최근접 이웃 알고리즘을 사용해 농어의 무게를 예측하는 프로그램 만들기 k-최근접 이웃 회귀 지도학습 알고리즘: 분류, 회귀 분류는 샘플을 몇 개의 클래스 중에서 하나로 분류하는 것이다. 회귀는 임의의 어떤 숫자를 예측하는 것이다. 정해진 클래스가 없고 임의의 수를 예측하는 것이다. 두 변수 사이에...