BLOG 사이킷런 (17)
인공지능

데이터 전처리: 훈련 셋과 테스트 셋 나누기

데이터의 전처리가 끝났다면 데이터를 훈련용 데이터와 테스트용 데이터로 나누어야 합니다.

그래야 훈련용 데이터로 훈련하고 테스트용 데이터로 그 모델의 성능을 검증할 수 있기 때문이죠.

사이킷런의 train_test_split …

사이킷런 scikit-learn
인공지능

사이킷런에서 KNN 사용하기

KNN은 k-최근접 이웃 이라고도 불리는 아주 간단한 분류 알고리즘입니다. 로지스틱 회귀나 랜덤포레스트 같은 분류기는 훈련데이터를 통해 훈련 한 후 더이상 훈련 데이터가 필요하지 않지만 KNN은 …

사이킷런 scikit-learn KNN
인공지능

사이킷런에서 결정 트리와 랜덤포레스트 사용하기

결정 트리는 대표적인 화이트박스 모델입니다. 화이트박스란 분류 과정을 설명할 수 있다는 뜻입니다. 신경망같은 모델은 내부에서 어떤 데이터에 가중치를 가지고 있는지, 어떤 특징을 잡아서 계산했는지 내부를 …

사이킷런 scikit-learn 랜덤포레스트 결정트리
인공지능

사이킷런에서 커널 svm 사용하여 비선형 데이터 분류하기

1. 커널이란?


바로 이전 포스트에서 서포트 벡터 머신(svm)에 대해서 알아보았어요. 굉장히 간단하고 성능이 좋은 분류기입니다. 하지만 svm의 진가는 커널을 사용할 수 있다는 것입니다.

커널 방법은 …

사이킷런 scikit-learn svm 커널
인공지능

서포트 벡터 머신 (SVM) 사이킷런에서 사용하기

이번 포스트에서는 서포트 벡터 머신 (SVM)에 대해서 알아보도록 하겠습니다.

서포트 벡터 머신도 분류 알고리즘 중 하나입니다. 기본적인 아이디어는 클래스를 구분하는 결정 경계와 그 경계와 가장 …

사이킷런 scikit-learn svm
인공지능

로지스틱 회귀(Logistic Regression) (2) 모델을 평가하고 규제를 통해 성능 높이기

이전 포스트에서 로지스틱 회귀 모델에 대해서 알아보고 사이킷런을 이용해서 훈련 데이터를 받아와 로지스틱 회귀 모델을 훈련하는 것 까지 알아 보았습니다. 이제부터는 이 훈련된 모델을 테스트셋으로 …

사이킷런 scikit-learn 로지스틱회귀
인공지능

로지스틱 회귀(Logistic Regression) (1) 이해하고 사이킷런에서 사용해보기

이번에는 퍼셉트론에 이어 제일 유명하고 간단한 회귀 모델인 로지스틱 회귀(Logistic Regression)을 알아보겠습니다.

1. 정의


로지스틱 회귀는 아주 간단하면서도 선형 분류 문제에서 뛰어난 성능을 보이는 모델이에요. …

사이킷런 scikit-learn 분류 로지스틱회귀
Search