인기 태그
인공지능
사이킷런
scikit-learn
학습 곡선
검증 곡선
사이킷런 학습 곡선, 검증 곡선으로 모델의 과대적합, 과소적합 조사하기
모델이 높은 편향을 가지면 모델이 너무 단순해서 데이터에 과소적합 되었다는 것을 의미합니다. 이는 모델을 더 복잡하게 만들거나 훈련에 사용하는 데이터의 양을 늘려야 합니다.
모델이 높은 …
인공지능
사이킷런
scikit-learn
K-fold
K-겹 교차 검증 (K-fold)를 통한 머신러닝 모델 평가
머신러닝 모델을 구축하는 과정에서 반드시 필요한 과정이 바로 모델을 평가하는 과정입니다. 모델을 만들고 평가한 뒤 그 결과를 바탕으로 다시 모델을 수정하고 구축할 수 있기 때문이죠. …
인공지능
사이킷런
scikit-learn
Pipeline
make_pipeline
파이프라인
사이킷런에서 모델 파이프라인 만들기
보통 머신러닝 모델을 만들면 전처리부터 분류나 회귀까지 다양한 데이터가 다양한 단계를 거치게 됩니다.
예를 들어 어떤 데이터를 표준화 전처리 한 후 주성분 분석(PCA)를 진행하고 이것을 …
인공지능
사이킷런
scikit-learn
LDA
머신러닝 데이터 선형 판별 분석 : LDA
선형 판별 분석, LDA는 규제가 없는 분류 모델에서 고차원의 데이터에 의한 과대 적합을 줄이고 특성을 추출하기 위한 기법중에 하나입니다.
이전에 주성분 분석(PCA)에 …
인공지능
사이킷런
scikit-learn
PCA
머신러닝 데이터 주성분 분석하기 : PCA와 KernelPCA
PCA는 특성사이의 상관관계를 분석해서 분산이 가장 큰 방향을 찾아 그것을 축으로 하는 새로운 좌표공간으로 데이터를 투영하는 방법으로 데이터의 특성을 추출하거나 차원을 줄이는데 사용합니다.
입력 데이터 …