BLOG 인공지능
인공지능

사이킷런에서 모델 파이프라인 만들기

보통 머신러닝 모델을 만들면 전처리부터 분류나 회귀까지 다양한 데이터가 다양한 단계를 거치게 됩니다.

예를 들어 어떤 데이터를 표준화 전처리 한 후 주성분 분석(PCA)를 진행하고 이것을 …

사이킷런 scikit-learn Pipeline make_pipeline 파이프라인
인공지능

머신러닝 데이터 선형 판별 분석 : LDA

선형 판별 분석, LDA는 규제가 없는 분류 모델에서 고차원의 데이터에 의한 과대 적합을 줄이고 특성을 추출하기 위한 기법중에 하나입니다.

이전에 주성분 분석(PCA)에 …

사이킷런 scikit-learn LDA
인공지능

머신러닝 데이터 주성분 분석하기 : PCA와 KernelPCA

PCA는 특성사이의 상관관계를 분석해서 분산이 가장 큰 방향을 찾아 그것을 축으로 하는 새로운 좌표공간으로 데이터를 투영하는 방법으로 데이터의 특성을 추출하거나 차원을 줄이는데 사용합니다.

입력 데이터 …

사이킷런 scikit-learn PCA
인공지능

강화학습 : MDP와 벨만 방정식

이번 포스트에서는 강화학습의 아주 기초가 되는 개념들에 대해서 알아보려고 합니다.

강화학습은 순차적으로 어떤 행동을 결정해야 하는 문제를 푸는 알고리즘 입니다. 이것을 순차적 행동 결정 문제라고 …

MDP 강화학습
인공지능

데이터 전처리 : 사이킷런 랜덤포레스트의 특성 중요도, feature_importnaces_

데이터셋에서 유용한 특성을 선택하는 방법은 여러가지가 있습니다. 이번 포스트에서는 그중에 가장 간단하다고 볼 수 있는 랜덤포레스트의 특성 중요도를 이용하는 방법에 대해서 알아보겠습니다.

랜덤 포레스트를 사용하면 …

랜덤포레스트 결정트리
Search