BLOG

인공지능

강화학습 : MDP와 벨만 방정식

이번 포스트에서는 강화학습의 아주 기초가 되는 개념들에 대해서 알아보려고 합니다.

강화학습은 순차적으로 어떤 행동을 결정해야 하는 문제를 푸는 알고리즘 입니다. 이것을 순차적 행동 결정 문제라고 …

MDP 강화학습
인공지능

데이터 전처리 : 사이킷런 랜덤포레스트의 특성 중요도, feature_importnaces_

데이터셋에서 유용한 특성을 선택하는 방법은 여러가지가 있습니다. 이번 포스트에서는 그중에 가장 간단하다고 볼 수 있는 랜덤포레스트의 특성 중요도를 이용하는 방법에 대해서 알아보겠습니다.

랜덤 포레스트를 사용하면 …

랜덤포레스트 결정트리
인공지능

데이터 전처리 : 순차적 특성 선택

모델을 훈련하다 보면 훈련셋에서의 성능이 테스트셋에서의 성능보다 많이 높게 나오는 경우가 있습니다. 즉, 일반화 성능이 안좋은 것인데요. 모델이 훈련셋에 과대적합 되었기 때문에 이러한 일이 발생하게 …

인공지능

데이터 전처리 : 특성의 스케일 조정하기

세상의 데이터들은 자신들만의 기준과 단위가 있습니다. 그렇기 때문에 값이 천차만별이죠. 예를 들어 어떤 옷들의 무게는 100~120g 정도 되는데 가격은 150000~250000원 정도의 분포를 가진다고 생각을 해봅시다. …

사이킷런 scikit-learn 표준화 최소최대변환
인공지능

데이터 전처리: 훈련 셋과 테스트 셋 나누기

데이터의 전처리가 끝났다면 데이터를 훈련용 데이터와 테스트용 데이터로 나누어야 합니다.

그래야 훈련용 데이터로 훈련하고 테스트용 데이터로 그 모델의 성능을 검증할 수 있기 때문이죠.

사이킷런의 train_test_split …

사이킷런 scikit-learn
Search