728x90
스케일링 하는 이유
너무 작거나 너무 크면 영향력(가중치, 회귀계수 등)이 제대로 표현 안 됨 -> over fitting
오버피팅의 가능성이 높아짐
Min-Max Scaling
from sklearn.preprocessing import MinMaxScaler
mMscaler = MinMaxScaler()
#
mMscaler.fit(data)
# 이러면 데이터의 범위가 0~1로 됨
mMsacled_data = mMscaler.fit_transform(data)
Standard Scailing
# Standard Scailing
from sklearn.preprocessing import StandardScaler
# 모델 생성
stdscaler = StandardScaler()
# 특징 찾기
stdscaler.fit(data)
# 데이터 변환
stdscaled_data = stdscaler.transform(data)
평균은 0, 표준편차는 1.
728x90
'코딩코딩' 카테고리의 다른 글
ADsP 27회 주관식 정답 (0) | 2020.11.22 |
---|---|
구글 코리아 머신러닝 부트캠프 소개 Google Korea ML Boot Camp (5) | 2020.09.16 |
Label Encoding, One-Hot Encoding / Scikit-learn 레이블 인코딩, 원핫인코딩 (0) | 2020.07.19 |
Scikit-learn Sampling 싸이킷런 샘플링 (0) | 2020.07.18 |
다양한 무료 공부소스들 (데이터 사이언스, 통계, 인공지능...) (0) | 2020.07.18 |
댓글