728x90
오전
머신러닝시간입니다. 선형회귀의 뒷부분을 배웠는데요,
Scikit-learn의 데이터(아이리스, boston 집값)를 회귀분석하고 시각화해보았습니다.
random_state = x #(랜덤 seed를 지정해서 똑같은 무작위성을 갖게 합니다.)
from sklearn.linear_model import Linear Regression
model = LinearRegression(fit_intercept=True)
model.fit(X,y)
model.coef_ # 회귀계수
model.intercept_ # y절편
- 사이킷런의 지표평가 기준은 높은 지표값일 수록 좋은 모델이라 MSE값에 -1을 곱해서 반환하므로 반환 값에 -1을 다시 곱해야 원래의 양의 값인 MSE값이 됨
- 여기에 sqrt를 해서 RMSE를 구할 수 있음
오후
자연어처리 딥러닝 부분을 배웠습니다.
토큰화 -> 패딩 -> 원핫인코딩
토큰화: 단어나 문장들을 토큰(단위)로 나눠줍니다.
패딩: 모자란 부분은 0으로 채우고 넘치는 부분은 잘라냅니다. 디폴트는 앞부터 잘라냅니다.
원핫인코딩: 0 또는 1의 값으로 전부 바꿔줍니다.
다른 공부를 해야해서 오늘은 여기까지
728x90
'교육, 대외활동, 봉사 > BIG리더 AI 아카데미 2기' 카테고리의 다른 글
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 14 (1) | 2020.07.19 |
---|---|
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 13 (마이크로소프트 이소영 이사님, 빅리더 2기 3기 선배님들) (0) | 2020.07.19 |
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 11 (0) | 2020.07.17 |
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 10 (0) | 2020.07.16 |
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 9 (1) | 2020.07.15 |
댓글