본문 바로가기
교육, 대외활동, 봉사/BIG리더 AI 아카데미 2기

[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 12

by g0n1 2020. 7. 18.
728x90

오전

머신러닝시간입니다. 선형회귀의 뒷부분을 배웠는데요,

Scikit-learn의 데이터(아이리스, boston 집값)를 회귀분석하고 시각화해보았습니다.

random_state = x #(랜덤 seed를 지정해서 똑같은 무작위성을 갖게 합니다.)


from sklearn.linear_model import Linear Regression
model = LinearRegression(fit_intercept=True)

model.fit(X,y) 
model.coef_            # 회귀계수
model.intercept_       # y절편

- 사이킷런의 지표평가 기준은 높은 지표값일 수록 좋은 모델이라 MSE값에 -1을 곱해서 반환하므로 반환 값에 -1을 다시 곱해야 원래의 양의 값인 MSE값이 됨
- 여기에 sqrt를 해서 RMSE를 구할 수 있음

 

오후

자연어처리 딥러닝 부분을 배웠습니다. 

 

토큰화 -> 패딩 -> 원핫인코딩

 

토큰화: 단어나 문장들을 토큰(단위)로 나눠줍니다.

패딩: 모자란 부분은 0으로 채우고 넘치는 부분은 잘라냅니다. 디폴트는 앞부터 잘라냅니다.

원핫인코딩: 0 또는 1의 값으로 전부 바꿔줍니다.

 

다른 공부를 해야해서 오늘은 여기까지

728x90

댓글