본문 바로가기

빅리더 AI 아카데미13

[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 11 오전 - 자연어처리(NLP) 용어 DTM: 문서 행렬 (Documnet Term Matrirx) tf: 현재 문서에 출현한 단어의 빈도(횟수) (Term Frequency) idf : 역문서 빈도, 전제 문서의 수를 해당 단어가 나오는 문서수로 나눈 것(Inverse Document Frequency) td-idf : 단어빈도 * 역문서 빈도 문서행렬은 문서에 나타나는 어휘를 모아 one-hot 인코딩으로 표현한 벡터다. 모든 어휘들이 columns가 되는데 columns에서 저빈도 어휘들은 빼고 고빈도 어휘들로 채운다. 고빈도 어휘들 중에서도 불용어(을/를, 은/는 ....)는 제외한다. 이때 빈도는 tf나 tf-idf가 될 수 있다. tf가 단순히 출현 횟수만을 카운트한다. if-idf는 특정 문서들.. 2020. 7. 17.
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 8 오전 프로젝트 설명회를 들었습니다. 기억나는 건 드론으로 지도를 그리고 GIS를 활용해서 이것저것 하는 거,,,, 오후 점심먹고 무슨 전파랑 전파전파랑 안테나 들으니까 졸려서 정신 나갔습니다. 기대하던 한국관광공사 프로젝트 설명회는 썩 만족스럽진 않았습니다... 질문을 하면 '뭐 이런 질문을 하나' 이런 느낌이었습니다. 저녁먹고 팀을 짰는데 저희 팀은 모두 비전공자에 파이썬을 잘 못 다루더라구요. 제가 그냥 당당하게 조장한다고 했습니다. 같은 주제를 하는 다른 팀은 팀원 절반 정도가 머신러닝 경험자더라구요. 하지만 오히려 좋습니다. 애니메이션 에서 주인공이 야구부도 없는 학교에서 야구부를 만들고 동료들과 고군분투하던 모습이 떠올랐습니다. 역시 저는 상대랑 맞붙어서 경쟁할 때가 제일 즐겁습니다. 1:1인데.. 2020. 7. 14.
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 7 (심가네 해물짬뽕, 신가네 ) 오늘도 메뉴 고민하느라 힘들었습니다. 비가 오긴 했지만 같은 방 형 차가 있어서 다행이었습니다. 오전 오늘도 아침엔 옆건물 2층 라운지에서 공부를 조금 했습니다. 챕터 12가 목표였는데 크롤링하는게 사이트마다 다 달라서 시간도 오래 걸리고 스트레스도 많이 받았습니다. 후... 점심은 심가네 해물짬뽕을 가려고 12시쯤 도착했는데, 웨이팅이 너무 길어서 텐동집으로 돌렸습니다. 하지만 텐동집도 사람이 많아 어제 갔던 신가네로 회귀했습니다. 돌고 돌아 국밥. 돌돌국. 오후 점심먹고 통영리스타트플랫폼 2층에 있는 "카페, 다시"에서 공부를 했습니다. 점원분이 늘 친절하십니다. 힐링 크롤링하다 머리 빠지는 줄 알았습니다;; why.... whyrano..... 저녁은 점심 때 못간 심가네 해물짬뽕을 갔습니다. 심가.. 2020. 7. 13.
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 6 (신가네 돼지국밥, 장안해물탕) 주말엔 밥을 안 줘서 고민입니다. 무슨 메뉴를 먹을지... 오전 어제 약간 늦게 자서 오늘은 7시 30분에 일어났습니다. 역시나 샤워는 1등. 하지만 형님들이 일어나시질 않아서 혼자 침대에서 공부하려니 힘들었습니다. 존버하다보니까 형님 일어나셔서 10시30분쯤 공부하러 가서 공부 좀 하고 형님들이랑 돼지국밥 먹었습니다. 제가 동네에서 먹던 돼지국밥을 생각하고 그냥 수육백반(12,000원)을 시켰는데 돼지국밥 + 수육으로 나오더라구요. 근데 보니까 옛날에 먹었던 맛있는 돼지국밥이라 수육까지 맛있게 먹었습니다. 굿 김치는 아무래도 맛이 많이 달라 깍두기만 좀 먹었습니다. 손님도 많고 맛도 있고 주차장도 있어서 좋았습니다. 장소는 여기입니다. 오후 오후에는 리스타트 플랫폼 2층 카페에서 공부를 했습니다. 전혀.. 2020. 7. 11.