본문 바로가기

코딩코딩81

싸이킷런 스케일링, Scikit-learn Scailing 스케일링 하는 이유 너무 작거나 너무 크면 영향력(가중치, 회귀계수 등)이 제대로 표현 안 됨 -> over fitting 오버피팅의 가능성이 높아짐 Min-Max Scaling from sklearn.preprocessing import MinMaxScaler mMscaler = MinMaxScaler() # mMscaler.fit(data) # 이러면 데이터의 범위가 0~1로 됨 mMsacled_data = mMscaler.fit_transform(data) Standard Scailing # Standard Scailing from sklearn.preprocessing import StandardScaler # 모델 생성 stdscaler = StandardScaler() # 특징 찾기 stdsc.. 2020. 7. 18.
다양한 무료 공부소스들 (데이터 사이언스, 통계, 인공지능...) 안녕하세요. 오늘은 제가 지금까지 이 분야 공부를 시작하면 알게 된 곳들을 소개하려고 합니다. 각 사이트마다 가지고 있는 강의들이 많으니 이곳저곳 찾아보시고 본인이 원하는 과목만 골라서 들으시면 되겠습니다. K-MOOC http://www.kmooc.kr/ | K-MOOC 닫기 강좌 정보 Excel www.kmooc.kr 다양한 대학의 강의가 들어있습니다. 우리나라 대학교 하면 가장 먼저 뽑는 SKY (Sejong, Korea, Yonsei)대학의 강의도 있고 다양한 학교, 다양한 과목이 있습니다. 이곳에서 수강을 완료하면 수강증도 제공해주고 본인 학교에서 학점 인정을 해주는 경우도 있습니다. 한과목만 들어봐서 어떻다 말하긴 어렵지만, 모바일 어플도 제공하고 강의 다운로드도 가능해 좋습니다. 저는 류근관.. 2020. 7. 18.
파이썬 자연어 처리 패키지 rhinoMorph import rhinoMorph rn = startRhino()# 라이노 사전 객체를 불러와 rn에 저장합니다. # 이 사전을 기반으로 형태소를 분석합니다. rhinoMorph.onlyMorph_list( rn, text, *args) # 형태소(morphemes)만 processed_text에 list 형식으로 반환해줍니다. # 본인이 원하는 품사만 골라주는 pos, # 어미를 결합해주는 eomi=True, 연결된 명사를 결합해주는 combineN=True 등의 arguments가 있습니다. # 동사의 경우 뒤에 '하'를 결합해주는 xrVv=True # 연결된 명사를 결합해주는 combineN=True 등의 arguments가 있습니다. rhinoMorph.onlyMorph_list(rn, text, .. 2020. 7. 10.
OS, xlrd, openpyxl,예외처리 1 디렉토리 관리 # 현재 작업 디렉토리 반환 os.getcwd() os.chdir("어쩌구") - 어쩌구 디렉토리로 이동 os.listdir("어쩌구") - 어쩌구 폴더 내의 모든 파일과 폴더 목록을 반환함 os.path.exists("C:\어쩌구\저쩌구") - 입력한 경로(폴더, 디렉토리)가 존재하면 True, 없으면 False os.mkdir("C:\python\python2") - 입력한 경로 제일 마지막 폴더를 생성 (이 경우에는 python2가 생성) os.makedirs("C:\python\python2") - 입력한 경로 모두 생성함 (python, python2 폴더 모두 생성) os.rmdir() / os.removedirs() - mkdir의 반대 삭제해주는데 개발자들 삭제하는거 무서.. 2020. 7. 8.