코딩코딩80 [Dacon] 대출 상점 총 매출 예측 경진대회 1등 솔루션 분석 1등 솔루션 (Yongjip님) 1등 수상자이신 Yongjip님께서는 경제학을 전공하고 빅데이터 관련 프로젝트들을 하다가 미국 버지니아에 있는 테크회사에서 data analyst로 일하시다가 귀국해 쿠팡의 business analyst로 근무를 하고 있으시다고 한다. 아무래도 경제학이라는 백그라운드 덕분에 시계열 예측 문제에서 지식을 발휘하여 1등을 할 수 있던 것 같다. (그렇다고 내 전공이 호텔머시기라고 쉴드치는 것 아님) 목표 이번 포스팅에서는 1등 솔루션을 분석하면서 시계열 문제에서 자주 쓰이는 ARIMA모델, 다운샘플링에 대해 가볍게나마 이해해보자. EDA, 전처리 Negative transaction elimination 매출량인 amount 칼럼에 가끔 음수가 있어, 하루 매출 자체가 음수가.. 2021. 3. 25. 공부할 것 보호되어 있는 글 입니다. 2021. 3. 21. [pandas]판다스 df.info()를 했는데 non-null counts가 안 보여요 train.info() 해결방법 train.info(verbose=True, null_counts=True) # verbose는 안 넣어도 된다. verbose 파라미터는 안 넣어줘도 된다. stackoverflow.com/questions/43427564/display-all-informations-with-data-info-in-python Display all informations with data.info() in Python I would display all informations of my data frame which contains more than 100 columns with .info() from panda but it won't : data_train.info() RangeIn... 2021. 3. 17. [Dacon] 병원 개/폐업문제 1등 솔루션 분석 1등 솔루션 분석 Model 1: id만 제외한 모델 regrssion모델로 0.1을 임계값으로 하여 0을 만들어내고 제출 → interest, profit, employee가 중요해 보이는 것으로 판단 Model2: (interest, profit, employee) + (sido, bedCount)를 추가한 모델 이번엔 모델 1에서 중요해보이는 피쳐 3가지에 시도, 침대 수를 추가함 임계값도 0.3으로 키움 → 중요해보이는 피쳐 10가지 추출 interest 1 interest 2 bedCount employee2 sido surplus profit2 noi1 sgg instkind Model3: model2에서 중요해보이는 10가지 피쳐 임계값 0.1로 조정 Model4: 병원 크기(규모)를 활용 .. 2021. 3. 12. 이전 1 ··· 11 12 13 14 15 16 17 ··· 20 다음