학교에서 진행한 데이콘 스쿨에서 2022년 6월 29일부터 2022년 8월 8일까지 교육을 들었다.
교육을 들으며 4번의 대회에 참여했는데, 많은 배움과 도움이 되었다.
신청하길 잘했다는 생각과 소중한 경험이었다.
열심히 참여하고 계속 예측을 높이려는 노력 덕분일까 발전상을 받았다.
4번의 대회에서 점차 실력이 향상되는 모습을 볼 수 있을 것이다.
교육 종료 후 이제야 글을 쓴다.
우선 첫 번째 대회에서 느낀 것들을 적겠다.
첫 번째 대회는 구내식당 식수 예측을 하는 대회였는데 첫 대회라 그런가 어떤 식으로 예측을 높여야 하는지 잘 몰라서 낮은 등수를 받았다.
알려주신 베이스라인에서 더 예측을 높이고 싶어서 이것저것 시도해봤지만 결국 더 예측이 좋아지질 않아서 예측을 더 높이는 것은 실패했다.
그래도 강사님께서 예측하는 법들을 주차가 지날 수록 더욱 깊이 알려주셨다.
첫 번째 대회에서는 하이퍼파라미터가 무엇이고 어느 부분에 하이퍼파라미터를 넣어주는지를 알게 되어 좋았다.
정확한 의미를 몰랐는데 모델에 함꼐 쓰인다는 것을 알게 된 후 하이퍼파라미터 튜닝의 이해도가 올라갔다.
또 데이터를 다룰 때 시각화를 많이 하셨는데, 시각화를 해서 보니 데이터를 더 잘 해석할 수 있었고 데이터를 분석하는데 꼭 필요한 작업이었다.
그리고 가장 흥미로웠던 부분이 바로 데이터 전처리 방법이었다.
Nan값을 확인해주어 결측값이 있는지 없는지 확인하고 요일을 숫자로 변경해주어 더 예측력을 높였다.
그리고 일자를 가지고 월과 일로 구분하여 나눠줄 수 있다는 거에 놀라웠다.
항상 나눠주고는 싶었지만 어떻게 나눠주는지 정확히 몰랐는데 알게 되어 좋았다.
# 월 칼럼 추가방법!
def month(text:str):
return int(text[5:7])
train['월']=train['일자'].map(month)
map함수를 이용해주었다. map함수는 처음에 들었을 때 기억하고 이용하기에 어려운 함수 같다.
하지만 자주 쓰이니 꼭 기억해야 하는 함수이다.
text[5:7]은 일자에서 월 부분만 추출해준 것이다.
map을 더 잘 알기 위해 예전에 교수님이 강의해주신 영상을 찾아 다시 한번 더 복습 차원에서 시청했다.
map은 시리즈의 각 element에 특정 함수를 적용할 수 있다고 한다.
시리즈.map(특정함수) 형식으로 사용된다.
또 신기했던 부분이 예측력을 높이기 위해 새로운 열을 만들어 추가해주셨다.
새로운 칼럼을 추가하니 예측력이 더 올라갔다. 관계성이 높은 지를 확인하여 나 역시도 새로운 칼럼들을 만들어내면 더 예측이 좋아질 것이라 생각하여 많은 열들을 만들어냈지만, 예측력을 높이는 열을 찾는 것은 쉽지 않았다.