플레이데이터 데이터엔지니어링 28기 10월 2주차 회고

2023.10.09 ~ 2023.10.13
Sep 25, 2023
플레이데이터 데이터엔지니어링 28기 10월 2주차 회고
10월 9일 (월)
10월 10일 (화)
10월 11일 (수)
10월 12일 (목)
10월 13일 (금)
학습내용
-
-
Machine Learning - pandas 심화 - data visualization (matplotlib, seaborn) - Pandas EDA (수치형)
Machine Learning - Pandas EDA (범주형) - Data Cleaning(Drop, 치환, 모델이용) - Feature Extraction
Machine Learning - Data Encoding
추가 학습 필요 내용
-
-
numpy, pandas 관련 자습 필요. 특히 loc이 생소했음
- kaggle을 통해서 현재의 score보다 높일 수 있는 아이디어 찾기
- 주말동안 지금까지 배운 내용을 토대로 score 높여보기 (특히 feature 생성을 위주로 할 것)
비고
-
-
 

1) 전반적인 느낀 점

🤔
1. 약 2주간 수강을 하지 못한 채로 중도에 시작했기 때문에 적응에 문제가 있었다. 앞에 내용은 파이썬 기초다보니 생략해도 내용을 알아들을 수 있었지만, 수업내용 외적으로의 적응이 쉽지 않았다. 어제까지는 회사를 다니다가 갑자기 바로 학원을 가는 것도 그렇고, 이미 안면을 튼 사람들 사이에서 뒤늦게나마 사람들을 알아가야한다는 부담도 있었다. 무엇보다.. 개발 공부를 제대로 해본적이 없었기때문에 방법론이 어려웠다. 2. 그래도 python/넘판맷/data visualization 관련 내용들은 background가 있어서 적응에 크게 어렵지 않았고, 강사님께서 공유해주신 개발공부 잘 하는 법이 큰 도움이 되었다. 3. 일단 실행해보고, 수정하는 것을 반복하는 Agile을 실무 뿐만 아니라 공부에서도 적용해볼 것

2) 좋았던 점 (좋았거나 내가 잘했던 점)

🤗
1. 쫄지 않고 틀리더라도 빠르게 문제를 제출해서 피드백을 받은 점 2. 일단 실행해보고 문제점을 수정하는 점. 나도 모르게 Agile하게 공부하고 있었다!

3) 아쉬웠던 점 & 개선점

🥲
1. 8-5 널널한 직장 생활에서 타이트한 9-6 학원 생활로 급하게 변화하면서 몸이 적응하지 못해 충분히 자습을 하지 못함 → 쭉 공부하는게 힘들다면 충분히 쉬고 밤에 좀 더 공부하기 2. 물론 경진대회의 점수 올리는게 중요하지만, 더 중요한 것은 강사님 말씀이라는걸 생각하고 수업에 집중 잘 하기

4) 기억해야할 점, 깨달은 점

💡
개발 공부는 열심히보다는 효율적으로. 우리가 0.1%의 인재가 아닌이상 자신의 스타일 대로 공부하지 말고 정석대로 공부할 것 → 한줄 한줄 코드를 씹어먹겠다는 마음으로 해볼 것.
💡
검증 코드는 항상 짜야한다. 검증코드는 내가 납득이 되는 것이 아닌 상대방들도 납득이 되게끔 구현해야한다.
  • 내가 구현한 방식을, 다른 방식으로 구현해보고 두 결과값이 같은지를 확인해보는 방식으로 진행한다.
💡
train 데이터로 학습해서, test 데이터에 적용해본다. 즉, test 데이터를 학습하는 것은 절대 금물이다.
💡
의미있는 feature끼리는 str로 묶어서 모델에게 일종의 가이드라인을 제공하는 방법이 있을 수 있다.
💡
중요한 것은 안 중요한 feature를 중요한 feature가 되도록 변형시켜보는 것

5) 다음주 계획

🍀
경진대회에서 만족할 만한 성과를 내보려고 한다.
🍀
git 프리코스를 뒤늦게나마 수강해보려고 한다.
🍀
자격증 시험 일정을 체크해보아야할 듯 하다 (빅분기, Adsp)
 
 
 
 
 
Share article

Edwin은 또 모험 중