SK네트웍스 Family AI캠프 16기

[플레이데이터 SK네트웍스 Family AI캠프 16기] 5주차 회고

minorii 2025. 7. 21. 09:44

✅ 일주일 동안 한 일과 느낀 점

5주차는 머신러닝의 주요 알고리즘들을 본격적으로 다뤄보는 한 주였다.
선형회귀(Linear Regression), 다항회귀(Polynomial Regression), 결정트리(Decision Tree), KNN(K-Nearest Neighbors), YOLO(You Only Look Once)까지 다양한 알고리즘을 이론과 실습을 통해 접할 수 있었고, 목요일에는 타이타닉 생존자 데이터를 활용한 세미 미니 팀 프로젝트를 진행했다.

기존에 익숙하지 않았던 평가 지표(MAE, MSE, RMSE 등)를 실제로 계산해보면서 모델 성능 평가에 대한 감도 키울 수 있었고, 결정트리를 활용한 분류 실습을 통해 시각적으로 판단 기준을 이해할 수 있었다.

✅ 주요 실습 내용 및 기술 회고

1. 회귀(Regression) 실습

  • 선형 회귀: 독립 변수와 종속 변수의 선형 관계를 분석. 잔차 시각화 및 MAE, MSE, RMSE 지표 실습.
  • 다항 회귀: 직선이 아닌 곡선으로 모델링. 비선형 데이터에 적합한 회귀 모델을 이해.
  • 모델 평가 지표 이해:
    • MAE: 평균 절대 오차
    • MSE: 평균 제곱 오차
    • RMSE: 평균 제곱근 오차
      이들을 직접 계산해보며 오차가 모델 성능에 어떤 영향을 미치는지 체감함.

2. 결정트리(Decision Tree) 실습

  • 기초 결정트리 분류 실습: 다양한 데이터셋에 대해 분류 기준 이해 및 plot_tree로 시각화.
  • 상업 데이터 기반 예측: 고객 구매 여부, 특성 등 실제 커머스 데이터를 활용한 분류 실습 진행.
  • 세미 프로젝트 준비에 유용한 분류 모델로 활용됨.

3. KNN 모델 실습

  • KNeighborsClassifier를 활용해 온도 예측 등 거리 기반 분류 방법 이해.
  • K 값에 따른 정확도 변화 및 오버피팅/언더피팅 개념 정리.

4. 타이타닉 세미 미니 프로젝트 (7/17 진행)

  • titanic_kor.csv를 활용하여 생존자 분류 모델 설계
  • 우리 팀 주제: 나이대별 생존율 분석
  • Pclass, Sex, Age, Fare 등 다양한 피처를 활용한 전처리 및 파생 변수 생성 (연령대)
  • 모델: 결정트리 분류기 (DecisionTreeClassifier) 사용
  • 성능:
    • 최종 예측 정확도: 79.87%
    • 성별/등급/연령대별 생존률 분석 및 시각화
    • ConfusionMatrixDisplay, plot_tree를 활용한 시각화까지 수행
  • 비록 정확도 80%를 넘기지는 못했지만, 향후 성능 개선을 위한 좋은 출발점이 되었다.

5. YOLO 수업 미참

  • YOLO 수업에는 개인 사정으로 참여하지 못해 아쉬움이 남음
  • 유튜브나 블로그를 통해 직접 학습 예정이며, 물체 인식 분야에 대한 흥미가 생김

✅ 아쉬웠던 점과 개선 포인트

  • YOLO 실습을 직접 해보지 못한 점은 아쉬움으로 남음. 추후 개인 프로젝트에서 직접 적용해볼 계획
  • 회귀 지표나 모델 학습 흐름이 익숙해지기까지 시간이 조금 걸렸으며, 반복적인 실습이 필요함을 느낌
  • 결정트리 시각화 과정에서 각 노드가 어떤 기준으로 분리되는지 완벽히 이해하기 위해 더 많은 예제를 보고자 함
  • 모델별 하이퍼파라미터 튜닝 경험이 부족했는데, 이 부분을 향후 프로젝트에서 심화해보고 싶다

✅ 마무리

5주차는 단순한 모델 적용을 넘어서, 데이터 기반 예측 문제를 어떻게 정의하고 해결할 것인지에 대한 감각을 키울 수 있었던 시간이었다.
결정트리, KNN, 회귀모델 등 다양한 머신러닝 알고리즘을 직접 적용해보면서, 이론과 실전의 연결 고리를 확실히 체험할 수 있었고, 특히 타이타닉 프로젝트를 통해 팀원과 협업하며 문제를 해결해보는 경험은 값졌다.

다음 주에는 개인 프로젝트나 심화 모델 학습을 통해 지금의 부족한 점을 채워나가고 싶다.
YOLO 학습도 빠르게 따라잡아서, 이미지 기반 문제도 어렵지 않게 해결해 나가고 싶다.