✅ 일주일 동안 한 일과 느낀 점
4주차는 미니 프로젝트의 마무리 정리와 함께, 본격적인 Python 기반 데이터 전처리 실습이 이어진 한 주였다.
7월 7일(월)에는 지난주에 수행했던 1차 팀 프로젝트 내용을 GitHub에 정리하고, 폴더 구조와 핵심 코드, 데이터, 시각화 결과물을 업로드.
그 과정에서 팀원들이 작성한 다양한 시각화 코드들과 내가 구현한 크롤러, FAQ 검색 UI 등이 어떻게 연결되어 있는지 다시금 정리하며 프로젝트 전반에 대한 이해도를 높일 수 있었다.
이후 진행된 수업에서는 NumPy와 Pandas를 중심으로 한 기초 데이터 분석 실습이 이어졌고, 주어진 기상 데이터를 기반으로 온도·습도 정제, 이상치 및 결측치 처리, 날씨 정보 통합 등의 전처리 과정까지 직접 수행해보았다.
✅ 주요 실습 내용 및 기술 회고
1. 이상치 및 결측치 처리
- 실제 기상 데이터에 포함된 이상치(outlier) 및 결측치(NaN)를 탐색하고, 이를 처리하는 다양한 방식(np.isnan, np.nanmean, 조건 필터링 등)을 실습하였다.
- 예를 들어 -999 같은 명시적 이상값을 탐지하고 np.where와 np.mean 등을 활용해 대체하는 기법을 적용하였다.
- 이 과정을 통해 데이터 신뢰도 확보를 위한 전처리의 중요성을 다시금 체감할 수 있었다.
2. 온도·습도 데이터 정제
- 복수의 csv 데이터를 불러와 배열로 구성하고, 2차원 배열 slicing, 조건 연산, 열 기준 정규화, 누락값 채우기 등을 수행.
- 온도·습도 데이터를 통합하여 정제하고, 불완전한 데이터를 보간하거나 평균 대체하는 작업을 진행
- 이를 통해 단순한 연산을 넘어서 시계열 데이터 분석의 기초 체력을 다질 수 있었다.
3. 날씨 정보 통합
- 여러 기상 요소(온도, 습도, 강수 등)를 통합해 하나의 데이터로 정제하고 시각화까지 이어졌다.
- 특정 기간의 온·습도 평균을 구하고, 조건에 따라 필터링한 결과를 그래프(matplotlib)로 표현해보는 등, 실제 서비스 데이터를 준비하는 시선으로 실습을 진행
- 실습 과정에서 넘파이 기반 배열 조작과 axis 개념을 명확히 이해할 수 있었던 것도 큰 수확이었다.
✅ GitHub 정리를 통해 다시 돌아본 3주차 프로젝트
7월 7일에는 팀 프로젝트 결과물을 GitHub에 정리하는 작업을 진행
내가 맡은 현대자동차 FAQ 크롤링 파트와 Streamlit 검색 UI는 source/FAQ_Crawling 및 source/st_faq.py 디렉토리에 저장했고, 전체 데이터와 ERD, 시각화 자료 등은 data, document, image 폴더로 구조화
- 크롤링 파트의 핵심: WebDriverWait, scrollIntoView, ExpectedConditions.staleness_of() 등을 활용한 비동기 구조 대응
- UI 파트의 핵심: st.expander, st.tabs, text_input을 활용한 검색 기반 인터페이스 구현
해당 프로젝트 구조와 기술 스택을 문서화하며, 개발 결과물의 가시성과 재사용성을 확보하는 방법을 배울 수 있었다.
✅ 아쉬웠던 점과 개선 포인트
- 7월 10일과 11일에는 개인 사정으로 인해 수업에 참여하지 못했는데, 해당 기간 동안 약간의 프로젝트가 진행된 것으로 알고 있어 아쉬움이 컸다.
직접 함께하지 못했지만, 이후 공유된 내용을 통해 어떤 프로젝트였는지 확인하며 간접적으로라도 프로젝트를 따라가 보려 노력 - NumPy 실습에서 배열 구조와 shape 개념을 완전히 직관적으로 잡기까지 시간이 다소 소요되었는데, 앞으로도 반복 학습이 필요할 것 같다.
- 실습 코드가 많아 나중에 복습 시 어려움 예상
- GitHub 문서화에서 다른 팀원이 담당한 시각화 모듈까지 완벽히 숙지하진 못해, 전체적인 구조 파악에 조금 더 적극적으로 참여할 필요성을 느꼈다.
✅ 마무리
이번 4주차는 기술을 정리하고 내 것으로 만드는 주간이었다.
단순히 따라하는 것을 넘어서, 내가 어떤 기술을 익혔고, 그걸 어디에 어떻게 적용했는지를 되돌아볼 수 있었던 시간이었다.
특히 NumPy를 통한 배열 조작과 결측치 처리, GitHub 프로젝트 정리를 통해 실전 데이터 분석의 기본기를 다질 수 있었다.
비록 주 후반 수업에 참여하지 못한 점은 아쉬움으로 남지만, 다음 주부터는 다시 집중하여 프로젝트와 실습에 적극 참여할 예정
'SK네트웍스 Family AI캠프 16기' 카테고리의 다른 글
| [플레이데이터 SK네트웍스 Family AI캠프 16기] 6주차 회고 (2) | 2025.07.29 |
|---|---|
| [플레이데이터 SK네트웍스 Family AI캠프 16기] 5주차 회고 (2) | 2025.07.21 |
| [플레이데이터 SK네트웍스 Family AI캠프 16기] 3주차 회고 (1) | 2025.07.07 |
| [플레이데이터 SK네트웍스 Family AI캠프 16기] 2주차 회고 (0) | 2025.07.01 |
| [플레이데이터 SK네트웍스 Family AI캠프 16기] 1주차 회고 (0) | 2025.06.24 |