본문 바로가기

KT AIVLE/복습은 실습으로

[KT AIVLE] 3주차 복습 - PyTorch로 타이타닉 생존자 예측 분류 모델

안녕하세요 수쿠입니다.

KT AIVLE 7기 AI 코스를 수강하면서 배운 내용을 나중에 다시 찾아보고 쉽게 활용할 수 있도록 기록해보려고 합니다.

 

오늘은 3주차 수업에서 처음으로 배운 PyTorch 딥러닝 기초 내용을 복습하며, Kaggle에서 다운로드한 Titanic 데이터셋을 활용해 실습한 내용을 공유해보려 합니다.



데이터셋 출처 : Titanic 데이터셋

- 타이타닉 생존 여부와 관련된 다양한 변수들 간의 연관성을 탐색할 수 있는 데이터셋입니다.

 

<목차>
1.환경준비
(1) 라이브러리 Import
(2) 필요 함수 생성
(3) device 준비(cpu or gpu)
(4) 데이터로딩

[데이터 컬럼 설명 (데이터 파일명: titanic_train.csv)]

PassengerId : 승객 고유 ID
Pclass : 선실 등급 (1, 2, 3등급)
Name : 승객 이름
Sex : 성별
Age : 나이
SibSp : 함께 탑승한 형제자매/배우자 수
Parch : 함께 탑승한 부모/자녀 수
Ticket : 티켓 번호
Fare : 운임 요금
Cabin : 선실 번호
Embarked : 탑승 항구 (C: Cherbourg, Q: Queenstown, S: Southampton)

 

2.데이터 준비
(1) 데이터 준비
(2) 원핫 인코딩
(3) 데이터분할
(4) Scaling

3.모델링1
(1) 딥러닝을 위한 준비작업
(2) 모델 선언
(3) 학습
(4) 모델 평가


 복습하면서 배운 점, 개선할점

- Keras에서 Pytorch로 넘어가면서 Tensor에 대한 이해가 부족한 부분이 있었다. 이 부분은 앞으로 더 연습을 통해 확실하게 익혀야겠다고 느꼈다. 특히, Tensor 연산과 그 변환 과정을 좀 더 명확히 이해할 필요가 있다는 생각이 들었다.


프로그램은 GitHub에 업로드해 두었으니, 언제든지 확인하거나 다운로드해보실 수 있어요!

만약 실행 중 오류가 나거나 궁금한 점이 있다면 댓글로 남겨주세요! 😊🚀