KPC KIA 파이썬 데이터 분석 입문 과정 (8H)

  • 개요: 파이썬 기반 데이터 분석 입문 과정
  • 장소: 기아 비전스퀘어 (기아 용인연수원)
  • 일시: 2025.02.27 목 08:00~17:00 (8H)
  • 과정 기획: 한국생산성본부 배제현, 홍수빈 위원
  • 강연 및 실습 진행: 넥스트플랫폼 동준상 대표

과정 구성

P1. 데이터 분석 환경 구축 실습 (08:00~11:00 / 4H)

  • Python 데이터 분석 환경 설정(Jupyter Notebook 설치/접속)
  • 파이썬 노트북 분석 환경에 다양한 원천의 데이터 가져오기
  • 기본적 데이터 탐색: 데이터 개요, 기술적 통계량
  • 데이터 전처리 및 시각화: 누락값/이상값 처리, 데이터 슬라이싱/인덱싱, 데이터 시각화

P2. 데이터 전처리/시각화 실습(12:00~17:00 / 4H)

  • 팀별 프로젝트 개요 설명 및 분석 대상 데이터 선택 (Kaggle, UCI +)
  • 머신러닝 및 딥러닝 기반의 분류, 회귀분석, 클러스터링 모델 중 선택
  • 목표 데이터에 대한 탐색적 데이터 분석(EDA) 및 인사이트 도출
  • 데이터 분석 보고서 작성 및 팀별 분석 결과 발표

실습 파일

데이터셋 묶음 다운로드

실습용 데이터 파일 묶음 (.zip >> 네 개의 csv 파일 포함)
https://drive.google.com/file/d/1-z2JuXdEko051B7S3FQMnC2twQ839JKt/view?usp=sharing

깃허브에서 추가 파일 다운로드
https://github.com/junsang-dong/file/tree/main


아나콘다 주피터 노트북 데이터 로딩 오류 해결

1.1 깃허브에서 데이터 로딩
– 완화된 보안 네트워크 등이 적용되어 해당 깃허브 접속 가능한 경우

#원시 데이터의 GitHub URL
url = “https://raw.githubusercontent.com/junsang-dong/file/main/CarSalesIndia.csv”


1.2 로컬 머신에서 데이터 로딩
– 엄격한 보안 네트워크 위치에서 실습하는 경우
– 문제 발생: 데이터 파일 위치와 아나콘다 주피터 노트북 실행 위치(디렉토리)가 다를 경우 데이터 파일 로딩 에러가 발생
– 해결 방법: 이 때는 주피터 노트북 실행 위치에 데이터 파일을 복사하거나, 절대 경로를 통해 로딩

#현재 주피터 노트북 실행 위치 (cwd: Current Work Directory) 확인
import os
print(os.getcwd())

#노트북 실행 위치를 실습 파일 위치로 변경 (chdir: Change Directory)
os.chdir(r”C:\Users\~\OneDrive\바탕 화면\0227 KPC KIA DS Python 8H\RSC02 Python Codes”)
print(os.getcwd()) # 변경 확인


NXP DS Intro: 파이썬과 주피터 노트북 시작하기


NXP DS Basic: 파이썬 데이터 분석 시작하기


NXP DS EDA: 메르세데스 벤츠 출고성능검사 데이터 분석


NXP DS ML 예측적 분석 마스터

실습용 파이썬 노트북 파일 묶음 (.zip >> 네 개의 ipynb 파일 포함)
https://drive.google.com/file/d/1SV2HyrKUN4GN-5JbMAjcvApNOlWSnwTB/view?usp=sharing


References

Recurrent Auto | Used Electric Car Prices & Market Report — Q1 2025
https://www.recurrentauto.com/research/used-electric-vehicle-buying-report

FRED – Consumer Price Index for All Urban Consumers: Used Cars and Trucks in U.S. City Average
https://fred.stlouisfed.org/series/CUSR0000SETA02


끝 | 감사합니다.

25.02.06 / 동준상.넥스트플랫폼 (naebon1@gmail.com)

Leave a Reply