
데이터 전처리란?
내가 원하는 데이터를 보기 위해 하는 모든 활동
방향성 중요
세로: 열(column)
가로: 행(row)
Pandas란?
- 자동화와 프로그래밍 기능
- 다양한 라이브러리를 사용하여 데이터를 불러와 변환, 분석
- 반복적이고 복잡한 작업을 자동화
- 대용량 데이터 처리
- 복잡한 데이터 처리 및 분석
- 복잡한 데이터 작업, 통계 분석, 머신러닝 모델 구축 등 가능
- 확장성과 유연성
- 다양한 데이터 포맷을 처리할 수 있는 라이브러리를 지원
- 데이터베이스와 연동하여 작업 가능
- 버전 관리 및 자동화
- 버전 관리 시스템(Git 등)을 사용하여 변경 내역을 관리
- 코드 자체에 주석을 추가 및 문서화 가능
Pandas 구조
- Series = 하나의 속성을 가진 데이터 집합
- value + index
- DataFrame = 표 형태
- index(row) : 각 아이템을 특정할 수 있는 고유의 값
- columns : 하나의 속성을 가진 데이터 집합

'강의자료 > 데이터 전처리&시각화' 카테고리의 다른 글
| 4강. (06.04) (0) | 2025.06.04 |
|---|---|
| 3강. (06.02) (2) | 2025.06.02 |
| 1강. (06.02) (1) | 2025.06.02 |