25.05.19 코딩 공부 시작

코딩 척척석박사 분들 피드백 환영합니다.

공대생이 코딩에서 살아남기

강의자료/데이터 전처리&시각화

2강. (06.02)

코딩 아가 2025. 6. 2. 11:49

데이터 전처리란?

내가 원하는 데이터를 보기 위해 하는 모든 활동

방향성 중요

세로: 열(column)

가로: 행(row)

Pandas란?

  1. 자동화와 프로그래밍 기능
    • 다양한 라이브러리를 사용하여 데이터를 불러와 변환, 분석
    • 반복적이고 복잡한 작업을 자동화
  2. 대용량 데이터 처리
  3. 복잡한 데이터 처리 및 분석
    • 복잡한 데이터 작업, 통계 분석, 머신러닝 모델 구축 등 가능
  4. 확장성과 유연성
    • 다양한 데이터 포맷을 처리할 수 있는 라이브러리를 지원
    • 데이터베이스와 연동하여 작업 가능
  5. 버전 관리 및 자동화
    • 버전 관리 시스템(Git 등)을 사용하여 변경 내역을 관리
    • 코드 자체에 주석을 추가 및 문서화 가능

Pandas 구조

  1. Series = 하나의 속성을 가진 데이터 집합
    • value + index
  2. DataFrame = 표 형태
    • index(row) : 각 아이템을 특정할 수 있는 고유의 값
    • columns : 하나의 속성을 가진 데이터 집합

'강의자료 > 데이터 전처리&시각화' 카테고리의 다른 글

4강. (06.04)  (0) 2025.06.04
3강. (06.02)  (2) 2025.06.02
1강. (06.02)  (1) 2025.06.02