[ADsP] 탐색적 데이터 분석(EDA)

2025. 5. 18. 17:49·자격증 (Certifications)/ADsP

데이터 분석을 시작할 때 가장 먼저 해야 하는 과정 중 하나는 바로 탐색적 데이터 분석(Exploratory Data Analysis, EDA) 입니다. EDA는 말 그대로 데이터를 본격적으로 분석하거나 모델링하기 전에, 데이터의 특성과 구조를 미리 살펴보는 작업입니다. 어떤 데이터가 주어졌을 때 무작정 분석을 시작하는 것이 아니라, 데이터를 "탐험"하듯이 먼저 이해하고 파악하는 것이 중요합니다.

EDA를 수행하는 목적은 다음과 같습니다:

  1. 데이터의 분포 파악
    평균, 중앙값, 표준편차, 최소값과 최대값 등 기본 통계량을 확인하여 데이터가 어떤 형태를 띄는지 이해합니다.
  2. 결측치 및 이상치 확인
    누락된 값이나 지나치게 튀는 값이 있는지 살펴보고, 그에 따라 처리 방안을 고민합니다.
  3. 변수 간의 관계 탐색
    변수 간 상관관계를 분석하거나 그룹별 차이를 비교해 보며 유의미한 패턴이 존재하는지 확인합니다.
  4. 시각화 도구 활용
    히스토그램, 박스플롯, 산점도, 막대그래프 등 다양한 시각화 기법을 사용해 데이터를 직관적으로 파악합니다.
  5. 분석 방향성 설정
    어떤 변수를 사용할지, 어떤 전처리가 필요한지, 나아가 어떤 분석 방법이 적합할지를 결정하는 데 중요한 기초 자료가 됩니다.

요약하자면, EDA는 데이터를 들여다보고, 특성을 파악하고, 문제점을 찾고, 분석 방향을 정하는 과정입니다.

탐색적 데이터 분석은 단순히 시각화나 요약 통계를 보는 것에 그치지 않고, 데이터를 깊이 이해하여 분석의 기초를 튼튼하게 만드는 작업입니다. 분석이 잘못된 방향으로 흘러가지 않도록 해주는 중요한 출발점이라고 할 수 있습니다.

반응형

'자격증 (Certifications) > ADsP' 카테고리의 다른 글

[ADsP] 반정형 데이터란?  (0) 2025.05.18
[ADsP] Extreme Studentized Deviation  (0) 2025.05.18
[ADsP] 독립사건과 배반사건  (0) 2025.05.18
[ADsP] 유의수준과 유의확률  (0) 2025.05.18
[ADsP] 2과목 – 데이터 분석 기획  (0) 2025.04.06
'자격증 (Certifications)/ADsP' 카테고리의 다른 글
  • [ADsP] 반정형 데이터란?
  • [ADsP] Extreme Studentized Deviation
  • [ADsP] 독립사건과 배반사건
  • [ADsP] 유의수준과 유의확률
LoopThinker
LoopThinker
모르는 것을 알아가고, 아는 것을 더 깊게 파고드는 공간
  • LoopThinker
    CodeMemoir
    LoopThinker
  • 전체
    오늘
    어제
    • 분류 전체보기 (231) N
      • 개발 (Development) (165) N
        • Algorithm (1)
        • Angular (1)
        • AWS (6)
        • DeepSeek (2)
        • Docker (7)
        • Git (3)
        • Java (34) N
        • JavaScript (4)
        • Kafka (5)
        • Kubernetes (4)
        • Linux (7)
        • PostgreSQL (38)
        • Python (31)
        • React (3)
        • TypeScript (3)
        • Vue.js (5)
        • General (11)
      • 데이터 분석 (Data Analysis) (1)
      • 알고리즘 문제 풀이 (Problem Solving.. (27)
      • 자격증 (Certifications) (24)
        • ADsP (14)
        • 정보처리기사 (4)
        • Linux Master (5)
        • SQLD (1)
      • 기술 동향 (Tech Trends) (11)
      • 기타 (Others) (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    javascript
    오답노트
    리눅스 마스터 2급 2차
    Vue.js
    자바
    DevOps
    Spring boot
    springboot
    PostgreSQL
    백준자바
    java
    Kafka
    ADsP
    백준온라인저지
    JSON
    AWS
    Linux
    JPA
    백준알고리즘
    deepseek
    timescaledb
    백준
    데이터분석
    Linux master
    docker
    MyBatis
    Kubernetes
    pandas
    리눅스 마스터 2급
    python
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
LoopThinker
[ADsP] 탐색적 데이터 분석(EDA)
상단으로

티스토리툴바