mmings_pring_day

[wiset- 파이썬 라이브러리로 하는 데이터 분석과 시각화] 데이터 분석 기초 (2) 본문

데이터 분석 강의/wiset

[wiset- 파이썬 라이브러리로 하는 데이터 분석과 시각화] 데이터 분석 기초 (2)

mming_10 2024. 8. 18. 18:51

[데이터 분석 방법]

(1) 데이터를 분석하는 방법은 데이터의 종류, 데이터 분석의 목적, 분야, 분석 도구 등에 따라 다양함

(2) 수학, 통계학, 기계학습, 데이터 시각화 등 다양한 분석 방법이 있고, 파이썬, 엑셀, R, Matlab 등 다양한 도구를 활용하여 분석할 수 있음

 -> 데이터 분석의 목적은 수많은 데이터 중에서 의사결정 등에 도움이 되는 정보를 발견하고 이를 활용하여 가치를 창출하는 데 있음

 

✅ 통계 분석

  •  통계를 기반으로 분석하는 방법으로 다양한 분석 기법이 있음 ( 회귀분석, 상관분석, 군집분석, 주성분분석 등 )

✅ 기계학습 분석

  •  컴퓨터에 스스로 학습하고 문제를 해결하는 능력을 줌 (분류, 예측, 군집 등)

✅ 시각화 분석

  •  분석 결과를 좀 더 자세하게 파악하기 위해 시각화하기도 하지만 여러 데이터 요소 간의 관계나 단순 나열된 데이터에서 알지 못한 인사이트를 시각화를 통해 발견할 수 있음

[데이터 종류에 따른 분석 방법]

✅ 정량적 데이터 분석

  •  데이터가 수치화된 형태일 때 분석하는 방법
  • 객관적으로 데이터를 분석, 평가할 수 있음

 -> 주로 정형 데이터로 통계 분석 등을 적용할 수 있음

 

✅ 정성적 데이터 분석

  •  숫자가 아닌 질적으로 평가되는 데이터를 분석하는 방법
  • 서술 형태로 표현되는 범주형 데이터를 분석함

 -> 주로 비정형 데이터로 텍스트 내 빈도 분석, SNS 데이터 분석 등을 할 수 있음


[파이썬에서 데이터 수집 및 분석 방법]

- 파이썬의 기본 문법 활용

: 파이썬의 기본 자료형, 기본 모듈을 활용하여 데이터를 수집, 전처리, 분석할 수 있음

 

- 파이썬의 외부 모듈 활용

: 잘 알려진 외부 라이브러리를 설치해 데이터를 수집 및 분석할 수 있음


[데이터 분석 기초 적용하기]

# 1. 데이터 분석 목적 설정하기

: 기온 데이터 수집 -> 일교차, 날씨, 기온의 변화량 (분석 및 시각화)

 

#2. 분석 목적에 맞는 데이터 선정 및 수집 방법 설정

: 구글에서 '기상청' 검색 -> 날씨와 관련된 다양한 정보를 제공함

(기상청에서 제공하는 기상자료개방포털 서비스를 통해 데이터를 다운받을 수 있음)

 

(데이터는 CSV, Excel 형태로 다운로드 받을 수 있음)

 

# 3. 파이썬으로 데이터를 불러와서 분석 및 시각화

⭐ 데이터 분석 전에 데이터 전처리 과정을 거치면 분석하기 편리함 (기온의 변화량과 관련 없는 데이터 처리)

데이터 전처리: 이상 데이터, 누락 데이터, 필요 없는 데이터를 병합/ 추출하는 과정
-> 지점명, 일시, 기온 데이터만 남기고 나머지 데이터는 전부 삭제