반응형
개체, 요인, 변수의 개념
- 개체: 연구나 관찰의 대상이 되는 것입니다. 예를 들어, 신입사원이 개체가 될 수 있습니다.
- 요인: 개체에 대해 연구자가 관심을 가지는 특성입니다. 예를 들어, 신입사원의 신체조건이 될 수 있습니다.
- 변수: 요인을 구성하는 구체적인 요소입니다. 예를 들어, 키, 몸무게, 가슴둘레 등이 될 수 있습니다.
데이터 유형
- 범주형 데이터: 각 필드의 데이터로, 예를 들어 음료의 종류(아메리카노, 카페라떼 등)가 이에 속합니다.
- 연속형 데이터: 각 레코드의 데이터로, 예를 들어 날짜나 온도가 이에 속합니다.
- 독립변수와 종속변수: 데이터 분석에서 사용되는 두 가지 주요 변수 유형입니다.
데이터 분석 방법론
- 범주형 데이터: 빈도 분석을 통해 분석합니다. 명목형(분류만 하는 것)과 순서형(순서가 있는 것)으로 나뉩니다.
- 수치형 데이터: 분포 분석을 통해 분석합니다. 이산형(유한한 데이터)과 연속형(무한한 데이터)으로 나뉩니다.
코드 예제
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 예시 데이터 생성
data = {
'음료': ['아메리카노', '카페라떼', '콜드브루', '아메리카노', '카페라떼'],
'온도': [20, 25, 22, 19, 24]
}
df = pd.DataFrame(data)
# 범주형 데이터 빈도 분석
print(df['음료'].value_counts())
# 연속형 데이터 분포 분석
plt.hist(df['온도'], bins=5)
plt.show()
반응형
'Applied > DataScience' 카테고리의 다른 글
확률실험과 사건의 기본 개념 (0) | 2024.02.13 |
---|---|
위치 통계량, 변이 통계량, 모양 통계량 (0) | 2024.02.10 |
일변량 및 다변량 차트 이해 (0) | 2024.02.08 |
도수분포표, 상대도수, 히스토그램 개념 및 코드 (0) | 2024.02.05 |
모집단, 모수, 표본, 통계량의 이해 (0) | 2024.02.01 |