반응형
1. 포아송 분포란?
포아송 분포는 일정한 단위 시간, 거리, 면적 등에서 랜덤하게 발생하는 사건의 분포를 나타내는 이산 확률 분포입니다. 이 분포는 특정 구간에서 일어나는 독립적인 사건의 수를 예측하는 데 사용됩니다.
즉, 포아송 분포는 일상생활에서 자주 발생하는 랜덤 사건들을 모델링하는 데 유용합니다. 은행에서의 고객 방문 수, 콜센터로의 전화 통화 수 등을 예측하는 데 이 분포를 활용할 수 있습니다. 이러한 이해는 데이터 분석 및 의사결정 과정에서 매우 중요한 역할을 합니다.
2. 포아송 분포의 적용 조건
포아송 분포를 적용하기 위한 조건은 다음과 같습니다:
- 구간마다 발생하는 사건은 서로 독립적입니다.
- 사건의 발생 확률은 구간의 길이에 비례합니다.
- 아주 작은 구간에서 사건이 발생할 확률은 무시할 만합니다.
- 구간마다 확률 분포는 일정합니다.
3. 포아송 분포의 활용 예시
실생활에서 포아송 분포는 다양하게 활용됩니다. 예를 들면:
- 은행 방문 고객 수 예측
- 예를 들어, 한 은행 지점에 평균적으로 1시간에 10명의 고객이 방문한다고 합시다. 이 정보를 바탕으로, 특정 시간대에 15명 이상의 고객이 방문할 확률을 계산할 수 있습니다.
- 콜센터 전화 통화 수
- 콜센터에 하루 평균 300통의 전화가 걸려온다고 가정해 봅시다. 이를 바탕으로, 어떤 날에 350통 이상의 전화가 걸려올 확률을 계산할 수 있습니다.
- 도서관의 도서 대출 건수
- 평일 하루 평균 200권의 도서가 대출된다고 가정할 때, 특정 평일에 250권 이상 대출될 확률을 예측할 수 있습니다.
- 공장의 불량품 발생 건수
- 한 공장에서 하루 평균 5개의 불량품이 발생한다고 할 때, 어느 날 10개 이상의 불량품이 발생할 확률을 계산할 수 있습니다.
4. 포아송 분포의 특징
포아송 분포에서 사건 발생 빈도, 평균, 분산은 모두 λ(람다)로 표현됩니다. λ 값이 클수록 분포는 정규 분포에 가까워집니다.
5. 파이썬을 이용한 포아송 분포의 구현
파이썬을 사용하여 포아송 분포를 시뮬레이션해 보겠습니다. scipy 라이브러리의 poisson 클래스를 활용할 수 있습니다.
import scipy.stats as stats
# 포아송 분포 계산
lambda_ = 3 # 예를 들어, 1시간 동안 평균 3건의 사건이 발생한다고 가정
poisson_dist = stats.poisson(lambda_)
# 확률 및 기대값, 분산 계산
print(f"P(X=5): {poisson_dist.pmf(5)}") # 5건의 사건이 발생할 확률
print(f"기대값: {poisson_dist.mean()}") # 기대값
print(f"분산: {poisson_dist.var()}") # 분산
반응형
'Applied > DataScience' 카테고리의 다른 글
지수분포 개념 및 예제 (0) | 2024.03.06 |
---|---|
이항분포 개념 및 코드 예제 (0) | 2024.03.03 |
확률 질량함수와 함률 밀도함수 개념 및 예제 (0) | 2024.03.01 |
확률 변수, 확률 분포에 대한 이해 (0) | 2024.02.27 |
베이즈 정리 개념 및 코드 (0) | 2024.02.18 |