반응형

1. 포아송 분포란?

포아송 분포는 일정한 단위 시간, 거리, 면적 등에서 랜덤하게 발생하는 사건의 분포를 나타내는 이산 확률 분포입니다. 이 분포는 특정 구간에서 일어나는 독립적인 사건의 수를 예측하는 데 사용됩니다.

즉, 포아송 분포는 일상생활에서 자주 발생하는 랜덤 사건들을 모델링하는 데 유용합니다. 은행에서의 고객 방문 수, 콜센터로의 전화 통화 수 등을 예측하는 데 이 분포를 활용할 수 있습니다. 이러한 이해는 데이터 분석 및 의사결정 과정에서 매우 중요한 역할을 합니다.

 

 

2. 포아송 분포의 적용 조건

포아송 분포를 적용하기 위한 조건은 다음과 같습니다:

  • 구간마다 발생하는 사건은 서로 독립적입니다.
  • 사건의 발생 확률은 구간의 길이에 비례합니다.
  • 아주 작은 구간에서 사건이 발생할 확률은 무시할 만합니다.
  • 구간마다 확률 분포는 일정합니다.

 

3. 포아송 분포의 활용 예시

실생활에서 포아송 분포는 다양하게 활용됩니다. 예를 들면:

  1. 은행 방문 고객 수 예측
    • 예를 들어, 한 은행 지점에 평균적으로 1시간에 10명의 고객이 방문한다고 합시다. 이 정보를 바탕으로, 특정 시간대에 15명 이상의 고객이 방문할 확률을 계산할 수 있습니다.
  2. 콜센터 전화 통화 수
    • 콜센터에 하루 평균 300통의 전화가 걸려온다고 가정해 봅시다. 이를 바탕으로, 어떤 날에 350통 이상의 전화가 걸려올 확률을 계산할 수 있습니다.
  3. 도서관의 도서 대출 건수
    • 평일 하루 평균 200권의 도서가 대출된다고 가정할 때, 특정 평일에 250권 이상 대출될 확률을 예측할 수 있습니다.
  4. 공장의 불량품 발생 건수
    • 한 공장에서 하루 평균 5개의 불량품이 발생한다고 할 때, 어느 날 10개 이상의 불량품이 발생할 확률을 계산할 수 있습니다.

 

4. 포아송 분포의 특징

포아송 분포에서 사건 발생 빈도, 평균, 분산은 모두 λ(람다)로 표현됩니다. λ 값이 클수록 분포는 정규 분포에 가까워집니다.

 

 

5. 파이썬을 이용한 포아송 분포의 구현

파이썬을 사용하여 포아송 분포를 시뮬레이션해 보겠습니다. scipy 라이브러리의 poisson 클래스를 활용할 수 있습니다.

import scipy.stats as stats

# 포아송 분포 계산
lambda_ = 3  # 예를 들어, 1시간 동안 평균 3건의 사건이 발생한다고 가정
poisson_dist = stats.poisson(lambda_)

# 확률 및 기대값, 분산 계산
print(f"P(X=5): {poisson_dist.pmf(5)}")  # 5건의 사건이 발생할 확률
print(f"기대값: {poisson_dist.mean()}")  # 기대값
print(f"분산: {poisson_dist.var()}")  # 분산
반응형