La derivazione della distribuzione di Poisson

Spread the love

La distribuzione di Poisson, una distribuzione molto importante in statistica e nella teoria delle probabilità, consente di studiare i problemi in cui applicheremmo una distribuzione binomiale di cui, però, non si conosce il parametro n; perché possa applicarsi tale distribuzione, è necessario che n assuma valori molto elevati. Inoltre vengono considerati intervalli di tempo t (nei quali n è grande e grosso modo costante) al posto di n.

La distribuzione di Poisson viene applicata a situazioni in cui conosciamo il valore medio λ di esiti di una variabile casuale bernoulliana con un numero molto elevato (e non noto) n di osservazioni, spalmate uniformemente in un fissato e ripetuto intervallo di tempo (ad esempio giorni, settimane, ore, ecc.).

Ad esempio, si potranno considerare il numero di telefonate ricevute in una giornata da un centralino, il numero di giorni in cui una scuola è chiusa a causa di neve nei periodi invernali, ecc. (Walpol et al, 2007). Se, ad esempio, conosciamo il numero medio λ di telefonate ricevute ogni giorno, ma non conosciamo il numero n di volte in cui qualcuno avrebbe potuto fare una chiamata (numero molto elevato, com’è facile immaginare), allora si può applicare la distribuzione di Poisson.

Come si vedrà nella derivazione della distribuzione di Poisson dalla distribuzione binomiale, si fa tendere il parametro n all’infinito e si calcola il limite; ciò significa che è necessario che n sia un numero molto grande, perché possa applicarsi con successo la distribuzione di Poisson. Tale distribuzione ha anche il vantaggio di semplificare enormemente i calcoli; infatti, se si applicasse la distribuzione binomiale ai casi in cui si applica la distribuzione di Poisson, la quantità di calcoli necessari diventerebbe estremamente proibitiva.

La distribuzione di Poisson è anche nota come distribuzione degli eventi rari dal momento che viene spesso applicata a situazioni in cui la probabilità di successo p di una distribuzione binomiale è molto bassa; in tali casi, il numero di successi x cresce molto lentamente al crescere di n, rendendo necessario considerare n molto grandi perché la probabilità del numero di successi x non sia concentrata su valori bassi.

Si tenga presente che, al posto del tempo, ci si può riferire allo spazio, sebbene le formule e il ragionamento di fondo restino sostanzialmente identici (Walpol et al, 2007, p. 162).

Proprietà di base

Perché si possa utilizzare la distribuzione di Poisson è necessario, come anche per la distribuzione binomiale, che tutti gli eventi che si verificano nell’intervallo di tempo siano tra loro indipendenti (in senso probabilistico). Come detto, anche il numero di eventi casuali n dev’essere sufficientemente grande da giustificare l’ipotesi di n infinito e, inoltre, gli eventi casuali e ripetuti devono essere uniformemente distribuiti in t.

Formule della distribuzione a seconda della derivazione

La distribuzione di Poisson può essere ricavata in due modi; il primo metodo, il più semplice e intuitivo, è quello che parte dalla distribuzione binomiale e,attraverso dei banali passaggi al limite, trova la formula della distribuzione. Il secondo metodo, invece, parte dal calcolo delle probabilità e, attraverso il calcolo differenziale, giunge alla formula della distribuzione di Poisson.

Le due formule che si ottengono sono sostanzialmente identiche, anche se espresse in forma diversa. In particolare, nel caso di derivazione dalla binomiale si impone:

\lambda = np

mentre nel secondo caso della derivazione della teoria delle probabilità si impone:

\lambda t = np

dove t è il tempo assunto come riferimento (ad esempio giorni, ore, settimane, mesi, ecc.). Il parametro λ assume diversi significati a seconda della formula che si utilizza; infatti, nel primo caso λ rappresenta il valore medio del numero di osservazione nel tempo t, mentre nel secondo caso rappresenta il valore medio diviso per il tempo preso in considerazione.

P_\lambda(x) = \frac{\lambda^x e^{-\lambda}}{x!}

P_\lambda(t, x) = \frac{(\lambda t)^x e^{-\lambda t}}{x!}

Derivazione dalla distribuzione binomiale

Si parte dalla formula della distribuzione binomiale:

B(x) = \binom{n}{x}p^x (1-p)^{n-x} = \frac{n!}{x!(n-x)!}p^x (1-p)^{n-x}

Si impone:

\lambda=np

E successivamente si sostituisce nella formula della distribuzione:

B(x)=\frac{n!}{x!(n-x)!}(\frac{\lambda}{n})^x (1-\frac{\lambda}{n})^{n-x}

B(x)=\frac{n!}{x!(n-x)!}(\frac{\lambda}{n})^x (1-\frac{\lambda}{n})^n (1-\frac{\lambda}{n})^{-x}

Passando al limite per n che va a infinito, si ottiene:

{\lim}_{n\to +\infty}\frac{n!}{(n-x)!n^x}\frac{\lambda^x}{x!} (1-\frac{\lambda}{n})^n (1-\frac{\lambda}{n})^{-x}

Analizzando separatamente i singoli contributi:

{\lim}_{n\to +\infty}\frac{n!}{(n-x)!n^x}={\lim}_{n\to\infty} \frac{n}{n} \frac{n-1}{n} \cdot \cdot \cdot \frac{n-x+1}{n}=1

{\lim}_{n\to +\infty}(1-\frac{\lambda}{n})^n= e^{-\lambda}

{\lim}_{n\to +\infty}(1-\frac{\lambda}{-x})^n=1

Ricordando che il limite di un prodotto è uguale al prodotto dei limiti, si ottiene la formula della distribuzione di Poisson:

P(x)={\lim}_{n\to +\infty}B(x)=\frac{\lambda^x}{x!}e^{-\lambda}

Derivazione dalla teoria delle probabilità

A differenza della precedente derivazione, in questo caso imponiamo:

\lambda t=np\Rightarrow\lambda=\frac{np}{t}

Il valore medio in questo caso è λt, piuttosto che solo λ. Come detto, gli eventi casuali sono uniformemente distribuiti nell’intervallo di tempo t; pertanto il numero di eventi casuali Δn contenuti in Δt è pari a:

\Delta n=\frac{t}{\Delta t}\cdot n

Il valore medio di un sottointervallo Δt è quindi pari a:

\lambda\Delta t=\Delta n\cdot p=\frac{t}{\Delta t} n\cdot p

Consideriamo adesso un intervallo di t talmente piccolo da contenere uno solo degli n eventi casuali; da un punto di vista infinitesimale, Δt tende a zero, mentre n tende a infinito. Per tale intervallo, la probabilità ch si verifichi un “successo” è pari a:

P(1,dt)=\lambda dt

Dal momento che in dt non può esserci più di un successo:

P(0,dt)=1-\lambda dt

Calcoliamo adesso la probabilità che non si verifichi nessun successo nell’intervallo t+dt; ricordando che gli eventi sono tra loro indipendenti e utilizzando il teorema della probabilità composta, la probabilità di nessun evento in t+dt è pari al prodotto della probabilità di nessun evento in t per la probabilità di nessun evento in dt:

P(0,t+dt)=P(0,t)(1-\lambda dt)

Questa formula può essere riscritta come:

\frac{P(0,t+dt) - P(0,t)}{dt}=-\lambda P(0,t)

Integrando l’equazione differenziale e considerando che P(0,0) = 1, otteniamo:

P(0,t)=e^{\lambda t}

Calcoliamo adesso la probabilità di x eventi in t+dt; utilizzando sia il teorema della probabilità totale, sia il teorema della probabilità composta e considerando che le situazioni possibili sono n eventi in t e 0 in dt oppure n-1 eventi in t e 1 evento in dt, otteniamo:

P(x,t+dt)= P(x,t)P(0,dt) + P(x-1,t)P(1,dt) P(x,t+dt)= P(x,t)(1-\lambda dt) + P(x-1,t)\lambda dt

Dopo alcuni semplici passaggi, otteniamo:

\frac{dP(x,t)}{dt} + \lambda P(x,t)=\lambda P(x-1,t)

Se moltiplichiamo ambo i membri per e elevato a lambda per t, otteniamo:

e^{\lambda t}\frac{dP(x,t)}{dt} + e^{\lambda t}\lambda P(x,t)=e^{\lambda t}\lambda P(x-1,t)

Il primo membro può essere raccolto come derivata di un prodotto:

\frac{d}{dt}[e^{\lambda t}P(x,t)]=e^{\lambda t}\lambda P(x-1,t)

Quest’equazione differenziale può essere risolta agevolmente partendo da x=1 e risalendo al generico elemento x:

\frac{d}{dt}[e^{\lambda t}P(1,t)]=e^{\lambda t}\lambda P(0,t)=e^{\lambda t}\lambda e^{-\lambda t}=\lambda

Adesso,integrando e considerando che la condizione iniziale è P(1,0) = 0:

e^{\lambda t}P(1,t)=\int \lambda dt = \lambda t  + C = \lambda t

Quindi otteniamo:

P(1,t)=\lambda t e^{-\lambda t}

Adesso possiamo risolvere a cascata P(2,t) partendo dal risultato appena ottenuto, e possiamo generalizzare il risultato:

P(x,t)=\frac{(\lambda t)^x}{x!}e^{-\lambda t}

Bibliografia