Probabilità e Combinatorica

Introduzione

Mi pare di capire che la probabilità non si fa a scuola in Italia.

Per questo o altri motivi, vediamo spesso gente in it.scienza.matematica e altrove (it.hobby.lotto? hehehe) gente che ha bisogno di una spiegazione delle basi del calcolo delle probabilità.

Naturalmente, sarebbe meglio leggere un libro o seguire un corso.

Questa pagina serve, in parte, ad ampliare la mia pagina sul non-funzionamento della fantomatica Teoria dei Ritardi. Vorrei che fosse di qualche utilità anche per un pubblico più ampio, però.

Con solamente qualche nozione sulla probabilità è possibile risolvere problemi a prima vista abbastanza complicati, e rendersi conto che i lottologi sono o bugiardi o incompetenti.

Parlo qui anche della combinatorica, perché è quasi indispensabile nella probabilità sapere in quanti modi una cosa può succedere.

Non mi interessano particolarmente questioni filosofiche sulle basi della probabilità. Il mio stile qui sarà quello di un libro di cucina.

Primi passi

La probabilità di un evento è un numero fra 0 e 1, ed è normalmente scritto Pr(evento) o P(evento).

È meglio non preoccuparsi troppo su cosa vuol dire la probabilità. Diciamo che, potendo fare moltissime prove, un evento di probabilità p dovrebbe verificarsi in una proporzione intorno a p delle prove. Essere molto precisi qui richiede un formalismo che non sarebbe di molto aiuto ad un principiante. Nota che un'abuso di questo punto è uno degli errori/inganni principali dei lottologi, per cui dovremo tornare prima o poi alla questione.

Diciamo che ho un'urna con delle biglie dentro. Queste urne sono tradizionali nella probabilità. Le biglie sono numerate, e sono di colori diversi, ma hanno la stessa grandezza, peso, ecc.

Attualmente, ci sono 100 biglie nell'urna. Sono di vari tipi:
Rosse costose: 20
Rosse economiche: 30
Verdi costose: 25
Verdi economiche: 25
Essendoci 100 biglie della stessa forma/dimensione/peso, possiamo immaginare che ogni singola biglia ha una probabilità 1/100 di essere scelta. Diciamo che le cose stanno effettivamente così.

Estraggo una biglia. La probabilità che sia il numero 17 è 1/100. La probabilità che sia rossa è 1/2. P(economica) = 55/100.

Eventi esclusivi

Se abbiamo due eventi A e B che non possono verificarsi allo stesso tempo, li chiamiamo esclusivi. E in tal caso, Pr(A o B) = Pr(A) + Pr(B).

"o" si può anche scrivere col segno dell'unione. Ma in html non lo farò.

Usando l'esempio dell'urna, una biglia non può essere allo stesso tempo "rossa e economica" e "verde e economica". Quindi per calcolare P(economica) posso calcolare P(R e E) + P(V e E).

Ma una biglia può essere rossa e economica allo stesso tempo, allora non posso calcolare P(R o E) tramite la somma P(R)+P(E). Guardando l'elenco, si vede facilmente che P(R o E) = (20+30+25)/100 = 75/100, mentre P(R)+P(E) viene ((20+30)+(30+25))/100, e questo e' palesemente impossibile perché è maggiore di 1.

Più generalmente, se abbiamo molti eventi (anche infinitamente tanti) tali che al massimo uno di loro si può verificare, allora possiamo calcolare Pr(succede uno degli eventi) = la somma delle loro probabilità.

Se gli eventi non sono esclusivi, possiamo soltanto dire che Pr(A o B) = Pr(A) + Pr(B) - Pr(A e B).

Esempio con le biglie:
P(R o E) = P(R) + P(E) - P(R e E)
= 50/100 + 55/100 - 30/100 = 75/100

E questa è la risposta che otteniamo calcolando la probabilità direttamente.

Questa formula funziona perché calcolando P(A)+P(B) abbiamo contato due volte il contenuto di "A e B" e allora sottraendo P(A e B) finiamo con una copia sola.

Eventi indipendenti

Se abbiamo due eventi A e B, e il verificarsi o meno di A non ci da' alcuna informazione su B, A e B sono detti indipendenti.

In questo caso Pr(A e B) = Pr(A).Pr(B)

"e" si può anche scrivere col segno dell'intersezione. Ma in html non lo farò.

Il colore e il costo delle biglie nella mia urna non sono indipendenti: se ti dico che ho estratto una biglia rossa, ha solamente una probabilità di 20/50 = 0,4 di essere costosa. Ma una biglia qualsiasi ha una probabilità di 0,45 di essere costosa.

Se A e B non sono indipendenti, possiamo soltanto dire Pr(A e B) = Pr(A).Pr(B dato A) = Pr(B).Pr(A dato B).

Pr(A dato B) si scrive Pr(A|B).

Più di 2 eventi possono essere indipendenti fra loro. Se abbiamo una raccolta {A_i} di eventi, dove gli i vengono da un insieme I, allora gli eventi sono indipendenti se, per ogni sottoinsieme finito J di I, Pr(si verificano tutti gli A_i con i in J) = il prodotto delle Pr(A_i) per i in J.

Probabilità condizionata

Variabili casuali

Tempi di attesa


ghira@mistral.co.uk