I limiti

Alcuni ritardisti sembrano non capire i limiti.

L'abuso più frequente è questo: un teorema (autentico) dice che x/y tende ad un limite l. Il RDT ti dice che si può dedurre da questo che x-ly tende a 0.

Questo non si può fare, ed è una delle prime cose che ti viene detto quando cominci a lavorare coi limiti.

A qualcuno che sa un po' di algebra ma non ha mai sentito parlare di limiti, l'inganno può sembrare abbastanza convincente a prima vista. x/y = l, quindi x = yl. Ma bisogna prestare più attenzione quando si usano i limiti.

Ecco dei controesempi abbastanza canonici:

Sia x_n = n+sqrt(n), y_n = n.
x_n / y_n tende a 1, ma x_n-y_n va all'infinito.
Sia x_n = 1/n, y_n = 1/n^2
x_n - y_n tende a 0, ma x_n / y_n va all'infinito.

La legge dei grandi numeri

Esiste davvero la legge dei grandi numeri. Ma non dice quello che i ritardisti vogliono che dica. Non immaginate che la LDGN sia una fesseria solamente perché ne parlano i ritardisti. Tenete presente che oltre alle cose false, i ritardisti dicono qualche volta cose vere ma irrilevanti. La LDGN non sostiene la tesi ritardista (che gli eventi indipendenti non sono indipendenti) ma i ritardisti sperano che le loro potenziali vittime non lo sappiano.

Se volete tante informazioni sulle varie leggi dei grandi numeri, vedete la bibliografia.

Quanto segue viene principalmente da Grimmett e Stirzaker, ma le stesse cose, magari spiegate in modo un po' diverso, si troveranno in qualsiasi testo universitario sulla probabilità.

Sia {X_i} una successione di variabili casuali indipendenti con la stessa distribuzione, con somme parziali S_n = somma (per i fra 1 e n) di X_i.

Diciamo che la legge forte dei grandi numeri vale per {X_i} se esiste una costante m tale, con probabilità 1, la successione [(S_n) / n] tende a m.

(C'è anche una legge debole dei grandi numeri ma visto che possiamo usare quella forte, ignoriamo quella debole.)

È possibile dimostrare che una condizione sufficiente per la LFDGN è E((X_1)^2) < infinito.

I ritardisti poi commettono l'abuso segnalato prima. Dicono "S_n /n tende a p, quindi S_n tende a np.". Ma come abbiamo visto, questa deduzione non è lecita.

In ogni caso, la legge dei grandi numeri è superflua. Parla di un limite all'infinito. I ritardisti si lamentano quando io faccio simulazioni con centinaia di migliaia di lanci di una moneta, ma poi invocano i limiti all'infinito?

Se cambi un qualsiasi numero finito di termini di una successione, il suo limite non cambia. Se ti dico il limite di una successione, non ti sto dicendo niente sul suo comportamento nel breve termine. Un ritardista che cita un teorema sui limiti all'infinito per convincerti che un numero ritardato sia migliore di uno qualsiasi alla prossima estrazione si sta arrampicando sugli specchi.

Alcuni ritardisti cercheranno di dirti che la legge dei grandi numeri abbia poteri magici. Se nei primi m lanci sei stato insolitamente fortunato (o sfortunato), dicono, la legge dei grandi numeri farà in modo che nel breve termine ci sarà una correzione tramite un periodo di poca (o tanta) fortuna. Alcuni sembrano dire che altrimenti S_n / n non può tendere a p. Vediamo (i) che può benissimo tendere a p senza i poteri mistici della legge impotente dei piccoli numeri creata dai ritardisti, e (ii) cosa succede più realisticamente.

Diciamo che abbiamo una moneta che esce testa con probabilità p. Finora abbiamo fatto m lanci, ottenendo km teste. Se facciamo altri n lanci, la proporzione di successi deve essere "strana" per bilanciare l'eventuale stranezza vista nei primi m lanci? No.

Facciamo un esempio concreto. p=1/2, m=50. Abbiamo avuto 40 teste: una proporzione di successi di 0,8. Nei prossimi 50 lanci, cosa dovrebbe succedere? Se i lanci sono indipendenti, i prossimi 50 lanci saranno come 50 lanci qualsiasi: ci saranno circa 25 teste. Se ci sono esattamente 25 teste, la proporzione di successi diventa (40+25)/(50+50) = 0,65. Siamo più vicini a 0,5, ma non c'è stato un misterioso periodo di sfortuna come vorrebbero i ritardisti. Ci avviciniamo a 0,5 anche con, diciamo, 35 o 39 teste nel secondo gruppo di 50 lanci: (40+39)/(50+50) = 0,79 è minore di 0,8, dopo tutto. È abbastanza difficile allontanarsi da 0,5 in questo caso. Sto dicendo che deve succedere così? No. Questo esempio serve solamente per mostrare che un ritardista che dice "Se la proporzione di successi si avvicina a 0,5, vuol dire che ci devono essere i bilanciamenti" sta dicendo cose non vere.

Le distribuzioni Bernoulli e binomiale

Realisticamente, cosa succede?

Non serve la legge dei grandi numeri. Basta conoscere la distribuzione binomiale, e questa la possiamo derivare dalla distribuzione Bernoulli.

La distribuzione Bernoulli è quella del numero di teste ottenute lanciando una moneta una volta.

P(X=0) = q, e P(X=1)=p.

Questa distribuzione ha media 0.q + 1.p = p

E ha varianza E(X^2)-E(X)^2 = 0^2.q + 1^2.p - p^2 = p-p^2 = p(1-p) = pq.

Facciamo n lanci indipendenti di una moneta. (Cioè il risultato di un lancio non dipende da quelli di altri lanci.)

Cosa possiamo dire della distribuzione del numero di teste?

La media di una somma di variabili indipendenti è la somma delle loro medie. Quindi, la media del numero di teste ottenute lanciando n monete (o la stessa moneta n volte) è np.

La varianza di una somma di variabili indipendenti è la somma delle loro varianze. Quindi la varianza del numero di teste ottenute lanciando n monete (o una moneta n volte) è npq. E quindi lo scarto quadratico medio è sqrt(npq).

Ok. Torniamo al problema dei m lanci atipici.

Abbiamo ottenuto mk teste dopo m lanci di una moneta. La lanciamo altre n volte. Cosa succede (i) al numero di teste e (ii) alla proporzione di teste?

Il numero di teste ottenuto nei prossimi n lanci avrà una distribuzione binomiale con parametri n e p: i lanci sono indipendenti, e il passato è irrilevante. Se n è abbastanza grande (maggiore di 20, diciamo), la distribuzione è approssimativamente normale. Quindi molto spesso (Almeno il 99,5% delle volte) il numero di teste sarà entro 3 s.q.m. della media. Naturalmente, raramente succederanno cose strane, ma vediamo come la proporzione di teste si avvicina a p senza l'intervento della magia nera:

Abbiamo km teste dopo m lanci. Nei prossimi n lanci otterremo tipicamente np +/- 3sqrt(npq) teste.

Quindi, il numero totale di teste sarà km+np+/-3sqrt(npq). Alcuni ritardisti vorrebbero convincerti che questo fosse solitamente più vicino a (m+n)p, il numero di teste previste inizialmente in m+n lanci. Ma km + np +/-3sqrt(npq) - (m+n)p = (k-p)m +/- 3sqrt(npq). Lo scostamento (k-p)m è sempre lì, e non c'è alcuna pressione verso l'alto o verso il basso.

Cosa succede alla proporzione di teste?

Diventa (km + np +/- 3sqrt(npq))/(m+n)

Cioé km/(m+n) + np/(n+m) +/- 3sqrt(npq)/(m+n)

Il primo termine e l'ultimo termine possono essere resi piccoli a piacere prendendo un n abbastanza grande, e il secondo termine può essere portato vicino quanto vogliamo a p prendendo n abbastanza grande.

Lo scostamento della proporzione di teste rispetto a p passa da k-p a

km/(m+n) + np/(n+m) +/- 3sqrt(npq)/(m+n) - (n+m)p/(n+m)

= m(k-p)/(m+n) +/- 3sqrt(npq)/(m+n)

E questo diventa piccolo quanto vogliamo con n abbastanza grande.

Se non ci basta 99,5%, possiamo sostituire 3 con 10, o 20, o 1000, o quanto vogliamo.

Questa non vuole essere una dimostrazione della legge dei grandi numeri o il teorema del limite centrale. Se volete roba del genere, vedete Feller o Grimmett e Stirzaker. Voglio solo mostrarvi quello che i ritardisti sperano che tu non sia in grado di capire quando cercano di ingannarti. Loro dicono che qualcosa può succedere solamente in un certo modo? Io vi mostro che può anche succedere diversamente.

ghira@mistral.co.uk