esercizi 4 - mat.unimi.it · una variabile aleatoria x i cui ... sia x una variabile aleatoria che...

36
I seguenti quesiti ed il relativo svolgimento sono coperti dal diritto d’autore, pertanto essi non possono essere sfruttati a fini commerciali o di pubblicazione editoriale senza autorizzazione esplicita e scritta dell’autore. Ogni abuso sar` a perseguito a termini di legge dal titolare del diritto. Esercizi 4 (1) In uno spazio campionario Ω, un evento A ha probabilit` a p(A)=1/2 ed un secondo evento B ha probabilit` a p(B)=2/3. Cosa si pu` o affermare a proposito di A B? (2) ` E dato su uno spazio campionario Ω = {a, b, c, d, e} dotato della funzione di probabilit` a seguente: p( a )=1/3, p( b )=1/9, p( c )=1/9, p( d )=1/9, p( e )=1/3, una variabile aleatoria X i cui valori sono X ( a )=1, X ( b )=3, X ( c )=5, X ( d )=7, X ( e )=9. Calcolare la media e la varianza di X . (3) Sullo spazio campionario Ω = [1, 2] ` e assegnata la funzione di densit` a di probabilit` a: f (x) = 2(x - 1). Calcolare la media e la varianza di questa distribuzione. (4) Sullo spazio campionario Ω = [-2, 2] ` e assegnata la seguente funzione di densit` a di probabilit` a: f (x)= (x + 2)/2 x [-2, -1] 1/2 x [-1, 1] (2 - x)/2 x [1, 2]. Calcolare la media e la varianza di questa densit` a. (5) Un esperimento ha prodotto le seguenti misure di una data grandezza: 1.2, 1.3, 1.5, 0.6, 1.0 . Calcolare la media e la varianza di questi dati. (6) Due dadi a sei facce, numerate da 1 a 6 e non truccati sono lanciati contemporaneamente. Sia X la variabile aleatoria il cui valore ` e la somma dei valori usciti ad ogni lancio. Calcolare media e varianza di X . (7) Per quali valori del parametro reale α, la funzione f (x)=(α + 1)x α + (2α + 1)x 2α pu` o essere considerata come una densit` a di probabilit` a sullo spazio campionario continuo Ω = [1, 2]? (8) I valori di una variabile aleatoria X sono distribuiti come una binomiale di parametri N =4e p =1/3. Calcolare la media e la varianza di X , di X + 2 e di X 2 . (9) Su un spazio campionario Ω sono date due variabili aleatorie X, Y , le cui probabilit` a congiunte sono date dalla seguente tabella: 1

Upload: donhi

Post on 14-Feb-2019

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

I seguenti quesiti ed il relativo svolgimento sono coperti dal diritto d’autore, pertanto essi non possono essere sfruttati a fini

commerciali o di pubblicazione editoriale senza autorizzazione esplicita e scritta dell’autore. Ogni abuso sara perseguito a

termini di legge dal titolare del diritto.

Esercizi 4

(1) In uno spazio campionario Ω, un evento A ha probabilita p(A) = 1/2 ed un secondoevento B ha probabilita p(B) = 2/3. Cosa si puo affermare a proposito di A ∩B?

(2) E dato su uno spazio campionario Ω = a, b, c, d, e dotato della funzione di probabilitaseguente:

p(′′a′′) = 1/3, p(′′b′′) = 1/9, p(′′c′′) = 1/9, p(′′d′′) = 1/9, p(′′e′′) = 1/3,

una variabile aleatoria X i cui valori sono

X(′′a′′) = 1, X(′′b′′) = 3, X(′′c′′) = 5, X(′′d′′) = 7, X(′′e′′) = 9.

Calcolare la media e la varianza di X.

(3) Sullo spazio campionario Ω = [1, 2] e assegnata la funzione di densita di probabilita:

f(x) = 2(x− 1).

Calcolare la media e la varianza di questa distribuzione.

(4) Sullo spazio campionario Ω = [−2, 2] e assegnata la seguente funzione di densita diprobabilita:

f(x) =

(x + 2)/2 x ∈ [−2,−1]1/2 x ∈ [−1, 1](2− x)/2 x ∈ [1, 2].

Calcolare la media e la varianza di questa densita.

(5) Un esperimento ha prodotto le seguenti misure di una data grandezza:

1.2, 1.3, 1.5, 0.6, 1.0 .

Calcolare la media e la varianza di questi dati.

(6) Due dadi a sei facce, numerate da 1 a 6 e non truccati sono lanciati contemporaneamente.Sia X la variabile aleatoria il cui valore e la somma dei valori usciti ad ogni lancio.Calcolare media e varianza di X.

(7) Per quali valori del parametro reale α, la funzione

f(x) = (α + 1)xα + (2α + 1)x2α

puo essere considerata come una densita di probabilita sullo spazio campionario continuoΩ = [1, 2]?

(8) I valori di una variabile aleatoria X sono distribuiti come una binomiale di parametriN = 4 e p = 1/3. Calcolare la media e la varianza di X, di X + 2 e di X2.

(9) Su un spazio campionario Ω sono date due variabili aleatorie X, Y , le cui probabilitacongiunte sono date dalla seguente tabella:

1

Page 2: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

X\Y 2 4 6 81 1/12 1/12 1/24 1/42 1/4 1/12 0 1/123 1/12 0 1/24 0

Calcolare M [X], M [Y ] e Cov[X, Y ]. X ed Y sono indipendenti? Sono incorrelate?

(10) Su un spazio campionario Ω sono date due variabili aleatorie X, Y le cui probabilitacongiunte sono date dalla seguente tabella:

X\Y 3 5 7 92 1/12 1/12 1/24 1/243 1/6 1/6 1/12 1/124 1/12 1/12 1/24 1/24

Calcolare M [X], M [Y ] e Cov[X, Y ]. X ed Y sono incorrelate? Sono indipendenti?

(11) Si consideri il seguente gioco al casino. Il gioco e giocato da un solo giocatore controil banco, tenuto dal croupier. Il giocatore lancia una coppia di dadi e vince 2 Euro sela somma dei valori usciti sui due dadi e 7, in ogni altro caso perde 1 Euro. Dopo avergiocato 100 partite, qual e la probabilita che il giocatore abbia guadagnato almeno 1Euro? Quale quella di aver perso almeno 40 Euro?

(12) Come nell’esercizio precedente, ma questa volta la somma vinta per ogni uscita delnumero 7 e pari a 5 Euro, mentre in caso di perdita si perde sempre 1 Euro. Dopo lesolite 100 partite, qual e la probabilita che il giocatore abbia guadagnato almeno 1 Euro?Quale quella di aver perso almeno 40 Euro?

(13) Una coppia di dadi e stata truccata in modo che al lancio di ogni dado la faccia 1compaia con probabilita 1/3, mentre le altre facce restano tra loro equiprobabili. Quale la probabilita che lanciando la coppia di dadi la somma dei numeri sulle facce sia 7?

(14) Un’azienda produttrice di lampadine sostiene che ogni lampadina prodotta ha probabilitap = 1/1000 di essere messa in vendita nonostante sia guasta. Tale azienda riesce adaggiudicarsi un appalto per la fornitura di lampade ad un ospedale che ne acquistaun primo lotto di 10000. Qual e la probabilita che in questo lotto vi siano piu di 15lampadine guaste?

(15) Nell’esercizio precedentemente discusso, si supponga di testare ogni lampadina acqui-stata e di averne trovate almeno 20 guaste: che conclusioni possiamo trarre riguardola dichiarazione del produttore di lampadine? E se le lampadine trovate guaste fosserostate almeno 40?

(16) Un test medico per la ricerca di un dato enzima si sa essere affidabile al 99%, ovveroesso produce una segnalazione errata con probabilita 1/100. Qual e la probabilita cheimpiegando questo test su 1000 campioni esso dia luogo a piu di 7 segnalazioni errate?

(17) In una certa classe d’eta, la probabilita di essere malati di ipertensione e 0.10. Il test Arisulta positivo nel 99% dei casi in una persona malata e il 5% dei casi in una sana.

a) Qual e la probabilita di una corretta diagnosi con il test A?b) Qual e la probabilita che una persona sia malata, nonostante il test sia risultato

negativo?

(18) Per quali valori del parametro α la funzione α sinx− sin(2x) e una densita di probabilitasullo spazio Ω = [0, π/2]?

(19) Un’azienda produce sistemi di controllo che ritiene particolarmente affidabili in quantoafferma che detti A e B gli eventi seguenti:

2

Page 3: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

A = “lo strumento segnala che il componente in esame e difettoso”B = “il componente in esame e difettoso”

allora p(A|B) = 95% e p(Ac|Bc) = 95%. In una partita di componenti molto numerosae noto che p(B) = 5%. Calcolare la probabilita che posto che lo strumento segnali undifetto, il componente in esame lo sia veramente.

(20) Una dattilografa ha circa il 20% di probabilita di commettere un errore in una pagina.Qual e la probabilita che in un libro di 400 pagine ci siano al massimo 70 pagine conqualche errore?

(21) Due dadi piramidali con 4 sole facce numerate da 1 a 4 vengono lanciati. Sia X lavariabile aleatoria che fornisce il risultato del primo dado e sia Y quella che fornisce ilrisultato del secondo dado. Siano poi U e V due nuove variabili aleatorie, definite da:

U = min(X, Y ), V = |X − Y |.

Calcolare la probabilita congiunta di U e V e stabilire se si tratta di variabili aleatorieincorrelate.

(22) Un agricoltore ha stimato che il 20% della semente di melone che ha prodotto nongermogliera. Egli vende questa semente in scatole contenenti 50 semi ciascuna. Calcolarela probabilita che una data scatola contenga piu di un seme sterile.

(23) Si fanno vari lanci con una moneta equilibrata, e ci si ferma alla prima uscita del la-to “Testa”. (quindi possibili risultati degli esperimenti sono i seguenti: CCCT , CT ,CCCCCCCT e cosı via). Calcolare la probabilita di ottenere “Testa” esattamente alquarto lancio.

(24) Un’urna contiene 4 palle bianche e 2 nere. Si estraggono due palle dall’urna senzareimmissione (cioe la prima palla estratta non viene rimessa nell’urna). Calcolare laprobabilita che entrambe le palle estratte siano bianche.

(25) Sia X una variabile aleatoria che assume i valori −1, 0, 1 con uguale probabilita. Tro-vare la distribuzione congiunta di X ed X2 e la probabilita condizionata di X sotto lacondizione X2 = 1.

(26) Una prima urna contiene 3 palle rosse e 1 bianca. Una seconda urna ne contiene invece 3bianche ed 1 rossa. Si estraggono una palla dalla prima urna ed una palla dalla seconda.Calcolare la probabilita che le palle estratte abbiano diverso colore.

(27) Siano A e B due eventi indipendenti e si supponga che p(A) = 0.5 e p(A ∩ B) = 0.2.Calcolare p(B).

(28) Siano A e B due eventi indipendenti tali che p(A) = p(B|A) = 0.5. Calcolare p(A ∪B).

(29) Studi epidemiologici mostrano che il 10% delle persone ha la bronchite cronica, che il65% delle persone con la bronchite fuma, mentre il 35% delle persone senza bronchitefuma. Determinare la percentuale dei fumatori con bronchite rispetto a tutti i fumatori.

(30) Si lanciano due dadi a quattro facce (due tetraedri) numerate da 1 a 4. Sia X la variabilealeatoria che fornisce il piu piccolo dei numeri usciti e sia invece Y la variabile aleatoriache ne da il piu grande. Trovare la distribuzione congiunta di X ed Y e la distribuzionedi Y condizionata da X = 3.

(31) X e una variabile aleatoria la cui distribuzione e binomiale con parametri (ignoti) N ep. Si sa pero che M [X] = 5 e che VarX = 4. Determinare N ed p.

3

Page 4: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(32) X e una variabile aleatoria la cui distribuzione e di Poisson con parametro (ignoto) λ.Si sa pero che p(X = 0) = p(X = 1). Determinare λ. Calcolare poi M [X] e Var[X].

(33) Da un’urna contenente tre palle numerate da 1 a 3 ne vengono estratte due senza reim-missione (cioe la prima estratta non viene rimessa nell’urna). Sia X il numero dellaprima palla estratta ed Y il piu grande dei due estratti. Determinare la distribuzionecongiunta di X e Y e trovare p(X = 1|Y = 3).

(34) Sono dati due eventi A e B per i quali sono noti i seguenti fatti:

p(A|B) = 1/3, p(Bc) = 6/7, p(A ∪B) = 1/2.

Gli eventi A e B sono indipendenti?

(35) Una casa da gioco ha deciso di introdurre un nuovo gioco d’azzardo. Consiste nel lanciodi un dato a forma ottagonale, nel quale le facce 1, 2, 3, 4 sono tra loro equiprobabili,cosı come pure sono tra loro equiprobabili le facce 5, 6, 7, 8, tuttavia, le due piramidicontrapposte che costituiscono il dado sono realizzate in materiali diversi, cosı che di fattola faccia 1 ha una probabilita tripla rispetto a quella della faccia 5. Il gioco consiste inquesto: il giocatore lancia una sola volta il dado e se esce 1, 2, 3 o 5 allora egli paga albanco 10 Euro, mentre se esce 4, 6, 7 o 8 egli vince X Euro. Determinare il valore di Xin modo che il gioco sia equo (il che significa che il guadagno medio del banco e pari a0).

(36) Il malfunzionamento di una lavatrice porta all’allagamento del locale che la ospita. Visono solo due possibili cause del suo malfunzionamento: la presenza di una cricca nelsuo oblo e l’intasamento del suo filtro. La prima causa ha probabilita 0.2. Inoltre, e notoche nel primo caso la probabilita di un allagamento e 0.9, mentre nel secondo e pari a0.3. Supponiamo che una volta messa in funzione la lavatrice effettivamente si assista(ahinoi!) all’allagamento del locale. Qual e la probabilita che esso sia dovuto alla cattivapulizia del filtro?

(37) Determinare per quale valore del parametro reale c la funzione

f(x) =

c√

x x ∈ [0, 1/2)c√

1− x x ∈ [1/2, 1]

fornisce una densita di probabilita su [0, 1]. Per tale valore di c si calcolino poi media evarianza dello spazio campionario.

(38) Su un spazio campionario Ω sono date due variabili aleatorie X, Y le cui probabilitacongiunte sono date dalla seguente tabella:

X\Y -2 0 2-1 1/8 1/8 1/82 1/8 3/8 1/8

Calcolare M [X], M [Y ], M [2X−3Y ], Cov[X, Y ] e Var[X+Y ]. X ed Y sono indipendenti?

(39) Il mal funzionamento dell’apparato W ha tre sole possibili cause, dette “causa A”, “causaB” e “causa C”. Il costruttore di W dichiara che se la causa A si realizza, essa produceil guasto di W nel 10% dei casi, se a realizzarsi e la causa B essa produce il guasto di Wnel 40% dei casi e, da ultimo, che se a realizzarsi e la causa C essa determina il guastodi W nel 60% dei casi.

4

Page 5: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Gianni acquista l’apparato W e lo installa in un ambiente in cui probabilita che l’evento“causa A” si verifichi e 50% mentre la probabilita che a verificarsi sia l’evento “causa B”e 40%. Calcolare anzitutto la probabilita che si verifichi l’evento “causa C”.

A seguito di un mal funzionamento di W, Gianni decide di consultare il call-centermesso a disposizione dei suoi clienti dal costruttore di W. Il tecnico del call-center non haaccesso a W e decide di guidare Gianni nel tentativo di risolvere il mal funzionamento.Le cause A,B,C hanno pero rimedi distinti e quindi per non perdere tempo convienepartire dalla causa piu probabile: qual e?

(40) La probabilita di trovare una perla in un’ostrica non coltivata e pari a circa 0.001. Quanteostriche si dovranno pescare per poter disporre, con probabilita maggiore od uguale a0.3, di almeno 10 perle?

(41) Guardavo il Tg2 del 10 ottobre e mi sono soffermato su un servizio. L’argomento e lo“stalking” (perseguitare, seguire, fare la posta). La voce di una giornalista in sottofondodiceva che un italiano su cinque (20%) ha subito molestie; su 100 omicidi volontari, dieci(10%) sono stati preceduti da un fenomeno di stalking. Qual e secondo voi il rischio diessere uccisi da uno stalker? Per rispondere e utile tenere presente che Il tasso di omicidiin Italia e di uno ogni 100 mila persone nel 2006 (fonte: Rapporto del Viminale sullacriminalita).

(42) Determinare per quali valori della costante reale c la funzione f(x) = 3cx + 3c2x2 e unadensita sullo spazio campionario Ω = [0, 1]. Si calcoli poi media µ e varianza σ2 perciascuna di esse.

(43) Determinare per quali valori della costante reale c la funzione f(x) = c2x − 32 cx2 sia

una densita sullo spazio campionario Ω = [0, 1]. Si calcoli poi media µ e varianza σ2 perciascuna della densita trovate.

(44) Un pediatra sa che la presenza di macchie rosse sulla pelle di un bambino puo esseresintomo di una infezione da varicella, di una infezione da morbillo oppure avere unaorigine non meglio precisata. Sulla base della sua esperienza egli stima: p(morbillo) = 0.5e p(varicella) = 0.3; egli inoltre sa che l’infezione da morbillo provoca la comparsa dellemacchie nel 30% dei casi che l’infezione da varicella provoca la comparsa delle macchienel 60% dei casi e infine che le macchie possono comparire anche nel 20% dei bimbi sani.In presenza di un paziente che presenta il sintomo ‘macchie rosse’, qual e la causa piuprobabile?

(45) Il moto di un grave in caduta libera da un’altezza x0 con velocita iniziale nulla e trascu-rando le forze di resistenza e regolato dalla legge x(t) = x0− g

2 t2, dove g e l’accelerazionedi gravita. Un esperimento consiste nel lanciare da un pallone aerostatico un grave nellecondizioni precedenti, e nel registrare la posizione ad intervalli di tempo prefissati. Cosıfacendo si sono ottenuti i dati seguenti:

t in secondi | 0 1 2 3 4x in metri | 102 97 83 58 24

Usando il metodo dei minimi quadrati determinare una stima per le costanti x0 e g.

Attenzione! la legge che lega x al tempo non e lineare, tuttavia lo e quella che lega x a t2. Edunque a queste variabili che deve essere applicato il metodo dei minimi quadrati.

(46) La quantita Z di zinco deposta al catodo di un bagno elettrochimico dipende linearmentedalla quantita di carica q che vi fluisce. Si ha cioe che Z = z0 +m · q dove z0 rappresentala quantita di zinco gia presente al catodo al momento dell’accensione del bagno ed mrappresenta una costante di proporzionalita. Durante un bagno chimico sono fatte le

5

Page 6: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

seguenti misure:

q in Coulomb | 2 3 7 9 12 15Z in grammi | 20.2 28.1 64.2 78.2 108.2 129.5

Usando il metodo dei minimi quadrati determinare una stima per le costanti m ed z0.

(47) A seguito del procedere di una reazione chimica la concentrazione C della sostanza ℵdecade secondo la legge C = C0e

−bt dove C0 misura la concentrazione al tempo t = 0 e b eun parametro di reazione costante nel tempo. La legge che lega C (variabile dipendente)al tempo t (variabile indipendente) non e lineare, tuttavia da essa segue che

log C = log C0 − b · tper cui se si assumono come nuove variabili il tempo t (variabile indipendente) e log C(variabile dipendente) la legge appare della forma lineare: log C = q + m · t (dovel’ordinata all’origine q di fatto coincide con log C0 e il coefficiente angolare coincide con−b). Un esperimento fornisce i seguenti dati:

t in secondi | 1 2 3 4 5C | 0.135355 0.018315 0.002478 0.000123 0.000016

Usando il metodo dei minimi quadrati determinare una stima per le costanti C0 e b.Suggerimento: per ogni valor di C calcolare log C ed interpolare linearmente log C e t.

(48) Presso un certo pronto soccorso di XXX il numero di casi di tetano diagnosticati ognimese e distribuito come una poissoniana con λ = 4.5.(a) Qual e la probabilita che in un certo mese venga diagnosticato un (sott. inteso

unico) caso di tetano?(b) Qual e la probabilita che in un certo mese vengano diagnosticato piu di tre casi di

tetano?

(49) In un periodo di 120 anni ci sono stati nel mondo 87 terremoti di alta intensita.a) Calcolare il numero medio di terremoti di alta intensita in un anno.b) Calcolare la probabilita che il numero di terremoti in un anno selezionato a caso sia

esattamente 2.c) Quale sara il numero di anni su 120 in cui si sono verificati 2 terremoti?

(50) La tabella riassume il gruppo sanguigno e il fattore Rh di un campione di 100 persone.0 A B AB

Rh+ 38 25 11 6Rh- 7 6 4 3

a) Scegliendo a caso una persona, determinare la probabilita che:1. il suo gruppo sanguigno non sia 02. abbia il gruppo AB o il fattore Rh+3. abbia il fattore Rh- sapendo che ha gruppo A

b) Scegliendo a caso tre persone, determinare la probabilita che abbiano il gruppo B.

(51) Su 150 analisi effettuate in un laboratorio, sono state riscontrate le seguenti frequenzedei vari gruppi sanguigni.

Gruppo Fr. assolute0 78A 48B 15

AB 9a) Calcolare le corrispondenti frequenze percentuali.b) Calcolare la probabilita che scelti due individui a caso essi abbiano lo stesso gruppo

sanguigno.6

Page 7: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

c) Come e noto le trasfusioni di sangue sono possibili: dal gruppo 0 a tutti i gruppi;dal gruppo A ai gruppi A, AB; dal gruppo B ai gruppi B, AB; dal gruppo AB algruppo AB. Calcolare la probabilita che un individuo scelto a caso possa donare ilproprio sangue a un secondo individuo scelto a caso.

(52) Consideriamo tre urne, la prima contiene 2 palline bianche e 3 nere, la seconda contiene4 palline bianche e una nera, la terza contiene 3 palline bianche e 4 nere.

a) Si sceglie a caso un’urna e si estrarre una pallina bianca. qual e la probabilita chequesta provenga dalla prima urna?

b) Si ripongono tutte le palline in un’unica urna e se ne estraggono 5 senza reimmis-sione. Calcola la probabilita che 3 siano bianche e due nere.

(53) In una vasta regione pianeggiante sono distribuite 40000 querce. per studiare il territoriola regione e suddivisa in 10000 zone. sapendo che la distribuzione di piante su unterritorio puo essere studiata utilizzando la distribuzione di poisson:

a) qual e la probabilita di trovare esattamente 2 querce in una zona scelta a caso?b) Qual e la probabilita di trovarne meno di quattro?

(54) Il Ministero della salute riferisce che la probabilita di avere l’HIV nella popolazione arischio e del 16%. Un test di screening con sensibilita pari al 90% ha fornito 6570 esitinegativi in un campione di 9000 soggetti.

a) Calcolare il valore predittivo del test.b) Calcolare la specificita del test.c) Quanti falsi negativi mi aspetto nel campione in esame?

7

Page 8: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Soluzioni

(1) L’intersezione A ∩ B non puo essere l’insieme vuoto. Infatti, se gli eventi A e B non siintersecassero, succederebbe che

p(A ∪B) = p(A) + p(B)− p(A ∩B) = p(A) + p(B)− p(∅) = 1/2 + 2/3− 0 = 7/6

cosa che pero e assurda, visto che la probabilita di ogni evento deve essere sempre unnumero tra 0 e 1.

(2) Per ottenere il valore di M [X] basta tener presente la definizione di media di X:

M [X] =∑α∈Ω

X(α)p(′′α′′),

e quindi nel caso in esame si ha

M [X] = 1p(′′a′′) + 3p(′′b′′) + 5p(′′c′′) + 7p(′′d′′) + 9p(′′e′′)

= 1 · 1/3 + 3 · 1/9 + 5 · 1/9 + 7 · 1/9 + 9 · 1/3 = 45/9 = 5.

Analogamente otteniamo

M [X2] = 12p(′′a′′) + 32p(′′b′′) + 52p(′′c′′) + 72p(′′d′′) + 92p(′′e′′)

= 12 · 1/3 + 32 · 1/9 + 52 · 1/9 + 72 · 1/9 + 92 · 1/3 = 329/9.

Dalla formula Var[X] = M [X2]− (M [X])2 otteniamo

Var[X] = M [X2]− (M [X])2 = 329/9− 52 = 104/9.

(3) Ricordo che quando lo spazio Ω e continuo, la media e varianza della distribuzione diprobabilita sono definite tramite integrali:

media = µ =∫ +∞

−∞xf(x)dx, varianza = σ2 =

∫ +∞

−∞(x− µ)2f(x)dx.

In questo caso Ω = [1, 2] e questa situazione rientra in quella ricordata qui sopra, pur dipensare alla densita di probabilita come ad una funzione che vale 0 fuori dell’intervallo[1, 2]. Dunque e:

µ =∫ +∞

−∞xf(x)dx =

∫ 2

1x2(x− 1)dx =

∫ 2

1(2x2 − 2x)dx

= (23x3 − x2)

∣∣21

= (2323 − 22)− (2

313 − 12) = 53 .

Per calcolare la varianza, possiamo usare la formula σ2 = Var[X] = M [X2]− (M [X])2 =M [X2]−µ2, dove X e la variabile aleatoria che sul punto x assume il valore x. Tuttavia,anche per variare un po’ le cose, questa volta calcoliamo σ2 direttamente dalla suadefinizione:

σ2 =∫ +∞

−∞(x− µ)2f(x)dx =

∫ 2

1(x− 5

3)2 2(x− 1)dx = 2∫ 2

1(x2 − 10

3 x + 259 )(x− 1)dx

= 2∫ 2

1(x3 − 13

3 x2 + 559 x− 25

9 )dx = 2(14x4 − 13

9 x3 + 5518x2 − 25

9 x)∣∣21

= 2(1424 − 13

9 23 + 551822 − 25

9 2)− 2(14 −

139 + 55

18 −259 ) = 1

18 .

8

Page 9: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(4) Procedo come nell’esercizio precedente:

µ =∫ +∞

−∞xf(x)dx =

∫ −1

−2x(x + 2)/2 dx +

∫ 1

−1x · 1/2 dx +

∫ 2

1x(2− x)/2 dx

=∫ −1

−2(x2/2 + x) dx +

∫ 1

−1x/2 dx +

∫ 2

1(x− x2/2) dx

= (x3/6 + x2/2)∣∣−1

−2+ (x2/4)

∣∣1−1

+ (x2/2− x3/6)∣∣21

= −13 + 0 + 1

3 = 0.

Il fatto che il valor medio sia 0 non e casuale e poteva essere anticipato: la funzione fe infatti una funzione pari (ovvero soddisfa l’identita f(x) = f(−x)), e la media di unadistribuzione pari e sempre uguale a 0.

Per il calcolo della varianza, abbiamo

σ2 =∫ +∞

−∞(x− µ)2f(x)dx =

∫ 2

−2x2f(x) dx

=∫ −1

−2x2(x + 2)/2dx +

∫ 1

−1x21/2dx +

∫ 2

1x2(2− x)/2dx

=∫ −1

−2(x3/2 + x2)dx +

∫ 1

−1x2/2dx +

∫ 2

1(x2 − x3/2)dx

= (x4/8 + x3/3)∣∣−1

−2+ (x3/6)

∣∣1−1

+ (x3/3− x4/8)∣∣21

= 1124 + 1

3 + 1124 = 5

4 .

(5) Sia X la variabile aleatoria il cui valore e il risultato di ogni singola misura. In mancanzadi ulteriori informazioni i valori di X sono assunti tutti equiprobabili e nel caso in esameessi sono in tutto 5 quindi a ciascuno compete una probabilita pari a p = 1/5. La mediadi X e dunque pari a:

M [X] = 1.2p(1.2) + 1.3p(1.3) + 1.5p(1.5) + 0.6p(0.6) + 1.0p(1.0)

= 1.2 · 15 + 1.3 · 1

5 + 1.5 · 15 + 0.6 · 1

5 + 1.0 · 15 = 5.6 · 1

5 = 1.12.

Per il calcolo della varianza e invece conveniente usare la formula secondo cui

Var[X] = M [X2]− (M [X])2,

e cosı

M [X2] = 1.22p(1.2) + 1.32p(1.3) + 1.52p(1.5) + 0.62p(0.6) + 1.02p(1.0)

= 1.22 · 15 + 1.32 · 1

5 + 1.52 · 15 + 0.62 · 1

5 + 1.02 · 15 = 6.74 · 1

5 = 1.348.

La varianza e quindi pari a:

Var[X] = M [X2]− (M [X])2 = 1.348− (1.12)2 = 0.0936.

(6) I dadi sono dichiarati non truccati, quindi le probabilita con cui ciascuna faccia esceal lancio di ogni dado e pari ad 1/6. I dadi lanciati sono pero due e quindi dobbiamoconsiderare lo spazio campionario Ω = ′′1′′,′′ 2′′,′′ 3′′,′′ 4′′,′′ 6′′ × ′′1′′,′′ 2′′,′′ 3′′,′′ 4′′,′′ 6′′corrispondente a tutte le possibili coppie di risultati corrispondenti al lancio simultaneo didue dadi. Inoltre, dato che non si afferma nulla riguardo possibili interferenze del primodado sul secondo, e sicuramente lecito supporre che i due lanci siano indipendenti, equindi le probabilita congiunte da assegnarsi allo spazio cartesiano Ω saranno i prodottidelle corrispondenti distribuzioni marginali: ma le probabilita di ogni faccia e 1/6, quindiad ogni evento dello spazio Ω compete la probabilita 1/ ·1/6 = 1/36. Per calcolare Media

9

Page 10: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

e varianza di X dobbiamo quindi calcolare le seguenti somme:

M [X] =∑α∈Ω

X(α)p(α) =6∑

n=1

6∑m=1

(n + m)p(′′(n, m)′′)

=6∑

n=1

6∑m=1

(n + m) 136 = 1

36

6∑n=1

6∑m=1

(n + m)

= 136

((1+1)+(1+2)+(1+3)+(1+4)

+(1+5)+(1+6)+(2+1)+(2+2)+· · ·+(6+6))

= 7.

M [X2] =∑α∈Ω

X(α)2p(α) =6∑

n=1

6∑m=1

(n + m)2p(′′(n, m)′′)

=6∑

n=1

6∑m=1

(n + m)2 136 = 1

36

6∑n=1

6∑m=1

(n + m)2

= 136

((1+1)2+(1+2)2+(1+3)2+(1+4)2

+(1+5)2+(1+6)2+(2+1)2+(2+2)2+· · ·+(6+6)2)

= 329/6.

QuindiVar[X] = M [X2]− (M [X])2 = 329/6− 72 = 35/6.

C’e anche un secondo metodo, un po’ piu rapido, che consente di ottenere il medesimorisultato. Osserviamo che dei 36 possibili eventi di Ω (le 6 · 6 possibili uscite dal lanciocontemporaneo di due dadi), X assume il valore 2 solo su 1 di essi (l’evento (′′(1, 1)′′)),il valore 3 su 2 di essi (gli eventi (′′(1, 2)′′) e (′′(2, 1)′′)), il valore 4 su 3 di essi (gli eventi(′′(1, 3)′′), (′′(2, 2)′′) e ′′(3, 1)′′), e cosı via secondo la tabella seguente:

valore di X 2 3 4 5 6 7 8 9 10 11 12numero di volte 1 2 3 4 5 6 5 4 3 2 1

e che quindi ai valori di X competono le seguenti probabilita:

valore di X 2 3 4 5 6 7 8 9 10 11 12probabilita 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

e quindi

M [X] =∑

a=valore di X

a p(a) =12∑

a=2

a p(a)

= 2 · 136 +3 · 2

36 +4 · 336 +5 · 4

36 +6 · 536 +7 · 6

36 +8 · 536 +9 · 4

36 +10 · 336 +11 · 2

36 +12 · 136

= 7.

M [X2] =∑

a=valore di X

a2 p(a) =12∑

a=2

a p(a)

= 22 · 136 +32 · 2

36 +42 · 336 +52 · 4

36 +62 · 536 +72 · 6

36 +82 · 536 +92 · 4

36 +102 · 336 +112 · 2

36 +122 · 136

= 329/6.

Evidentemente i valori trovati coincidono con quelli precedentemente trovati; il vantaggioche si ha nel condurre il calcolo nel secondo modo deriva dal fatto che ora si devonoeseguire meno somme.

10

Page 11: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(7) Per poter essere considerata come una densita di probabilita la funzione f(x) deve esserecontinua a tratti, essere a valori non negativi e il suo integrale su tutto il dominio devevalere 1. La funzione in esame soddisfa sicuramente i primi due requisiti, quindi restada controllare quando (e se) e soddisfatta anche la terza ipotesi.

1 =∫ 2

1((α + 1)xα + (2α + 1)x2α) dx = (xα+1 + x2α+1)

∣∣21

= 2α+1 + 22α+1 − 2.

Ovvero2 · 22α + 2 · 2α − 3 = 0.

Per risolvere l’equazione poniamo 2α = x, cosı che essa diventa2x2 + 2x− 3 = 02α = x

=⇒

x = −1±

√7

2

2α = x

delle due soluzioni trovate la x = −1−√

72 non e accettabile (poiche 2α = x non ha in quel

caso soluzione), e quindi resta solo√

7−12 da cui

2α = (√

7− 1)/2 =⇒ α =log((

√7− 1)/2)

log 2.

(8) Affermare che i valori di una variabile aleatoria X sono distribuiti come una binomialedi parametri N = 4 e p = 1/3 significa affermare che X assume i valori 0, 1, 2, 3, 4, conuna probabilita che e pari a

p(X = n) =(

N

n

)pn(1− p)N−n =

(4n

)(1/3)n(2/3)4−n, n = 0, 1, 2, 3, 4.

Per il calcolo di M [X] e di Var[X] possiamo procedere ricordando che essi sono dati dalleseguenti formule: (caso di distribuzione binomiale)

M [X] = Np = 4 · 13 = 4

3 , Var[X] = Np(1− p) = 4 · 13 ·

23 = 8

9 .

Per il calcolo di M [X +2] possiamo usare le proprieta formali dell’operatore di media:

M [X + 2] = M [X] + M [2] = M [X] + 2 = 43 + 2 = 10

3 .

Per il calcolo della varianza di X +2 invece non possiamo procedere in modo analogo (lavarianza di una somma non e, in generale, la somma delle varianze), tuttavia osserviamoche le proprieta della media consentono di dimostrare le seguenti uguaglianze

Var[(X + 2)] = M [(X + 2)2]− (M [X + 2])2 = M [X2 + 4X + 4]− (M [X] + 2)2

= M [X2] + 4M [X] + 4− (M [X])2 − 4M [X]− 4 = M [X2]− (M [X])2

= Var[X],

quindi Var[X + 2] = Var[X] = 89 .

Per il calcolo di M [X2] possiamo usare la formula:

Var[X] = M [X2]− (M [X])2 =⇒ M [X2] = Var[X] + (M [X])2 = 89 + (4

3)2 = 83 .

Per il calcolo della varianza di X2 non c’e scampo e ci tocca eseguire tutte le somme;infatti

Var[X2] = M [(X2)2]− (M [X2])2 = M [X4]− (M [X2])211

Page 12: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

e quindi abbiamo bisogno di conoscere M [X4]. Si ha:

M [X4] =4∑

n=0

n4 p(X = n) =4∑

n=0

n4

(4n

)(1/3)n(2/3)4−n

= 04 ·(

40

)(1/3)0(2/3)4−0 + 14 ·

(41

)(1/3)1(2/3)4−1 + 24 ·

(42

)(1/3)2(2/3)4−2

+ 34 ·(

43

)(1/3)3(2/3)4−3 + 44 ·

(44

)(1/3)4(2/3)4−4

= 0 · 1 · 1(2/3)4 + 1 · 4 · (1/3)(2/3)3 + 16 · 6 · (1/3)2(2/3)2 + 81 · 4(1/3)3(2/3)1

+ 256 · 1 · (1/3)41

= 4·881 + 16·6·4

81 + 81·4·281 + 256

81 = 44027 ,

quindiVar[X2] = M [X4]− (M [X2])2 = 440

27 − (83)2 = 248

27 .

(9) Per poter calcolare la media di X e necessario anzitutto conoscere con quale probabilitaX assuma i propri valori. Dato che si conosce la distribuzione congiunta di X ed Y , laprobabilita di X e data dalla distribuzione marginale: quindi, ad esempio,

p(X = 1) = p(X = 1, Y = 2) + p(X = 1, Y = 4) + p(X = 1, Y = 6) + p(X = 1, Y = 8)

= 1/12 + 1/12 + 1/24 + 1/4 = 11/24.

Di fatto si tratta della somma dei dati che nella tabella compaiono nella prima riga. Laprobabilita di X puo essere quindi rapidamente ottenuta come somma sulle righe, edanalogamente quella di Y e ottenuta come somma sulle colonne:

X\Y 2 4 6 8 Marginale X1 1/12 1/12 1/24 1/4 11/242 1/4 1/12 0 1/12 5/123 1/12 0 1/24 0 1/8

Marginale Y 5/12 1/6 1/12 1/3

Possiamo ora calcolare il valor medio di X:

M [X] =∑

a valore di X

a · p(X = a) = 1 · p(X = 1) + 2 · p(X = 2) + 3 · p(X = 3)

= 1 · 1124 + 2 5

12 + 3 · 18 = 5

3 .

Analogamente

M [Y ] =∑

b valore di Y

b · p(Y = b) = 2 · p(Y = 2) + 4 · p(Y = 4) + 6 · p(Y = 6) + 8 · p(Y = 8)

= 2 · 512 + 41

6 + 6 · 112 + 8 · 1

3 = 143 .

Possiamo ora calcolare la covarianza di X ed Y :

Cov[X, Y ] =∑

(a,b)∈Ω

(a−M [X])(b−M [Y ]) p(X = a, Y = b)

= (1− 53)(2− 14

3 )p(X = 1, Y = 2) + (1− 53)(4− 14

3 )p(X = 1, Y = 4)

+ (1− 53)(6− 14

3 )p(X = 1, Y = 6) + (1− 53)(8− 14

3 )p(X = 1, Y = 8)

+ (2− 53)(2− 14

3 )p(X = 1, Y = 2) + (2− 53)(4− 14

3 )p(X = 1, Y = 4)

+ (2− 53)(6− 14

3 )p(X = 1, Y = 6) + (2− 53)(8− 14

3 )p(X = 1, Y = 8)

+ (3− 53)(2− 14

3 )p(X = 1, Y = 2) + (3− 53)(4− 14

3 )p(X = 1, Y = 4)

+ (3− 53)(6− 14

3 )p(X = 1, Y = 6) + (3− 53)(8− 14

3 )p(X = 1, Y = 8)12

Page 13: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Cov[X, Y ] = (1− 53)(2− 14

3 ) · 112 + (1− 5

3)(4− 143 ) · 1

12

+ (1− 53)(6− 14

3 ) · 124 + (1− 5

3)(8− 143 ) · 1

4

+ (2− 53)(2− 14

3 ) · 14 + (2− 5

3)(4− 143 ) · 1

12

+ (2− 53)(6− 14

3 ) · 0 + (2− 53)(8− 14

3 ) · 112

+ (3− 53)(2− 14

3 ) · 112 + (3− 5

3)(4− 143 ) · 0

+ (3− 53)(6− 14

3 ) · 124 + (3− 5

3)(8− 143 ) · 0

= −79 .

Dato che Cov[X, Y ] 6= 0, X ed Y non sono incorrelate, quindi non sono neancheindipendenti.

(10) Procediamo come nell’esercizio precedente. La probabilita di X puo essere rapidamenteottenuta come somma sulle righe, ed analogamente quella di Y e data dalla somma sullecolonne della tabella contenente la distribuzione congiunta:

X\Y 3 5 7 9 Marginale X2 1/12 1/12 1/24 1/24 1/43 1/6 1/6 1/12 1/12 1/24 1/12 1/12 1/24 1/24 1/4

Marginale Y 1/3 1/3 1/6 1/6

Possiamo ora calcolare il valor medio di X:

M [X] =∑

a valore di X

a · p(X = a) = 2 · p(X = 2) + 3 · p(X = 3) + 4 · p(X = 4)

= 2 · 14 + 31

2 + 4 · 14 = 3.

Analogamente

M [Y ] =∑

b valore di Y

b · p(Y = b) = 3 · p(Y = 3) + 5 · p(Y = 5) + 7 · p(Y = 7) + 9 · p(Y = 9)

= 3 · 13 + 51

3 + 7 · 16 + 9 · 1

6 = 163 .

Possiamo ora calcolare la covarianza di X ed Y :

Cov[X, Y ] =∑

(a,b)∈Ω

(a−M [X])(b−M [Y ]) p(X = a, Y = b)

= (2− 3)(3− 163 )p(X = 2, Y = 3) + (2− 3)(5− 16

3 )p(X = 2, Y = 5)

+ (2− 3)(7− 163 )p(X = 2, Y = 7) + (2− 3)(9− 16

3 )p(X = 2, Y = 9)

+ (3− 3)(3− 163 )p(X = 3, Y = 3) + (3− 3)(5− 16

3 )p(X = 3, Y = 5)

+ (3− 3)(7− 163 )p(X = 3, Y = 7) + (3− 3)9− 16

3 )p(X = 3, Y = 9)

+ (4− 3)(3− 163 )p(X = 4, Y = 3) + (4− 3)(5− 16

3 )p(X = 4, Y = 5)

+ (4− 3)(7− 163 )p(X = 4, Y = 7) + (4− 5)(9− 16

3 )p(X = 4, Y = 9)

= (2− 3)(3− 163 ) · 1

12 + (2− 3)(5− 163 ) · 1

12

+ (2− 3)(7− 163 ) · 1

24 + (2− 3)(9− 163 ) · 1

24

+ (3− 3)(3− 163 ) · 1

6 + (3− 3)(5− 163 ) · 1

6

+ (3− 3)(7− 163 ) · 1

12 + (3− 3)(9− 163 ) · 1

12

+ (4− 3)(3− 163 ) · 1

12 + (4− 3)(5− 163 ) · 1

12

+ (4− 3)(7− 163 ) · 1

24 + (4− 3)(9− 163 ) · 1

24

= 0.

13

Page 14: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Dato che Cov[X, Y ] = 0, X ed Y sono incorrelate. In realta, le variabili sono addiritturaindipendenti poiche e possibile verificare direttamente che la probabilita congiunta esempre data come prodotto delle due probabilita marginali, ovvero che

p(X = a, Y = b) = p(X = a) · p(Y = b) ∀a, b.

Ad esempio (ma la verifica va fatta per tutti i 12 casi!)

p(X = 2, Y = 3) = 1/12 = 1/4 · 1/3 = p(X = 2) · p(Y = 3).

(11) Si tratta di un problema interessante ed istruttivo. La cosa piu difficile e indubbiamenteriuscire a matematizzare in modo corretto il problema. Anzitutto studiamo gli eventi.Tutto e regolato dal lancio di due dadi a 6 facce: vi sono quindi 6 ·6 = 36 eventi possibilicorrispondenti a tutte le possibili coppie. I lanci sono tra loro indipendenti e quindi laprobabilita di ciascuna coppia e pari al prodotto delle probabilita delle singole uscite: idadi non sono truccati, quindi ogni faccia esce con probabilita pari a 1/6, ragion per cuila probabilita di ogni coppia e pari a 1/6 · 1/6 = 1/36. Delle 36 coppie, solo 6 hannoper somma il numero 7, quindi i casi favorevoli alla vincita sono in tutto 6. Gli altri30 invece producono una perdita. Ad ogni lancio di una coppia di dadi, quindi, si haprobabilita p = 6/36 = 1/6 di vincere e probabilita 1− p = 30/36 = 5/6 di perdere. SiaS la variabile aleatoria che conta il numero totale di vincite (attenzione! S da il numerodi partite vinte, non la somma vinta) dopo aver eseguito le N = 100 partite.

Da considerazioni generali sappiamo che la variabile S e distribuita come una bino-miale con parametri N = 100 e p = 1/6 (ripetizione di N volte del medesimo singoloesperimento che ha probabilita p di riuscire. Le ripetizioni sono indipendenti ed S contail numero totale di successi).

La variabile aleatoria V che fornisce la somma vinta e collegata evidentemente allavariabile S. Il legame e il seguente: ogni vittoria fa guadagnare 2 Euro, ogni perditafa spendere 1 Euro, inoltre, se si vincono S partite, evidentemente se ne sono perseN − S = 100− S, quindi

V = 2S − (N − S) = 3S −N = 3S − 100.

Cio che il testo chiede di calcolare per primo e la probabilita che V sia maggiore o ugualead 1 Euro, e quindi:

p(V ≥ 1) = p(3S − 100 ≥ 1) = p(3S ≥ 101) = p(S ≥ 101/3) = p(S ≥ 33.6).

Dato che S ha una distribuzione di tipo binomiale con parametri N = 100 e p = 1/6,abbiamo che

p(V ≥ 1) = p(S ≥ 33.6) = p(S = 34) + p(S = 35) + p(S = 36) + · · · =100∑

n=34

p(S = n)

=100∑

n=34

(100n

)(1/6)n(5/6)100−n.

Questa formula e corretta ma purtroppo non e certo di agevole calcolo: ci sono 67addendi, ciascuno dei quali e prodotto di un numero enorme (il binomiale) moltiplicatoper un numero molto piccolo (il prodotto delle probabilita). E quindi sicuramente unabuona idea tentare un approccio approssimato. Osserviamo che

M [S] = Np = 100 · 1/6 = 16.6, Var[S] = Np(1− p) = 100 · 1/6 · 5/6 = 13.8;

entrambe i parametri della distribuzione sono ben maggiori di 5, per cui possiamo sicura-mente utilizzare il Teorema del Limite Centrale (ed il suo corollario) e pensare ad S comead una variabile distribuita come una Normale (cosa che pero e falsa!): il valore ottenuto

14

Page 15: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

sotto questa ipotesi differisce ben poco (meno di 1%) dal valore corretto. Abbiamo

p(V ≥ 1) = p(S ≥ 33.6) = p(S −M [S]√

Var[S]≥ 33.6− 16.6√

13.8)

= p(S −M [S]√

Var[S]≥ 4.56) = 1− Φ(4.56) < 1− 0.999995 = 5 · 10−6 = 0.005%.

(In questo calcolo Φ e la funzione di ripartizione di probabilita per la distribuzioneNormale Standard ed il suo valore e stato ricavato dalle note tabelle).

La seconda probabilita che si chiede di calcolare e la probabilita di perdere almeno 40Euro, ovvero che V ≤ −40. Procedendo come prima, ed usando ancora il Teorema dellimite Centrale, abbiamo:

p(V ≤ −40) = p(3S − 100 ≤ −40) = p(3S ≤ 60) = p(S ≤ 20) = p(S −M [S]√

Var[S]≤ 20− 16.6√

13.8)

= p(S −M [S]√

Var[S]≤ 0.89) = Φ(0.89) = 0.8133 ∼ 81.3%.

Come si vede, le probabilita di vincere qualcosa sono estremamente basse, mentre deci-samente elevata e quella di perdere una “bella cifretta”!

(12) Procedere come nell’esercizio precedente.

(13) Anzitutto occorre calcolare la probabilita con cui al lancio di un dado esce una dellefacce diverse dalla 1. Nel testo si dice che la faccia 1 ha probabilita 1/3, quindi resta unaprobabilita pari a 1− 1/3 = 2/3 da spartirsi tra le altre facce. Dato che il testo affermache esse sono equiprobabili, a ciascuna di esse compete un quinto della loro probabilitatotale, e quindi le facce 2, 3, 4, 5, 6 hanno tutte probabilita pari a 1/5 · 2/3 = 2/15.L’esperimento consiste pero nel lancio indipendente di due dadi: le probabilita appenacalcolate vanno quindi intese come probabilita marginali associate ad una probabilitacongiunta ancora da calcolarsi, e che rappresentiamo nella solita forma a tabella:

dado 1 \ dado 2 1 2 3 4 5 6 Marginale dado 11 1/32 2/153 2/154 2/155 2/156 2/15

Marginale dado 2 1/3 2/15 2/15 2/15 2/15 2/15

Dato che i lanci sono indipendenti, la probabilita congiunta e data dal prodotto dellemarginali, per cui la tabella si completa nel modo seguente

dado 1 \ dado 2 1 2 3 4 5 6 Marginale dado 11 1/9 2/45 2/45 2/45 2/45 2/45 1/32 2/45 4/225 4/225 4/225 4/225 4/225 2/153 2/45 4/225 4/225 4/225 4/225 4/225 2/154 2/45 4/225 4/225 4/225 4/225 4/225 2/155 2/45 4/225 4/225 4/225 4/225 4/225 2/156 2/45 4/225 4/225 4/225 4/225 4/225 2/15

Marginale dado 2 1/3 2/15 2/15 2/15 2/15 2/15

La somma dei valori della coppia vale 7 solo per le seguenti coppie:

(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1)15

Page 16: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Quindi la probabilita cercata e

p(′′a + b = 7′′) = p((1, 6)) + p((2, 5)) + p((3, 4)) + p((4, 3)) + p((5, 2)) + p((6, 1))

= 2/45 + 4/225 + 4/225 + 4/225 + 4/225 + 2/45

= 4/25.

(14) Sia N = 10000, il numero di lampadine vendute, e sia p = 1/1000 la probabilita di ognisingola lampadina di essere guasta. Immaginiamo di fare effettivamente il controllo ditutto il lotto di lampadine e di indicare con X1 la variabile aleatoria che assume il valore1 se la prima lampadina e guasta, 0 se la prima lampadina e non guasta. Analogamentecon X2 indica la variabile aleatoria che assume il valore 1 se la seconda lampadina eguasta, 0 se la seconda lampadina e non guasta, e cosı via: Xn vale 1 se la lampadinanumero n e guasta, 0 altrimenti. Quindi ogni Xn assume due soli valori, 1 e 0, ed haprobabilita pari a p di assumere il valore 1.

In questo schema, il numero totale di lampadine guaste e rappresentato dalla somma

S =N∑

n=1

Xn.

Osserviamo che le Xn sono N variabili aleatorie identiche (stessa distribuzione di proba-bilita) e tra loro indipendenti (il fatto che la lampadina numero 6 sia guasta o no non hainfluenza sul fatto che lo sia o meno la lampadina numero 17). Dai principi generali sap-piamo che S e una variabile aleatoria i cui valori sono distribuiti secondo una binomialecon parametri N e p, e che quindi la probabilita che cerchiamo e

p(S > 15) =N∑

n=16

(N

n

)pn(1− p)N−n =

10000∑n=16

(10000

n

)(1/1000)n(999/1000)10000−n.

La formula precedente, seppur corretta, e assolutamente intrattabile: contiene ben 9985addendi, ciascuno dei quali e dato un prodotto tra un numero molto grande (il binomiale(10000500

)ad esempio vale circa 102000 e quindi e un intero con circa 2000 cifre in rappre-

sentazione decimale) ed uno invece molto piccolo (il prodotto della probabilita). Perpoter eseguire effettivamente il calcolo avremmo dunque bisogno di poter rappresentarecirca 10000 numeri e ciascuno con almeno 2000 cifre decimali esatte (in realta ne servonomolte di piu). Evidentemente occorre escogitare qualcosa di meglio. Osserviamo che

M [S] = Np = 10000 ·1/1000 = 10, Var[S] = Np(1−p) = 10000 ·1/1000 ·999/1000 = 999/100,

e che quindi entrambi questi parametri sono ben maggiori di 5. Come abbiamo osservatoprecedentemente la variabile S e somma di variabili aleatorie identicamente distribuiteed indipendenti; possiamo quindi applicare il Teorema del Limite Centrale (o meglio,un suo corollario) che mostra che quando i parametri M [S] e Var[S] sono maggiori di5, il calcolo puo essere condotto come se S fosse distribuita come una normale: l’erroreche cosı si commette (inevitabile dato che in realta S e distribuito come una binomiale)e sicuramente inferiore a 0.01%. Supponendo dunque S distribuito come una normale,abbiamo

p(S > 15) = p(S −M [S]√

Var[S]>

15− 10√999/100

)

= p(S −M [S]√

Var[S]> 1.582) = 1− Φ(1.58) = 1− 0.943 ∼ 5.7%.

16

Page 17: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(15) Si procede come nell’esercizio precedente, solo che ora si deve calcolare p(S ≥ 20) ep(S ≥ 40). Usando ancora il Teorema del Limite Centrale abbiamo:

p(S ≥ 20) = p(S −M [S]√

Var[S]≥ 20− 10√

999/100)

= p(S −M [S]√

Var[S]≥ 3.163) = 1− Φ(3.163) = 1− 0.9992 ∼ 0.1%.

Analogamente

p(S > 40) = p(S −M [S]√

Var[S]≥ 40− 10√

999/100)

= p(S −M [S]√

Var[S]≥ 9.49) = 1− Φ(9.49) < 1− 0.999995 ∼ 5 · 10−6.

Gia nel primo caso, quindi, ma a maggior ragione nel secondo, ci troviamo con un dilem-ma: l’evento che si e prodotto, piu di 20 lampadine guaste, e estremamente improbabile,quindi o crediamo al venditore, ma allora dobbiamo pensare di essere stati estremamen-te sfortunati, o non crediamo piu al venditore (egli dichiara che la probabilita di essereguasta per ogni lampadina e 1/1000, ma forse l’evento e molto piu probabile...)

(16) Sia N = 1000, il numero di test eseguiti, e sia p = 1/100 la probabilita che ogni singolotest fornisca un dato errato. Immaginiamo di fare effettivamente tutti gli N test edindichiamo con Xn la variabile aleatoria che assume il valore 1 se il test numero n hafornito il risultato scorretto, 0 se invece ha dato il risultato corretto: tutto cio ovviamenteper n = 1, 2, 3, · · · , N .

In questo schema, il numero totale di test errati e rappresentato dalla variabile alea-toria

S =N∑

n=1

Xn.

Osserviamo che le Xn sono N variabili aleatorie identiche (stessa distribuzione di proba-bilita) e tra loro indipendenti (il fatto che il test numero 6 fornisca la risposta errata nonha influenza sul fatto che lo stesso accada o meno per il test numero 107). Dai princıpigenerali sappiamo che S e una variabile aleatoria i cui valori sono distribuiti secondouna binomiale con parametri N e p e che quindi la probabilita che cerchiamo e

p(S ≥ 8) =N∑

n=8

(N

n

)pn(1− p)N−n =

1000∑n=8

(1000

n

)(1/100)n(99/100)1000−n.

La formula precedente, seppur corretta, e assolutamente ineseguibile (anche su un PC):evidentemente occorre escogitare qualcosa di meglio. Osserviamo che

M [S] = Np = 1000 · 1/100 = 10, Var[S] = Np(1− p) = 1000 · 1/100 · 99/100 = 9.9,

e che quindi entrambi questi parametri sono ben maggiori di 5. Come abbiamo osservatoprecedentemente la variabile S e somma di variabili aleatorie identicamente distribuiteed indipendenti; possiamo quindi applicare il Teorema del Limite Centrale (o meglio,un suo corollario) che mostra che quando i parametri M [S] e Var[S] sono maggiori di5, il calcolo puo essere condotto come se S fosse distribuita come una normale: l’erroreche cosı si commette (inevitabile dato che in realta S e distribuito come una binomiale)e sicuramente inferiore a 1%. Supponendo dunque S distribuito come una normale,abbiamo

p(S ≥ 8) = p(S −M [S]√

Var[S]≥ 8− 10√

9.9)

= p(S −M [S]√

Var[S]≥ −0.63) = Φ(0.63) = 0.7357 ∼ 73.5%.

17

Page 18: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(17) Indichiamo con + il fatto che il test abbia dato esito positivo e con − il fatto che il testabbia dato esito negativo. Indichiamo poi con m il fatto che il paziente sia malato, e cons il fatto che non lo sia. Lo spazio campionario da considerare e quindi bidimensionale:

Test \ Salute m s+-

Il testo fornisce quindi i seguenti dati: p(m) = 1/10 (probabilita di essere malato pari ad1/10), p(+|m) = 99/100 (probabilita che su un paziente malato il test risulti positivo)ed infine p(+|s) = 5/100 (probabilita che su un paziente sano il test risulti positivo).Conoscere p(m) significa conoscere una delle probabilita marginali:

Test \ Salute m s Marginale Test+-

Marginale Salute .1

Il fatto che le marginali siano delle particolari distribuzioni di probabilita dice subito chep(s) = 1− p(m) = .9. Aggiungiamo questo dato alla tabella

Test \ Salute m s Marginale Test+-

Marginale Salute .1 .9

Ora utilizziamo le informazioni sulle probabilita condizionate: dal fatto che p(+|m) =99/100 e dalla definizione di probabilita condizionata segue che

p((+,m)) = p(+|m) · p(m) = 99/100 · 1/10 = 99/1000.

Dal fatto che p(+|s) = 5/100 ricaviamo che

p((+, s)) = p(+|s) · p(s) = 5/100 · 0.9 = 45/1000.

Aggiungiamo anche questi dati alla tabella

Test \ Salute m s Marginale Test+ 99/1000 45/1000-

Marginale Salute 0.1 0.9

Guardando la tabella precedente, si vede come in ogni colonna manchi un solo dato; tut-tavia i dati di ogni colonna devono fornire la probabilita marginale riportata nella riga in-feriore, quindi possiamo ricavare p((−,m)) = p(m)−p((+,m)) = .1−99/1000 = 1/1000,ed analogamente p((−, s)) = p(s)−p((+, s)).9−45/1000 = 855/1000. Riportiamo anchequesti dati nella tabella

Test \ Salute m s Marginale Test+ 99/1000 45/1000- 1/1000 855/1000

Marginale Salute 0.1 0.9

Ora possiamo anche calcolare le altre probabilita marginali, come somma sulle righe:

18

Page 19: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Test \ Salute m s Marginale Test+ 99/1000 45/1000 144/1000- 1/1000 855/1000 856/1000

Marginale Salute 0.1 0.9

Possiamo ora rispondere alle domande postea) Si chiede di calcolare la probabilita di una diagnosi corretta, ovvero che il test risulti

positivo su un paziente effettivamente malato oppure che il test risulti negativo su unpaziente effettivamente sano. In formule si tratta di calcolare

p((+,m)) + p((−, s)) = 99/1000 + 855/1000 = 954/1000 ∼ 95.4%.

b) Si chiede di calcolare la probabilita che, dato un test negativo, il paziente sia difatto malato. In formule si tratta di calcolare la probabilita condizionata p(m|−). Dallasua definizione segue

p(m|−) =p((−,m))

p(−)=

1/1000856/1000

=1

856∼ .0011 = .11%.

(18) Perche la funzione possa essere pensata come densita di probabilita e necessario che∫ π/2

0(α sin(x)− sin(2x)) dx = 1.

Calcolando l’integrale si ottiene una semplice equazione per α la cui soluzione e α = 2.Si osservi che pero l’esercizio non e finito qui: dobbiamo controllare che quando α = 2 ivalori della funzione sono non negativi per ogni x ∈ [0, π/2]. Questo e vero, ma saprestedimostrarlo? Come?

(19) L’esercizio chiede di calcolare p(B|A). Visti i dati forniti, e abbastanza chiaro che primao poi si dovra usare la formula di Bayes. Per maggiore chiarezza conviene ricostruire laformula man mano che si eseguono i calcoli. Osserviamo che

p(B|A) =p(B ∩A)

p(A)=

p(B ∩A)p(A ∩B) + p(A ∩Bc)

.

La prima di queste relazioni e la definizione di probabilita condizionata, la seconda derivadal fatto che B,Bc e una partizione dello spazio campionario. Sempre dalla definizionedi probabilita condizionata abbiamo che

p(A ∩B) = p(A|B)p(B), p(A ∩Bc) = p(A|Bc)p(Bc),

quindi

p(B|A) =p(A|B)p(B)

p(A|B)p(B) + p(A|Bc)p(Bc).

(La formula appena scritta e proprio la formula di Bayes). Per calcolare p(Bc) e p(A|Bc),osserviamo che valgono le relazioni seguenti:

p(B) + p(Bc) = 1, p(A|Bc) + p(Ac|Bc) = 1,

la cui validita deriva dal fatto che p(·) e p(·|Bc) sono delle probabilita sullo spaziocampionario Ω. Di conseguenza si ha:

p(B|A) =p(A|B)p(B)

p(A|B)p(B) + (1− p(Ac|Bc))(1− p(Bc))=

0.95 · 0.050.95 · 0.05 + (1− 0.95)(1− 0.05)

=12.

Come si vede il risultato e abbastanza sbalorditivo: la probabilita che il componente siadifettoso veramente, posto che lo strumento lo segnali come tale, e solo 50%! Significache lo strumento non e poi cosı eccezionale come sembrava dalle alte probabilita datenel testo per p(A|B) (probabilita che lo strumento segnali effettivamente un componentedifettoso) e per p(Ac|Bc) (probabilita che lo strumento non segnali come difettoso uncampione che non lo e).

19

Page 20: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(20) Si tratta di un esercizio il cui impianto logico e gia stato discusso (ad esempio negliesercizi 14 e 15). In sostanza, per ogni n = 1, 2, 3, · · · , 400 sia Xn la variabile aleatoriail cui valore e 1 se la pagina numero n presenta qualche errore, altrimenti vale 0. Ivalori di Xn sono quindi solo 1 e 0, e la probabilita p(Xn = 1) e pari a 0.2, standoa quanto e detto nel testo. Evidentemente possiamo pensare alle variabili Xn comea variabili indipendenti (la presenza di errori in una data pagina non influenza lapresenza di errori in una pagina diversa). Questo sara particolarmente utile in seguito.Sia S :=

∑400n=1 Xn. Questa variabile aleatoria conta il numero totale di pagine che

contengono qualche errore. Sotto le ipotesi precedenti sappiamo che S e distribuitacome una binomiale con parametri N = 400 e p = 0.2. Cio che il testo chiede e ilnumero p(S ≤ 70). Quindi:

p(S ≤ 70) =70∑

n=0

p(S = n) =70∑

n=0

(N

n

)pn(1− p)N−n =

70∑n=0

(400n

)(0.2)n(0.8)400−n.

Purtroppo questa formula non e di agevole calcolo; cerchiamo quindi di calcolarne ilvalore in modo approssimato. Osserviamo che

M [S] = N · p = 400 · 0.2 = 80, Var[S] = N · p · (1− p) = 400 · 0.2 · 0.8 = 64.

Entrambi i parametri sono evidentemente maggiori di 5. Per il Teorema del LimiteCentrale (ed il suo corollario) sappiamo che sotto queste condizioni possiamo trattare Scome se fosse distribuito come una normale (cosa che evidentemente non e visto che euna binomiale), sapendo che cosı facendo introduciamo un errore che e inferiore a 1%nella probabilita. Grazie a questa osservazione abbiamo

p(S ≤ 70) = p(S −M [S]√

Var[S]≤ 70− 80√

64)

= p(S −M [S]√

Var[S]≤ −1.25) = 1− Φ(1.25) = 1− 0.8944 ∼ 10.5%.

(21) Dato che si lanciano in modo indipendente due dadi di 4 facce ciascuno, e sicuramenteconveniente pensare ad uno spazio campionario Ω composto dalle 4 · 4 = 16 possibilicombinazioni:

X\Y 1 2 3 41234

Dato che i dadi sono assunti non truccati (altrimenti si direbbe in che cosa consiste iltrucco), le facce sono equiprobabili, quindi le marginali sono

X\Y 1 2 3 4 Marginale X1 1/42 1/43 1/44 1/4

Marginale Y 1/4 1/4 1/4 1/4

e visto che i lanci sono indipendenti, le probabilita congiunte sono date dal prodottodelle rispettive marginali, ovvero

20

Page 21: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

X\Y 1 2 3 4 Marginale X1 1/16 1/16 1/16 1/16 1/42 1/16 1/16 1/16 1/16 1/43 1/16 1/16 1/16 1/16 1/44 1/16 1/16 1/16 1/16 1/4

Marginale Y 1/4 1/4 1/4 1/4

Siamo ora in grado di individuare lo spazio campionario per la coppia di variabili U, V .Evidentemente U assume i valori 1, 2, 3, 4, mentre V assume i valori 0, 1, 2, 3, quindi lospazio campionario per questa coppia e Ω′ dato dalla seguente tabella:

U\V 0 1 2 31234

Per ciascuno degli eventi della coppia (X, Y ) rintracciamo il corrispondente evento (U, V ):

(X = 1, Y = 1) =⇒ (U = 1, V = 0), (X = 3, Y = 1) =⇒ (U = 1, V = 2),

(X = 1, Y = 2) =⇒ (U = 1, V = 1), (X = 3, Y = 2) =⇒ (U = 2, V = 1),

(X = 1, Y = 3) =⇒ (U = 1, V = 2), (X = 3, Y = 3) =⇒ (U = 3, V = 0),

(X = 1, Y = 4) =⇒ (U = 1, V = 3), (X = 3, Y = 4) =⇒ (U = 3, V = 1),

(X = 2, Y = 1) =⇒ (U = 1, V = 1), (X = 4, Y = 1) =⇒ (U = 1, V = 3),

(X = 2, Y = 2) =⇒ (U = 2, V = 0), (X = 4, Y = 2) =⇒ (U = 2, V = 2),

(X = 2, Y = 3) =⇒ (U = 2, V = 1), (X = 4, Y = 3) =⇒ (U = 3, V = 1),

(X = 2, Y = 4) =⇒ (U = 2, V = 2), (X = 4, Y = 4) =⇒ (U = 4, V = 0).

Per ottenere la probabilita nella tabella (U, V ) occorre quindi sommare sulle probabilitadi tutti gli eventi corrispondenti nella tabella (X, Y ). Ad esempio l’evento (U = 1, V = 2)e prodotto sia da (X = 1, Y = 3) che da (X = 3, Y = 1), quindi

p(U = 1, V = 2) = p(X = 1, Y = 3) + p(X = 3, Y = 1) = 1/16 + 1/16 = 1/8.

Procedendo in questo modo si ottiene

U\V 0 1 2 31 1/16 1/8 1/8 1/82 1/16 1/8 1/8 03 1/16 1/8 0 04 1/16 0 0 0

Per poter stabilire se U, V sono non correlate occorre anzitutto calcolare le marginali diU e V e poi utilizzare queste distribuzioni per ottenere M [U ] e M [V ]. Abbiamo

U\V 0 1 2 3 Marginale U1 1/16 1/8 1/8 1/8 7/162 1/16 1/8 1/8 0 5/163 1/16 1/8 0 0 3/164 1/16 0 0 0 1/16

Marginale V 1/4 3/8 1/4 1/821

Page 22: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

e quindi

M [U ] =∑

u valore di U

u · p(U = u) = 1 · 7/16 + 2 · 5/16 + 3 · 3/16 + 4 · 1/16 = 15/8,

M [V ] =∑

v valore di V

v · p(V = v) = 0 · 1/4 + 1 · 3/8 + 2 · 1/4 + 3 · 1/8 = 5/4.

Ora possiamo calcolare la covarianza di U e V .

Cov(U, V ) =∑

u valore di Uv valore di V

(u−M [U ])(v −M [V ]) · p(U = u, V = v) = . . . = −15/32.

Dato che Cov(U, V ) 6= 0, le variabili sono correlate.

(22) Lo schema e quello ormai ben noto (esercizi 14,15,20), ma con una piccola variazioneinteressante. Sia p = 0.2 la probabilita di ogni seme di essere sterile. Sia S il numerototale di semi sterili in un campione di N = 50 semi. Quello che si vuole calcolare ep(S > 1). Osserviamo che S e distribuito come una binomiale con parametri N , p, equindi possiamo scrivere

p(S > 1) =50∑

n=2

p(S = n) =50∑

n=2

(N

n

)pn(1− p)N−n =

50∑n=2

(50n

)(0.2)n(0.8)50−n.

Questa somma e troppo complessa per poter essere eseguita effettivamente. Fortunata-mente pero non ce ne e alcun bisogno! Infatti possiamo osservare che

p(S > 1) + p(S ≤ 1) = 1

poiche gli eventi S > 1 ed S ≤ 1 sono complementari, e quindi

p(S > 1) = 1− p(≤ 1) = 1− p(S = 0)− p(S = 1)

= 1−(

500

)(0.2)0(0.8)50−0 −

(501

)(0.2)1(0.8)50−1

= 1− 1 · 1 · (0.8)50 − 50 · 0.2 · (0.8)49

∼ 0.9998 = 99.98%.

(23) Dire che la moneta equilibrata significa dire che Testa e Croce sono equiprobabili e chequindi hanno entrambi probabilita 1/2. Cio che si chiede di calcolare e la probabilitadella sequenza CCCT . Siccome i lanci sono tra loro indipendenti la probabilita congiuntae data dal prodotto delle probabilita marginali e quindi

p(CCCT ) = p(lancio 1=C, lancio 2=C, lancio 3=C, lancio 4=T)

= p(lancio 1=C) · p(lancio 2=C) · p(lancio 3=C) · p(lancio 4=T)

= 1/2 · 1/2 · 1/2 · 1/2 = 1/16.

(24) Alla prima estrazione c’e ua probabilita pari a 4/6 di estrarre una palla bianca, ov-vero p(prima = bianca) = 4/6. Posto che alla prima estrazione si sia estratta unapallina bianca, alla seconda estrazione sono rimaste 3 palline bianche su un totale di5, quindi p(seconda=bianca | prima = bianca) = 3/5. Cio che si chiede di calcolare ep(seconda=bianca , prima = bianca) che dalla definizione di probabilita condizionatarisulta essere uguale a:

p(seconda=bianca,prima=bianca) = p(seconda=bianca|prima=bianca) · p(prima=bianca)

= 3/5 · 4/6 = 2/5.

22

Page 23: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(25) Osserviamo che X2 assume solo i valori 0, 1. Lo spazio campionario per la coppia X, X2

e quindi il seguente:

X\X2 0 1-101

Il testo dice che i valori di X sono equiprobabili quindi a ciascuno di essi competeprobabilita 1/3, che nella tabella precedente compaiono come marginali di X:

X\X2 0 1 Marginale X-1 1/30 1/31 1/3

Dato che

X = −1 =⇒ X2 = 1, X = 0 =⇒ X2 = 0, X = 1 =⇒ X2 = 1,

quindi nella tabella compaiono sicuramente i seguenti zeri:

X\X2 0 1 Marginale X-1 0 1/30 0 1/31 0 1/3

Le altre caselle rimaste incognite possono essere determinate dal fatto che le marginalisu X sono le somme sulle righe:

X\X2 0 1 Marginale X-1 0 1/3 1/30 1/3 0 1/31 0 1/3 1/3

Possiamo quindi calcolare le probabilita su X2:

X\X2 0 1 Marginale X-1 0 1/3 1/30 1/3 0 1/31 0 1/3 1/3

Marginale X2 1/3 2/3

Le probabilita di X condizionate da X2 = 1 sono quindi:

p(X = −1|X2 = 1) = p(X = −1, X2 = 1)/p(X2 = 1) =1/32/3

=12,

p(X = 0|X2 = 1) = p(X = 0, X2 = 1)/p(X2 = 1) = 0,

p(X = 1|X2 = 1) = p(X = 1, X2 = 1)/p(X2 = 1) =1/32/3

=12.

23

Page 24: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(26) Si tratta di calcolare la seguente somma:

p(prima=bianca, seconda=rossa) + p(prima=rossa, seconda=bianca).

Date che le estrazioni avvengono in due contenitori distinti, e sicuramente lecito imma-ginare che le estrazioni siano indipendenti e che quindi

p(prima=bianca, seconda=rossa) = p(prima=bianca) · p(seconda=rossa)

p(prima=rossa, seconda=bianca) = p(prima=rossa) · p(seconda=bianca).

Nella prima urna vi sono in tutto 4 palle, una sola delle quali e bianca, quindi

p(prima=bianca) = 1/4, p(prima=rossa) = 3/4.

Nella seconda urna vi sono in tutto 4 palle, una sola delle quali e rossa, quindi

p(seconda=bianca) = 3/4, p(seconda=rossa) = 1/4.

Concludendo,

p(prima=bianca, seconda=rossa)+p(prima=rossa, seconda=bianca) = 1/4·1/4+3/4·3/4 = 5/8.

(27) Per ipotesi gli eventi A e B sono indipendenti, quindi p(A ∩B) = p(A) · p(B). Quindi

p(B) =p(A ∩B)

p(A)=

0.20.5

= 0.4.

(28) Sappiamo che p(A∪B) = p(A) + p(B)− p(A∩B). Per ipotesi A e B sono indipendenti,quindi p(A ∩B) = p(A) · p(B) cosı che

p(A ∪B) = p(A) + p(B)− p(A) · p(B).

L’indipendenza di A e B implica anche che P (B|A) = p(A ∩B)/p(A) = p(B), quindi leipotesi danno p(A) = p(B) = 0.5 e la formula precedente da

p(A ∪B) = 0.5 + 0.5− 0.5 · 0.5 = 0.75.

(29) Si risolve con lo stesso metodo usato per l’esercizio 17.

(30) Si risolve con lo stesso metodo usato per l’esercizio 21.

(31) Sappiamo che quando i valori di X sono distribuiti come una binomiale con parametriN e p, il valor medio di X e M [X] = Np e la sua varianza e Var[X] = Np(1 − p). Diconseguenza

(1− p) =Np(1− p)

Np=

Var[X]M [X]

=45.

Quindi p = 1 − 4/5 = 1/5. Ora che p e noto, ricaviamo N da N = Np/p = M [X]/p =5/(1/5) = 25.

(32) Sappiamo che quando i valori di X sono distribuiti come una distribuzione di Poisson,allora p(X = n) = e−λλn/n!. Di conseguenza

p(X = 0) = e−λλ0/0! = e−λ, p(X = 1) = e−λλ1/1! = e−λλ,

quindi

λ =e−λλ

e−λ=

p(X = 1)p(X = 0)

= 1.

Infine, sappiamo che per le distribuzioni di Poisson M [X] = Var[X] = λ, quindi in questocaso entrambe valgono 1.

24

Page 25: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

(33) Siccome non c’e reimmissione, le uniche possibili estrazioni sono le seguenti:

Prima Seconda1 21 32 12 33 13 2

(mancano cioe le estrazioni (1, 1), (2, 2), (3, 3)). Questi eventi sono tra loro equiprobabilie quindi hanno ciascuno probabilita 1/6. Per ciascuno di essi calcoliamo il valore dellacorrispondente coppia (X, Y ):

(Prima = 1, seconda = 2) =⇒ (X = 1, Y = 2),

(Prima = 1, seconda = 3) =⇒ (X = 1, Y = 3),

(Prima = 2, seconda = 1) =⇒ (X = 2, Y = 2),

(Prima = 2, seconda = 3) =⇒ (X = 2, Y = 3),

(Prima = 3, seconda = 1) =⇒ (X = 3, Y = 3),

(Prima = 3, seconda = 2) =⇒ (X = 3, Y = 3).

Nello spazio campionario Ω per la coppia X, Y , quindi, non accadono mai gli eventi(X = 1, Y = 1), (X = 2, Y = 1), (X = 3, Y = 1), (X = 3, Y = 2) che quindi avrannoprobabilita 0. Gli altri avranno la probabilita che deriva dalla precedente tabella equindi:

X\Y 1 2 31 0 1/6 1/62 0 1/6 1/63 0 0 1/3

Che completata con le marginali diventa

X\Y 1 2 3 Marginale X1 0 1/6 1/6 1/32 0 1/6 1/6 1/33 0 0 1/3 1/3

Marginale Y 0 1/3 2/3

Da questa tabella e dalla definizione di probabilita condizionata segue poi che

p(X = 1|Y = 3) =p(X = 1, Y = 3)

p(Y = 3)=

1/62/3

= 0.25.

(34) Si tratta di stabilire se nel caso in esame vale la relazione p(A ∩ B) = p(A)p(B). Dap(Bc) = 6/7 ricaviamo che

p(B) = 1− p(Bc) = 1− 6/7 = 1/7.

Dalla definizione di probabilita condizionata secondo cui p(A|B) = p(A ∩ B)/p(B)ricaviamo

p(A ∩B) = p(A|B)P (B) = 1/3 · 1/7 = 1/21.

Infine, dalla relazione p(A ∪B) = p(A) + p(B)− p(A ∩B) otteniamo

p(A) = p(A ∪B)− P (B) + p(A ∩B) = 1/2− 1/7 + 1/21 = 17/42.

Dato chep(A ∩B) = 1/21 6= 17/42 · 1/7 = p(A)p(B)

25

Page 26: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

concludiamo che gli eventi A e B non sono indipendenti.

(35) Anzitutto occorre trovare le probabilita con cui le facce del dado possono apparire. In-dichiamo con p la probabilita della faccia 5. Le informazioni fornite sul dado consentonodi affermare che:

p(′1′) = p(′2′) = p(′3′) = p(′4′) = 3p, p(′5′) = p(′6′) = p(′7′) = p(′8′) = p.

Il valore di p puo essere determinato osservando che per definizione di probabilita deveessere

1 = p(′1′) + p(′2′) + p(′3′) + p(′4′) + p(′5′) + p(′6′) + p(′7′) + p(′8′) = 4 · 3p + 4p = 16p,

da cui p = 1/16, e quindi

p(′1′) = p(′2′) = p(′3′) = p(′4′) = 3/16, p(′5′) = p(′6′) = p(′7′) = p(′8′) = 1/16.

Sia ora G la variabile aleatoria che misura la somma vinta del banco (e quindi persadal giocatore) ad ogni partita. Il banco vince quando esce 1, 2, 3 o 5 e quindi la suaprobabilita di vincere e

p(′banco vince′) = p(′1′) + p(′2′) + p(′3′) + p(′5′) = 10/16.

e quindip(′banco perde′) = 1− p(′banco vince′) = 6/16.

Quando vince, il banco vince 10 Euro, mentre quando perde esso perde X Euro. Diconseguenza G e la variabile aleatoria che assume i seguenti valori:

G =

10 con probabilita 10/16X con probabilita 6/16.

La vincita media (ovvero la media di G) e quindi pari a M [G] = 10 · 10/16 + X · 6/16,ma per ipotesi la vincita media e 0, quindi

0 = M [G] = 10 · 10/16 + X · 6/16 =⇒ X = −100/6 ≈ −16.7.

Il gioco e dunque equo se il banco e disposto a pagare 16.7 Euro ad ogni vincita (delconcorrente).

(36) Per comodita e bene introdurre la seguente nomenclatura:

B = allagamento, A = oblo criccato, Ac = filtro sporco.

Si osservi che gli eventi A e Ac sono effettivamente i complementari uno dell’altro dato cheper ipotesi non vi sono altre possibili cause d’allagamento. Usando queste convenzioni idati del problema sono quindi:

p(A) = 0.2, probabilita di una cricca

p(B|A) = 0.9, probabilita che una cricca provochi l’allagamento

p(B|Ac) = 0.3 probabilita che il filtro sporco provochi l’allagamento.

Quello che si chiede di valutare e quindi semplicemente

p(Ac|B) = probabilita che l’allagamento sia dovuto al filtro sporco.

Usando la formula di Bayes si ha:

p(Ac|B) =p(B|Ac)p(Ac)

p(B|Ac)p(Ac) + p(B|(Ac)c)p((Ac)c)

=p(B|Ac)p(Ac)

p(B|Ac)p(Ac) + p(B|A)p(A)

=0.3 · (1− 0.2)

0.3 · (1− 0.2) + 0.9 · 0.2≈ 0.57.

26

Page 27: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

V’e quindi un 57% di probabilita che l’allagamento sia dovuto al filtro, mentre la pro-babilita che esso sia dovuto all’oblo difettoso e pari al 47% circa (quindi, in caso diallagamento, dopo aver tolto la tensione all’impianto elettrico conviene anzituttodare un’occhiata al filtro della lavatrice).

(37) Per essere una densita e necessario che la funzione sia continua a tratti ed a valori non-negativi; cio accade per ogni valore di c ≥ 0. Perche sia una densita su [0, 1] e dunquenecessario e sufficiente che l’integrale di f su [0, 1] valga 1. Quindi

1 =∫ 1

0f(x) dx =

∫ 1/2

0c√

x dx +∫ 1

1/2c√

1− x dx = c23x3/2

∣∣∣1/2

0− c

23(1− x)3/2

∣∣∣11/2

=2c

3x3/2

∣∣∣1/2

0− 2c

3(1− x)3/2

∣∣∣11/2

=2c

3(1/2)3/2 +

2c

3(1/2)3/2

e quindi

1 =4c

3(1/2)3/2

da cui c = 3/√

2.La media di f per tale valore di c e quindi

µ =∫ 1

0xf(x) dx =

3√2

∫ 1/2

0x√

x dx +3√2

∫ 1

1/2x√

1− x dx

=3√2

∫ 1/2

0x3/2 dx +

3√2

∫ 1/2

0(1− t)

√t dt =

3√2

25x5/2

∣∣∣1/2

0+

3√2

(23t3/2 − 2

5t5/2

)∣∣∣1/2

0

=12.

Si osservi che il fatto che µ sia uguale ad 1/2 era prevedibile fin dall’inizio, dato che ladensita di probabilita e simmetrica attorno al valore 1/2.Calcoliamo ora la varianza:

σ2 =∫ 1

0x2f(x) dx− µ2 =

3√2

∫ 1/2

0x2√x dx +

3√2

∫ 1

1/2x2√

1− x dx− µ2

=3√2

∫ 1/2

0x5/2 dx +

3√2

∫ 1/2

0(1− t)2

√t dt− µ2

=3√2

27x7/2|1/2

0 +3√2

(23t3/2 − 2 · 2

5t5/2 +

27t7/2

)∣∣∣1/2

0− µ2

=3√2

27(1/2)7/2 +

3√2

(23(1/2)3/2 − 2 · 2

5(1/2)5/2 +

27(1/2)7/2

)− µ2

=235

.

(38) Le probabilita marginali sono:X\Y -2 0 2

-1 1/8 1/8 1/8 3/82 1/8 3/8 1/8 5/8

1/4 1/2 1/4e quindi

M [X] = −1 · 38

+ 2 · 58

=78,

M [Y ] = −2 · 14

+ 0 · 12

+ 2 · 14

= 0,

M [2X − 3Y ] = 2M [X]− 3M [Y ] = 2 · 78− 3 · 0 =

74.

27

Page 28: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Per il calcolo della covarianza, usiamo la formula Cov[X, Y ] = M [XY ] − M [X]M [Y ];quindi

M [XY ] = (−1) · (−2) · 18

+ (−1) · (2) · 18

+ (2) · (−2) · 18

+ (2) · (2) · 18

= 0

segue che Cov[X, Y ] = M [XY ]−M [X]M [Y ] = 0− 78 · 0 = 0 e che quindi X, Y sono non

correlate. Dalla formula Var[X + Y ] = Var[X] + Var[Y ] + 2 Cov[X, Y ] si ha poi:

Var[X] = M [X2]− (M [X])2 =[12 · 3

8+ 22 · 5

8

]−

(78

)2=

13564

,

Var[Y ] = M [Y 2]− (M [Y ])2 =[(−2)2 · 1

4+ 22 · 1

4

]= 2,

Var[X + Y ] = Var[X] + Var[Y ] + 2 Cov[X, Y ] =13564

+ 2 =26364

.

Infine, dal fatto che

p(X = −1) · p(Y = −2) =38· 14

=332

6= 18

= p(X = −1, Y = −2)

segue che X ed Y non sono indipendenti.

(39) I dati del problema possono essere riassunti nella seguente lista di informazioni:

p(W guasto |“causa A”) = 0.1,

p(W guasto |“causa B”) = 0.4,

p(W guasto |“causa C”) = 0.6,

e che

p(“causa A”) = 0.5, p(“causa B”) = 0.4 .

Visto che le cause possibili sono solo tre, si ha

p(“causa A”) + p(“causa B”) + p(“causa C”) = 1

e quindi la probabilita dell’evento “causa C” e pari a

p(“causa C”) = 1− 0.5− 0.4 = 0.1 .

Per affrontare la risoluzione dal guasto conviene partire dalla causa che si rivela piuprobabile una volta tenuto conto che W e guasto. Cio significa che conviene partireda quella causa x tra A, B, C in corrispondenza delle quali p(“causa x”|W guasto ) emassima. Per calcolare tali probabilita usiamo la formula di Bayes, cosı che

p(“causa A”|W guasto )

=p(W guasto |“A”) · p(“A”)

p(W guasto |“A”) · p(“A”) + p(W guasto |“B”) · p(“B”) + p(W guasto |“C”) · p(“C”)

=0.1 · 0.5

0.1 · 0.5 + 0.4 · 0.4 + 0.6 · 0.1≈ 0.185 = 18.5%,

p(“causa B”|W guasto )

=p(W guasto |“B”) · p(“B”)

p(W guasto |“A”) · p(“A”) + p(W guasto |“B”) · p(“B”) + p(W guasto |“C”) · p(“C”)

=0.4 · 0.4

0.1 · 0.5 + 0.4 · 0.4 + 0.6 · 0.1≈ 0.592 = 59.2%,

28

Page 29: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

p(“causa C”|W guasto )

=p(W guasto |“C”) · p(“C”)

p(W guasto |“A”) · p(“A”) + p(W guasto |“B”) · p(“B”) + p(W guasto |“C”) · p(“C”)

=0.6 · 0.1

0.1 · 0.5 + 0.4 · 0.4 + 0.6 · 0.1≈ 0.222 = 22.2%.

Dai calcoli precedenti risulta che conviene supporre che il guasto sia dovuto alla causaB.

(40) Sia N il numero di perle pescate e sia p = 0.001 la probabilita che una data ostricacontenga una perla. Sia S il numero totale di perle: S e distribuito come una binomialedi parametri N e p. Il problema richiede di determinare N in modo che p(S ≥ 10) risulti≥ 0.3. Approssimiamo S ad una gaussiana (lo facciamo utilizzando il teorema del limitecentrale, riservandoci di verificare a posteriori che sussistano effettivamente le condizioniperche cio sia corretto) e scriviamo quindi

0.3 ≤ p(S ≥ 10) = p(S −M [S]√

Var[S]≥ 10−Np√

Np(1− p)) = 1− Φ(

10−Np√Np(1− p)

) .

La condizione sara quindi soddisfatta quando il valore di N sara tale da far sı che

Φ(10−Np√Np(1− p)

) ≤ 1− 0.3 = 0.7.

Dalle tabelle risulta che Φ(0.53) = 0.7, dalla monotonia della funzione Φ segue allorache N deve soddisfare la richiesta

10−Np√Np(1− p)

≤ Φ−1(0.7) = 0.53;

questa e una disequazione che va risolta in N . Osserviamo che la quantita 1 − p =1 − 0.001 ≈ 1, possiamo quindi semplificare un poco i calcoli necessari usando nelladisuguaglianza precedente l’approssimazione (1− p) ≈ 1, cosı che essa diventa

10−Np√Np

≈ 10−Np√Np(1− p)

≤ 0.53;

ovvero10−Np ≤ 0.53

√Np =⇒ Np + 0.53

√Np− 10 ≥ 0 .

Questa puo essere vista come una equazione di secondo grado in√

Np, cosı che risolven-dola si ha√Np ≤ −0.53−

√0.532 − 4 · 102

≈ −3.43,√

Np ≥ −0.53 +√

0.532 − 4 · 102

≈ 2.91.

Delle due soluzioni ovviamente solo la seconda e accettabile e da essa si ricava la stima

N ≥ 2.912/p = 8468.

Infine, osserviamo che per tali valori di N si ha M [S] = Np ≥ 8468 · 0.001 ≥ 8.46 edVar[S] = Np(1 − p) ≥ 8468 · 0.001 · 0.999 = 8.45: l’uso del teorema del limite centraleper l’approssimazione della binomiale appare quindi giustificato.In conclusione, perche la probabilita di avere almeno 10 perle sia almeno 0.3 e necessariopescare almeno 8468 ostriche.

(41) Stando a quei numeri non sorprenderebbe che qualcuno pensasse che e un rischio nontrascurabile. Del resto se la probabilita che una persona a caso in Italia possa esseremolestata e del 20% e il 10% degli assassini sono anche stalkers... In realta la risposta ela seguente. Schematizziamo la situazione:

Eventi:A: essere molestati (da Stalker), Ac: non essere molestatiB: essere uccisi, Bc: non essere uccisi

29

Page 30: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Dati:p(A) = 20%p(B) = 10−5 (Viminale)p(A|B) = 10% (gli stalker sono responsabili del 10% degli omicidi).

Si chiede di calcolare p(B|A) = probabilita che, posto di essere molestati, si venga uccisi.

p(A ∩B) = p(A|B)p(B) = 10−6

quindi

p(B|A) = p(B ∩A)/p(A) = 5 · 10−6

Stando a quei dati, la probabilita di essere uccisi da uno stalker e dello 0.0005%. Aveteletto bene, 5 su un milione. Il problema dello stalking e grave e pericoloso?

(42) La condizione 1 =∫Ω f(x)dx diventa 1 =

∫ 10 (3cx + 3c2x2)dx = 3

2 c + c2 la quale ha ledue soluzioni c = −2 e c = 1/2. Per c = −2 la funzione diventa f(x) = 12x2 − 6x chepero e negativa in (0, 1/2) e quindi non e una densita. Per c = 1/2 la funzione diventaf(x) = 3x/2 + 3x2/4 che e positiva in [0, 1] e continua (e un polinomio), quindi definisceeffettivamente una densita. Posto f(x) = 3x/2 + 3x2/4 si ha:

µ =∫

Ωxf(x)dx =

∫ 1

0x(3x/2 + 3x2/4) dx =

∫ 1

0(3x2/2 + 3x3/4) dx = 1/2 + 3/16 = 11/16.

Analogamente si ha

σ2 =∫

Ωx2f(x)dx− µ2 =

∫ 1

0x2(3x/2 + 3x2/4) dx− µ2 = . . . = 67/1280.

(43) Come nell’esercizio di prima; la condizione 1 =∫Ω f(x)dx e soddisfatta solo per c = −1

e c = 2. Entrambi i valori producono una densita.

(44) Per brevita indichiamo S il sintomo “avere macchie rosse” e con con A (morbillo), B(varicella) e C (causa non precisata) le tre possibili cause del sintomo. I dati contenutinel testo possono essere schematizzati dicendo che:

p(A) = 0.5, p(B) = 0.3, p(S|A) = 0.3, p(S|B) = 0.6 e che p(S|C) = 0.2.

In presenza di un paziente con il sintomo S il medico deve valutare quale causa piuprobabile quella, delle tre possibili A, B o C, che corrisponde al massimo di p(A|S),p(B|S) e p(C|S). Per calcolarle anzitutto osserviamo che p(C) = 1− p(A)− p(B) = 0.2,e che, per la relazione di Bayes, deve essere:

p(A|S) =p(S|A) · p(A)

p(S|A) · p(A) + p(S|B) · p(B) + p(S|C) · p(C)=

0.5 · 0.30.5 · 0.3 + 0.3 · 0.6 + 0.2 · 0.2

=1537

p(B|S) =p(S|B) · p(B)

p(S|A) · p(A) + p(S|B) · p(B) + p(S|C) · p(C)=

0.3 · 0.60.5 · 0.3 + 0.3 · 0.6 + 0.2 · 0.2

=1837

p(C|S) =p(S|C) · p(C)

p(S|A) · p(A) + p(S|B) · p(B) + p(S|C) · p(C)=

0.2 · 0.20.5 · 0.3 + 0.3 · 0.6 + 0.2 · 0.2

=437

.

In presenza del sintomo, quindi, la causa piu probabile e la B, nonostante in mancanzadi informazioni sulla presenza o meno del sintomo la malattia piu probabile sia A (poichep(A) > p(B)).

(45) Il testo ricorda che la legge che lega lo spostamento x (variabile dipendente) al tempot (variabile indipendente) e x = x0 − g

2 t2 e quindi non e lineare. Essa pero lo diventasi prendiamo come variabile indipendente t2 al posto di t. In sostanza applichiamo il

30

Page 31: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

metodo dei minimi quadrati alla coppia di grandezze X ed Y , dove:

t in secondi | 0 1 2 3 4X := t2 in secondi2 | 02 12 22 32 42

Y := x in metri | 102 97 83 58 24

In particolare vogliamo determinare i valori “ottimali” per i parametri m e q nella leggelineare Y = mX + q. Per farlo procediamo con il calcoli di vari parametri statistici:

M [X] =15

(0 + 1 + 4 + 9 + 16) = 6

M [X2] =15

(02 + 12 + 42 + 92 + 162) = 70.8

M [Y ] =15

(102 + 97 + 83 + 58 + 24) = 72.8

M [Y 2] =15

(1022 + 972 + 832 + 582 + 242) = 6128.4

M [XY ] =15

(0 · 102 + 1 · 97 + 4 · 83 + 9 · 58 + 16 · 24) = 267

Cov[X, Y ] = M [XY ]−M [X] ·M [Y ] = −157.8

Var[X] = M [X2]− (M [X])2 = 34.8

Var[Y ] = M [Y 2]− (M [Y ])2 = 828.56

Il coefficiente angolare m e quindi pari a

m =Cov[X, Y ]

Var[X]≈ −4.53

e l’ordinata all’origine e

q = M [Y ]−m ·M [X] ≈ 99.98

Abbiamo quindi ottenuto che x = 99.98− 4.53 · t2 la quale, per confronto con la formulax = x0− g

2 t2, da per g il valore 2 ·4.53 = 9.06 in metri al secondo quadro (il valore “vero”di g e 9.8m/s2 ma il valore determinato coi minimi quadrati e evidentemente affetto daerrori di misurazione dei dati di partenza).Infine, e possibile calcolare il coefficiente di correlazione:

r =Cov[X, Y ]√

Var[X] ·Var[Y ]≈ −0.92

tale valore (vicino a −1) e indice di una buona vicinanza dei valori misurati ai valoriprevisti tramite la retta di interpolazione.

(46) Il testo ricorda che la legge che lega Z (variabile dipendente) alla carica q (variabileindipendente) e: Z = z0 + m · q e quindi e lineare. Per risolvere l’esercizio basta quindiapplicare il metodo dei minimi quadrati alla coppia di grandezze X ed Y , dove:

X := q in Coulomb | 2 3 7 9 12 15Y := Z in grammi | 20.2 28.1 64.2 78.2 108.2 129.5

In particolare vogliamo determinare i valori “ottimali” per i parametri m e q nella leggelineare Y = mX + q. Per farlo procediamo con il calcoli di vari parametri statistici:

31

Page 32: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

M [X] =16

(2 + 3 + 7 + 9 + 12 + 15) = 8

M [X2] =16

(22 + 32 + 72 + 92 + 122 + 152) = 85.33

M [Y ] =16

(20.2 + 28.1 + 64.2 + 78.2 + 108.2 + 129.5) = 71.4

M [Y 2] =16

(20.22 + 28.12 + 64.22 + 78.22 + 108.22 + 129.52) = 6652.0

M [XY ] =16

(2 · 20.2 + 3 · 28.1 + 7 · 64.2 + 9 · 78.2 + 12 · 108.2 + 15 · 129.5) = 753.13

Cov[X, Y ] = M [XY ]−M [X] ·M [Y ] = 181.93

Var[X] = M [X2]− (M [X])2 = 21.33

Var[Y ] = M [Y 2]− (M [Y ])2 = 1554.04

Il coefficiente angolare m e quindi pari a

m =Cov[X, Y ]

Var[X]≈ 8.52

e l’ordinata all’origine e

q = M [Y ]−m ·M [X] ≈ 3.24

Abbiamo quindi ottenuto che Z = 3.24 + 8.52 · t.Infine, e possibile calcolare il coefficiente di correlazione:

r =Cov[X, Y ]√

Var[X] ·Var[Y ]≈ 0.999

tale valore (estremamente vicino a 1) e indice di una buona vicinanza dei valori misuratiai valori previsti tramite la retta di interpolazione.

(47) Il testo ricorda che la legge che lega la concentrazione C (variabile dipendente) al tempot (variabile indipendente) e C = C0e

−bt e quindi non e lineare. Essa pero lo diventase prendiamo come variabile dipendente log C al posto di C. In sostanza applichiamo ilmetodo dei minimi quadrati alla coppia di grandezze X ed Y , dove:

X := t in secondi | 1 2 3 4 5C | 0.135355 0.018315 0.002478 0.000123 0.000016

Y := log C | −1.9998 −4.0000 −6.0003 −9.0033 −11.0429

In particolare vogliamo determinare i valori “ottimali” per i parametri m e q nella leggelineare Y = mX + q. Per farlo procediamo con il calcoli di vari parametri statistici:

M [X] =15

(1 + 2 + 3 + 4 + 5) = 3

M [X2] =15

(12 + 22 + 32 + 42 + 52) = 11.2

M [Y ] =15

(−1.9998− 4.0000− 6.0003− 9.0033− 11.0429) = −6.4092

M [Y 2] =15

(1.99982 + 4.00002 + 6.00032 + 9.00332 + 11.04292) = 51.8015

M [XY ] =15

(1 · (−1.9998) + 2 · (−4.0000) + 3 · (−6.0003) + · · · ) = −23.8456

Cov[X, Y ] = M [XY ]−M [X] ·M [Y ] = −4.6180

Var[X] = M [X2]− (M [X])2 = 2.2

Var[Y ] = M [Y 2]− (M [Y ])2 = 10.723632

Page 33: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Il coefficiente angolare m e quindi pari a

m =Cov[X, Y ]

Var[X]≈ −2.099

e l’ordinata all’origine e

q = M [Y ]−m ·M [X] ≈ −0.1122

Abbiamo quindi ottenuto che log C = −0.1122− 2.099 · t la quale, per confronto con laformula log C = log C0 − b t, da per C0 il valore e−0.1122 ≈ 0.89 e per b il valore −2.099.Abbiamo percio determinato che

C = 0.89 · e−2.099·t.

Infine, e possibile calcolare il coefficiente di correlazione:

r =Cov[X, Y ]√

Var[X] ·Var[Y ]≈ −0.95

tale valore (vicino a −1) e indice di una buona vicinanza dei valori misurati ai valoriprevisti tramite la retta di interpolazione.

(48) In base alla definizione di distribuzione di Poisson, la probabilita che vengano diagnosti-cati n casi e data da

p(n) = e−λ λn

n!per ogni n = 0, 1, 2, . . ..

Nel caso in esame λ = 4.5. La prima domanda ha per soluzione il numero

p(1) = e−λ λ1

1!= e−4.5 4.51

1!= 0.05.

La seconda domanda ha per soluzione:

p(piu di due casi) = p(3) + p(4) + p(5) + · · · .

Tale somma fornisce la risposta ma purtroppo non e di agevole calcolo poiche presentainfiniti addendi. Possiamo piu facilmente ottenere il medesimo risultato osservando che

p(piu di due casi) = 1− p(meno di tre casi)

= 1− (p(0) + p(1) + p(2))

= 1− (e−λ λ0

0!+ e−λ λ1

1!+ e−λ λ2

2!)

≈ 1− 0.173 = 0.927.

(49) Il numero medio di terremoti e semplicemente il numero di terremoti registrati in 120anni / 120 anni, ovvero 87/120 = 0.725. In base a questo dato, la probabilita che inun anno qualsiasi si verifichino esattamente n terremoti ha distribuzione di Poisson conparametro λ = 0.725, e quindi

p(n) = e−λ λn

n!∀n ∈ N,

quindi

p(2) = e−0.725 0.7252

2!≈ 12.7%.

Ci si attende quindi che su un totale di 120 anni, in 120 · 0.127 ≈ 15 di essi si sianoverificati esattamente due terremoti all’anno.

(50) Le probabilita sono0 A B AB

Rh+ 0.38 0.25 0.11 0.06Rh- 0.07 0.06 0.04 0.03

33

Page 34: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

con marginali pari a:

0 A B ABRh+ 0.38 0.25 0.11 0.06 0.8Rh- 0.07 0.06 0.04 0.03 0.2

0.45 0.31 0.15 0.09

Si ha quindi:

p(gruppo non 0) = p(A,B, AB) = p(A) + p(B) + p(AB) = 0.31 + 0.05 + 0.09 = 0.55 = 55%,

p(gruppo AB o fattore Rh+) = p(gruppo AB ∪ fattore Rh+)

= p(AB) + p(Rh+)− p(AB ∩Rh+) = 0.09 + 0.8− 0.06

= 0.83 = 83%,

p(Rh− |A) =p(Rh− ∩ A)

p(A)=

p(Rh−, A)p(A)

=0.060.31

≈ 19.2%.

Infine, e ragionevole supporre che la scelta delle tre persone con gruppo B avvenga incondizioni di indipendenza, per tale motivo

p(scelte tre persone con gruppo B) = p(B)· (B)· (B) = p(B)3 = 0.153 ≈ 0.3%.

Questo pero solo la scelta delle tre persone non esclude dalle scelte successive le personegia scelte (ovvero solo se la la scelta avviene con reimmissione). Se si desidera invececalcolare la probabilita che scelte tre persone distinte, esse abbiano gruppo B si dovratener conto che ad ogni estrazione successiva, la persona scelta al passo precedente none piu disponibile, e cosı si avra

p(tre persone distinte con gruppo B) =15100

· 1499

· 1398

≈ 0.28%.

(51) Le frequenze percentuali sono

Gruppo Fr. assolute0 78/150 = 0.52A 48/150 = 0.32B 15/150 = 0.1

AB 9/150 = 0.06

Scegliendo due persone si avranno quindi le seguenti coppie di possibili gruppi sanguigni

0 A B AB0AB

AB

con marginali pari a:

0 A B AB0 0.52A 0.32B 0.1

AB 0.060.52 0.32 0.1 0.06

Le due persone sono scelte indipendentemente una dall’altra, quindi probabilita congiun-te saranno prodotto delle corrispondenti marginali e si avra

34

Page 35: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

0 A B AB0 0.2704 0.1664 0.052 0.0312 0.52A 0.1664 0.1024 0.032 0.0192 0.32B 0.052 0.032 0.01 0.006 0.1

AB 0.0312 0.0192 0.006 0.00036 0.060.52 0.32 0.1 0.06

Possiamo ora rispondere alle domande poste nell’esercizio:

p(gruppo sanguigno uguale) = p((0, 0)) + p((A,A)) + p((B,B)) + p((AB,AB))

= 0.2704 + 0.1024 + 0.01 + 0.00036 ≈ 38%,

e

p(persona 1 puo donare a persona 2)

= p((0, 0)) + p((0, A)) + p((0, B)) + p((0, AB)) + p((A,A)) + p((A,AB))

+ p((B,B)) + p((B,AB)) + p((AB,AB))

= 0.2704 + 0.1664 + 0.052 + 0.0312 + 0.1024 + 0.0192 + 0.01 + 0.006 + 0.00036 ≈ 65.8%.

(52) Soluzione:a) Si chiede calcolare la probabilita’ condizionata p(urna 1|bianca). In base alla for-

mula di Bayes si ha:

p(urna 1|bianca) =p(bianca|urna 1) · p(urna 1)

p(bianca|urna 1) · p(urna 1) + p(bianca|urna 2) · p(urna 2) + p(bianca|urna 3) · p(urna 3).

In questo calcolo le urne vengono scelte a caso, quindi p(urna 1) = p(urna 2) =p(urna 3) e quindi il valore comune e 1/3.Inoltre, l’urna 1 contiene 2 bianche su 5, quindi p(bianca|urna 1) = 2/5; l’urna 2contiene 4 bianche su 5, quindi p(bianca|urna 2) = 4/5; l’urna 3 contiene 3 bianchesu 7, quindi p(bianca|urna 3) = 3/7. Sostituendo questi dati nella formula di primasi ha:

p(urna 1|bianca) =(2/5) · (1/3)

(2/5) · (1/3) + (4/5) · (1/3) + (3/7) · (1/3)=

2/52/5 + 4/5 + 3/7

=1457

.

b) Le palle vengono riunite in un’unica urna, che quindi contiene 9 bianche e 8 nere. Sifanno cinque estrazioni senza reimmissione, qual e la probabilita di avere 3 bianchee 2 nere?di seguito elenchiamo tutte le estrazioni che producono 3 bianche e 2 nere. Il numerodi tali sequenza e uguale al binomiale di indici 5 e 3 e quindi e

(53

)= 5·4·3

3·2·1 = 10; essesono:

bbbnn, bbnbn, bnbbn, bnnbb, bnbnb,

bbnnb, nbbbn, nbbnb, nbnbb, nnbbb.

la prima ha probabilita: (9/17) · (8/16) · (7/15) · (8/14) · (7/13). Questo perche laprobabilita di estrarre una bianca alla prima estrazione e 9/17 (9 bianche su totaledi 17); posto che alla prima estrazione sia uscita bianca, la probabilita che allaseconda estrazione esca ancora bianca e 8/16 (restano 8 bianche nel vaso, su totaledi 16); posto che alle prime due estrazioni siano uscite bianche, la probabilita chealla terza estrazione esca ancora bianca e 7/15 (restano 7 bianche nel vaso, su totaledi 15); posto che alle prime tre estrazioni siano uscite bianche, la probabilita chealla quarta estrazione esca nera e 8/14 (restano 8 nere nel vaso, su totale di 14);posto che alle prime tre estrazioni siano uscite bianche e alla quarta sia uscita nera,la probabilita che alla quinta estrazione esca ancora nera e 7/13 (restano 7 nere nelvaso, su totale di 13).

35

Page 36: Esercizi 4 - mat.unimi.it · una variabile aleatoria X i cui ... Sia X una variabile aleatoria che assume i valori ... X `e una variabile aleatoria la cui distribuzione `e binomiale

Conti analoghi danno le probabilita delle altre combinazioni che quindi saranno:

p(bbbnn) = (9/17) · (8/16) · (7/15) · (8/14) · (7/13)

p(bbnbn) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)

p(bnbbn) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)

p(bnnbb) = (9/17) · (8/16) · (7/15) · (8/14) · (7/13)

p(bnbnb) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)

p(bbnnb) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)

p(nbbbn) = (8/17) · (9/16) · (8/15) · (7/14) · (7/13)

p(nbbnb) = (8/17) · (9/16) · (8/15) · (7/14) · (7/13)

p(nbnbb) = (8/17) · (9/16) · (7/15) · (8/14) · (7/13)

p(nnbbb) = (8/17) · (7/16) · (9/15) · (8/14) · (7/13)

La probabilita cercata e la somma delle probabilita che sono scritte a destra. Siosservi che nonostante le differenti scritture, queste probabilita sono tutte ugualitra loro, e valgono

9 · 8 · 7 · 8 · 717 · 16 · 15 · 14 · 13

;

la probabilita cercata quindi e

10 · 9 · 8 · 7 · 8 · 717 · 16 · 15 · 14 · 13

=84221

≈ 38.%

N.B. Queste simmetrie non sono casuali e nascondono una teoria generale che puoessere usata per ottenere il risultato piu agevolmente.

(53) La teoria generale mostra che la variabile aleatoria X =“numero di querce in una casellascelta a caso” assume i propri valori con probabilita molto vicine ad una Poisson diparametro λ = 40000/10000 = 4.

a) p(X = 2) = e−λ · λ2

2! = e−4 · 42

2 ≈ 14.6%;b) p(X < 4) = p(X = 0)+p(X = 1)+p(X = 2)+p(X = 3) = e−λ ·(λ0

0! + λ1

1! + λ2

2! + λ3

3! ) ≈43.3%.

(54) Indichiamo con ‘+’ l’evento: ‘il test e risultato positivo’, con ‘−’ l’evento: ‘il test erisultato negativo’, con ‘M ’ l’evento: ‘il paziente e malato’ ed infine con ‘S’ l’evento: ‘ilpaziente e sano’. Il testo del problema fornisce le seguenti informazioni:

p(M) = 0.16, p(−) =65709000

= 0.73, p(+|M) = sensibilita = 0.90.

Possiamo quindi calcolare:

p(+,M) = p(x|M) · p(M) = 0.9 · 0.16 = 0.144.

Di conseguenza:

Valore predittivo = p(M |+) =p(M,+)

p(+)=

0.1441− p(−)

=0.1440.23

≈ 0.626 ≈ 62.6%.

Dalla relazione p(M) = p(+,M)+ p(−,M) ricaviamo che p(−,M) = p(M)− p(+,M) =0.16− 0.144 = 0.016.Dalla relazione p(−) = p(−,M) + p(−, S) ricaviamo che p(−, S) = p(−) − p(−,M) =0.73− 0.016 = 0.714. Possiamo cosı concludere che

Specificita = p(−|S) =p(−, S)p(S)

=0.714

1− p(M)=

0.7140.84

= 0.85 = 85%.

Infine, il valore atteso di falsi negativi sul campione di 6000 e pari a 6000 · p(−|M) =6000 · (1− p(+|M)) = 6000 · (1− 0.90) = 600.

36