fondamenti di inferenzafondamenti di...

45
1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI DI INFERENZA FONDAMENTI DI INFERENZA Corso di Laurea in Ingegneria Civile Facoltà di Ingegneria, Università di Padova PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 1 Docente: Dott. L. Corain E-mail: [email protected] Home page: www.gest.unipd.it/~livio/Corso_Civile.html SOMMARIO Definizioni, principi e fasi del DoE (Design of Experiments) ANOVA ad una via ANOVA ad una via Confronti multipli Blocco e covariata ANOVA a due vie ANOVA multivia PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 2 ANOVA multivia Piani 2k Fattori fissi e fattori casuali e studi di ripetibilità e riproducibilità

Upload: duonghanh

Post on 16-Feb-2019

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

1

Metodi Statistici e Probabilistici per l’Ingegneria

FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZA

Corso di Laurea in Ingegneria Civile

Facoltà di Ingegneria, Università di Padova

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 1

Docente: Dott. L. CorainE-mail: [email protected] Home page: www.gest.unipd.it/~livio/Corso_Civile.html

SOMMARIO

Definizioni, principi e fasi del DoE (Design of Experiments)ANOVA ad una viaANOVA ad una viaConfronti multipliBlocco e covariataANOVA a due vieANOVA multivia

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 2

ANOVA multiviaPiani 2kFattori fissi e fattori casuali e studi di ripetibilità e riproducibilità

Page 2: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

2

PRINCIPI E FASI DEL DOEUn esperimento è una serie di prove in cui losperimentatore fa variare deliberatamente dei fattori(controllabili) di input di un processo/sistema, osserva larisposta in un uscita e quindi, grazie ad opportuneelaborazioni statistiche inferenziali determina quali fattorielaborazioni statistiche inferenziali, determina quali fattoriinducono una variazione significativa nella risposta.Nell’esperimento sono sempre presenti anche dei fattori (fonti di variabilità) non controllabili(strumenti di esecuzione/misurazione della prova materiale sperimentale non

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 3

prova, materiale sperimentale non omogeneo/uniforme, campionamento, ecc.) i quali inducono una variabilità ulteriore alla risposta che si somma a quella determinata dai fattori controllabili.

PRINCIPI E FASI DEL DOESi noti che mentre la variabile risposta (TWT, ST,durezza, ecc.) deve necessariamente essere una misuradi tipo numerico, i fattori controllabili di input di unprocesso/sistema possono essere sia qualitativi (tipo di

i l di f i ) ireagente, materiale di confezionamento, ecc.) siaquantitativi (% di additivo, quantità di ossidante, ecc.).In un esperimento fattoriale, tutte le possibilicombinazioni dei livelli dei fattori (detti trattamenti)vengono testati, generalmente ciascuno per un ugualenumero di volte pari ad n (esperimento bilanciato).In un piano fattoriale frazionato invece non tutte le

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 4

In un piano fattoriale frazionato invece non tutte lecombinazioni dei trattamenti vengono testate, ma sonouna loro parte (detta frazione del piano).Se i trattamenti vengano testati una sola volta, si parla diesperimento/piano fattoriale non replicato. Esso ha ilforte limite di non consentire una analisi inferenziale.

Page 3: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

3

PRINCIPI E FASI DEL DOEGrazie ad un opportuno modello statistico dirappresentazione dei dati sperimentali è possibileformalizzare il ruolo sia dei fattori controllabili sia di quellinon controllabili: Y = µ + ε,

dove Y è la risposta, µ rappresenta il valore mediodella risposta, che può dipendere (linearmente) dailivelli (cioè dai valori) dei fattori controllabili. Ad es.

µ = µ0 + τi (ANOVA ad una via)µ = µ0 + τi + βj (ANOVA ad una via con blocco)µ = µ0 + τi + βj + (τβ)ij (ANOVA a due vie)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 5

j jε rappresenta il termine di errore sperimentale, doveconfluiscono tutte le fonti (fattori) di variabilità noncontrollabile e che si assume indipendente edidenticamente distribuito secondo una v.a. gaussiana:

ε∼IIN(0,σ2).

PRINCIPI E FASI DEL DOE

Gli esperimenti sono largamente utilizzati nell’industriaprincipalmente nell’area della ricerca e sviluppo e dellaqualità, ad esempio allo scopo di

Ridurre il tempo per progettare/sviluppare nuovip p p g ppprodotti e processi.Valutazione dei materiali, delle alternative di progetto,settare componenti e sistemi di tolleranza, ecc.Caratterizzare e migliorare le prestazioni dei processiesistenti.Migliorare l’affidabilità e le prestazioni dei prodotti.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 6

g p pRaggiungere robustezza di prodotto e processo.

In generale, tutti gli esperimenti sono progettati ed i datiottenuti elaborati con metodi statistici, tuttavia solo alcuniin modo adeguato ed opportuno, altri invece sonopianificati poco e male ed analizzati in modo improprio.

Page 4: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

4

PRINCIPI E FASI DEL DOEÈ importante sottolineare che l’esperimento deve esseredebitamente progettato prima della sua esecuzione. Inparticolare bisogna stabilire:

l’idonea risposta (TWT, ST, durezza, ecc.) alla luce delproblema in oggetto;i fattori ed i rispettivi livelli che si vogliono manipolarenell’esperimento e che ci si aspetta possano influenzarela risposta; esiste un ovvio trade-off tra numero difattori/livelli e tempi/costi dell’esperimento;il numero n di prove per trattamento (numero direpliche); in generale si preferisce far sì che ogni

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 7

repliche); in generale si preferisce far sì che ognitrattamento abbia lo stesso numero di prove(esperimento bilanciato);una appropriata assegnazione del materialesperimentale ai trattamenti;un idoneo ordine di esecuzione delle prove.

PRINCIPI E FASI DEL DOEI principi basilari del DoE sono tre: randomizzazione,replicazione e blocco.Randomizzazione: sia l’ordine di esecuzione delleprove sia l’assegnazione del materiale sperimentale aitrattamenti deve avvenire in modo completamentecasuale (randomizzato); questo consente di mediare glieffetti di fattori non controllabili sempre presenti (ma“nascosti”) che vanno così ad incidere in modo uniformesui vari trattamenti.Replicazione: significa che ogni trattamento deveessere eseguito in più di una prova indipendente; questo

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 8

essere eseguito in più di una prova indipendente; questoconsente di migliorare la precisione della stimadell’effetto dei fattori, riducendo nel contempo la stimadell’errore e del rumore di fondo (si ricordi che l’errorestandard della media campionaria è uguale a σ, scartoquadratico medio della popolazione, diviso √n).

Page 5: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

5

PRINCIPI E FASI DEL DOEBlocco: si tratta di un fattore di disturbo noto econtrollabile che quasi certamente produce sulla rispostaun effetto, che non interessa però allo sperimentatore.Tuttavia la variabilità che trasmette alla risposta deveessere minimizzata.Tipici fattori di disturbo/blocco sono: lotti di materialegrezzo, operatori, provini, attrezzature, il fattoretemporale (turni, giorni, ecc.).Se la variabilità del disturbo è nota e controllabile, si puòusare la tecnica dei blocchi; se il fattore di disturbo ènoto, osservabile ma non controllabile, si può usare

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 9

noto, osservabile ma non controllabile, si può usarel’analisi di covarianza per rimuovere l’effetto del fattoredi disturbo dall’analisi.Se il fattore di disturbo non è né noto né controllabile (a“variabile nascosta”), si spera che la randomizzazioneequilibri la sua influenza nei confronti dell’esperimento.

PRINCIPI E FASI DEL DOELe linee guida per la pianificazione ed analisi degliesperimenti sono le seguenti:

Identificazione e formulazione del problema.Scelta dei fattori, livelli ed intervalli.Identificazioni dei blocchi e delle covariate.Selezione della variabile di risposta.Scelta del piano sperimentale:

determinazione del numero di repliche;assegnazione del materiale sperimentale ai trattamenti;definizione dell’ordine di esecuzione delle prove.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 10

pEsecuzione dell’esperimento.Analisi statistica dei dati mediante metodi ANOVA(Analysis of Variance).Conclusioni e raccomandazioni (eventuale pianificazionedi un nuovo esperimento sulla base dei risultati ottenuti).

Page 6: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

6

ANOVA AD UNA VIAConsideriamo un esperimento in cui è presente un unicofattore di interesse (% di cemento, spessore, tipo additivo,fornitore, ecc.) che può assumere a livelli.Il primo step è la progettazione dell’esperimento (DoE):p o s ep è a p oge a o e de espe e o ( o )

stabilire in numero di repliche sperimentali n e quindi ilnumero totale di prove: N = a × n;assegnare in modo casuale il materiale sperimentale(N provini) agli a trattamenti (1° randomizzazione);stabilire l’ordine di esecuzione delle N prove (2°randomizzazione)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 11

randomizzazione).Il modello di rappresentazione dei dati:

Yij = µ + τj + εij = µj + εij, i=1,...,n, j =1,…,adove µ è la media generale, τj è l’effetto del j-thtrattamento (livello del fattore), Σjτj=0, εij∼IIN(0,σ2).

ANOVA AD UNA VIA

Il cambiamento del peso % di cotone cambia la resistenza

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 12

cambia la resistenza media a trazione?C’è un livello ottimaledi percentuale di cotone?

Page 7: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

7

L’obiettivo è stabilire (testate) se al variare degli a livellidel fattore di interesse la risposta subisce (mediamente)degli scostamenti (variazioni significative).Il problema inferenziale riferibile a questo contesto è noto

ANOVA AD UNA VIA

p qcome “ANOVA ad una via” :

H0: τ1 = … = τa = 0 (o µ1 = … = µa)vs. H1: ∃ τj ≠ 0 (or ∃ µj ≠µh, j,h = 1,…,a; j ≠ h)se l’ipotesi nulla viene rigettata, allo sarà di interesseapprofondire l’analisi considerandoH : µ = µ j h = 1 C; j ≠ h;

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 13

H0(jh): µj = µh, j,h = 1,…,C; j ≠ h;ovvero l’insieme delle C×(C−1)/2 verifiche di ipotesichiamate “confronti a coppie o multipli”.

Prima di tutto è necessario sviluppare un proceduraidonea a testare l’ipotesi nulla (globale) H0 contro H1.

ANOVA AD UNA VIAL’acronimo ANOVA − “ANalysis Of Variance” si riferisceal fatto che la variabilità totale della variabile rispostaviene ripartita in componenti che sono coerenti con ilmodello di rappresentazione dei dati dell’esperimento.pp pLa variabilità totale SST viene rappresentata dallasomma totale dei quadrati:

La partizione ANOVA viene definita come:

2..

1 1( )

a n

T ijj i

SS y y= =

= −∑∑

2 2( ) [( ) ( )]a n a n

y y y y y y− = − + −∑∑ ∑∑

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 14

.. . .. .1 1 1 1

2 2. .. .

1 1 1

( ) [( ) ( )]

( ) ( )

ij j ij jj i j i

a a n

j ij jj j i

T Trattamenti E

y y y y y y

n y y y y

SS SS SS

= = = =

= = =

= +

= − + −

= +

∑∑ ∑∑

∑ ∑∑

Page 8: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

8

V l i l i di SS ifl l i l i d i

T Trattamenti ESS SS SS= +

ANOVA AD UNA VIA

Valori elevati di SSTrattamenti riflettono elevati valori deiparametri τj e quindi grandi differenze nelle medie deitrattamenti (evidenza contro H0);Piccoli valori di SSTrattamenti suggeriscono che non ci sonodifferenze nelle medie dei trattamenti (ovvero che i τjsono tutti uguali a zero; evidenza a favore di H0);

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 15

Mentre le somme dei quadrati non possono esseredirettamente confrontate tra loro (il numero di addendi èdiverso), possono invece essere confrontati i cosiddettiquadrati medi definiti come la somma dei quadrati divisoi corrispondenti gradi di libertà.

I quadrati medi sono definiti come la somma dei quadratidiviso i corrispondenti gradi di libertà :

1 1 ( 1)Totale Trattamenti Erroredf df df

an a a n= +

− = − + −

ANOVA AD UNA VIA

Se Ie medie dei trattamenti fossero tutte uguali (τj tuttiuguali a zero), i quadrati medi dei trattamenti edell’errore sarebbero (teoricamente) anche’essi uguali.

1 1 ( 1)

,1 ( 1)

Trattamenti ETrattamenti E

an a a nSS SSMS MS

a a n

= +

= =− −

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 16

Se Ie medie dei trattamenti fossero diverse, i quadratimedi dei trattamenti sarebbero maggiori dei quadratimedi dell’errore. Ne consegue che, calcolando ilrapporto tra i due quadrati medi, possiamo ottenere unamisura dell’evidenza empirica contro l’ipotesi H0.

Page 9: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

9

Questi calcoli vengono usualmente riportati nellacosiddetta tabella dell’Analisi della Varianza:

ANOVA AD UNA VIA

La distribuzione di riferimento della statistica test F è la

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 17

La distribuzione di riferimento della statistica test F0 è ladistribuzione F(a−1,N−a) (F di Fisher con a−1 e N−a gdl).L’ipotesi nulla (uguaglianza delle medie dei trattamenti)deve essere rifiutata se

oss ; 1,a N aF F − −> α

Output dell’esperimento di resistenza alla trazione (tabella ANOVA e dotplot con medie campionarie):

ANOVA AD UNA VIA

engh

t

25

20

15

Dotplot of Strenght vs Cotton%

p )

General Linear Model:Strenght versus Cotton%

Factor Type Levels ValuesCotton% fixed 5 15; 20; 25; 30; 35

Analysis of Variance for Strenght, using Adjusted SS for Tests

Cotton%

Str

3530252015

10

5

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 18

y g g j

Source DF Seq SS Adj SS Adj MS F PCotton% 4 475.76 475.76 118.94 14.76 0.000Error 20 161.20 161.20 8.06Total 24 636.96

S = 2.83901 R-Sq = 74.69% R-Sq(adj) = 69.63%

Page 10: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

10

ANOVA AD UNA VIA

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 19

Qual è il meccanismo di funzionamento e perché ilmetodo ANOVA funziona correttamente?

2 21 0 ( 1)2 2

Stiamo campionando da popolazioni normali, quindi

se è vera, e Treamtents Ea a n

SS SSH− −∼ ∼χ χσ σ

ANOVA AD UNA VIA

il teorema di Cochran prova l'independenza di queste due variabili casuali di tipo chi-quadrato.

Qu

σ σ

21

0 1, ( 1)2( 1)

/ ( 1) / ( 1)indi / [ ( 1)] / [ ( 1)]

Trattmenti aa a n

E a n

a

SS a aF FSS a n a n

−− −

− −=

− −∼ ∼χχ

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 20

2

12 2Infine, ( ) e ( )1

Perciò un test unilateriale (coda destra) risulta essere appropriato

jj

Trattmenti E

nE MS E MS

aF

== + =−

∑τσ σ

.

Page 11: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

11

Quando il fattore di interesse è tipo numerico, si puòapplicare all’esperimento anche un modello alternativo dirappresentazione dei dati detto modello di regressione(polinomiale):

ANOVA AD UNA VIA

(p )Yi = β0 + Σq

s=1 βs Xsi + εi, i=1,...,n,

engh

t

25

20

15

Scatterplot of Strenght vs Cotton%Nel caso dell’esperimento di resistenza alla trazione, assumendo un polinomio di terzo grado, otteniamo un

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 21

Cotton%

Str

e

3530252015

15

10

5

modello empirico che ci consente di stabilire che la percentuale di cotone che massimizza la risposta è attorno al 28-29%.

ANOVA AD UNA VIAIl controllo delle assunzioni attraverso l’analisi deiresidui è una fase importante.Le assunzioni sono riassunte in εij∼IIN(0,σ2), ovvero

1 Normalità1. Normalità2. Varianza costante (omoschedasticità)3. Indipendenza

del termine di errore casuale ε (non osservabile) checompare nel modello di rappresentazione dei dati.I residui sono definiti come .ˆij ij ij ij ie y y y y= − = −

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 22

ovvero come la differenza tra dato osservato e valoreprevisto da modello.Se gli errori rispettassero le assunzioni, i residui (daconsiderare delle realizzazioni della variabile casualeε) “erediterebbero” le stesse proprietà/caratteristiche.

Page 12: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

12

99

90

5.0

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Strenght

ANOVA AD UNA VIA

Residual

Per

cent

5.02.50.0-2.5-5.0

90

50

10

1

Fitted Value

Res

idua

l

20.017.515.012.510.0

2.5

0.0

-2.5

-5.0

4.8 5.0

Histogram of the Residuals Residuals Versus the Order of the Data

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 23

Residual

Freq

uenc

y

6420-2-4

3.6

2.4

1.2

0.0

Observation Order

Res

idua

l

24222018161412108642

2.5

0.0

-2.5

-5.0

L’esito di un esperimento dipende da molti aspetti, inclusoquale tipo di esperimento viene proposto, come saràcondotto, le risorse e la sensitività desiderata.La sensitività si riferisce alla differenza tra le medie che

ANOVA AD UNA VIA

La sensitività si riferisce alla differenza tra le medie chelo sperimentatore desidera mettere in evidenza.Generalmente, al crescere del numero di replichecresce la sensitività nel senso che diventano più facilemettere in evidenza anche piccole differenze tra le medie.Si può pensare di scegliere una dimensione campionariaopportuna per indagare una specifica differenza tra le

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 24

opportuna per indagare una specifica differenza tra lemedie a prefissati e desiderati valori di errore di I e II tipo.Errore di I Tipo: – rifiutare H0 quando è vera (α).Errore di II Tipo: non rifiutare H0 quando è falsa (β).Potenza = 1−β: rifiutare H0 quando è falsa.

Page 13: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

13

A questo scopo sono state sviluppate le curve OC(operative caratteristiche) per il modello ad effetti fissi.Un modo molto comune per usare queste carte è definireuna differenza tra due medie d di interesse il minimo

ANOVA AD UNA VIA

una differenza tra due medie d di interesse, il minimovalore di d/σ è

Tipicamente funziona in termini di rapporto tra Φ2: siricercano valori di n fino a che non sia raggiunta la

22

22nDaσ

Φ =

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 25

potenza desiderata.

ANOVA AD UNA VIA

Potenza del test nel caso del test a due campioni.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 26

Page 14: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

14

ANOVA AD UNA VIAPotenza del test nel caso del test a due campioni.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 27

d = ⏐ δ ⏐ / σ

ANOVA AD UNA VIAPotenza del test nel caso dell’ANOVA ad una via.

β = 0.10

β ≈ 0.40

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 28

Φ = 2.12, v2 = 12

Page 15: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

15

Il metodo dell’analisi della varianza sottopone a verifical’ipotesi di uguaglianza delle medie dei trattamenti (dellemedie degli a livelli del fattore di interesse).Se questa ipotesi viene rigettata, non sappiamo però

CONFRONTI MULTIPLI

quale specifica media differisce (si veda laspecificazione dell’ipotesi alternativa).Stabilire quali specifiche medie differiscono a seguito diuna analisi ANOVA viene chiamato problema deiConfronti Multipli (o Confronti a Coppie).Ci sono diverse per affrontare questo problema.C id i i i t tt il t d d i t t t i

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 29

Consideriamo innanzi tutto il metodo dei t-test a coppiesulle differenze delle medie, chiamato metodo Fisher’sLeast Significant Difference – LSD:

0 =2

j hN a

E

Y YT t

MS n −

⋅i i ∼

Si rigetta l’ipotesi nulla H0(jh): µj=µh, j,h=1,…,a; j ≠ h se

È importante notare che quando il numero di confrontiche da realizzare simultaneamente cresce (a aumenta)

/2; /2;| | 2oss N C j h N C Et t y y LSD t MS n− −> ⇒ − > = ⋅ ⋅i iα α

CONFRONTI MULTIPLI

che da realizzare simultaneamente cresce (a aumenta),la probabilità di identificare almeno un falso positivo (untest statisticamente significativo, quando invece è veral’ipotesi nulla H0(jh)), aumenta anch’esso.Questo problema (noto come multiplicity issue –questione della molteplicità) è legato al controllodell’errore di I tipo globale (relativo a tutti i confronti) che

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 30

dell errore di I tipo globale (relativo a tutti i confronti) chetende a crescere all’aumentare del numero di confronti.Allo scopo di superare facilmente il problema, si deveapplicare la cosiddetta correzione di Bonferroni:α*=α/a×(a−1)/2, cioè si utilizza non l’α nominale ma

corretto in modo che l’errore globale sia ≤α.

Page 16: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

16

No. of Sim. y11 y21 y31 y41 y12 y22 y32 y42 y13 y23 y33 y43 y1-bar y2-bar y3-bar y-bar SSTreat SSE F 0 p -value check1 69.766 68.348 72.404 70.104 69.52 70.154 68.752 69.022 70.856 69.391 70.579 69.459 70.16 69.36 70.07 69.86 1.52 11.33 0.60 0.57 02 71.372 69.187 70.751 70.032 69.069 69.963 69.595 71.101 69.017 70.627 71.64 67.933 70.34 69.93 69.80 70.02 0.61 13.05 0.21 0.81 03 70.389 70.769 69.088 70.138 69.714 69.854 71.151 70.063 67.638 71.361 70.409 71.842 70.10 70.20 70.31 70.20 0.09 13.43 0.03 0.97 04 68.955 70.158 68.837 70.015 69.312 70.309 69.77 70.547 68.793 70.317 70.007 69.599 69.49 69.98 69.68 69.72 0.50 3.66 0.61 0.56 05 70.729 68.182 72.48 69.227 70.17 71.541 70.261 70.586 69.168 69.275 69.328 70.646 70.15 70.64 69.60 70.13 2.14 13.13 0.74 0.51 06 70 088 69 199 71 592 68 91 71 039 71 452 69 386 69 706 70 099 69 438 70 736 70 151 69 95 70 40 70 11 70 15 0 41 8 23 0 23 0 80 0

CONFRONTI MULTIPLI

6 70.088 69.199 71.592 68.91 71.039 71.452 69.386 69.706 70.099 69.438 70.736 70.151 69.95 70.40 70.11 70.15 0.41 8.23 0.23 0.80 07 70.645 69.306 72.181 69.608 72.025 67.441 69.875 69.108 69.553 70.439 69.757 69.299 70.44 69.61 69.76 69.94 1.54 16.62 0.42 0.67 08 68.873 69.134 70.064 69.596 70.864 68.661 69.872 70.129 70.772 70.766 69.638 70.013 69.42 69.88 70.30 69.87 1.55 4.30 1.62 0.25 09 68.404 71.883 69.832 69.208 69.942 68.029 69.812 69.846 69.16 70.393 69.001 69.561 69.83 69.41 69.53 69.59 0.38 10.34 0.17 0.85 010 69.773 71.273 69.233 69.93 70.873 70.795 70.352 72.419 71.373 70.14 70.84 71.224 70.05 71.11 70.89 70.69 2.50 5.61 2.01 0.19 011 70.531 71.152 69.849 69.304 70.254 71.698 71.459 69.877 69.753 71.691 70.43 69 70.21 70.82 70.22 70.42 0.99 8.25 0.54 0.60 012 68.733 70.244 71.16 68.205 69.138 69.725 70.119 68.39 69.914 69.703 70.951 69.788 69.59 69.34 70.09 69.67 1.16 8.26 0.63 0.55 013 70.909 70.885 70.421 70.894 68.937 70.287 71.363 68.939 70.798 68.961 70.82 69.629 70.78 69.88 70.05 70.24 1.81 6.83 1.19 0.35 014 70.336 68.647 71.108 70.2 69.555 70.926 69.723 69.165 70.571 69.63 69.518 68.078 70.07 69.84 69.45 69.79 0.79 8.10 0.44 0.66 015 71.615 68.202 70.451 69.147 69.636 68.528 70.499 67.774 70.307 69.173 69.631 69.566 69.85 69.11 69.67 69.54 1.20 11.68 0.46 0.64 016 69.135 69.957 70.714 70.449 70.293 70.009 72.263 70.544 70.425 68.38 70.824 69.406 70.06 70.78 69.76 70.20 2.18 8.14 1.21 0.34 017 71.436 70.123 71.512 70.275 70.748 69.109 69.581 71.118 69.585 69.132 71.866 70.581 70.84 70.14 70.29 70.42 1.08 8.75 0.55 0.59 018 69.891 68.729 70.336 68.246 68.899 69.881 69.993 69.877 70.246 70.899 70.378 70.927 69.30 69.66 70.61 69.86 3.67 4.01 4.12 0.05 019 69.731 70.15 69.761 69.744 70.378 69.346 70.651 70.552 71.551 68.908 70.082 71.435 69.85 70.23 70.49 70.19 0.85 5.90 0.65 0.55 020 71.194 70.01 71.634 70.829 71.332 69.999 70.734 71.097 69.437 68.966 71.184 68.394 70.92 70.79 69.50 70.40 4.95 6.78 3.28 0.08 021 71.549 68.581 70.755 69.638 68.305 70.814 69.403 70.589 72.319 71.912 69.575 70.89 70.13 69.78 71.17 70.36 4.22 13.58 1.40 0.30 022 70.477 70.355 68.928 70.944 70.765 70.319 69.549 72.001 70.904 69.34 70.149 70.958 70.18 70.66 70.34 70.39 0.48 7.17 0.30 0.75 023 71.031 70.321 69.518 68.971 70.078 69.801 68.583 69.734 69.372 70.339 70.782 70.055 69.96 69.55 70.14 69.88 0.73 4.81 0.68 0.53 0

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 31

24 69.702 68.845 70.705 69.416 71.434 69.811 71.928 70.289 68.157 70.436 70.969 69.64 69.67 70.87 69.80 70.11 3.45 9.21 1.69 0.24 025 70.001 68.594 69.646 71.155 69.993 71.381 72.179 70.745 67.652 69.393 70.697 69.715 69.85 71.07 69.36 70.10 6.21 10.77 2.60 0.13 026 68.072 70.381 69.37 69.098 66.921 70.523 67.981 70.498 70.286 68.404 70.307 69.109 69.23 68.98 69.53 69.25 0.60 15.25 0.18 0.84 027 69.682 70.344 69.8 70.656 68.781 69.609 68.478 70.903 70.931 70.254 70.234 67.669 70.12 69.44 69.77 69.78 0.92 10.37 0.40 0.68 028 67.321 69.995 69.874 69.159 71.264 69.044 68.961 70.404 70.736 68.72 71.224 69.534 69.09 69.92 70.05 69.69 2.19 12.18 0.81 0.48 029 70.504 71.244 71.268 71.255 71.241 69.642 70.786 71.369 69.074 69.61 70.484 69.826 71.07 70.76 69.75 70.53 3.81 3.30 5.20 0.03 130 69.981 69.19 69.964 69.979 68.836 69.522 71.17 68.36 70.186 70.101 70.209 69.947 69.78 69.47 70.11 69.79 0.82 5.03 0.73 0.51 031 70.45 68.606 69.884 69.549 71.331 70.187 70.876 69.972 70.106 71.078 70.593 69.868 69.62 70.59 70.41 70.21 2.13 3.83 2.50 0.14 032 70.096 69.601 70.207 70.574 70.918 69.601 70.478 69.089 71.305 69.52 68.993 69.893 70.12 70.02 69.93 70.02 0.07 5.48 0.06 0.94 033 69.809 69.719 72.207 71.647 70.253 68.796 69.794 70.678 68.996 70.85 70.094 68.272 70.85 69.88 69.55 70.09 3.61 10.73 1.52 0.27 034 70.679 69.745 69.436 68.978 69.762 69.403 70.577 71.559 67.944 71.022 70.685 70.327 69.71 70.33 69.99 70.01 0.76 10.15 0.34 0.72 0

In alternativa (e con esito ovviamente equivalente), sipuò opportunamente aggiustare il valore del p-value:p* = p ⋅ a×(a−1)/2.L’inconveniente del metodo della correzione di

CONFRONTI MULTIPLI

L inconveniente del metodo della correzione diBonferroni è evidente: al crescere del numero diconfronti a coppie diminuisce la potenza complessivadella procedura e questo a causa di un aumentodell’errore di II tipo.Si dice che la correzione di Bonferroni è eccessivamente

ti ( ti il i tt d l li ll i l

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 32

conservativa (garantisce il rispetto del livello nominalema a discapito della potenza) e questo è causato dalfatto che l’effettivo valore dell’errore family-wise(dell’intera set di verifiche di ipotesi) può risultare anchemolto inferiore al livello prescelto α.

Page 17: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

17

Una metodo alternativo (un po’ più potente) è lacosiddetta procedura di Tukey (o Tukey-Cramer) delrange studentizzato:

CONFRONTI MULTIPLI

dove Q è la statistica del range studentizzato, i cuipercentili sono stati tabulati per diversi valori di a e N−a(i gradi di libertà dell’MSE).

max min;=

2 C N CE

Y YQ qMS n −

−⋅

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 33

Si rigetta l’ipotesi nulla H0(jh): µj=µh, j,h=1,…,a; j ≠ h se

( ; )j h Ey y HSD q c N a MS n⇒ − > = − ⋅i i α

( ; )ossq q a N a> − ⇒α

Bonferroni Simultaneous TestsResponse Variable StrenghtAll Pairwise Comparisons among Levels of Cotton%Cotton% = 15 subtracted from:

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value20 5.600 1.796 3.1188 0.054125 7.800 1.796 4.3441 0.0031

Tukey Simultaneous TestsResponse Variable StrenghtAll Pairwise Comparisons among Levels of Cotton%Cotton% = 15 subtracted from:

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value20 5.600 1.796 3.1188 0.038525 7.800 1.796 4.3441 0.0026

CONFRONTI MULTIPLI

30 11.800 1.796 6.5718 0.000035 1.000 1.796 0.5569 1.0000

Cotton% = 20 subtracted from:

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value25 2.200 1.796 1.225 1.000030 6.200 1.796 3.453 0.025135 -4.600 1.796 -2.562 0.1859

Cotton% = 25 subtracted from:

30 11.800 1.796 6.5718 0.000035 1.000 1.796 0.5569 0.9798

Cotton% = 20 subtracted from:

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value25 2.200 1.796 1.225 0.737330 6.200 1.796 3.453 0.018935 -4.600 1.796 -2.562 0.1163

Cotton% = 25 subtracted from:

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 34

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value30 4.000 1.796 2.228 0.375435 -6.800 1.796 -3.787 0.0116

Cotton% = 30 subtracted from:

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value35 -10.80 1.796 -6.015 0.0001

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value30 4.000 1.796 2.228 0.210135 -6.800 1.796 -3.787 0.0091

Cotton% = 30 subtracted from:

Difference SE of AdjustedCotton% of Means Difference T-Value P-Value35 -10.80 1.796 -6.015 0.0001

Page 18: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

18

Formalmente, la questione della molteplicità è legata alproblema del controllo degli errori inferenziali di tuttol'insieme della famiglia delle S=a×(a−1)/2 ipotesi nulle.Le procedure per i confronti multipli − MCPs (Multiple

CONFRONTI MULTIPLI

p p p ( pComparisons Procedures) sono metodi dedicati alcontrollo del cosiddetto FWER (Family-wise Error Rate).In senso forte, FWER è la probabilità di rigettare almenouna ipotesi nulla vera Hi contenuta in un sottoinsieme diipotesi nulle S, formalmente:

FWER(S) = Pr (Rigettare almeno una H0i, i ∈ S | H0i è

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 35

( ) ( g 0i, | 0ivera per tutti gli i ∈ S).

Mentre i metodi di Bonferroni e Tukey sono tipicamenteprocedure di tipo single-step, in letteratura sono stateproposte delle procedure MCPs di tipo step-wise che sirivelano più potenti nel controllo dell’FWER.

metodo di Bonferroni-Holm:si ordinano i p-value dal più piccolo al più grande, ovverop(1)<p(2)<…< p(S);il primo p-value p(1) viene testato a livello di significatività

CONFRONTI MULTIPLI

il primo p value p(1) viene testato a livello di significativitàα/S. Se p(1)>α/S la corrispondente ipotesi nulla non puòessere rifiutata e possiamo concludere che anche tuttele altre ipotese nulle sono vere;se p(1)≤α/S si deve proseguire con il secondo p-valueordinato, ma a livello α/(S−1), e così via, e l’s-esimo p-value sarà confrontato con il livello α/(S−s+1) fino a che

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 36

value sarà confrontato con il livello α/(S s+1), fino a cheuna ipotesi nulla non verrà rifiutata (o fino che si arriva alp-value più piccolo).

Page 19: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

19

metodo di Bonferroni-Holm-Shaffer:si ordinano i p-value dal più piccolo al più grande, ovverop(1)<p(2)<…< p(S);l’s-esimo p-value deve essere confrontato con il livello di

CONFRONTI MULTIPLI

l s esimo p value deve essere confrontato con il livello disignificatività α/S*, dove S* rappresenta il numeromassimo di possibili ipotesi nulle vere al passo s-esimodella procedura, condizionate al numero di rifiuti ottenutial passo precedente:

Ordered p-value No of groups (C) and of

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 37

No. of groups (C) and of pair-wise comparisons (S) p (1) p(2) p(3) p(4) p(5) p(6) p(7) p (8) p(9) p(10) p (11) p(12) p(13) p(14) p(15)

C = 3 – S = 3 3 1 1 C = 4 – S = 6 6 3 3 3 2 1 C = 5 – S = 10 10 6 6 6 6 4 4 3 2 1 C = 6 – S = 15 15 10 10 10 10 10 7 7 7 6 4 4 3 2 1

BLOCCO E COVARIATABlocco e covariata rappresentano due tipologie di fattoredi disturbo noto di cui è possibile tener debitamenteconto per fare in modo che lo studio sul possibile effettodei fattori di interesse sulla risposta sia condotto in modoappropriato.Blocco: si tratta di un fattore di disturbo noto econtrollabile (quasi sempre di tipo qualitativo) che moltoprobabilmente produce sulla risposta un effetto, che noninteressa però allo sperimentatore. Tuttavia la variabilitàche trasmette alla risposta deve essere minimizzata.Tipici fattori di disturbo/blocco sono: lotti di materiale

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 38

Tipici fattori di disturbo/blocco sono: lotti di materialegrezzo, operatori, provini, attrezzature, il fattoretemporale (turni, giorni, ecc.).La presenza del fattore di blocco incide sul problema dadue punti di vista: 1. in sede di pianificazionedell’esperimento e 2. in sede di analisi statistica dei dati.

Page 20: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

20

BLOCCOIl blocco, in sede di pianificazione, rappresenta unarestrizione alla randomizzazione, nel senso che larandomizzazione dovrà essere vincolata in modo tale daessere realizzata indipendentemente per ciascuno dei blivelli del fattore di blocco B.Il fattore di blocco verrà formalmente incluso nel modellostatistico di rappresentazione dei dati (ANOVA una via):

Yijk = µ + τi + βj + εijk,con i=1,...,a, j=1,...,b, k=1,...n.

Quindi, al momento di eseguire l’analisi statistica, unaparte della variabilità totale verrà assegnata all’effetto del

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 39

parte della variabilità totale verrà assegnata all effetto delblocco, e di conseguenza la tabella dell’ANOVA conterràuna riga aggiuntiva in cui si potrà eseguire una formaleverifica di ipotesi sulla significatività del fattore di blocco,ovvero si sottoporrà a verifica l’ipotesi H0B: β1=…=βb=0contro H1B: βj ≠ 0 per almeno un livello j.

BLOCCO

Esempio: per studiare le prestazioni di resistenza di travidi cemento in relazione ai giorni di stagionatura (3,7,28),si utilizzano due distinte macchine (A,B) per laconduzione della prova sperimentale, misurando sup p ,alcuni provini la forza massima di rottura.Modello statistico:

Yijk = µ + τi + βj + εijk i=3,7,28; j=A,B; k=1,…,4Statistica descrittiva:

40000

Boxplot of Forza Max by Stagion

40000

Boxplot of Forza Max by Macchina

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 40

Stagion

Forz

a M

ax

2873

35000

30000

25000

20000

Macchina

Forz

a M

ax

BA

35000

30000

25000

20000

Page 21: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

21

BLOCCO

of F

orza

Max

40000

37500

35000

32500

Stagion Macchina

Main Effects Plot (fitted means) for Forza MaxFactor Type Levels ValuesStagion fixed 3 3; 7; 28Macchina fixed 2 A; B

Analysis of Variance for Forza Max

Source DF Seq SS Adj SS Adj MS F P

Mea

n o

2873

30000

27500

25000

BA

99 1000

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Forza Max

Stagion 2 887893652 887893652 443946826 856.72 0.000Macchina 1 44772836 44772836 44772836 86.40 0.000Error 20 10363813 10363813 518191Total 23 943030301

S = 719.855 R-Sq = 98.90% R-Sq(adj) = 98.74%

Tukey Simultaneous TestsResponse Variable Forza MaxAll Pairwise Comparisons among Levels of StagionStagion = 3 subtracted from:

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 41

Residual

Per

cent

200010000-1000-2000

99

90

50

10

1

Fitted Value

Res

idua

l

40000350003000025000

1000

500

0

-500

-1000

ResidualFr

eque

ncy

10005000-500-1000-1500

8

6

4

2

0

Observation Order

Res

idua

l

24222018161412108642

1000

500

0

-500

-1000

Histogram of the Residuals Residuals Versus the Order of the Data

Difference SE of AdjustedStagion of Means Difference T-Value P-Value7 11670 359.9 32.42 0.0000

28 13856 359.9 38.50 0.0000

Stagion = 7 subtracted from:

Difference SE of AdjustedStagion of Means Difference T-Value P-Value28 2185 359.9 6.072 0.0000

BLOCCONel caso sia pari ad 1 il numero di repliche pertrattamento (definito dalle a×b combinazioni dei livelli delfattore di interesse A e del fattore di blocco B), il modellostatistico di rappresentazione dei dati diventa:

Yij = µ + τi + βj + εij, con i=1,...,a, j=1,...,b.e si parla in questo caso di RCB (RandomizedComplete Block) design.Si consideri uno studio dove si vuole determinare se 4differenti punte (Tip) producono diverse durezze (inmedia) leggendole in un durometro Rockwell. I 4 coupona disposizione sono

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 42

a disposizione sono piuttosto disomogenei,quindi vengono trattati come fattore di blocco(è possibile applicarele 4 punte ad ogni singolo provino).

Page 22: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

22

BLOCCODa notare la struttura a due vie dell’esperimento.Ancora una volta, siamo interessati a testarel’uguaglianza delle medie dei trattamenti (punte deipenetratori), ma bisogna rimuovere la variabilitàassociata al fattore di disturbo (blocchi, ovvero i coupon).La variabilità totale deve essere scompostaconsiderando anche il fattore di blocco:

2 2.. . .. . .. . . ..

1 1 1 1

2 2 2

( ) [( ) ( ) ( )]

( ) ( ) ( )

a b a b

ij i j ij i ji j i j

a b a b

i j ij i j

y y y y y y y y y y

b y y a y y y y y y

= = = =

− = − + − + − − + =

+ − + − + − − +

∑∑ ∑∑

∑ ∑ ∑∑

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 43

I gradi di libertà per la somma dei quadrati sono:ab − 1 = (a − 1) + (b − 1) + (a − 1)×(b − 1)

. .. . .. . . ..1 1 1 1

( ) ( ) ( )i j ij i ji j i j

T Trattamenti Blocchi E

y y y y y y y y

SS SS SS SS= = = =

= + +

∑ ∑ ∑∑

BLOCCOI rapporti tra le somme dei quadrati e i rispettivi gdldefiniscono i quadrati medi, e il rapporto tra il quadratomedio dei trattamenti e il quadrato medio dell’erroredefinisce una statistica F che può essere usata pertestare l’ipotesi di uguaglianza delle medie tra gli a livellidel fattore di interesse.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 44

Page 23: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

23

BLOCCOFactor Type Levels ValuesTip fixed 4 1; 2; 3; 4Coupon fixed 4 1; 2; 3; 4

Analysis of Variance for HardnessSource DF Seq SS Adj SS Adj MS F PTip 3 0.38500 0.38500 0.12833 14.44 0.001Coupon 3 0.82500 0.82500 0.27500Error 9 0.08000 0.08000 0.00889Total 15 1.29000

S = 0.0942809 R-Sq = 93.80% R-Sq(adj) = 89.66%

Tukey Simultaneous TestsResponse Variable HardnessAll Pairwise Comparisons among Levels of Tip

Tip = 1 subtracted from:Difference SE of Adjusted

Tip of Means Difference T-Value P-Value2 0.0250 0.06667 0.375 0.98093 -0.1250 0.06667 -1.875 0.30284 0.3000 0.06667 4.500 0.0067

Tip = 2 subtracted from:Difference SE of Adjusted

Factor Type Levels ValuesTip fixed 4 1; 2; 3; 4

Source DF Seq SS Adj SS Adj MS F PTip 3 0.38500 0.38500 0.12833 1.70 0.220Error 12 0.90500 0.90500 0.07542Total 15 1.29000

S = 0.274621 R-Sq = 29.84% R-Sq(adj) = 12.31%

10.0Coupon Tip

Main Effects Plot (fitted means) for Hardness

99

90 0.1

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Hardness

Difference SE of AdjustedTip of Means Difference T-Value P-Value3 -0.1500 0.06667 -2.250 0.18164 0.2750 0.06667 4.125 0.0113

Tip = 3 subtracted from:Difference SE of Adjusted

Tip of Means Difference T-Value P-Value4 0.4250 0.06667 6.375 0.0006

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 45

Mea

n of

Har

dnes

s

4321

9.9

9.8

9.7

9.6

9.5

9.4

4321

Residual

Per

cent

0.20.10.0-0.1-0.2

50

10

1

Fitted Value

Res

idua

l

10.29.99.69.3

0.0

-0.1

Residual

Freq

uenc

y

0.160.120.080.040.00-0.04-0.08-0.12

4.8

3.6

2.4

1.2

0.0

Observation Order

Res

idua

l

16151413121110987654321

0.1

0.0

-0.1

Histogram of the Residuals Residuals Versus the Order of the Data

BLOCCOL’RCB design utilizza un modello additivo: è importantenotare che nessuna interazione tra trattamenti e blocchiè ammessa.La presenza simultanea di due fonti di variabilità didi t b bbli l’ tili di lt i ti l i di idisturbo obbliga l’utilizzo di un ulteriore tipologia di pianosperimentale: il piano a quadrati Latini.Anche in questo caso, una assunzione importante è chei trattamenti e i 2 fattori di disturbo non interagiscono.Esempio di quadrato latino 5×5:

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 46

In caso via siano 3 fattori i blocco, si utilizza il piano aquadrati Greco-Latini.

Page 24: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

24

COVARIATASe il fattore di disturbo è noto, osservabile ma noncontrollabile, si può usare l’analisi della covarianza perrimuovere l’effetto del fattore di disturbo dall’analisi.Tipiche covariate sono: temperatura, umidità, ecc. (ingenerale variabili continue che caratterizzano ilgenerale variabili continue che caratterizzano ilcontesto/l’ambiente sperimentale).La presenza di (una o più) covariate non incide nellapianificazione, ma solo nella fase di analisi statistica.Il modello statistico di rappresentazione dei dati diventa:

Yij = µ + τi + Xij γ + εij, con i=1,...,a, j=1,..., n,dove Xij è il valore della(e) covariata(e).in sede di analisi statistica na parte della ariabilità

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 47

in sede di analisi statistica, una parte della variabilitàtotale verrà assegnata all’effetto della covariata e latabella dell’ANOVA conterrà una riga aggiuntiva in cui sipotrà eseguire una formale verifica di ipotesi sullasignificatività della covariata, ovvero si sottoporrà averifica l’ipotesi H0COV: γ =0 contro H1COV: γ ≠ 0.

COVARIATAIn uno studio sulle proprietà meccaniche di un nuovabarra di fibra di carbonio si vogliono confrontare leprestazioni in termini di tensione di rottura rispetto a trediversi fornitori (A,B,C). Nel condurre le prove si è volutotenere conto della massa lineica delle barre, in quanto èpossibile che anche da essa possa dipendere in modorilevante la tensione stessa.

Factor Type Levels ValuesFornitore fixed 3 A; B; CAnalysis of Variance for Tensione rottura

ean

of T

ensi

one

rott

ura

3500

3000

2500

2000

Main Effects Plot (fitted means) for Tensione rottura

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 48

Term Coef SE Coef T PConstant -2198 1113 -1.98 0.055Massa lineica 29.690 6.737 4.41 0.000

Source DF SS MS F PMassa lineica 1 264056 2264056 19.42 0.000Fornitore 2 2649091 1324546 11.36 0.000Error 41 4779190 116566Total 44 7444345

Fornitore

Me

CBA

1500

1000

Page 25: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

25

COVARIATAAll Pairwise Bonferroni Simultaneous Comparisons among Levels of Fornitore

Fornitore = A subtracted from:Difference SE of Adjusted

Fornitore of Means Difference T-Value P-ValueB -2473 557.2 -4.438 0.0002C -107 137.5 -0.778 1.0000

Fornitore = B subtracted from:Difference SE of Adjusted

Fornitore of Means Difference T-Value P-ValueC 2366 500.9 4.723 0.0001

Per

cent

99

90

50

Res

idua

l

800

400

0

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Tensione rottura

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 49

Residual

P

5000-500-1000

10

1

Fitted ValueR

30002750250022502000

-400

-800

Residual

Freq

uenc

y

6004002000-200-400-600-800

10.0

7.5

5.0

2.5

0.0

Observation Order

Res

idua

l

454035302520151051

800

400

0

-400

-800

Histogram of the Residuals Residuals Versus the Order of the Data

Nell’ANOVA a due vie si vuole stabilire se l’effetto dei duefattori di interesse A e B e della loro interazione ha unimpatto significativo sulla risposta.Si definisce interazione la possibile sinergia dei due

ANOVA A DUE VIE

p gfattori che si verifica quando l’effetto del fattore A sullarisposta è diverso a seconda dei livelli del fattore B.Il modello di rappresentazione dei dati è il seguente:

Yijk = µ + τi + βj + (τβ)ij + εijk,con i=1,...,a, j=1,...,b, k=1,...n.

Le analisi inferenziali di interesse corrispondono alle

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 50

verifiche d’ipotesi:H0A: τ1=…=τa=0 contro H1A: τi ≠ 0 per almeno un livello i;H0B: β1=…=βb=0 contro H1B: βj ≠ 0 per almeno un livello j;H0AB: (τβ)11= …=(τβ)ab= 0 contro H1AB: (τβ)ij≠0 per almeno

una combinazione di livelli ij.

Page 26: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

26

Ad esempio, in uno studio sui materiali di costruzione vienemisurato lo stato tensionale in relazione allo stato di degradodei mattoni e delle malte. L’obiettivo è stabilire se degradodei mattoni e delle malte, così come la loro interazione,

ANOVA A DUE VIE

2 5Degr. mattoni Degr. malte

Main Effects Plot (fitted means) for Stato tens. [Mpa]

3.0 Degr.

Interaction Plot (fitted means) for Stato tens. [Mpa]

causa una variazione nello stato tensionale. I valori medicampionari della risposta, per ciascun livello dei singoli fattori(main effect plot) e per i 4 trattamenti in questione(interaction plot), possono fornire una preliminareindicazione descrittiva sul problema.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 51

Mea

n of

Sta

to t

ens.

[M

pa]

SINO

2.5

2.0

1.5

1.0

0.5SINO Degr. malte

Mea

n

SINO

2.5

2.0

1.5

1.0

0.5

mattoniNOSI

Per sviluppare una formale verifica di ipotesi, per ciascunadelle tre ipotesi H0 di interesse, è necessario considerare laseguente scomposizione della somma dei quadrati dellarisposta.

ANOVA A DUE VIE

2 2 2... .. ... . . ...

1 1 1 1 1

2 2. .. . . ... .

1 1 1 1 1

( ) ( ) ( )

( ) ( )

a b n a b

ijk i ji j k i j

a b a b n

ij i j ijk iji j i j k

y y bn y y an y y

n y y y y y y

= = = = =

= = = = =

− = − + −

+ − − + + −

∑∑∑ ∑ ∑

∑∑ ∑∑∑

p

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 52

gradi di libertà:1 1 1 ( 1)( 1) ( 1)

T A B AB ESS SS SS SS SSdfabn a b a b ab n

= + + +

− = − + − + − − + −

Page 27: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

27

Grazie all’assunzione di normalità del termine di errorecasuale, è possibile considerare tre statistiche test di tipo F,riassunte nella usuale tabella ANOVA.

ANOVA A DUE VIE

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 53

Qualora uno o più p-value fossero inferiori al livello αprefissato, si potrebbe rigettare la corrispondente ipotesi H0e concludere che i relativi effetti sono significativi.

ANOVA A DUE VIESe applichiamo l’analisi inferenziale ANOVA al caso studiosul degrado delle malte otteniamo i seguenti risultati. Fissatoil livello α al 5%, si può concludere che sia il degrado dellemalte, sia quello dei mattoni sia la loro interazione ha un

Factor Type Levels ValuesDegr. mattoni fixed 2 NO; SIDegr. malte fixed 2 NO; SI

Analysis of Variance for Stato tens. [Mpa], using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

qeffetto significativo sullo stato tensionale.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 54

Source DF Seq SS Adj SS Adj MS F PDegr. mattoni 1 0.6765 0.6765 0.6765 56.13 0.000Degr. malte 1 11.8164 11.8164 11.8164 980.45 0.000Degr. mattoni*Degr. malte 1 2.1683 2.1683 2.1683 179.91 0.000Error 12 0.1446 0.1446 0.0121Total 15 14.8058

S = 0.109782 R-Sq = 99.02% R-Sq(adj) = 98.78%

Page 28: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

28

ANOVA A DUE VIE

Tukey Simultaneous Tests - Response Variable Stato tens. [Mpa]ll i i i l f i* l

Grazie all’applicazione della procedura dei confronti a coppie(metodo di Tukey) possiamo affermare che tutti i 4 trattamentidifferiscono significativamente tra loro (a livello α=5%).

All Pairwise Comparisons among Levels of Degr. mattoni*Degr. malte

Degr. mattoni = NODegr. malte = NO subtracted from:Degr. Degr. Difference SE of Adjustedmattoni malte of Means Difference T-Value P-ValueNO SI -2.455 0.07763 -31.63 0.0000SI NO -1.147 0.07763 -14.78 0.0000SI SI -2.130 0.07763 -27.44 0.0000

Degr. mattoni = NODegr. malte = SI subtracted from:Degr. Degr. Difference SE of Adjusted

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 55

g g jmattoni malte of Means Difference T-Value P-ValueSI NO 1.3075 0.07763 16.843 0.0000SI SI 0.3250 0.07763 4.187 0.0060

Degr. mattoni = SIDegr. malte = NO subtracted from:Degr. Degr. Difference SE of Adjustedmattoni malte of Means Difference T-Value P-ValueSI SI -0.9825 0.07763 -12.66 0.0000

ANOVA A DUE VIEL’analisi dei residui indica che l’assunzione di normalità deltermine di errore è ragionevole, mentre vi sono delleperplessità sull’assunzione di omogeneità dalla varianza(ipotesi di omoschedasticità).( p )

Residual

Per

cent

0.20.10.0-0.1-0.2

99

90

50

10

1

Fitted Value

Res

idua

l

321

0.2

0.1

0.0

-0.1

-0.2

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Stato tens. [Mpa]

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 56

Residual

Freq

uenc

y

0.20.10.0-0.1-0.2

4.8

3.6

2.4

1.2

0.0

Observation Order

Res

idua

l

16151413121110987654321

0.2

0.1

0.0

-0.1

-0.2

Histogram of the Residuals Residuals Versus the Order of the Data

Page 29: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

29

E’ importante notare che la procedura dell’ANOVA trattaogni fattore come se fosse qualitativo,indipendentemente dal fatto che sia qualitativo oquantitativo.

ANOVA A DUE VIE

qA volte un esperimento può coinvolgere sia fattoriquantitativi che qualitativi.Questo fatto può essere considerato nell’analisistatistica in riferimento ad un modello di regressione, peri fattori quantitativi a ciascun livello (o combinazione deilivelli) dei fattori qualitativi. Si tratta di una analisi

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 57

aggiuntiva (e seguente a quella ANOVA) che può essereimplementata sugli stessi dati sperimentali.Queste curve e/o superfici di risposta sono spesso unaiuto considerevole nell’interpretazione pratica deirisultati.

Si consideri uno studio sulla durata di vita di una batteria infunzione della temperatura di esercizio (fattore A) ed deltipo di materiale utilizzato (fattore B).

ANOVA A DUE VIE

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 58

In questo caso, separatamente per ciascun materiale, èpossibile applicare anche un modello di regressione, ad es.

Yi = β0 + β1 Ti + β1 Ti2 + εi .

Page 30: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

30

ANOVA A DUE VIEL’applicazione dell’analisi inferenziale ANOVA a due vie alcaso studio sulla durata della batteria mette in luce i seguentirisultati. Fissato il livello α al 5%, si può concludere che sia ilmateriale sia la temperatura di esercizio, così come la loro

Factor Type Levels ValuesMateriale fixed 3 1; 2; 3Temper fixed 3 15; 70; 125

Analysis of Variance for Batteri, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

pinterazione, hanno un effetto significativo sulla durata dellabatteria.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 59

Source DF Seq SS Adj SS Adj MS F PMateriale 2 10683.7 10683.7 5341.9 7.91 0.002Temper 2 39118.7 39118.7 19559.4 28.97 0.000Materiale*Temper 4 9613.8 9613.8 2403.4 3.56 0.019Error 27 18230.7 18230.7 675.2Total 35 77647.0

S = 25.9849 R-Sq = 76.52% R-Sq(adj) = 69.56%

ANOVA A DUE VIEAnalizzando i main effect e interaction plot (dopo l’analisiinferenziale) possiamo stabilire quale sia il materiale miglioree peggiore e quale sia l’effetto della temperatura (relazioneinversa con la durata). Inoltre si desume che al variare del

150

140

130

Materiale Temper

Main Effects Plot (fitted means) for Durata

150

125

Materiale

3

12

Interaction Plot (fitted means) for Durata

)materiale, l’effetto della temperatura non è lo stesso (ognimateriale ha un proprio profilo di durata in funzione dellatemperatura).

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 60

Mea

n of

Dur

ata

321

130

120

110

100

90

80

70

601257015 Temper

Mea

n

1257015

100

75

50

Page 31: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

31

ANOVA A DUE VIEL’analisi dei residui non evidenzia alcuna criticità rispetto alletre assunzioni (normalità, indipendenza edomoschedasticità) sul termine di errore casuale del modello.

Residual

Per

cen

t

50250-25-50

99

90

50

10

1

Fitted Value

Res

idu

al

1501251007550

50

25

0

-25

-50

50

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Histogram of the Residuals Residuals Versus the Order of the Data

Residual Plots for Durata

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 61

Residual

Freq

uenc

y

4530150-15-30-45-60

10.0

7.5

5.0

2.5

0.0

Observation Order

Res

idua

l

35302520151051

50

25

0

-25

-50

ANOVA A DUE VIEDal momento che uno dei due fattori è di tipo quantitativo(temperatura) è possibile stimare una curva di risposta(polinomiale di 2° grado) per ciascuno dei tre materiali. Dairisultati si possono desumere delle importanti indicazioni sul

urat

a

200

150

100

Materiale

3

12

Scatterplot of Durata vs Temper

profili di durata per i tre materiali.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 62

Temper

Du

140120100806040200

50

0

Page 32: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

32

In uno studio sulle frodi alimentari, si vuole stabilire se i duefattori “origine della produzione” (due livelli: standard ocommerciale) e “tipo di produzione” (due livelli: allevamentoo pescato) e la loro interazione hanno un impatto

ANOVA A DUE VIE

significativo sulla quantità di grasso nella carne di branzino.I valori medi campionari della risposta, per ciascun livello deisingoli fattori (main effect plot) e per i 4 trattamenti inquestione (interaction plot), possono fornire unapreliminare indicazione descrittiva sul problema.

Origine

Interaction Plot (fitted means) for grasso

Origine Tipo Prod

Main Effects Plot (fitted means) for grasso

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 63

Tipo Prod

Mea

n

PescatoAllevam

6

5

4

3

2

O g eCommStd

Mea

n of

gra

sso

StdComm

6.0

5.5

5.0

4.5

4.0

PescatoAllevam

Origine Tipo Prod

ANOVA A DUE VIESe applichiamo l’analisi inferenziale ANOVA al caso studiosulle frodi alimentari dei branzini otteniamo i seguentirisultati. Fissato il livello α al 5%, si può concludere che sia iltipo di produzione, sia l’origine sia la loro interazione ha un

Factor Type Levels ValuesOrigine fixed 2 Comm; StdTipo Prod fixed 2 Allevam; Pescato

Analysis of Variance for grasso, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

p p geffetto significativo sulla quantità di grasso nella carne.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 64

Source DF Seq SS Adj SS Adj MS F POrigine 1 88.630 93.720 93.720 12.83 0.001Tipo Prod 1 30.892 68.671 68.671 9.40 0.003Origine*Tipo Prod 1 122.552 122.552 122.552 16.78 0.000Error 102 745.100 745.100 7.305Total 105 987.173

S = 2.70276 R-Sq = 24.52% R-Sq(adj) = 22.30%

Page 33: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

33

ANOVA A DUE VIEGrazie all’applicazione della procedura dei confronti multiplia coppie (metodo di Tukey) possiamo concludere chesolamente lo standard/pescato differisce (ha meno grasso, siveda l’interaction plot) rispetto agli altri 3 trattamenti, che

Tukey Simultaneous Tests Response Variable grassoAll Pairwise Comparisons among Levels of Origine*Tipo Prod

Origine = Comm, Tipo Prod = Allevam subtracted from:Difference SE of Adjusted

Origine Tipo Prod of Means Difference T-Value P-ValueComm Pescato 0.561 0.6605 0.849 0.8308Std Allevam 0.280 0.7616 0.368 0.9829Std Pescato -3.620 0.7742 -4.676 0.0001

presentano invece tra loro uguale valore medio di grasso.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 65

Origine = Comm, Tipo Prod = Pescato subtracted from:Difference SE of Adjusted

Origine Tipo Prod of Means Difference T-Value P-ValueStd Allevam -0.281 0.7659 -0.367 0.9831Std Pescato -4.181 0.7784 -5.371 0.0000

Origine = Std, Tipo Prod = Allevam subtracted from:Difference SE of Adjusted

Origine Tipo Prod of Means Difference T-Value P-ValueStd Pescato -3.900 0.8659 -4.504 0.0001

ANOVA A DUE VIEL’analisi dei residui indica che l’assunzione di normalità deltermine di errore è ragionevole, mentre qualche perplessitàrimane sull’assunzione di omogeneità dalla varianza (ipotesidi omoschedasticità).

Residual

Per

cent

1050-5-10

99.9

99

90

50

10

1

0.1

Fitted Value

Res

idua

l

65432

10

5

0

-5

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for grasso

)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 66

Residual

Freq

uenc

y

9630-3-6

24

18

12

6

0

Observation Order

Res

idua

l

1009080706050403020101

10

5

0

-5

Histogram of the Residuals Residuals Versus the Order of the Data

Page 34: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

34

ANALISI DELLA VARIANZA MULTIVIA

Modello statistico (3 fattori)

( ) ( ) ( ) ( )⎪

⎪⎪⎨

⎧==

++++++++=k

bjai

Y ijklijkjkikijkjiijkl 21,...,2,1,...,2,1

ετβγβγτγτβγβτµ

Numero di osservazioni totali: abcn

⎪⎪⎩ =

=nlckjijkjkikijjj

,...,2,1,...,2,1

Yijkl  è variabile casuale che indica l’ijkl‐esima osservazione   µ  è il valore atteso totale, è un parametro comune a tutti i livelli 

dell’esperimento   iτ  è l’effetto dell’i‐esimo livello del fattore A  

jβ  è l’effetto del j‐esimo livello del fattore B  

kγ è l’effetto del k‐esimo livello del fattore C  

( )ijτβ è l’effetto dell’interazione tra il fattore A e il fattore B 

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 67

( )ijβ ( )ikτγ è l’effetto dell’interazione tra il fattore A e il fattore C 

( ) jkβγ  è l’effetto dell’interazione tra il fattore B e il fattore C 

( )ijkτβγ  è l’effetto dell’interazione tra il fattore A, il fattore B e il fattore C 

ijklε   rappresenta la componente dell’errore casuale avente distribuzione 

normale con media zero e varianza  2σ . 

La procedura di base è simile al caso a due fattori; tutti leabc…k combinazioni dei fattori (trattamenti) , ciascunareplicata n volte, vengono realizzate in ordine casuale.

ANALISI DELLA VARIANZA MULTIVIA

Anche l’analisi ANOVA è simile e si basa sullascomposizione della somma dei quadrati del tipo:

T A B AB AC

ABC AB K E

SS SS SS SS SSSS SS SS

= + + + + ++ + + +

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 68

Per quanto riguarda l’analisi inferenziale, si avrannotante verifiche di ipotesi (cosiddette sugli effetti principali)quanti sono i k fattori, così come si andrà a testare lasignificatività delle interazioni a due, a tre e così via.

Page 35: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

35

PIANI 2KLo studio sulle frodi alimentari è un esempio di piano 22,ovvero di piano 2k con k=2. In generale, un piano 2k è uncaso particolare di piano multivia quando si consideranok fattori, ciascuno dei quali su 2 livelli (detti con-venzionalmente “alto”/”basso” o “presenza”/“assenza”venzionalmente alto / basso o presenza / assenza ,rispettivamente per fattori quantitativi o qualitativi).Si noti che il modello di rappresentazione dei dati includek effetti principali, e interazioni a 2 e a 3 e così via.Il piano 2k è particolarmente utile nelle fasi iniziali dellasperimentazione quando è probabile che ci siano moltifattori da analizzare. Dato che tale piano determina un

2k⎛ ⎞⎜ ⎟⎝ ⎠ 3

k⎛ ⎞⎜ ⎟⎝ ⎠

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 69

numero di trattamenti che il minimo valore possibile perlo studio di k fattori, il piano 2k viene ampiamenteutilizzato negli esperimenti di screening.Dato che si considerano solamente due livelli per fattore,si assume implicitamente che la risposta varilinearmente nel range dei livelli scelti del fattore.

Esempio: si consideri il processo di riempimento di unabevanda gasata dove la risposta (differenza dell’altezza dellivello target) è in funzione di 3 fattori, quali A: % dicarbonazione, B: pressione e C: velocità del macchinario.P i d li 8 i li 2

PIANI 2K

Per ciascuno degli 8 trattamenti sono state realizzate n=2repliche.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 70

Page 36: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

36

PIANI 2K

Term Effect Coef SE Coef T PConstant 1.0000 0.1976 5.06 0.001A 3.0000 1.5000 0.1976 7.59 0.000B 2 2500 1 1250 0 1976 5 69 0 000

Risultati dell’analisi inferenziale.

B 2.2500 1.1250 0.1976 5.69 0.000C 1.7500 0.8750 0.1976 4.43 0.002A*B 0.7500 0.3750 0.1976 1.90 0.094A*C 0.2500 0.1250 0.1976 0.63 0.545B*C 0.5000 0.2500 0.1976 1.26 0.242A*B*C 0.5000 0.2500 0.1976 1.26 0.242

S = 0.790569 R-Sq = 93.59% R-Sq(adj) = 87.98%

Analysis of Variance for Y (coded units)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 71

Source DF Seq SS Adj SS Adj MS F PMain Effects 3 68.500 68.500 22.8333 36.53 0.0002-Way Interactions 3 3.500 3.500 1.1667 1.87 0.2143-Way Interactions 1 1.000 1.000 1.0000 1.60 0.242Residual Error 8 5.000 5.000 0.6250Pure Error 8 5.000 5.000 0.6250

Total 15 78.000

PIANI 2KMain effect e interaction plot.

3025 2502004

2

A1012

Interaction Plot (data means) for Y

A

B

C

2

0

4

2

0

12

B2530

Y

2

1

0

A B

Main Effects Plot (data means) for Y

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 72

Mea

n of

1210 3025

250200

2

1

0

C

Page 37: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

37

Hold ValuesA 10B 25

Surface Plots of Y

PIANI 2KSurface e contour plot.

30.0

Y

-2

0

27.5

2

B10 11 25.012A

240

Y

-2-101

220 C10 11 20012A

240

Y

-2

-1

0

1

220 C25.0 20027.5 30.0B

C 200

B*A30.0

27.5

C*A

240

220

Y

-1 - 00 - 11 - 2

> 2

< -2-2 - -1

Contour Plots of Y

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 73

12.011.511.010.510.025.0

12.011.511.010.510.0200

C*B

30.027.525.0

240

220

200

Hold ValuesA 10B 25C 200

2

ESEMPIO

PIANI 2K

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 74

Page 38: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

38

Negli esperimenti che abbiamo considerato finora i fattorisi assumono come fissi: ciò significa che losperimentatore può fissare a propria scelta i livelli delfattore stesso.

FATTORI FISSI E FATTORI CASUALI

L’analisi inferenziale mira a stabilire se quei specificilivelli del fattore inducono una variazione significativanella risposta.Talvolta invece i livelli dei fattori non possono essereconsiderati fissi, ma sono di fatto estratti casualmente dauna più ampia popolazione di possibili livelli (ad es. alcun

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 75

tra tutti i possibili operatori, laboratori, ecc.).Parliamo in questo caso di fattori casuali. L’obiettivo èstabilire se l’intera popolazione di un dato fattore casualeha un effetto significativo sulla risposta.

FATTORI FISSI E FATTORI CASUALINei disegni con fattori casuali spesso l’obiettivo è anchequello di isolare e stimare la parte della variabilitàimputabile al fattore casuale, separandola dalla variabilitànon controllabile (rappresentata dal termine casuale ε).( pp )Nel caso di un singolo fattore casuale, il modello statisticoè definito come

sia τi sia εi sono assunte variabili casuali, ovvero

1, 2,...,1, 2,...,ij i ij

i ay

j nµ τ ε

=⎧= + + ⎨ =⎩

2 2(0 ) e (0 )IIN IINε σ τ σ

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 76

da cui, la variabilità totale della variabile casuale cherappresenta ciascuna osservazione è data da

(0, ) e (0, )ij iIIN IIN τε σ τ σ∼ ∼

2 2( )ijV y τσ σ= +

Page 39: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

39

La variabilità totale delle osservazioni è scomposta in unacomponente che misura la variabilità tra i trattamenti e unache misura la variabilità all’interno dei trattamenti.La verifica di ipotesi sugli effetti di un trattamento individualeè i di i ifi l l i i

FATTORI FISSI E FATTORI CASUALI

è priva di significato, pertanto vengono valutate le ipotesisulle componenti di varianza:

Se σ2τ=0 tutti i trattamenti sono identici; se invece σ2

τ>0 c’èvariabilità tra i trattamenti (e quindi un effetto sulla risposta).

20

21

: 0

: 0

H

τ

σ

σ

=

>

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 77

variabilità tra i trattamenti (e quindi un effetto sulla risposta).I valori attesi delle somme dei quadrati portano a

Bisogna quindi valutare la statistica test F con a-1 e N-1gradi di libertà: .0 /Trattamenti EF MS MS=

2 2 2( ) e ( )E TrattamentiE MS E MS n= = + τσ σ σ

Gli stimatori delle componenti della varianza sono:2 2 2

2

ˆ ˆ ˆ e

ˆ

E Trattamenti

Trattamenti E

MS n MSMS MS

= + =

−=

τσ σ σ

σ

FATTORI FISSI E FATTORI CASUALI

Nel caso di due o più fattori (tutti od in parte) di tipocasuale, si possono ricavare opportuni stimatori dellecomponenti della varianza e stimare il peso checiascuna di queste ha sulla variabilità (e quindi sulla

2ˆ E

nMS

=

=

τσ

σ

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 78

ciascuna di queste ha sulla variabilità (e quindi sullaripetibilità) dell’intero sistema/protocollo di misurazione.Si noti che talvolta il metodo di analisi della varianza puòcondurre ad una stima negativa (ovviamente priva disignificato) di un componente della varianza.

Page 40: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

40

ESEMPIO: In uno studio sulla ripetibilità di un sistemasperimentale finalizzato all’indagine delle problematicheinerenti alla presenza dei detriti lignei in alveo, si èmisurato il flusso di portata (m3/s) tale da trascinar via i

hi i di hi di i di i i

FATTORI FISSI E FATTORI CASUALI

tronchi, per un campione di tronchi di varie dimensioni(lunghezza, diametro ed estensione delle radici).Per ciascunodei 16 tronchiconsiderati, la provaè stata ripetuta10 volte. [m

^3

/s]

30

28

26

Dot Plot della Portata (Y) [m^3/s] vs ID tronco

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 79

10 volte.

ID tronco

Por

tata

(Y

)

16151413121110987654321

24

22

20

FATTORI FISSI E FATTORI CASUALIFactor Type Levels ValuesID tronco random 16 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15; 16

Analysis of Variance for Portata (Y) [m^3/s], using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PID tronco 15 554.229 554.229 36.949 37.17 0.000Error 144 143.126 143.126 0.994Total 159 697 355Total 159 697.355

S = 0.996960 R-Sq = 79.48% R-Sq(adj) = 77.34%

Expected Mean Squares, using Adjusted SS

Expected MeanSquare for Each

Source Term1 ID tronco (2) + 10.0000 (1)2 Error (2)

Error Terms for Tests, using Adjusted SS

Per

cent

99.9

99

90

50

Res

idua

l

3.0

1.5

0.0

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Portata (Y) [m^3/s]

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 80

Synthesisof Error

Source Error DF Error MS MS1 ID tronco 144.00 0.994 (2)

Variance Components, using Adjusted SS

EstimatedSource ValueID tronco 3.5955Error 0.9939

Residual

P

3.01.50.0-1.5-3.0

10

1

0.1

Fitted Value

R

28262422

-1.5

-3.0

Residual

Freq

uenc

y

210-1-2-3

40

30

20

10

0

Observation Order

Res

idua

l

160

150

140

130

120

110

1009080706050403020101

3.0

1.5

0.0

-1.5

-3.0

Histogram of the Residuals Residuals Versus the Order of the Data

Page 41: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

41

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀSpesso risulta di interesse validare/studiare un protocollodi laboratorio mediante un esperimento pianificato al finedi studiare/stimare le componenti di variabilità di undeterminato sistema di misurazione. Si parla di ANOVAG R&R (R bili & R d ibili )Gauge R&R (Repeatability & Reproducibility).Per ripetibilità si intende la variazione nelle misure preseda una stessa persona/strumento sulla stessa unità e allestesse condizioni. La ripetibilità è la parte della variabilitàattribuibile al solo errore sperimentale (σ2 relativo ad ε) .Con riproducibilità ci si riferisce invece alla componentedella variabilità che può essere attribuita all’operatore

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 81

della variabilità che può essere attribuita all operatore(inteso quindi come fattore casuale, come se un operatorevenisse “estratto” da una ipotetica popolazione).Nel caso si considerasse anche il fattore laboratorio,saremmo di fronte ad un modello con due fattori casuali,entrambi con un possibile impatto sulla riproducibilità.

Il modello di riferimento per gli studi Gauge R&Rconsiste in un ANOVA a due fattori casuali (parti eoperatore), dove appunto entrambi i fattori sono assuntidelle variabili casuali con distribuzione normale con

l i l i di d i

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ

valore atteso zero e siano tra loro indipendenti:

2 2 2 2

2 2 2 2

( ) ,

1, 2,..., ; 1, 2,..., ; 1, 2,...,( ) , ( ) , [( ) ] , ( )

( )

ijk i j ij ijk

i j ij ijk

y

i a j b k nV V V V

V y

= + + + +

= = =

= = = =

= + + +τ β τβ

µ τ β τβ ε

τ σ β σ τβ σ ε σ

σ σ σ σ

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 82

Le ipotesi di interesse da sottoporre a verifica sono tre:

( )ijkV y = + + +τ β τβσ σ σ σ

2 2 20 0 0

2 2 21 1 1

: 0 : 0 : 0

: 0 : 0 : 0A B AB

A B AB

H H H

H H H

= = =

> > >τ β τβ

τ β τβ

σ σ σ

σ σ σ

Page 42: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

42

I valori attesi dei quadrati medi sono:

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ

2 2 20

2 2 2

( )

( )A A A ABE MS n bn F MS MS

E MS n an F MS MS

= + + ⇒ =

= + + ⇒ =τβ τσ σ σ

σ σ σ

Le componenti della varianza possono essere stimateeguagliando i quadrati medi osservati ai loro valori attesi:

0

2 20

2

( )

( )

( )

B B B AB

AB AB AB E

E

E MS n an F MS MS

E MS n F MS MS

E MS

= + + ⇒ =

= + ⇒ =

=

τβ β

τβ

σ σ σ

σ σ

σ

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 83

eguagliando i quadrati medi osservati ai loro valori attesi:2 2

2 2

ˆ ˆ

ˆ ˆ

A AB B AB

AB EE

MS MS MS MSbn an

MS MS MSn

− −= =

−= =

τ β

τβ

σ σ

σ σ

ESEMPIO: uno strumento viene utilizzato per misurareuna dimensione critica di un pezzo. Venti pezzi sonostati scelti casualmente dal processo di produzione e treoperatori, scelti casualmente, misurano per due volte

i

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ

con questo strumento ciascun pezzo.

sura

32.5

30.0

27.5

25.0

Dot Plot of Misura vs Parti; Operatore

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 84

Mis

PartiOperatore

2019181716151413121110987654321

321321321321321321321321321321321321321321321321321321321321

22.5

20.0

17.5

15.0

Page 43: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

43

Factor Type Levels ValuesParti random 20 1; 2; ...; 19; 20Operatore random 3 1; 2; 3

Analysis of Variance for Misura, using Adjusted SS for TestsSource DF Seq SS Adj SS Adj MS F PParti 19 1185.425 1185.425 62.391 87.65 0.000Operatore 2 2.617 2.617 1.308 1.84 0.173Parti*Operatore 38 27.050 27.050 0.712 0.72 0.861Error 60 59 500 59 500 0 992

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ

Error 60 59.500 59.500 0.992Total 119 1274.592

S = 0.995825 R-Sq = 95.33% R-Sq(adj) = 90.74%

Expected Mean Squares, using Adjusted SSSource Expected Mean Square for Each Term

1 Parti (4) + 2.0000 (3) + 6.0000 (1)2 Operatore (4) + 2.0000 (3) + 40.0000 (2)3 Parti*Operatore (4) + 2.0000 (3)4 Error (4)

Error Terms for Tests, using Adjusted SSSynthesisof Error nt

99.9

99

90

ual

1

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Misura

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 85

Source Error DF Error MS MS1 Parti 38.00 0.712 (3)2 Operatore 38.00 0.712 (3)3 Parti*Operatore 60.00 0.992 (4)

Variance Components, using Adjusted SSEstimated

Source ValueParti 10.2798Operatore 0.0149Parti*Operatore -0.1399Error 0.9917

Residual

Per

cen

210-1-2

50

10

1

0.1

Fitted Value

Res

idu

32282420

0

-1

Residual

Freq

uenc

y

1.51.00.50.0-0.5-1.0-1.5

30

20

10

0

Observation Order

Res

idua

l

1201101009080706050403020101

1

0

-1

Histogram of the Residuals Residuals Versus the Order of the Data

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀTwo-Way ANOVA Table With Interaction Source DF SS MS F PParti 19 1185.43 62.3908 87.6470 0.000Operatore 2 2.62 1.3083 1.8380 0.173Parti * Operatore 38 27.05 0.7118 0.7178 0.861Repeatability 60 59.50 0.9917Total 119 1274.59

Two-Way ANOVA Table Without Interaction ySource DF SS MS F PParti 19 1185.43 62.3908 70.6447 0.000Operatore 2 2.62 1.3083 1.4814 0.232Repeatability 98 86.55 0.8832Total 119 1274.59

Gage R&R %ContributionSource VarComp (of VarComp)Total Gage R&R 0.8938 8.02Repeatability 0.8832 7.92Reproducibility 0.0106 0.10

Operatore 0.0106 0.10Part-To-Part 10.2513 91.98Total Variation 11.1451 100.00

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 86

Study Var %Study VarSource StdDev (SD) (6 * SD) (%SV)Total Gage R&R 0.94541 5.6724 28.32Repeatability 0.93977 5.6386 28.15Reproducibility 0.10310 0.6186 3.09

Operatore 0.10310 0.6186 3.09Part-To-Part 3.20176 19.2106 95.91Total Variation 3.33842 20.0305 100.00

Number of Distinct Categories = 4

Page 44: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

44

erc

ent

100

50

% Contribution% Study Var

30

25

Components of Variation Misura by Parti

Gage R&R (ANOVA) for Misura

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ

Pe

Part-to-PartReprodRepeatGage R&R0

Sam

ple

Ran

ge

4

2

0

_R=1.15

UCL=3.757

LCL=0

1 2 3

Parti2019181716151413121110987654321

20

Operatore321

30

25

20

R Chart by Operatore

Xbar Chart by Operatore

Misura by Operatore

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 87

Sam

ple

Mea

n

30

25

20

__X=22.39

UCL=24.55

LCL=20.23

1 2 3

Parti

Ave

rage

2019181716151413121110 9 8 7 6 5 4 3 2 1

30

25

20

Operatore123

Xbar Chart by Operatore Operatore * Parti Interaction

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀFinora abbiamo considerato i due fattori operatore e particome crossed, ovvero ciascun operatore misura tutti ipezzi (le parti). Questo schema rappresenta il pianosperimentale standard degli studi R&R.p gTalvolta il fattore operatore può però risultare nidificato(nested) all’interno delle parti (ciascun operatore misuraun singolo pezzo) oppure all’interno di un terzo fattore, adesempio il laboratorio/reparto (un operatore operasolamente all’interno di un dato laboratorio).In presenza di fattori nested il numero di trattamenti e di

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 88

In presenza di fattori nested, il numero di trattamenti e digradi di libertà si calcolano in modo diverso dal casostandard (detto fattori crossed).

Page 45: FONDAMENTI DI INFERENZAFONDAMENTI DI INFERENZAstatic.gest.unipd.it/~livio/PDF/PDF_CIVILE/Progettazione ed analisi... · 1 Metodi Statistici e Probabilistici per l’Ingegneria FONDAMENTI

45

ESEMPIO: uno studio inter-laboratorio, dove la risposta è ilconteggio delle colonie batteriche aerobiche, è statocondotto in 10 laboratori in ciascuno dei quali 2 analistihanno provato 2 campioni di uno stesso lotto, facendo le

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀ

p panalisi in doppio per ogni campione. Quindi, ogni laboratorioha effettuato 2x2x2=8 analisi e il numero totale di prove èpari ad 80. Si tratta di uno studio Gauge R&R con 3 fattori(full nested). Dall’analisi della tabella ANOVA, fissato illivello α=5%, si evince che sia tra laboratori sia tra campioniesiste una differenza significativa.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 89

Analysis of Variance for Log(counts), using Adjusted SS for TestsSource DF Seq SS Adj SS Adj MS F PLaboratory 9 12.63583 12.63583 1.40398 9.42 0.001Analyst(Laboratory) 10 1.49058 1.49058 0.14906 2.22 0.062Sample(Laboratory Analyst) 20 1.34515 1.34515 0.06726 4.84 0.000Error 40 0.55540 0.55540 0.01389Total 79 16.02695S = 0.117835 R-Sq = 96.53% R-Sq(adj) = 93.16%

STUDI DI RIPETIBILITÀ E RIPRODUCIBILITÀVariance Components

% ofSource Var Comp. Total StDevLaboratory 0.157 71.99 0.396Analyst 0.020 9.39 0.143Sample 0.027 12.25 0.163

g(co

unts

)

6.5

6.0

5.5

Dotplot of Log(counts) vs Laboratory; Analyst; Sample

erce

nt

99.9

99

90

50 sidu

al

0.2

0.1

0.0

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Log(counts)

Error 0.014 6.37 0.118Total 0.218 0.467

Ripetibilità = .014 (6.4%)Riproducibilità = .157 + .020 + .027

= .204(93.6%)

Log

LaboratoryAnalystSample

10987654321

21212121212121212121

2121212121212121212121212121212121212121

5.0

4.5

s)

6.5

Main Effects Plot (data means) for Log(counts)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 90

Residual

Pe

0.20.10.0-0.1-0.2

10

1

0.1

Fitted Value

Res

6.56.05.55.04.5

-0.1

-0.2

Residual

Freq

uenc

y

0.20.10.0-0.1-0.2

20

15

10

5

0

Observation Order

Res

idua

l

80757065605550454035302520151051

0.2

0.1

0.0

-0.1

-0.2

Histogram of the Residuals Residuals Versus the Order of the Data

Laboratory

Mea

n of

Log

(cou

nts

10987654321

6.0

5.5

5.0