estatística e probabilidadehelcio/crs.pdf• só devemos utilizar a equação da reta de regressão...

Post on 21-Apr-2020

3 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

11/43/43

EstatEstatíísticastica e e ProbabilidadeProbabilidade

Aula Aula 0909: : CorrelaCorrelaççãoão, , RegressãoRegressão & & SimulaSimulaççãoão

ITA ITA -- LaboratLaboratóóriorio de Guerra de Guerra EletrônicaEletrônica

EENEM 2008EENEM 2008

22/43/43

PodePode--se se pesarpesar um um ursourso com com fitafita mméétricatrica??

•• Como Como osos ursosursos, , emem suasua maioriamaioria, , sãosãobastantebastante pesadospesados e e difdifííceisceis de de seremseremlevantadoslevantados, , osos pesquisadorespesquisadores e e cacaççadoresadores têmtêm considerconsideráávelvel dificuldadedificuldadeemem determinardeterminar seusseus pesos pesos nana florestafloresta. . SeriaSeria posspossíívelvel determinarmosdeterminarmos o peso de o peso de um um ursourso a a partirpartir de de outrasoutras medidasmedidasmaismais ffááceisceis de se de se obterobter??

33/43/43

ComprimentosComprimentos e pesos de e pesos de ursosursos machosmachos

comprimento x (in) peso y (lb)53,0 8067,5 34472,0 41672,0 34873,5 26268,5 36073,0 33237,0 34

44/43/43

DefiniDefiniççãoão

•• ExisteExiste umauma correlacorrelaççãoão entre entre duasduasvarivariááveisveis quandoquando umauma delasdelas estestáá, de , de algumaalguma forma, forma, relacionadarelacionada com a com a outraoutra..

55/43/43

CorrelaCorrelaççãoão

•• VamosVamos determinardeterminar se se hháá correlacorrelaççãoãoentre a entre a varivariáávelvel x (x (comprimentocomprimento) e a ) e a varivariáávelvel y (peso). y (peso).

•• A A importânciaimportância de de taltal determinadeterminaççãoãodecorredecorre do do fatofato de de queque a a presenpresenççaa de de umauma correlacorrelaççãoão podepode conduzirconduzir--nosnos a a um um mméétodotodo parapara estimarestimar o peso de o peso de um um ursourso medindomedindo o o seuseu comprimentocomprimento..

66/43/43

SuposiSuposiççõesões

1) a 1) a amostraamostra de dados de dados emparelhadosemparelhados(x, y) (x, y) éé aleataleatóóriaria

2) 2) osos pares de dados (x, y) pares de dados (x, y) têmtêm umaumadistribuidistribuiççãoão normal normal bivariadabivariada..

77/43/43

DefiniDefiniççãoão

•• O O coeficientecoeficiente de de correlacorrelaççãoão linearlinear r r medemede o o graugrau de de relacionamentorelacionamentolinear entre linear entre osos valoresvalores emparelhadosemparelhadosx e y x e y emem umauma amostraamostra. . CalculaCalcula--se se seuseuvalor com valor com auxauxííliolio dada ffóórmularmula a a seguirseguir..

r = nΣxy − (Σx)(Σy)√n(Σx2) − (Σx)2 √n(Σy2) − (Σy)2

--1 1 ≤≤ r r ≤≤ 11

88/43/43

99/43/43

ExemploExemplo•• A A tabelatabela a a seguirseguir fornecefornece o o nnúúmeromero ((emem

milharesmilhares) de ) de armasarmas automautomááticasticas registradasregistradas, , juntamentejuntamente com a com a taxataxa de de criminalidadecriminalidade ((ememcrimes crimes porpor 100.000). Os crimes com 100.000). Os crimes com armasarmas de de fogofogo parecemparecem estarestar relacionadosrelacionados com o com o nnúúmeromerode de armasarmas automautomááticasticas??

armasautomáticas 11,6 8,3 3,6 0,6 6,9 2,5 2,4 2,6

taxa de criminalidade 13,1 10,6 10,1 4,4 11,5 6,6 3,6 5,3

1010/43/43

armas automáticas

taxa

de

crim

inal

idad

e

121086420

13

12

11

10

9

8

7

6

5

4

Scatterplot of taxa de criminalidade vs armas automáticas

1111/43/43

CoeficienteCoeficiente de de correlacorrelaççãoão linearlinear

•• devemosdevemos evitarevitar a a conclusãoconclusão de de queque a a correlacorrelaççãoão implicaimplica causalidadecausalidade

•• surge surge outraoutra fontefonte de de erroerro potencialpotencialquandoquando osos dados se dados se baseiambaseiam emem taxastaxas ououmméédiasdias

•• a a conclusãoconclusão de de queque nãonão hháá correlacorrelaççãoãolinear linear significativasignificativa nãonão querquer dizerdizer queque x e x e y y nãonão estejamestejam relacionadosrelacionados de de algumaalgumaoutraoutra forma forma nãonão--linearlinear

1212/43/43

CorrelaCorrelaççãoão

•• TendoTendo concluconcluíídodo pelapela existênciaexistência de um de um relacionamentorelacionamento, , interessainteressa agora agora determinardeterminar qualqual éé esseesse relacionamentorelacionamento, , de de modomodo queque possamospossamos calcularcalcular o peso o peso de um de um ursourso, , quandoquando conhecemosconhecemos seuseucomprimentocomprimento ((regressãoregressão). ).

1313/43/43

EfeitoEfeito de de regressãoregressão

•• No final do No final do ssééculoculo 19 Francis Galton 19 Francis Galton procuravaprocurava porpor umauma estimativaestimativa dadaalturaaltura do do filhofilho a a partirpartir dada alturaaltura do do paipai. . EleEle concluiuconcluiu queque osos filhosfilhos de de paispaiscom com alturasalturas superioressuperiores ((ouou inferioresinferiores) ) àà mméédiadia tambtambéémm seriamseriam maismais altos altos ((baixosbaixos) ) queque a a mméédiadia, , masmas nãonão tantotantoquantoquanto osos paispais. . OuOu sejaseja, , haveriahaveria um um efeitoefeito de de regressãoregressão àà mméédiadia......

1414/43/43

DefiniDefiniççãoão

•• Dada Dada umauma colecoleççãoão de dados de dados amostraisamostraisemparelhadosemparelhados, a , a equaequaççãoão de de regressãoregressão descrevedescreve a a relarelaççãoão entre as entre as duasduas varivariááveisveis

y = by = b00 + b+ b11xx^̂

1515/43/43

EquaEquaççãoão de de regressãoregressão

b0 = (Σy)(Σx2) − (Σx)(Σxy)n(Σx2) − (Σx)2

b1 = n(Σxy) − (Σx)(Σy)n(Σx2) − (Σx)2

1616/43/43

armas automáticas

taxa

de

crim

inal

idad

e

121086420

15,0

12,5

10,0

7,5

5,0

S 1,81154R-Sq 78,3%R-Sq(adj) 74,7%

Fitted Line Plottaxa de criminalidade = 4,047 + 0,8525 armas automáticas

1717/43/43

PrediPrediççõesões

•• SSóó devemosdevemos utilizarutilizar a a equaequaççãoão dada retareta de de regressãoregressão se r se r indicaindica a a existênciaexistência de de umaumacorrelacorrelaççãoão linear linear significativasignificativa..

•• Na Na ausênciaausência de de umauma taltal correlacorrelaççãoão linear, linear, nãonão devemosdevemos utilizarutilizar a a equaequaççãoão de de regressãoregressão parapara projetarprojetar ouou predizerpredizer; ; ememvezvez disso, disso, nossanossa melhormelhor estimativaestimativa dadasegundasegunda varivariáávelvel éé simplesmentesimplesmente a a suasuamméédiadia..

1818/43/43

UsoUso dada equaequaççãoão de de regressãoregressão

1) se 1) se nãonão hháá correlacorrelaççãoão linear linear significativasignificativa, , nãonãouse a use a equaequaççãoão de de regressãoregressão parapara fazerfazerprediprediççõesões

2) 2) aoao aplicaraplicar a a equaequaççãoão de de regressãoregressão paraparaprediprediççõesões, , mantenhamantenha--se se dentrodentro do do âmbitoâmbito dos dos dados dados amostraisamostrais

3) 3) umauma equaequaççãoão de de regressãoregressão baseadabaseada emem dados dados passadospassados nãonão éé necessariamentenecessariamente vváálidalida hojehoje

4) 4) nãonão devemosdevemos fazerfazer prediprediççõesões sobresobre umaumapopulapopulaççãoão diferentediferente daqueladaquela de de ondeonde provêmprovêmosos dados dados amostraisamostrais

1919/43/43

DefiniDefiniççãoão

•• Dado um par de dados Dado um par de dados amostraisamostrais (x, (x, y), um y), um resresííduoduo éé a a diferendiferenççaa (y (y -- y) y) entre um valor entre um valor amostralamostral observadoobservado y y e o valor y e o valor y preditopredito com base com base nanaequaequaççãoão de de regressãoregressão..

2020/43/43

DefiniDefiniççãoão

•• A A equaequaççãoão de de regressãoregressão representarepresenta a a retareta queque melhormelhor se se ajustaajusta aosaos pontospontosde de acordoacordo com a com a propriedadepropriedade dos dos mmíínimosnimos quadradosquadrados

•• UmaUma retareta verificaverifica a a propriedadepropriedade dos dos mmíínimosnimos quadradosquadrados se a soma dos se a soma dos quadradosquadrados dos dos resresííduosduos éé a a menormenorposspossíívelvel

2121/43/43

DefiniDefiniççãoãovariavariaççãoão total = var. total = var. explicadaexplicada + var. + var. nãonão--explicadaexplicada

ΣΣ(y (y -- y)y)22 = = ΣΣ(y (y -- y)y)22 + + ΣΣ(y (y -- y)y)22^̂ ^̂

y = 9 •

(5,9)

(5,13)

(5,19)

desvio total(y - y)

desvio não-explicado(y - y)

desvio explicado(y - y)^

^

x = 5

2222/43/43

DefiniDefiniççãoão

•• O O coeficientecoeficiente de de determinadeterminaççãoão éé o o valor valor dada variavariaççãoão de y de y queque ééexplicadoexplicado pelapela retareta de de regressãoregressão

rr22 = = variavariaççãoão explicadaexplicadavariavariaççãoão totaltotal

2323/43/43

ExemploExemplo•• Os dados a Os dados a seguirseguir referemreferem--se a pares se a pares

de de medidasmedidas de y = de y = porosidadeporosidade (%) de (%) de diversasdiversas espespééciescies de de concretoconcretorelacionadasrelacionadas com x = peso com x = peso unitunitááriorio((pcfpcf). ). PodemosPodemos estimarestimar y a y a partirpartir de x?de x?

x 99,0 101,1 102,7 103,0 105,4 107,0 108,7 110,8 112,1 112,4 113,6 113,8 115,1 115,4 120,0

y 28,8 27,9 27,0 25,2 22,8 21,5 20,9 19,6 17,1 18,9 16,0 16,7 13,0 13,6 10,8

2424/43/43

pcf

poro

sida

de

120115110105100

30

25

20

15

10

S 0,938035R-Sq 97,4%R-Sq(adj) 97,2%

Fitted Line Plotporosidade = 118,9 - 0,9047 pcf

2525/43/43

Residual

Per

cent

210-1-2

99

90

50

10

1

Fitted Value

Res

idua

l

3025201510

2

1

0

-1

-2

Residual

Freq

uenc

y

1,51,00,50,0-0,5-1,0-1,5-2,0

4

3

2

1

0

Observation Order

Res

idua

l

151413121110987654321

2

1

0

-1

-2

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Histogram of the Residuals Residuals Versus the Order of the Data

Residual Plots for porosidade

2626/43/43

E o urso?E o urso?

2727/43/43

comprimento (in)

peso

(lb

)

757065605550454035

400

300

200

100

0

Scatterplot of peso (lb) vs comprimento (in)

Não podemos estimar o peso de um urso a partir do seu Não podemos estimar o peso de um urso a partir do seu tamanho. Precisamos de mais dados...tamanho. Precisamos de mais dados...

2828/43/43

DefiniDefiniççãoão

•• SimulaSimulaççãoão éé umauma ttéécnicacnica parapararealizarealizaççãoão de um de um experimentoexperimento quequeimitaimita o o mundomundo real com o real com o objetivoobjetivo de de se se obterobter dados dados queque possampossam ser ser utilizadosutilizados parapara se se fazerfazer previsõesprevisõessobresobre o o sistemasistema..

2929/43/43

PorPor quêquê simularsimular??•• nemnem sempresempre temostemos eventoseventos

independentesindependentes: P(A: P(A∩∩B) = P(A)B) = P(A)⋅⋅P(B) e as P(B) e as relarelaççõesões de de dependênciadependência costumamcostumam ser ser complexascomplexas

•• ausênciaausência de de modelosmodelos analanalííticosticos ““fechadosfechados””parapara distribuidistribuiççõesões especespecííficasficas nãonão--usuaisusuais

•• o o tratamentotratamento analanalííticotico de de nãonão--linearidadeslinearidadespodepode ser ser impossimpossíívelvel ouou impraticimpraticáávelvel. . LembrarLembrar queque: : E[f(XE[f(X)] )] ≠≠ f(E[Xf(E[X])]) se f se f éé umaumafunfunççãoão nãonão--linearlinear

3030/43/43

DefiniDefiniççãoão

•• Um Um modelomodelo estatestatíísticostico éé aqueleaquele quequetomatoma amostrasamostras aleataleatóóriasrias de de umaumadistribuidistribuiççãoão de de probabilidadeprobabilidade quequedescrevedescreve a a operaoperaççãoão de de algumalgumaspectoaspecto do do sistemasistema ouou de de todotodo o o sistemasistema. . SimulaSimulaççõesões queque envolvemenvolvemamostrasamostras aleataleatóóriasrias sãosão usualmenteusualmentechamadaschamadas de de simulasimulaççõesões de Monte de Monte CarloCarlo..

3131/43/43

ExemploExemplo: : ccáálculolculo de de ππ

y: Unif(0,1)

x: Unif(0,1)

a cada nova rodada são gerados x e y se x2+y2 < 1, faz-se A = A+1

Após muitas rodadas, observa-se que π = 4⋅A/N

raio = 1

3232/43/43

DoisDois paradigmasparadigmas

•• TimeTime--stepstep: a : a cadacada passagempassagem de de tempo tempo ΔΔt, t, todotodo o o sistemasistema se se atualizaatualizae e novosnovos estadosestados sãosão determinadosdeterminados

•• DiscreteDiscrete--eventevent: : osos eventoseventos se se sucedemsucedem emem filafila, e , e osos tempos entre tempos entre osos eventoseventos nãonão sãosão fixadosfixados a prioria priori

3333/43/43

Time step simulationTime step simulation

v

A

B

CΔt

•• deslocamentodeslocamento de um de um vetorvetor emem movimentomovimentoretilretilííneoneo uniformeuniforme•• 3 3 sensoressensores nana áárearea•• PPdetecdetecççãoão = = f(df(d))

dA

dB

dC

3434/43/43

Discrete event simulationDiscrete event simulation

AAexp(exp(λλAA))

SS11exp(exp(λλ11))

SS22exp(exp(λλ22))

t evento

1chegada A(1)início S1/A(1)

3chegada A(2)início S2/A(2)chegada A(3)

8término S1/A(1)início S1/A(3)

9 chegada A(4)

11término S2/A(2)início S2/A(4)

... ...

3535/43/43

NNúúmerosmeros aleataleatóóriosrios

•• nnúúmerosmeros geradosgerados porpor computadorescomputadores e e calculadorascalculadoras sãosão, , nana verdadeverdade, , pseudo pseudo aleataleatóóriosrios, , umauma seqseqüüênciaência provenienteprovenientede de umauma funfunççãoão matemmatemááticatica quequedependedepende de um valor de um valor inicialinicial: a : a ““sementesemente”” ((seedseed))

•• atendeatende semsem problemasproblemas àà grandegrandemaioriamaioria das das aplicaaplicaççõesões ((éé problemaproblemaparapara a a criptografiacriptografia))

3636/43/43

GeraGeraççãoão de de nnúúmerosmeros aleataleatóóriosrios com com umaumadada dada distribuidistribuiççãoão de de probabilidadeprobabilidade

•• MMéétodotodo dada transformatransformaççãoão inversainversa

0,5

1,0

Uniforme (0,1)

x

F(x)

Normal (μ = 0, σ = 1)

3737/43/43

MMéétodotodo dada transformatransformaççãoão inversainversa

•• GerarGerar umauma distribuidistribuiççãoão UniformeUniforme (a, b):(a, b):f(x;a,bf(x;a,b): 1/(b ): 1/(b -- a) se a a) se a ≤≤ x x ≤≤ b b ((pdfpdf))F(x;a,bF(x;a,b): (x ): (x -- a)/(b a)/(b -- a) se a) se a a ≤≤ x x ≤≤ bb ((cdfcdf))

y = (x y = (x -- a)/(b a)/(b -- a), a), resolvendoresolvendo parapara y:y:x = a + (b x = a + (b -- a)a)⋅yy, se y , se y éé Unif(0,1) Unif(0,1) ⇒⇒

x = a + x = a + (b-a)⋅Unif(0,1)Unif(0,1)FF--11(y)(y)

3838/43/43

MMéétodotodo dada transformatransformaççãoão inversainversa

•• GerarGerar umauma distribuidistribuiççãoão ExponencialExponencial ((λλ))f(xf(x;;λλ): ): λλ⋅ee--λλxx x x ≥≥ 0 e 0 e λλ > 0 > 0 ((pdfpdf))F(xF(x,,λλ): 1 ): 1 -- ee--λλxx x x ≥≥ 0 e 0 e λλ > 0 > 0 ((cdfcdf))

y = 1 y = 1 -- ee--λλxx, , resolvendoresolvendo parapara y:y:x = x = --ln(1 ln(1 -- y)/y)/λλ, se y , se y éé Unif(0,1) Unif(0,1) ⇒⇒

FF--11(y)(y)x = x = --ln(ln(Unif(0,1)Unif(0,1)))

λλ

3939/43/43

CritCritéériosrios de de paradaparada

•• A A necessidadenecessidade de se de se buscarbuscar estimativasestimativasde de parâmetrosparâmetros de de interesseinteresse nosnos fazfazsimularsimular parapara acumularacumular dadosdados

•• essesesses dados dados precisamprecisam ser ser analisadosanalisadosestatisticamenteestatisticamente, de , de acordoacordo com com critcritéériosrios estabelecidosestabelecidos a priori (N a priori (N nãonãopodepode simplesmentesimplesmente ser ser infinitoinfinito!)!)

•• utilizarutilizar intervalosintervalos de de confianconfianççaa ouou erroerrorelativorelativo parapara interromperinterromper a a simulasimulaççãoão

4040/43/43

Exemplos de SimulaExemplos de Simulaççãoão

4141/43/43

Exemplos de SimulaExemplos de Simulaççãoão

4242/43/43

Exemplos de SimulaExemplos de Simulaççãoão

•• OTIMIZAOTIMIZAÇÇÃO DO ÃO DO LANLANÇÇAMENTO DE MAE AMENTO DE MAE OPTRÔNICAS (FLARE)OPTRÔNICAS (FLARE)

4343/43/43

Exemplos de SimulaExemplos de Simulaççãoão•• A A ModifiedModified MultipleMultiple

SampleSample CorrelationCorrelationAlgorithmAlgorithm for for ElectronicElectronicTargetTarget LocationLocation

top related