le mie lezioni di statistica -...
TRANSCRIPT
Le mie lezioni di Statistica
di G. Calvi
STATISTICA
• indu'va• descri'va
cennistorici
TERMINISTATISTICI
FASIDIUN’INDAGINESTATISTICA
• DISTRIBUZIONIDIFREQUENZA
• INDICICENTRALI
• INDICIDIVARIABILITA’
RAPPRESENTAZIONIGRAFICHE: • Diagrammiabarre • Diagrammicircolari • Istogrammi • Diagrammicartesiani Distribuzionenormale
sta)s)ca:studioquanMtaMvodifenomenicolle'vista)s)caindu0va:larilevazionedeidaM,anzichésull’interapopolazione,èeseguitasuuncampione,edall’esamediquest’ulMmosidesumonoinformazioni
sta)s)cadescri0vaorganizzainmodofacil-mentedominabileidaMraccolMsull’interapopolazioneinesame
• universo:insiemedegliindividuioggeUodell’indagine.
• unitàsta)s)ca:ciascunodegliindividuioggeUodellaricerca.
InalcunicasinonèpossibilesoUoporretu#gliindividuiall’indaginemacisilimitaaraccogliereinformazionirelaMveadunapartedellapopola-zionedeUacampione
• Sidiconocara:erileproprietàchesonooggeUodirilevazione.
• IdiversimodiincuiuncaraUeresipresentaoidiversivaloricheessoassumepressoleunitàstaMsMchesonode'modalitàdelcaraUere
CARATTERI
QUANTITATIVIpossonoesseremisuraM
discreMseleloromodalitàassumonovalori
appartenenMall’insiemedeinumerinaturali
ConMnuiseleloromodalitàassumonogliinfiniMvaloricompresiin
unintervalloreale
QUALITATIVIvengonoindicaMmedianteespressioniverbali
FASIDIUN’INDAGINESTATISTICA
• PIANIFICAZIONEDELL’INDAGINESTATISTICAOccorrestabilireinmodochiaroecompletoqualisonoirisultaMchesiintendono
oUenere;daquestafasedipendonoipassisuccessiviedirisultaMfinali.Individuareifenomenidaindagareconriferimentoalleunitàdellapopolazione
staMsMcaIndividuarel’insiemeicuielemenMsonooggeUodellaraccoltadeidaMSceglieredaqualiequanteunitàsta)s)cheoUenereinformazioniProcurarsiglistrumen)perlaraccoltadeida)(costruzionediun
quesMonario)
• RILEVAZIONEDEIDATI• SPOGLIODEIDATIERELATIVAELABORAZIONE• PRESENTAZIONEDEIRISULTATI• INTERPRETAZIONEDEIRISULTATIOTTENUTI
RAPPRESENTAZIONIGRAFICHE:obie'vo:renderequasiimmediatoilrisultatodell’indagine
• DiagrammaaBarre• Istogrammi• GraficiaTorta• DiagrammiCartesiani
DiagrammaaBarre
• èungraficouMlizzatoperrappresentarecara:eriqualita)vioquan)ta)vidiscre);
• consisteinunaseriedireUangoliequidistanMlacuialtezzaèproporzionaleallafrequenzacorrispondente.
Istogrammi
• rappresentazionegraficadicara:eriquan)ta)vicon)nuiconmodalitàraggruppateinclassi.
EssoècosMtuitodaunaseriedireUangoliconMguiognunodeiqualièassociatoadunaclasseinmodotaleche:•labasedelreUangoloèpariall’ampiezzadiclasse•l’altezzadelreUangoloèparialladensitàdifrequenza•l’areadelreUangoloèpercostruzionelafrequenza(assolutaorelaMva)associataallaclasse
GraficiaTorta
Inessil’areadelcerchioesprimel’intensitàolafrequenzatotale(siainterminiassoluMchedipercentuale)
mentreise:oricircolariesprimonoleintensitàolefrequenzeesonooUenuMdividendol’angologiro(360°)inparMproporzionalialleintensitàoallefrequenzedarappresentare
DiagrammiCartesiani
• Questarappresentazionesiavvalediunriferimentoincoordinatecartesiane
• IlpiùfrequenteuMlizzoriguardalarappresentazionedelleserietemporali
DISTRIBUZIONIDIFREQUENZA
Sidefiniscefrequenzaassoluta(diunamodalità)ilnumerototaledivoltecheessasipresentanelladistribuzionedidaMconsideraM.
N.B.lasommadellefrequenzeassoluteèugualealn.degliindividuicheformanol’universo
Ildato:215 StudenMdell’isMtuto“Nonsonulla”sonostaMrespinMÈdiversamentesignificaMvosel’isMtutoèfrequentatoda5.340allieviosegliiscri'erano340!IldatodellafrequenzaassolutaèdipersépocosignificaMvo:
E’IMPORTANTECONFRONTARELEFREQUENZE
CONILNUMEROTOTALEDIUNITÀRILEVATE
• Sidefiniscelafrequenzarela)vacomerapportofralasuafrequenzaassolutaedilnumerototalediunitàrilevate.
N.T.B.lasommadellefrequenzarelaMvedeveSEMPREfare1
Ingeneralesipreferisceesprimerelefrequenze
relaMveinpercentuale,perfarlobastamolMplicareper100lafrequenzarelaMva.
• LafrequenzacumulataassolutaassociataadunamodalitàdellavariabileèdatadallasommadellefrequenzedituUelemodalitàminoriougualiadessa
ESEMPIOStudiandoilcara-erealtezzanellaclasse,calcolarelafrequenzacumulatadiperme-edirisponderealladomanda:“quan8studen8hannostaturaminoreougualea1.75?”
osservazioni
Lafrequenzacumulata:• sipuòuMlizzaresoloseilcaraUereèordinabile• Laprimafrequenzacumulatacoincidesempreconlafrequenzadellaprimamodalità
• L’ulMmafrequenzacumulatacoincidesempreconilnumerocomplessivodiindividui.
modalità Frequenza assoluta Frequenza relativa Frequenza percentuale
Frequenza cumulata
INDICICENTRALI
SinteMzzanoidaMrilevaMdall’indaginestaMsMcaaUraversopochinumerisignificaMvi.• MODA• MEDIA• MEDIANA
MODA
• Sidicemodalamodalitàoilvalorecuicorrispondelamassimafrequenza.
• Pu`oessereu)lizzataperqualunque)podivariabile,maèpocoinforma)va
MEDIAIlconceUodimediaèdeltuUofamiliare,inquantol’uomoèpernaturainclineariassumeredaMdiscordanMperpoterconcentra-rel’aUenzionesull’intensitàmediadiuncaraUereepoterpiùfacilmenteconfrontaredaMomogeneirelaMviapopolazionidiverse.• DaMnvaloriX1,X2,...,Xn,sidicemediaaritme)ca(o
semplicementemedia)ilvalorechesioCenedividendolalorosommaperilloronumeron;indicandoconMalamediaaritmeMca,
Informulasiha:
n
xxxM n+++
=...21
OSSERVAZIONI• lamediaaritmeMcaèsemprecompresatrailminimoedil
massimodeivaloriosservaM(internalità)• lasommadegliscar)dallamedia`esemprepariazeroPregiedife0dellamedia+èunbuonindicatoredellatendenzacentrale+èsemplicedatraUareanaliMcamente-risenteinmisurarilevantediciòcheaccadesullecodedelladistribuzione(èpocorobusta)
casipar8colari:
• MEDIAPONDERATA• MEDIADIDATISUDDIVISIPERCLASSI
MEDIANALamedianaèilvalorecheoccupailpostodimezzo,quandoida8sonodispos8inordinecrescente.Inaltreparole,idaMchelaseguonosonotanMquanMquellichelaprecedono.Percalcolarelamedianabisogna:1.ordinareivaloriosservaMinordinecrescente2.prendereilvalorecentralenellagraduatoriaordinataIlmododiprocedereperilsecondopuntovariaasecondadellanumerositàdelcolle'vostudiatondispariSen`edispari,esisteununicovalorechedivideesaUamenteindueladistribuzione.Ilvalorecentraleoccupalaposizione(n+1)/2nellagraduatoriaordinata.Me=x(n+1)/2npariSenèpari,siconsideranovaloricentraliquellicheoccupanoleposizionin/2en+1/2Lamedianaèquindidatadallasemisommadeivaloricentrali
OSSERVAZIONE:L’informazionechecidàlamedianaèche:il50%dellapopolazionepresentamodalitàminoriougualiallamediana,
il50%dellapopolazionepresentamodalitàmaggioriougualiallamediana
Pregiedife0dellamediana+èunbuonindicatoredellatendenzacentrale+risentepocodici`ocheaccadesullecodedelladistribuzione
-èdifficiledatraUareanaliMcamente
CalcolarelamedianaquandoidaMsonomoltonumerosi….
• Sicostruiscelatabelladelladistribuzionedellefrequenze(assolute);
• SicalcolanoinparMcolarelefrequenzecumulate;
• Consideratoilnumerondiindividui,sappiamocheperdefinizionelamedianaèilterminecentraleedèquindidatadallasemisommadelleintensitàindividuatedaidueposMcentralin/2edn/2+1(senpari)
• Dall’intensitàindividuatadalpostocentralesendispari
INDICIDIVARIABILITA’
studente16-6-5,5-6,5-5–7studente24-8-7-5-3–9studente33-4-3-8-9-9Chevotoavrannosullapagella?Checosapossiamoosservare?
Lemedieriassumonoinununicovaloreilfenomenostudiato,
manonfornisconoalcunainformazionesullasuavariabilità.Ènecessariodefiniredeiparametricheindichino:ladispersionedeidaMovverolaloromaggioreominoreconcentrazioneaUornoaunvaloremedio.
Eciinforminoquindidellasignifica)vitàdell’indicecentraleconsiderato.
Lapiùimmediatamisuradellavariabilitàèilcampodivariazione,cioèladifferenzafrailminimoeilmassimodeivaloriosserva8.Ingenereperòilcampodivariazione,cheMenecontosoltantodeiduevaloriestremienonèinfluenzatoinalcunmododaquelliintermedi,cosMtuisceunamisuratropporozzadellavariabilità.
E’possibilecostruireunindicechesfru'almeglioilcontenutoinformaMvodeidaM?Ilgradodidispersionedellesingoleosservazionièmisuratodagliscar)UnbuonindicedidispersionedeveessereunasintesidiquestequanMtàLoscartosemplicemedioeloscartoquadraMcomediosonoindicididispersione
InmoltecircostanzesiverificachelefrequenzediundatocaraUerehannounadistribuzionenormale,ossiasidistribuisconoinmodosimmetricoedecrescenterispeUoaunvaloreMpicoalqualespeUalamassimafrequenza.L’andamentodellefrequenzeèallorarappresentatodaunacurvaacampana,deUacurvadiGauss,chehamoltepliciriscontriinfenomenireali.
SitraUadiunacurvadallaclassicaformaacampanachehaunmassimoaUornoallamediadeivalorimisuraMepuòesserepiùomenostreUaasecondadelladispersionedeivaloriaUornoallamedia;ladispersionesimisuraconladeviazionestandard:praMcamenteunadelleproprietàdellagaussianaècheil68%dellemisurazionidifferiscedallamediamenodelladeviazionestandardecheil95%menodiduedeviazionistandard:quindimaggioreèladeviazionestandard,piùlagaussianaè"aperta"epiùc'èlapossibilitàchelamedia(ilpuntopiùalto)nonsiarappresentaMvoditanMcasi.AnchenelcasodellacurvadiGaussl'areasoUesadallacurvavale1perchélasommadelleprobabilitàditu'ivaloridà1,cioèlacertezza.