datorÖvning 1: introduktion till datorsystemet …732g70/datorovn12012.pdf · när du har startat...
TRANSCRIPT
1
DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.
ALLMÄNT OM DATORERNA Datorsystemet består av persondatorer kopplade i ett nätverk till en större server.
Operativsystemet Windows med personlig login används.
Väl inne i systemet har varje användare en egen area på den gemensamma servern. Det innebär
att alla dokument, program etc. som du laddar hem eller skapar hamnar på den enhet som i
datorn heter Z:. Du skall alltså inte spara någonting på enhet C:. Den enheten används bara för
att installera programvara och systemfiler och andra filer som sparats där ”försvinner”. Man har
som användare heller ingen möjlighet att själv installera programvara eller ändra i
systemfilerna: detta kan bara datoradministratörerna göra.
Datorerna skall normalt alltid vara påslagna. Vid avslutat arbete skall man alltså bara logga ut
(log off) och sedan lämna datorn.
START Eftersom datorerna påslagna räcker det med att sätta sig vid en dator och röra på musen. Då
kommer det upp en ruta som upplyser om att du skall trycka Ctrl+Alt+Del för att komma till
inloggningsrutan. När inloggningsrutan kommer up, skriv in användaridentitet (user name) och
lösenord (password) och välj log on to: HELIX. Tryck sedan på OK.
DEL 1: BESKRIVANDE STATISTIK MED EXCEL Öppna Excel (dvs Microsoft Office Excel 2007). Observera att versionen är på engelska.
Du måste vid denna första inloggning anpassa Excel så att du kan göra statistiska beräkningar.
Välj File -> Options -> Add-Ins och markera alternativet Analysis ToolPak. Tryck Go, och
bocka för Analysis ToolPak. Du har nu fått upp en ny meny under fliken Data: Data analysis.
Den kommer vi ofta att ha nytta av, och du kan naturligtvis göra samma sak med din egen
Excelinstallation hemma.
DATAINMATNING När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2,
Sheet3) öppnats. Vi använder ett datamaterial som består av uppgifter hämtade från en liten
enkätundersökning riktad till några studerande vid en högskola. I enkäten ställde man frågor
kring
2
utbildningsområde (UTB): 1 = filosofisk utbildning, 2 = teknisk utbildning
kön (KON): 1 = kvinna, 2 = man
attityd till utbildningen (ATT): 4-gradig skala med 1 = negativ, 4 = positiv
ungefärlig nedlagd studietid per normalvecka i timmar (TID)
I följande tabell motsvaras en rad av en enkät.
Enkät nr UTB KON ATT TID
1 1 1 4 30
2 1 1 2 16
3 2 1 2 26
4 1 2 3 19
5 2 2 4 35
6 2 1 2 45
7 2 2 3 52
8 1 1 2 36
9 1 1 4 22
10 2 2 4 40
11 2 2 3 29
12 2 1 1 48
13 2 2 3 38
14 1 2 4 40
15 1 1 3 20
16 2 2 4 30
17 1 1 4 15
18 2 2 3 30
19 2 2 2 25
20 2 2 4 35
Skriv in dessa data på Blad 1 (Sheet 1), förslagsvis i kolumnerna A-E. Varje enkät skall motsvara
en rad. Varje kolumn bör förses med respektive rubrik (i rad 1).
Spara dina data genom att välja Save AsExcel Workbook. I den dialogruta som öppnas kan du
i fältet File name: skriva in namnet studenter. Notera att det i det översta fältet står namnet
på den mapp i vilken du befinner dig (skall normalt vara användaridentitet on ’Samba 3.2.1
(Neptunus)’ (Z:) ). I fältet Save as type: står Excel Workbook. Detta är standardformatet att
spara i och det innebär att dina data sparas som en hel bok. Klicka på Save.
FREKVENSTABELLER Det är naturligt att först göra enkla frekvenstabeller över svaren på var och en av frågorna i
enkäten, utifrån den upplagda datafilen. Vi använder först ”histogramfunktionen”. Välj
DataData Analysis. I listan av analysmetoder, välj Histogram och klicka på OK. Med denna
funktion kan man bilda enkla frekvenstabeller.1 Förutom själva ursprungsdata behöver man för
att använda funktionen de förekommande värdena inlagda särskilt i en kolumn. Dessa anges
som Bin Range (fackområde), se exemplet nedan. Stäng för tillfället dialogfönstren genom att
klicka på Cancel i vart och ett av dem.
1 För att man faktiskt skall få ett histogram och inte bara en frekvenstabell krävs att man markerar alternativet
Chart Output.
3
Vi exemplifierar med kolumnen "attityd". För att få fram en lämplig tabell skriver vi först in de
förekommande värdena 1, 2, 3, 4 i en egen tom kolumn (exempelvis kolumn G). Öppna därefter
histogramfunktionen, och markera data i fjärde kolumnen (D, attityd) som Input Range
(indataområde) och de förekommande värdena (kolumn G) som Bin Range. Klicka först i
respektive fält i dialogrutan och markera sedan motsvarande kolumn i bladet. Markera endast
data och ej kolumnrubrik. Följande tabell hamnar nu på ett nytt blad (Sheet 4).
Bin Frequency
1 1
2 5
3 6
4 8
More 0
Lite redigering, rubrikerna ersatta med andra begrepp (det går att skriva direkt i rutorna för Bin
etc.), attitydsiffrorna ersatta med begrepp, "More-raden" bort, en summerad till, och ett annat
typsnitt ger i stället tabellen nedan:
Tabell 1. De svarandes attityder
Attityd Antal
svarande
Negativ 1
Något negativ 5
Något positiv 6
Positiv 8
Summa 20
När man på motsvarande sätt gör en enkel frekvenstabell eller ett histogram för variabeln
"arbetstid" behöver man klassindela materialet (eller hur!). Detta gör man genom att som
fackområde lägga in övre klassgränser. Antag att vi vill klassindela materialet i fem klasser: t o m
20, 21-30, 31-40, 41-50, 51 och uppåt (eller 51-60, eftersom inget värde är större än 60). Lägg
då som fackområde 20, 30, 40, 50, 60, inlagda under varandra på samma sätt som 1, 2, 3, 4 i
kolumnen G ovan.
UPPGIFT 1 Konstruera en frekvenstabell som visar hur de 20 personerna fördelar sig på de fem
studietidsklasserna. Använd även här absoluta frekvenser. Skriv in klasserna i den vänstra
kolumnen (ersätt alltså 20 med "högst 20" eller 0-20 etc.).
4
DIAGRAM När man fått fram frekvenstabellen ovan, tabell 1, kan man göra ett diagram av den. Markera
hela frekvenstabellen förutom raden More, välj Insert-menyn och klicka på Column. Välj den
översta vänstra diagramtypen i menyn som öppnas.
UPPGIFT 2
a) Konstruera ett diagram som ovan. Observera att vissa förändringar måste göras. När
diagrammet konstruerats, markera det och välj menyn Layout. Här hittar vi funktioner
för att ändra diagrammets utseende. Pröva dessa tills diagrammet blir likt exemplet
ovan!
b) Gör ett enkelt stapeldiagram (stående staplar) som beskriver hur de svarande fördelar
sig på studietid i 5 klasser.
c) Gör om diagrammet under b till ett histogram på följande sätt. Högerklicka på en av
staplarna och välj Format Data Series. Se till att du står under fliken Series Options.
Genom att minska gapet (Gap width) mellan kolumnerna blir bilden mer och mer
histogramliknande. Fundera kring klassgränserna. Pröva samtidigt hur staplarna ser ut i
annan färg och kanske med mönster.
d) Gör ett cirkeldiagram som beskriver hur de svarande fördelar sig på attityd.
BESKRIVANDE MÅTT För variabeln TID, som ju är en kvantitativ variabel - till skillnad från övriga variabler - kan det
också vara intressant att beräkna några beskrivande mått. Detta görs enklast med DataData
Analysis. Välj Descriptive statistics och bocka för Summary Statistics i dialogrutan. Markera
data i den aktuella kolumnen och följ anvisningarna. Fram kommer - med viss redigering (och i
svensk översättning) - följande:
0
1
2
3
4
5
6
7
8
9
Negativ Något negativ Något positiv Positiv
Antal
5
Kolumn1
Medelvärde 31,55
Standardfel 2,3412491
Medianvärde 30
Typvärde 30
Standardavvikelse 10,4703843
Varians 109,628947
Toppighet -0,6498275
Snedhet 0,19975206
Variationsvidd 37
Minimum 15
Maximum 52
Summa 631
Antal 20
För att bredda kolumnerna, dubbelklicka mitt emellan dem!
Denna sammanställning är mindre njutbar för en betraktare. Bra är att dels ta bort sådana mått
som i sammanhanget ej är intressanta, dels att minska antalet decimaler betydligt innan man
visar en sådan här uppställning i en rapport. Alla mått som man tar med i en rapport skall man
själv kunna förstå och förklara! Här vore det naturligt att ta bort ”standardfel", "toppighet" och
"snedhet", samt att avrunda till två decimaler. Det senare gör man genom att klicka i aktuell cell
med höger musknapp, välja FormatCells, Number och ange två decimaler.
6
Beskrivning av arbetstiden hos undersökningsgruppen
Medelvärde 31,55
Medianvärde 30
Typvärde 30
Standardavvikelse 10,47
Varians 109,63
Variationsvidd 37
Minimum 15
Maximum 52
Summa 631
Antal 20
UPPGIFT 3 Ta fram tabellen ovan. Jämför de engelska uttrycken med de svenska översättningarna.
Spara hela arbetsboken på nytt i Excel-format, så att du har ditt arbete kvar.
DEL 2: BESKRIVANDE STATISTIK MED MINITAB Öppna Start-menyn igen. Välj All Programs och sök upp alternativet Minitab Solutions. Detta
val öppnar ytterligare en undermeny, där du väljer alternativet Minitab 16 Statistical Software
English. Följande fönster öppnas på skärmen:
7
Det du ser är två delfönster: det övre heter Session och det nedre Worksheet. I Session-fönstret
presenteras resultaten av dina analyser.
I Worksheet-fönstret hamnar (så gott som) alla data som matas in eller skapas i programmet.
Worksheet-fönstret är uppbyggt med ett stort antal kolumner som numreras C1, C2, etc. Minitab
är i sina kommandon uppbyggt runt analys av kolumner, men har också med tiden utvecklat
vissa operationer för rader. Till skillnad från Excel är inte ett Worksheet i Minitab något
kalkylblad. Det går alltså inte att flytta eller kopiera celler hur som helst, eller införa
kalkylbladsformler.
För att kunna skriva något i Worksheet-fönstret krävs att det aktiveras och det gör ni genom att
klicka på det, lämpligen i titelraden (den blå).
BESKRIVANDE MÅTT OCH LÅDAGRAM Klicka nu i Worksheet-fönstret och skriv in följande värden i den första kolumnen (C1). Börja i
raden med nummer 1 (längst t v):
2, 4, 14, 3, 0, 1, 8, 12, 1, 3
(kommatecknen skall inte skrivas in). Gå nu längst upp i Minitab-fönstret och öppna menyn med
titel Stat.
8
I denna meny finns en stor mängd av alla möjliga statistiska procedurer av vilka vi endast skall
använda några i denna första kurs, men under din utbildnings gång kommer du att stöta på de
flesta av dem. Välj alternativet Basic Statistics, varvid följande undermeny öppnas:
Välj alternativet Display Descriptive Statistics… (dvs beskrivande mått) och följande fönster
öppnas på skärmen:
9
Detta fönster visar hur en typisk s k dialogruta i Minitab kan se ut. Längst till vänster finns ett
vitt fält i vilket det står C1 överst. Detta fält är en lista över alla kolumner som är aktiva i
Minitab. Ni har ju skrivit in värden i kolumn C1, men ingen annanstans och följaktligen är endast
just kolumnen C1 aktiv.
Fältet till höger har rubriken Variables. Till detta fält skall du välja de kolumner (variabler) du
vill göra analyser på (i detta fall deskriptiva mått). Det gör du genom att endera markera de
kolumner du vill analysera i listan till höger och sedan klicka på knappen Select eller
dubbelklicka på de kolumner du vill analysera. Gör något av detta med C1 så kommer du att se
att den hamnar i listan till höger.
Under det högra fältet finns en ruta märkt By variable: följt av ett mindre vitt fält. Den används
för att sortera variablerna efter en kolumn som anger någon form av klassificering, men vi
väntar ett slag med detta. Klicka istället på knappen Graphs…
Markera rutan Boxplot of data (lådagram) och klicka på OK. Klicka sedan på OK i den första
dialogrutan.
10
Observera nu vad som händer i Session-fönstret samtidigt som ett lådagram dyker upp på
skärmen. Du får flytta på det senare för att se innehållet i Session-fönstret. Där bör du ha fått
följande utskrift:
Descriptive Statistics: C1 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
C1 10 0 4,80 1,54 4,87 0,00 1,00 3,00 9,00 14,00
och lådagrammet bör se ut så här:
Boxplot of C1
Titta nu på utskriften i Session-fönstret. Där listas för variabeln (kolumnen) C1 ett antal
beskrivande mått (Descriptive Statistics). Först anges antal värden i C1 betecknat N som här är
10. Vi ser medeltalet (Mean) som är 4.8 och medianen (Median) som är 3. TrMean är ett s k
trimmat eller avhugget medeltal, som vi inte beaktar ytterligare här. StDev är standardavvikelse,
beräknad enligt formeln med n-1 i nämnaren, SEMean är ett speciellt spridningsmått för själva
medeltalet, som vi heller inte är mogna att ta upp just nu, men de övriga kan vi förstå: Minimum,
Maximum, Q1 som står för första kvartilen (25e percentilen) och Q3 som står för tredje
kvartilen (75e percentilen). Alla dessa beskrivande mått är alltså förvalda av Minitab och utgör
en standarduppsättning, som väl ganska ofta efterfrågas. Vill man beräkna ytterligare
beskrivande mått måste detta göras mer manuellt. Vi återkommer till det senare.
Lådagrammet lämnar kanske inte så mycket att kommentera. Dock bör sägas att detta diagram
inte kan hanteras så enkelt som med ett diagram i Excel. Det går t ex inte att ändra på skalor
eller ändra indata till diagrammet.
Nu skall du pröva att göra ett lådagram direkt. Öppna menyn Graph längst upp i
Minitab-fönstret. Den har följande innehåll:
11
Välj alternativet Boxplot…
och tryck OK så får du fram dialogrutan
12
Kolumnlistan med Select till vänster ser ut och fungerar som tidigare. Välj kolumn C1 så att den
hamnar i fältet Graph variables. Välj tills vidare inget mer utan klicka bara på OK. Resultatet
blir följande lådagram:
Det kan ju kännas litet trist med variabelnamnet C1. Låt oss anta att de data ni matat in är
åldrarna hos en barnaskara till ett ovanligt produktivt par. Ni kan då t ex välja namnet ålder för
denna kolumn. Gå då till Worksheet-fönstret igen och klicka i den rad som ligger mellan det
första värdet och raden med alla kolumnnummer. Detta är rubrikraden för kolumnerna och i
denna kan man skriva in valfria rubriker för kolumnerna. Dock kan inte samma namn användas
för flera kolumner. Skriv in Ålder i rubriken för C1:
13
Gör nu om proceduren med lådagrammet. Det räcker att välja Boxplot från Graph-menyn och
sedan klicka på OK , men observera att i listan över kolumner har nu C1 försetts med sin rubrik.
Rubriker är praktiska när man han många aktiva kolumner och vill vara säker på att man väljer
rätt kolumn i en dialogruta.
För att spara allt arbete man gjort, t ex för att enkelt kunna återuppta det senare, krävs att man
skapar en s k Projekt-fil. Välj från File-menyn alternativet Save Project As… Du får då upp en
dialogruta liknande den tidigare, men här finns bara ett filformat, MPJ (som står för Minitab
Project). Skriv in ett lämpligt filnamn (t ex syskon) och klicka på Save. Den fil som då skapas
syns som vanligt i Windows Explorer, men observera att den är betydligt större (i
minnesutrymme) än de andra. Detta kan vara värt att komma ihåg om man behöver skicka
projektfiler mellan varandra. De kan bli rätt stora och man tjänar på att rensa bort onödiga
fönster och kolumner innan man sparar arbetet.
Avsluta nu Minitab genom att välja Exit från File-menyn. Svara Nej på eventuella frågor. Starta
sedan Minitab igen. Du är nu åter i ett ”tomt” arbetsfält, men denna gång skall du hämta det
arbete ni nyss sparade. Välj från File-menyn alternativet Open Project. Se till att du hamnar i
den katalog där du sparade den senaste projektfilen (normalt din hemkatalog). Dubbelklicka på
filen med det namn du gav (syskon) och du kommer att se att allt du tidigare gjorde laddas in
igen.
DEL 3: SKAPA PIVOTTABELLER I EXCEL Vi ska nu använda Excel för att konstruera pivottabeller. Pivottabellerna används sedan för att
beräkna standardvägda medeltal.
DATA Betrakta följande lilla datamaterial över 20 personer:
14
Person Kön Utbildning Ålderklass Månadslön
1 Man Högskola yngre 18400
2 Man Grundskola yngre 15300
3 Kvinna Högskola yngre 17600
4 Man Gymnasieskola medel 20100
5 Kvinna Högskola medel 15900
6 Kvinna Gymnasieskola yngre 13500
7 Man Högskola medel 23400
8 Kvinna Grundskola äldre 14100
9 Man Högskola medel 26700
10 Man Högskola äldre 25900
11 Kvinna Gymnasieskola medel 18600
12 Kvinna Högskola medel 31500
13 Kvinna Grundskola yngre 13600
14 Man Gymnasieskola äldre 22300
15 Man Högskola äldre 35900
16 Kvinna Högskola medel 24800
17 Man Gymnasieskola äldre 20000
18 Kvinna Högskola medel 19400
19 Kvinna Grundskola medel 14100
20 Man Högskola medel 23800
Börja med att ta in materialet i Excel genom att öppna den färdiga Excelfilen som ligger på
kurshemsidan (data1.xls).
Nu ska vi bilda tabeller utifrån detta material.
TABELL 1 Markera hela dataområdet (det vill säga alla celler med information i, inklusive rubrikraden) i
Excelbladet. Välj menyn Insert, alternativet PivotTable och sedan PivotTable ännu en gång. Då
får du upp följande dialogruta:
15
Kontrollera att det dataområde vi önskar använda (hela) är angivet i rutan enligt ovan. Klicka
OK. Skärmbilden blir följande:
Dra nu Kön till fältet ”Row Labels” och Utbildning till fältet ”Column Labels”. Dra även Utbildning
ännu en gång från rutan ”Choose fields to add to report” till fältet ” Values” (det går alltså att
16
dra samma knapp flera gånger). Notera att det i rutan Values nu står ”Count of utbildning”, dvs
måttet är antal. Skärmbilden bör nu vara följande:
Ur tabellen kan vi nu utläsa att tre av kvinnorna och en av männen som högst har
grundskoleutbildning, och att fem av kvinnorna och sex av männen har högskoleutbildning.
Kontrollera att du förstår tabellen2!
Låt oss nu åskådliggöra tabellen i diagramform. Klicka någonstans i Pivottabellen, se till att du är
i menyn Options och tryck på knappen PivotChart. Välj en lämplig diagramtyp och klicka OK.
Snygga till diagrammet. Visst blir diagrammet lättare att tolka än tabellen?
TABELL 2 Antag att vi nu vill ha en trevägsindelad tabell, där du också får in Ålder. Dra då Åldersklass till
rutan ”Column Labels”. Tabellen får nu följande utseende:
2 Detta är ett exempel på en korstabell (eller tvåvägstabell). Namnet kommer sig av att den består av två
variabler som korsats.
17
Vi kan nu utläsa att av de tre kvinnorna med grundskoleutbildning tillhör en åldersklassen
yngre, en medel och en äldre. Mannen med grundskoleutbildning tillhör åldersklassen yngre.
Kontrollera att du förstår tabellen!
Gör ett diagram över trevägstabellen och snygga till det så att det blir så begripligt som möjligt.
Är diagrammet eller tabellen lättast att tolka?
TABELL 3 Gå tillbaka till Sheet1, se till att hela dataområdet är markerat. Välj återigen fliken Insert, sedan
PivotTable och PivotTable. Klicka OK i den följande rutan. Välj nu Kön som Row Labels och
Utbildning till Column Labels, men välj denna gång Månadslön till Values. Notera att det nu
står Sum of Månadslön i detta fält. Det innebär att tabellen kommer att innehålla summerade
månadslöner inom varje kombination av kön och utbildning. Det känns väl vettigare att beräkna
medellönen i en sådan här tabell så detta måste korrigeras!
Klicka med höger musknapp i cellen ”Sum of Månadslön” i Pivottabellen och välj alternativet
Value Field Settings. Följande ruta öppnas:
18
Välj Average (står förstås för genomsnitt) och klicka på OK.
Ni får du beräknade genomsnittslöner i cellerna. Formatet på dessa kan ställas till valfritt antal
decimaler: markera alla celler du vill ändra format på, högerklicka, välj Format Cells och
Number, och välj antal decimaler.
FUNDERA ÖVER: Vad säger tabellen om genomsnittslönen hos män respektive hos kvinnor,
samt för olika utbildningsbakgrunder? Skulle tabellen göra sig bra i diagramform? Testa!
TABELL 4 Gå tillbaka till Sheet1, se till att hela dataområdet är och skapa en Pivottabell. Välj nu Åldersklass
till Row Labels och Utbildning till såväl Row Labels som Value. Återigen får du Count of
Utbildning som knapp i detta fält. Högerklicka nu i en cell inne i Pivottabellen och välj Value
Field Settings i undermenyn. Klicka på fliken Show values as:
19
Det fält där det står Normal har en undermeny kopplad till sig där du kan välja bland andra
alternativ. Välj alternativet % of Grand Total och klicka sedan på OK. Vad händer nu med
tabellen? Kontrollera att du förstår vad tabellen nu säger!
Pröva även med något av alternativen % of row resp. % of column. Observera att du måste ha
Count of utbildning som vald funktion för att denna metodik ska fungera.
20
STANDARDVÄGNING MED EXCEL
DATA Betrakta följande datamaterial, innehållande uppgifter om utbildningsnivå, ålder, kön och
månadslöner hos 30 slumpmässigt valda personer från två olika företag, A och B:
Företag Utbildningsnivå Ålder Kön Månadslön
A Högre Äldre Kvinna 18390
A Lägre Yngre Man 17450
B Lägre Äldre Kvinna 18670
A Högre Yngre Kvinna 18310
B Lägre Yngre Kvinna 16370
A Lägre Äldre Man 19430
A Högre Äldre Man 18080
B Lägre Äldre Kvinna 14870
A Högre Yngre Man 18250
B Högre Äldre Kvinna 20010
B Högre Yngre Kvinna 14210
B Högre Yngre Man 17720
A Lägre Äldre Man 15360
B Högre Äldre Kvinna 17710
A Lägre Yngre Kvinna 16440
A Högre Äldre Kvinna 18120
B Högre Yngre Man 16790
A Lägre Äldre Man 18170
B Lägre Äldre Kvinna 15350
B Lägre Yngre Man 15190
A Högre Äldre Kvinna 16440
B Lägre Äldre Man 17950
A Lägre Äldre Kvinna 15990
B Lägre Äldre Man 15070
B Högre Yngre Kvinna 16380
A Lägre Äldre Kvinna 17570
A Högre Yngre Man 14810
B Lägre Yngre Man 14730
B Högre Äldre Kvinna 17370
A Lägre Yngre Man 14030
Börja med att ta in materialet i Excel genom att öppna den färdiga Excelfilen som ligger på
hemsidan (data2.xls).
Gör en trevägsindelad medeltalstabell över månadslöner, där utbildningsnivå och ålder läggs i
rader och kön läggs i kolumner. Välj månadslön och ålder i tabellens Value-fält. Placera
tabellen på ett nytt blad. Ordna till funktionerna i tabellen så att du får medellöner (Average) för
månadslön och antal (Count) för ålder.
21
Studera den erhållna tabellen och jämför totala medellöner för kvinnor och män. Är dessa
samstämmiga med hur det ser ut för respektive kombination av ålder och utbildningsnivå?
Beräkna standardvägda medellöner för kvinnor respektive män. Använd kombinationen av
utbildningsnivå och ålder för samtliga anställda som standardiseringsvariabel.
Jämför de standardvägda medellönerna med de totala medellönerna. Blir jämförelsen
kvinnor/män rättvisare med de standardvägda medellönerna jämfört med hur det blev med
totalmedellönerna?
DEL 4: SANNOLIKHETSLÄRA I MINITAB I denna övning skall du med hjälp av ett så kallat makro, en kort programsekvens, simulera ett
försök och med hjälp av detta uppskatta sannolikheter för ett antal händelser (och
kombinationer/betingningar på dessa). Dessa sannolikheter skall du sedan beräkna teoretiskt
med hjälp av de modeller som ligger till grund för simuleringarna.
För att kunna köra makrot måste du förbereda Minitab för att ta emot kommandosekvenser i
Sessionfönstret. Det gör du genom att klicka i Sessionfönstret, välja menyn Editor och markera
alternativet Enable Commands.
EXPERIMENT På kurshemsidan finns makrot events.mac. Ladda hem detta och spara dem på din egen
arbetsyta (Z:\). Se sedan till att Minitab använder detta som arbetsmapp genom att i Session-
fönstret ge kommandot cd z:
TVÅ HÄNDELSER Events.mac genomför ett antal oberoende slumpmässiga försök som vart och ett kan resultera i
minst en av händelserna A och B. Makrot anropas med kommandot
MTB > %events c1 c2 n
där C1 och C2 kan bytas mot i princip vilka kolumner som helst (det viktiga är att två kolumner
anges) och n är det antal försök man vill ha. Resultatet kommer att ges i just dessa två kolumner
som automatiskt får rubrikerna ”A” och ”B”. I varje kolumn står det en etta (1) om motsvarande
händelse har inträffat och en nolla (0) om den inte har inträffat.
Pröva genom att ge kommandot %events c1 c2 3
Du skall nu ha fått data motsvarande tre rader i C1 och C2 från vilka du kan avläsa vad som
inträffade i de tre försöken.
Din uppgift är att med hjälp av makrot genomföra ett stort antal försök från vilka du skall kunna:
a) uppskatta sannolikheten att A inträffar, dvs. P(A)
b) uppskatta sannolikheten att B inträffar, dvs. P(B)
c) uppskatta sannolikheten att båda inträffar, dvs. P(AB) = P(A och B)
d) uppskatta sannolikheten att minst en av dem inträffar, dvs. P(AB) = P(A eller B)
e) uppskatta sannolikheten att A inträffar betingat av att B har inträffat, dvs. P(A | B)
22
f) uppskatta sannolikheten att B inträffar betingat av att A har inträffat, dvs. P(B | A)
g) bedöma om A och B kan vara oberoende händelser
Börja inte försöka lösa dessa uppgifter ännu.
Det kan vara lämpligt att genomföra 10 000 försök. Detta tar i och för sig en stund men inte
längre än att du orkar vänta (det är alltså inget fel med att det dröjer och du får sitta och titta på
”timglaset” på skärmen).
Efter att försöken gjorts (och ni alltså har era data i C1 och C2) kan ni ha hjälp av följande:
Kommandot mean c1 beräknar medeltalet av alla värden i C1. Eftersom värdena är
ettor och nollor kommer detta medelvärde att vara detsamma som proportionen ettor i
kolumnen, dvs. en uppskattning av sannolikheten för A.
Fundera på vad du får för resultat i kolumnen C3 om du ger kommandot
MTB > let c3=c1*c2
Kan du använda C3 för att lösa någon av uppgifterna a) – g) ?
Fundera på vad du får för resultat i kolumnen C4 om du ger kommandot
MTB > let c4=c1+c2
Kan du använda C4 för att lösa någon av uppgifterna a) – g) ?
Prova att ge kommandot:
MTB > table c1 c2;
SUBC> counts;
SUBC> rowpercents;
SUBC> colpercents;
SUBC> totpercents.
Alternativt kan du menyvägen välja StatTablesCross Tabulation and Chi-Square
och bocka för rutorna Counts, Row percents, Column percents och Total percents.
23
Kan du använda utskriften för att besvara någon eller några av uppgifterna a) – g)?
Lös nu uppgifterna a) – g)!
I makrot har följande modell använts:
Ett tal väljs slumpmässigt bland talen 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Händelsen A = ”Talet är udda”
Händelsen B = ”Talet är högst 5”
Lös nu uppgifterna a) – g) teoretiskt
dvs. räkna ut de sökta sannolikheterna. Jämför de resultat ni fick från data med de teoretiska
resultaten.
AVSLUTNING Avsluta Minitab.
Öppna Start-menyn i Windows och välj alternativet Log off (inte Shut Down).
Klicka Log off i den frågande ruta som kommer upp.