datorÖvning 1: introduktion till datorsystemet …732g70/datorovn12012.pdf · när du har startat...

23
1 DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA. ALLMÄNT OM DATORERNA Datorsystemet består av persondatorer kopplade i ett nätverk till en större server. Operativsystemet Windows med personlig login används. Väl inne i systemet har varje användare en egen area på den gemensamma servern. Det innebär att alla dokument, program etc. som du laddar hem eller skapar hamnar på den enhet som i datorn heter Z:. Du skall alltså inte spara någonting på enhet C:. Den enheten används bara för att installera programvara och systemfiler och andra filer som sparats där ”försvinner”. Man har som användare heller ingen möjlighet att själv installera programvara eller ändra i systemfilerna: detta kan bara datoradministratörerna göra. Datorerna skall normalt alltid vara påslagna. Vid avslutat arbete skall man alltså bara logga ut (log off) och sedan lämna datorn. START Eftersom datorerna påslagna räcker det med att sätta sig vid en dator och röra på musen. Då kommer det upp en ruta som upplyser om att du skall trycka Ctrl+Alt+Del för att komma till inloggningsrutan. När inloggningsrutan kommer up, skriv in användaridentitet (user name) och lösenord (password) och välj log on to: HELIX. Tryck sedan på OK. DEL 1: BESKRIVANDE STATISTIK MED EXCEL Öppna Excel (dvs Microsoft Office Excel 2007). Observera att versionen är på engelska. Du måste vid denna första inloggning anpassa Excel så att du kan göra statistiska beräkningar. Välj File -> Options -> Add-Ins och markera alternativet Analysis ToolPak. Tryck Go, och bocka för Analysis ToolPak. Du har nu fått upp en ny meny under fliken Data: Data analysis. Den kommer vi ofta att ha nytta av, och du kan naturligtvis göra samma sak med din egen Excelinstallation hemma. DATAINMATNING När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats. Vi använder ett datamaterial som består av uppgifter hämtade från en liten enkätundersökning riktad till några studerande vid en högskola. I enkäten ställde man frågor kring

Upload: others

Post on 26-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

1

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

ALLMÄNT OM DATORERNA Datorsystemet består av persondatorer kopplade i ett nätverk till en större server.

Operativsystemet Windows med personlig login används.

Väl inne i systemet har varje användare en egen area på den gemensamma servern. Det innebär

att alla dokument, program etc. som du laddar hem eller skapar hamnar på den enhet som i

datorn heter Z:. Du skall alltså inte spara någonting på enhet C:. Den enheten används bara för

att installera programvara och systemfiler och andra filer som sparats där ”försvinner”. Man har

som användare heller ingen möjlighet att själv installera programvara eller ändra i

systemfilerna: detta kan bara datoradministratörerna göra.

Datorerna skall normalt alltid vara påslagna. Vid avslutat arbete skall man alltså bara logga ut

(log off) och sedan lämna datorn.

START Eftersom datorerna påslagna räcker det med att sätta sig vid en dator och röra på musen. Då

kommer det upp en ruta som upplyser om att du skall trycka Ctrl+Alt+Del för att komma till

inloggningsrutan. När inloggningsrutan kommer up, skriv in användaridentitet (user name) och

lösenord (password) och välj log on to: HELIX. Tryck sedan på OK.

DEL 1: BESKRIVANDE STATISTIK MED EXCEL Öppna Excel (dvs Microsoft Office Excel 2007). Observera att versionen är på engelska.

Du måste vid denna första inloggning anpassa Excel så att du kan göra statistiska beräkningar.

Välj File -> Options -> Add-Ins och markera alternativet Analysis ToolPak. Tryck Go, och

bocka för Analysis ToolPak. Du har nu fått upp en ny meny under fliken Data: Data analysis.

Den kommer vi ofta att ha nytta av, och du kan naturligtvis göra samma sak med din egen

Excelinstallation hemma.

DATAINMATNING När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2,

Sheet3) öppnats. Vi använder ett datamaterial som består av uppgifter hämtade från en liten

enkätundersökning riktad till några studerande vid en högskola. I enkäten ställde man frågor

kring

Page 2: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

2

utbildningsområde (UTB): 1 = filosofisk utbildning, 2 = teknisk utbildning

kön (KON): 1 = kvinna, 2 = man

attityd till utbildningen (ATT): 4-gradig skala med 1 = negativ, 4 = positiv

ungefärlig nedlagd studietid per normalvecka i timmar (TID)

I följande tabell motsvaras en rad av en enkät.

Enkät nr UTB KON ATT TID

1 1 1 4 30

2 1 1 2 16

3 2 1 2 26

4 1 2 3 19

5 2 2 4 35

6 2 1 2 45

7 2 2 3 52

8 1 1 2 36

9 1 1 4 22

10 2 2 4 40

11 2 2 3 29

12 2 1 1 48

13 2 2 3 38

14 1 2 4 40

15 1 1 3 20

16 2 2 4 30

17 1 1 4 15

18 2 2 3 30

19 2 2 2 25

20 2 2 4 35

Skriv in dessa data på Blad 1 (Sheet 1), förslagsvis i kolumnerna A-E. Varje enkät skall motsvara

en rad. Varje kolumn bör förses med respektive rubrik (i rad 1).

Spara dina data genom att välja Save AsExcel Workbook. I den dialogruta som öppnas kan du

i fältet File name: skriva in namnet studenter. Notera att det i det översta fältet står namnet

på den mapp i vilken du befinner dig (skall normalt vara användaridentitet on ’Samba 3.2.1

(Neptunus)’ (Z:) ). I fältet Save as type: står Excel Workbook. Detta är standardformatet att

spara i och det innebär att dina data sparas som en hel bok. Klicka på Save.

FREKVENSTABELLER Det är naturligt att först göra enkla frekvenstabeller över svaren på var och en av frågorna i

enkäten, utifrån den upplagda datafilen. Vi använder först ”histogramfunktionen”. Välj

DataData Analysis. I listan av analysmetoder, välj Histogram och klicka på OK. Med denna

funktion kan man bilda enkla frekvenstabeller.1 Förutom själva ursprungsdata behöver man för

att använda funktionen de förekommande värdena inlagda särskilt i en kolumn. Dessa anges

som Bin Range (fackområde), se exemplet nedan. Stäng för tillfället dialogfönstren genom att

klicka på Cancel i vart och ett av dem.

1 För att man faktiskt skall få ett histogram och inte bara en frekvenstabell krävs att man markerar alternativet

Chart Output.

Page 3: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

3

Vi exemplifierar med kolumnen "attityd". För att få fram en lämplig tabell skriver vi först in de

förekommande värdena 1, 2, 3, 4 i en egen tom kolumn (exempelvis kolumn G). Öppna därefter

histogramfunktionen, och markera data i fjärde kolumnen (D, attityd) som Input Range

(indataområde) och de förekommande värdena (kolumn G) som Bin Range. Klicka först i

respektive fält i dialogrutan och markera sedan motsvarande kolumn i bladet. Markera endast

data och ej kolumnrubrik. Följande tabell hamnar nu på ett nytt blad (Sheet 4).

Bin Frequency

1 1

2 5

3 6

4 8

More 0

Lite redigering, rubrikerna ersatta med andra begrepp (det går att skriva direkt i rutorna för Bin

etc.), attitydsiffrorna ersatta med begrepp, "More-raden" bort, en summerad till, och ett annat

typsnitt ger i stället tabellen nedan:

Tabell 1. De svarandes attityder

Attityd Antal

svarande

Negativ 1

Något negativ 5

Något positiv 6

Positiv 8

Summa 20

När man på motsvarande sätt gör en enkel frekvenstabell eller ett histogram för variabeln

"arbetstid" behöver man klassindela materialet (eller hur!). Detta gör man genom att som

fackområde lägga in övre klassgränser. Antag att vi vill klassindela materialet i fem klasser: t o m

20, 21-30, 31-40, 41-50, 51 och uppåt (eller 51-60, eftersom inget värde är större än 60). Lägg

då som fackområde 20, 30, 40, 50, 60, inlagda under varandra på samma sätt som 1, 2, 3, 4 i

kolumnen G ovan.

UPPGIFT 1 Konstruera en frekvenstabell som visar hur de 20 personerna fördelar sig på de fem

studietidsklasserna. Använd även här absoluta frekvenser. Skriv in klasserna i den vänstra

kolumnen (ersätt alltså 20 med "högst 20" eller 0-20 etc.).

Page 4: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

4

DIAGRAM När man fått fram frekvenstabellen ovan, tabell 1, kan man göra ett diagram av den. Markera

hela frekvenstabellen förutom raden More, välj Insert-menyn och klicka på Column. Välj den

översta vänstra diagramtypen i menyn som öppnas.

UPPGIFT 2

a) Konstruera ett diagram som ovan. Observera att vissa förändringar måste göras. När

diagrammet konstruerats, markera det och välj menyn Layout. Här hittar vi funktioner

för att ändra diagrammets utseende. Pröva dessa tills diagrammet blir likt exemplet

ovan!

b) Gör ett enkelt stapeldiagram (stående staplar) som beskriver hur de svarande fördelar

sig på studietid i 5 klasser.

c) Gör om diagrammet under b till ett histogram på följande sätt. Högerklicka på en av

staplarna och välj Format Data Series. Se till att du står under fliken Series Options.

Genom att minska gapet (Gap width) mellan kolumnerna blir bilden mer och mer

histogramliknande. Fundera kring klassgränserna. Pröva samtidigt hur staplarna ser ut i

annan färg och kanske med mönster.

d) Gör ett cirkeldiagram som beskriver hur de svarande fördelar sig på attityd.

BESKRIVANDE MÅTT För variabeln TID, som ju är en kvantitativ variabel - till skillnad från övriga variabler - kan det

också vara intressant att beräkna några beskrivande mått. Detta görs enklast med DataData

Analysis. Välj Descriptive statistics och bocka för Summary Statistics i dialogrutan. Markera

data i den aktuella kolumnen och följ anvisningarna. Fram kommer - med viss redigering (och i

svensk översättning) - följande:

0

1

2

3

4

5

6

7

8

9

Negativ Något negativ Något positiv Positiv

Antal

Page 5: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

5

Kolumn1

Medelvärde 31,55

Standardfel 2,3412491

Medianvärde 30

Typvärde 30

Standardavvikelse 10,4703843

Varians 109,628947

Toppighet -0,6498275

Snedhet 0,19975206

Variationsvidd 37

Minimum 15

Maximum 52

Summa 631

Antal 20

För att bredda kolumnerna, dubbelklicka mitt emellan dem!

Denna sammanställning är mindre njutbar för en betraktare. Bra är att dels ta bort sådana mått

som i sammanhanget ej är intressanta, dels att minska antalet decimaler betydligt innan man

visar en sådan här uppställning i en rapport. Alla mått som man tar med i en rapport skall man

själv kunna förstå och förklara! Här vore det naturligt att ta bort ”standardfel", "toppighet" och

"snedhet", samt att avrunda till två decimaler. Det senare gör man genom att klicka i aktuell cell

med höger musknapp, välja FormatCells, Number och ange två decimaler.

Page 6: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

6

Beskrivning av arbetstiden hos undersökningsgruppen

Medelvärde 31,55

Medianvärde 30

Typvärde 30

Standardavvikelse 10,47

Varians 109,63

Variationsvidd 37

Minimum 15

Maximum 52

Summa 631

Antal 20

UPPGIFT 3 Ta fram tabellen ovan. Jämför de engelska uttrycken med de svenska översättningarna.

Spara hela arbetsboken på nytt i Excel-format, så att du har ditt arbete kvar.

DEL 2: BESKRIVANDE STATISTIK MED MINITAB Öppna Start-menyn igen. Välj All Programs och sök upp alternativet Minitab Solutions. Detta

val öppnar ytterligare en undermeny, där du väljer alternativet Minitab 16 Statistical Software

English. Följande fönster öppnas på skärmen:

Page 7: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

7

Det du ser är två delfönster: det övre heter Session och det nedre Worksheet. I Session-fönstret

presenteras resultaten av dina analyser.

I Worksheet-fönstret hamnar (så gott som) alla data som matas in eller skapas i programmet.

Worksheet-fönstret är uppbyggt med ett stort antal kolumner som numreras C1, C2, etc. Minitab

är i sina kommandon uppbyggt runt analys av kolumner, men har också med tiden utvecklat

vissa operationer för rader. Till skillnad från Excel är inte ett Worksheet i Minitab något

kalkylblad. Det går alltså inte att flytta eller kopiera celler hur som helst, eller införa

kalkylbladsformler.

För att kunna skriva något i Worksheet-fönstret krävs att det aktiveras och det gör ni genom att

klicka på det, lämpligen i titelraden (den blå).

BESKRIVANDE MÅTT OCH LÅDAGRAM Klicka nu i Worksheet-fönstret och skriv in följande värden i den första kolumnen (C1). Börja i

raden med nummer 1 (längst t v):

2, 4, 14, 3, 0, 1, 8, 12, 1, 3

(kommatecknen skall inte skrivas in). Gå nu längst upp i Minitab-fönstret och öppna menyn med

titel Stat.

Page 8: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

8

I denna meny finns en stor mängd av alla möjliga statistiska procedurer av vilka vi endast skall

använda några i denna första kurs, men under din utbildnings gång kommer du att stöta på de

flesta av dem. Välj alternativet Basic Statistics, varvid följande undermeny öppnas:

Välj alternativet Display Descriptive Statistics… (dvs beskrivande mått) och följande fönster

öppnas på skärmen:

Page 9: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

9

Detta fönster visar hur en typisk s k dialogruta i Minitab kan se ut. Längst till vänster finns ett

vitt fält i vilket det står C1 överst. Detta fält är en lista över alla kolumner som är aktiva i

Minitab. Ni har ju skrivit in värden i kolumn C1, men ingen annanstans och följaktligen är endast

just kolumnen C1 aktiv.

Fältet till höger har rubriken Variables. Till detta fält skall du välja de kolumner (variabler) du

vill göra analyser på (i detta fall deskriptiva mått). Det gör du genom att endera markera de

kolumner du vill analysera i listan till höger och sedan klicka på knappen Select eller

dubbelklicka på de kolumner du vill analysera. Gör något av detta med C1 så kommer du att se

att den hamnar i listan till höger.

Under det högra fältet finns en ruta märkt By variable: följt av ett mindre vitt fält. Den används

för att sortera variablerna efter en kolumn som anger någon form av klassificering, men vi

väntar ett slag med detta. Klicka istället på knappen Graphs…

Markera rutan Boxplot of data (lådagram) och klicka på OK. Klicka sedan på OK i den första

dialogrutan.

Page 10: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

10

Observera nu vad som händer i Session-fönstret samtidigt som ett lådagram dyker upp på

skärmen. Du får flytta på det senare för att se innehållet i Session-fönstret. Där bör du ha fått

följande utskrift:

Descriptive Statistics: C1 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum

C1 10 0 4,80 1,54 4,87 0,00 1,00 3,00 9,00 14,00

och lådagrammet bör se ut så här:

Boxplot of C1

Titta nu på utskriften i Session-fönstret. Där listas för variabeln (kolumnen) C1 ett antal

beskrivande mått (Descriptive Statistics). Först anges antal värden i C1 betecknat N som här är

10. Vi ser medeltalet (Mean) som är 4.8 och medianen (Median) som är 3. TrMean är ett s k

trimmat eller avhugget medeltal, som vi inte beaktar ytterligare här. StDev är standardavvikelse,

beräknad enligt formeln med n-1 i nämnaren, SEMean är ett speciellt spridningsmått för själva

medeltalet, som vi heller inte är mogna att ta upp just nu, men de övriga kan vi förstå: Minimum,

Maximum, Q1 som står för första kvartilen (25e percentilen) och Q3 som står för tredje

kvartilen (75e percentilen). Alla dessa beskrivande mått är alltså förvalda av Minitab och utgör

en standarduppsättning, som väl ganska ofta efterfrågas. Vill man beräkna ytterligare

beskrivande mått måste detta göras mer manuellt. Vi återkommer till det senare.

Lådagrammet lämnar kanske inte så mycket att kommentera. Dock bör sägas att detta diagram

inte kan hanteras så enkelt som med ett diagram i Excel. Det går t ex inte att ändra på skalor

eller ändra indata till diagrammet.

Nu skall du pröva att göra ett lådagram direkt. Öppna menyn Graph längst upp i

Minitab-fönstret. Den har följande innehåll:

Page 11: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

11

Välj alternativet Boxplot…

och tryck OK så får du fram dialogrutan

Page 12: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

12

Kolumnlistan med Select till vänster ser ut och fungerar som tidigare. Välj kolumn C1 så att den

hamnar i fältet Graph variables. Välj tills vidare inget mer utan klicka bara på OK. Resultatet

blir följande lådagram:

Det kan ju kännas litet trist med variabelnamnet C1. Låt oss anta att de data ni matat in är

åldrarna hos en barnaskara till ett ovanligt produktivt par. Ni kan då t ex välja namnet ålder för

denna kolumn. Gå då till Worksheet-fönstret igen och klicka i den rad som ligger mellan det

första värdet och raden med alla kolumnnummer. Detta är rubrikraden för kolumnerna och i

denna kan man skriva in valfria rubriker för kolumnerna. Dock kan inte samma namn användas

för flera kolumner. Skriv in Ålder i rubriken för C1:

Page 13: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

13

Gör nu om proceduren med lådagrammet. Det räcker att välja Boxplot från Graph-menyn och

sedan klicka på OK , men observera att i listan över kolumner har nu C1 försetts med sin rubrik.

Rubriker är praktiska när man han många aktiva kolumner och vill vara säker på att man väljer

rätt kolumn i en dialogruta.

För att spara allt arbete man gjort, t ex för att enkelt kunna återuppta det senare, krävs att man

skapar en s k Projekt-fil. Välj från File-menyn alternativet Save Project As… Du får då upp en

dialogruta liknande den tidigare, men här finns bara ett filformat, MPJ (som står för Minitab

Project). Skriv in ett lämpligt filnamn (t ex syskon) och klicka på Save. Den fil som då skapas

syns som vanligt i Windows Explorer, men observera att den är betydligt större (i

minnesutrymme) än de andra. Detta kan vara värt att komma ihåg om man behöver skicka

projektfiler mellan varandra. De kan bli rätt stora och man tjänar på att rensa bort onödiga

fönster och kolumner innan man sparar arbetet.

Avsluta nu Minitab genom att välja Exit från File-menyn. Svara Nej på eventuella frågor. Starta

sedan Minitab igen. Du är nu åter i ett ”tomt” arbetsfält, men denna gång skall du hämta det

arbete ni nyss sparade. Välj från File-menyn alternativet Open Project. Se till att du hamnar i

den katalog där du sparade den senaste projektfilen (normalt din hemkatalog). Dubbelklicka på

filen med det namn du gav (syskon) och du kommer att se att allt du tidigare gjorde laddas in

igen.

DEL 3: SKAPA PIVOTTABELLER I EXCEL Vi ska nu använda Excel för att konstruera pivottabeller. Pivottabellerna används sedan för att

beräkna standardvägda medeltal.

DATA Betrakta följande lilla datamaterial över 20 personer:

Page 14: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

14

Person Kön Utbildning Ålderklass Månadslön

1 Man Högskola yngre 18400

2 Man Grundskola yngre 15300

3 Kvinna Högskola yngre 17600

4 Man Gymnasieskola medel 20100

5 Kvinna Högskola medel 15900

6 Kvinna Gymnasieskola yngre 13500

7 Man Högskola medel 23400

8 Kvinna Grundskola äldre 14100

9 Man Högskola medel 26700

10 Man Högskola äldre 25900

11 Kvinna Gymnasieskola medel 18600

12 Kvinna Högskola medel 31500

13 Kvinna Grundskola yngre 13600

14 Man Gymnasieskola äldre 22300

15 Man Högskola äldre 35900

16 Kvinna Högskola medel 24800

17 Man Gymnasieskola äldre 20000

18 Kvinna Högskola medel 19400

19 Kvinna Grundskola medel 14100

20 Man Högskola medel 23800

Börja med att ta in materialet i Excel genom att öppna den färdiga Excelfilen som ligger på

kurshemsidan (data1.xls).

Nu ska vi bilda tabeller utifrån detta material.

TABELL 1 Markera hela dataområdet (det vill säga alla celler med information i, inklusive rubrikraden) i

Excelbladet. Välj menyn Insert, alternativet PivotTable och sedan PivotTable ännu en gång. Då

får du upp följande dialogruta:

Page 15: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

15

Kontrollera att det dataområde vi önskar använda (hela) är angivet i rutan enligt ovan. Klicka

OK. Skärmbilden blir följande:

Dra nu Kön till fältet ”Row Labels” och Utbildning till fältet ”Column Labels”. Dra även Utbildning

ännu en gång från rutan ”Choose fields to add to report” till fältet ” Values” (det går alltså att

Page 16: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

16

dra samma knapp flera gånger). Notera att det i rutan Values nu står ”Count of utbildning”, dvs

måttet är antal. Skärmbilden bör nu vara följande:

Ur tabellen kan vi nu utläsa att tre av kvinnorna och en av männen som högst har

grundskoleutbildning, och att fem av kvinnorna och sex av männen har högskoleutbildning.

Kontrollera att du förstår tabellen2!

Låt oss nu åskådliggöra tabellen i diagramform. Klicka någonstans i Pivottabellen, se till att du är

i menyn Options och tryck på knappen PivotChart. Välj en lämplig diagramtyp och klicka OK.

Snygga till diagrammet. Visst blir diagrammet lättare att tolka än tabellen?

TABELL 2 Antag att vi nu vill ha en trevägsindelad tabell, där du också får in Ålder. Dra då Åldersklass till

rutan ”Column Labels”. Tabellen får nu följande utseende:

2 Detta är ett exempel på en korstabell (eller tvåvägstabell). Namnet kommer sig av att den består av två

variabler som korsats.

Page 17: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

17

Vi kan nu utläsa att av de tre kvinnorna med grundskoleutbildning tillhör en åldersklassen

yngre, en medel och en äldre. Mannen med grundskoleutbildning tillhör åldersklassen yngre.

Kontrollera att du förstår tabellen!

Gör ett diagram över trevägstabellen och snygga till det så att det blir så begripligt som möjligt.

Är diagrammet eller tabellen lättast att tolka?

TABELL 3 Gå tillbaka till Sheet1, se till att hela dataområdet är markerat. Välj återigen fliken Insert, sedan

PivotTable och PivotTable. Klicka OK i den följande rutan. Välj nu Kön som Row Labels och

Utbildning till Column Labels, men välj denna gång Månadslön till Values. Notera att det nu

står Sum of Månadslön i detta fält. Det innebär att tabellen kommer att innehålla summerade

månadslöner inom varje kombination av kön och utbildning. Det känns väl vettigare att beräkna

medellönen i en sådan här tabell så detta måste korrigeras!

Klicka med höger musknapp i cellen ”Sum of Månadslön” i Pivottabellen och välj alternativet

Value Field Settings. Följande ruta öppnas:

Page 18: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

18

Välj Average (står förstås för genomsnitt) och klicka på OK.

Ni får du beräknade genomsnittslöner i cellerna. Formatet på dessa kan ställas till valfritt antal

decimaler: markera alla celler du vill ändra format på, högerklicka, välj Format Cells och

Number, och välj antal decimaler.

FUNDERA ÖVER: Vad säger tabellen om genomsnittslönen hos män respektive hos kvinnor,

samt för olika utbildningsbakgrunder? Skulle tabellen göra sig bra i diagramform? Testa!

TABELL 4 Gå tillbaka till Sheet1, se till att hela dataområdet är och skapa en Pivottabell. Välj nu Åldersklass

till Row Labels och Utbildning till såväl Row Labels som Value. Återigen får du Count of

Utbildning som knapp i detta fält. Högerklicka nu i en cell inne i Pivottabellen och välj Value

Field Settings i undermenyn. Klicka på fliken Show values as:

Page 19: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

19

Det fält där det står Normal har en undermeny kopplad till sig där du kan välja bland andra

alternativ. Välj alternativet % of Grand Total och klicka sedan på OK. Vad händer nu med

tabellen? Kontrollera att du förstår vad tabellen nu säger!

Pröva även med något av alternativen % of row resp. % of column. Observera att du måste ha

Count of utbildning som vald funktion för att denna metodik ska fungera.

Page 20: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

20

STANDARDVÄGNING MED EXCEL

DATA Betrakta följande datamaterial, innehållande uppgifter om utbildningsnivå, ålder, kön och

månadslöner hos 30 slumpmässigt valda personer från två olika företag, A och B:

Företag Utbildningsnivå Ålder Kön Månadslön

A Högre Äldre Kvinna 18390

A Lägre Yngre Man 17450

B Lägre Äldre Kvinna 18670

A Högre Yngre Kvinna 18310

B Lägre Yngre Kvinna 16370

A Lägre Äldre Man 19430

A Högre Äldre Man 18080

B Lägre Äldre Kvinna 14870

A Högre Yngre Man 18250

B Högre Äldre Kvinna 20010

B Högre Yngre Kvinna 14210

B Högre Yngre Man 17720

A Lägre Äldre Man 15360

B Högre Äldre Kvinna 17710

A Lägre Yngre Kvinna 16440

A Högre Äldre Kvinna 18120

B Högre Yngre Man 16790

A Lägre Äldre Man 18170

B Lägre Äldre Kvinna 15350

B Lägre Yngre Man 15190

A Högre Äldre Kvinna 16440

B Lägre Äldre Man 17950

A Lägre Äldre Kvinna 15990

B Lägre Äldre Man 15070

B Högre Yngre Kvinna 16380

A Lägre Äldre Kvinna 17570

A Högre Yngre Man 14810

B Lägre Yngre Man 14730

B Högre Äldre Kvinna 17370

A Lägre Yngre Man 14030

Börja med att ta in materialet i Excel genom att öppna den färdiga Excelfilen som ligger på

hemsidan (data2.xls).

Gör en trevägsindelad medeltalstabell över månadslöner, där utbildningsnivå och ålder läggs i

rader och kön läggs i kolumner. Välj månadslön och ålder i tabellens Value-fält. Placera

tabellen på ett nytt blad. Ordna till funktionerna i tabellen så att du får medellöner (Average) för

månadslön och antal (Count) för ålder.

Page 21: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

21

Studera den erhållna tabellen och jämför totala medellöner för kvinnor och män. Är dessa

samstämmiga med hur det ser ut för respektive kombination av ålder och utbildningsnivå?

Beräkna standardvägda medellöner för kvinnor respektive män. Använd kombinationen av

utbildningsnivå och ålder för samtliga anställda som standardiseringsvariabel.

Jämför de standardvägda medellönerna med de totala medellönerna. Blir jämförelsen

kvinnor/män rättvisare med de standardvägda medellönerna jämfört med hur det blev med

totalmedellönerna?

DEL 4: SANNOLIKHETSLÄRA I MINITAB I denna övning skall du med hjälp av ett så kallat makro, en kort programsekvens, simulera ett

försök och med hjälp av detta uppskatta sannolikheter för ett antal händelser (och

kombinationer/betingningar på dessa). Dessa sannolikheter skall du sedan beräkna teoretiskt

med hjälp av de modeller som ligger till grund för simuleringarna.

För att kunna köra makrot måste du förbereda Minitab för att ta emot kommandosekvenser i

Sessionfönstret. Det gör du genom att klicka i Sessionfönstret, välja menyn Editor och markera

alternativet Enable Commands.

EXPERIMENT På kurshemsidan finns makrot events.mac. Ladda hem detta och spara dem på din egen

arbetsyta (Z:\). Se sedan till att Minitab använder detta som arbetsmapp genom att i Session-

fönstret ge kommandot cd z:

TVÅ HÄNDELSER Events.mac genomför ett antal oberoende slumpmässiga försök som vart och ett kan resultera i

minst en av händelserna A och B. Makrot anropas med kommandot

MTB > %events c1 c2 n

där C1 och C2 kan bytas mot i princip vilka kolumner som helst (det viktiga är att två kolumner

anges) och n är det antal försök man vill ha. Resultatet kommer att ges i just dessa två kolumner

som automatiskt får rubrikerna ”A” och ”B”. I varje kolumn står det en etta (1) om motsvarande

händelse har inträffat och en nolla (0) om den inte har inträffat.

Pröva genom att ge kommandot %events c1 c2 3

Du skall nu ha fått data motsvarande tre rader i C1 och C2 från vilka du kan avläsa vad som

inträffade i de tre försöken.

Din uppgift är att med hjälp av makrot genomföra ett stort antal försök från vilka du skall kunna:

a) uppskatta sannolikheten att A inträffar, dvs. P(A)

b) uppskatta sannolikheten att B inträffar, dvs. P(B)

c) uppskatta sannolikheten att båda inträffar, dvs. P(AB) = P(A och B)

d) uppskatta sannolikheten att minst en av dem inträffar, dvs. P(AB) = P(A eller B)

e) uppskatta sannolikheten att A inträffar betingat av att B har inträffat, dvs. P(A | B)

Page 22: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

22

f) uppskatta sannolikheten att B inträffar betingat av att A har inträffat, dvs. P(B | A)

g) bedöma om A och B kan vara oberoende händelser

Börja inte försöka lösa dessa uppgifter ännu.

Det kan vara lämpligt att genomföra 10 000 försök. Detta tar i och för sig en stund men inte

längre än att du orkar vänta (det är alltså inget fel med att det dröjer och du får sitta och titta på

”timglaset” på skärmen).

Efter att försöken gjorts (och ni alltså har era data i C1 och C2) kan ni ha hjälp av följande:

Kommandot mean c1 beräknar medeltalet av alla värden i C1. Eftersom värdena är

ettor och nollor kommer detta medelvärde att vara detsamma som proportionen ettor i

kolumnen, dvs. en uppskattning av sannolikheten för A.

Fundera på vad du får för resultat i kolumnen C3 om du ger kommandot

MTB > let c3=c1*c2

Kan du använda C3 för att lösa någon av uppgifterna a) – g) ?

Fundera på vad du får för resultat i kolumnen C4 om du ger kommandot

MTB > let c4=c1+c2

Kan du använda C4 för att lösa någon av uppgifterna a) – g) ?

Prova att ge kommandot:

MTB > table c1 c2;

SUBC> counts;

SUBC> rowpercents;

SUBC> colpercents;

SUBC> totpercents.

Alternativt kan du menyvägen välja StatTablesCross Tabulation and Chi-Square

och bocka för rutorna Counts, Row percents, Column percents och Total percents.

Page 23: DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET …732G70/datorovn12012.pdf · När du har startat Excel har en ny arbetsbok (Book1) med tre arbetsblad (Sheet1, Sheet2, Sheet3) öppnats

23

Kan du använda utskriften för att besvara någon eller några av uppgifterna a) – g)?

Lös nu uppgifterna a) – g)!

I makrot har följande modell använts:

Ett tal väljs slumpmässigt bland talen 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Händelsen A = ”Talet är udda”

Händelsen B = ”Talet är högst 5”

Lös nu uppgifterna a) – g) teoretiskt

dvs. räkna ut de sökta sannolikheterna. Jämför de resultat ni fick från data med de teoretiska

resultaten.

AVSLUTNING Avsluta Minitab.

Öppna Start-menyn i Windows och välj alternativet Log off (inte Shut Down).

Klicka Log off i den frågande ruta som kommer upp.