analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/fulltext01.pdf ·...

48
Analys av vilka faktorer som påverkar priset på maltwhisky Författare: VICTOR JANSSON, [email protected] ERIK DAHLBERG, [email protected] 21 maj 2013 SA104X Examensarbete inom teknisk fysik, grundnivå Kandidatexamensrapport Handledare: Gunnar Englund

Upload: nguyenkiet

Post on 04-Jul-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Analys av vilka faktorer som påverkar priset påmaltwhisky

Författare:VICTOR JANSSON, [email protected]

ERIK DAHLBERG, [email protected]

21 maj 2013SA104X Examensarbete inom teknisk fysik, grundnivå

KandidatexamensrapportHandledare: Gunnar Englund

Page 2: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK
Page 3: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

ReferatI detta arbete är syftet att undersöka vilka faktorer i all-mänhet som påverkar en maltwhiskys pris och i synnerhetvarumärkets påverkan. Data samlades in från Systembola-get ABs sortiment och manipulerades för att passa arbe-tets behov. Variabler som analyserades var maltwhiskynsålder, alkoholhalt, märke, ursprungsland och, om det varen skotsk maltwhisky, skotska ursprungsregionen.

En teoretisk modell togs fram och denna specificera-des till tre olika huvudmodeller som skiljer på märke, ur-sprungsland och skotska regioner. För att bestämma vilkaoberoende variabler som skulle inkluderas i varje huvud-modell beräknades Akaike Information Criterion corrected(AICc) för varje delmängd av huvudmodellen. Modellernamed lågt AICc och hög signifikans hos de oberoende vari-ablerna valdes till de slutgiltiga modellerna. Dessa modellerutvärderades med multipel regressionsanalys för att kvan-tifiera variablernas påverkan på priset.

Analysen visade att vissa ursprungsländer och varu-märken hade signifikant inverkan på priset och även attvissa skotska regioner hade betydande inverkan på priset.Samtliga modeller gav ett acceptabelt resultat för deras syf-te.

Page 4: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Abstract

The aim of this report is to examine which factors in generalthat influence the price of a malt whisky and in particularthe price effect of the brand. Data was gathered from Sys-tembolaget AB’s assortment and was manipulated to fit theneeds of this project’s needs. The variables that were anal-ysed were the age and alcohol content of malt whisky, itsbrand, the country of origin and, if it was a Scotch maltwhisky, the Scottish region of origin.

A theoretical model was developed and three differentmain models were specified to part brand, country of ori-gin and region. To be able to conclude which independantvariables that were to be included in the final models theAkaike Information Criterion corrected (AICc) for everysubset of the main model was calculated. The models withlow AICc score and highly significant independant variableswere chosen as the final models. These models were thenevaluated using multiple regression analysis to quantify thevariables’ price influence.

The analysis showed that some of the brands and coun-tries of origin had significant influence on the price andthere could be seen some significant influence on the pricein the Scottish whisky regions model as well. All modelsgave an acceptable result for the purpose of the report.

Page 5: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Innehåll

1 Inledning 11.1 Bakgrund . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Maltwhisky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Varumärke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.4 Land och region . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.5 Datainsamling och manipulation . . . . . . . . . . . . . . . . . . . . 2

2 Teoretisk bakgrund 52.1 Terminologi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1.1 Beroende och oberoende variabler . . . . . . . . . . . . . . . 52.1.2 Dummyvariabel . . . . . . . . . . . . . . . . . . . . . . . . . . 52.1.3 Koefficient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.1.4 Felterm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.1.5 Signifikans . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.1.6 Strukturtolkning . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Matematisk bakgrund för regressionsanalys . . . . . . . . . . . . . . 62.2.1 Linjära regressionsmodellen . . . . . . . . . . . . . . . . . . . 62.2.2 Minstakvadratmetoden . . . . . . . . . . . . . . . . . . . . . 72.2.3 Antaganden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Test- och modellanpassningsmetoder . . . . . . . . . . . . . . . . . . 92.3.1 R2 och R2

adj . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.3.2 t-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.3.3 AICc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.4 Att tänka på vid utförande av regressionsanalys . . . . . . . . . . . . 112.4.1 Heteroskedasticitet . . . . . . . . . . . . . . . . . . . . . . . . 112.4.2 Endogenitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.4.3 Multikollinearitet . . . . . . . . . . . . . . . . . . . . . . . . . 12

3 Metod 133.1 Litteraturstudier och utveckling av teoretisk modell . . . . . . . . . 133.2 Specificering av modellen . . . . . . . . . . . . . . . . . . . . . . . . 143.3 Prediktion av koefficienter . . . . . . . . . . . . . . . . . . . . . . . . 153.4 Datainsamling och manipulation . . . . . . . . . . . . . . . . . . . . 17

Page 6: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

3.5 Estimation och evaluering av modellen . . . . . . . . . . . . . . . . . 18

4 Resultat 194.1 Resultat för landmodellen . . . . . . . . . . . . . . . . . . . . . . . . 194.2 Resultat för regionmodellen . . . . . . . . . . . . . . . . . . . . . . . 224.3 Resultat för varumärkemodellen . . . . . . . . . . . . . . . . . . . . . 25

5 Diskussion 295.1 Landmodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

5.1.1 De inkluderade variablerna . . . . . . . . . . . . . . . . . . . 295.1.2 De eliminerade variablerna . . . . . . . . . . . . . . . . . . . 30

5.2 Regionmodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305.2.1 De inkluderade variablerna . . . . . . . . . . . . . . . . . . . 315.2.2 De eliminerade variablerna . . . . . . . . . . . . . . . . . . . 33

5.3 Varumärkemodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . 335.3.1 De inkluderade variablerna . . . . . . . . . . . . . . . . . . . 335.3.2 De eliminierade variablerna . . . . . . . . . . . . . . . . . . . 34

5.4 Jämförelse av de tre modellerna . . . . . . . . . . . . . . . . . . . . . 345.5 Felkällor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

6 Slutsats 396.1 Förslag till vidare undersökning . . . . . . . . . . . . . . . . . . . . . 39

Litteraturförteckning 41

Page 7: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Kapitel 1

Inledning

1.1 Bakgrund

Priset på en vara ska spegla vad konsumenter är villiga att betala för varan ochvarierar således med ett antal olika faktorer. De flesta av dessa faktorer är lätta förde flesta att förstå och många har en uppfattning om varför en vara har ett visst prisutan någon närmare undersökning. Ett enkelt exempel är en flaska läsk i affären:Priset bestäms utifrån råvarukostnad, produktionskostnad och att affären också skagöra vinst på varan. Utöver detta tillkommer mervärdesskatt till staten. Ett sådantsätt att prissätta varor uppfattas logiskt och korrekt. Det finns dock en del faktorervars påverkan på priset inte alltid behöver vara direkt relaterad till en underliggandeinsats. I detta arbete ska det med hjälp av regressionsanalys undersökas hur dessafaktorer påverkar priset.

1.2 Maltwhisky

Whisky, som på lågskotska betyder livets vatten, är en spritdryck gjord på spannmåloch som tillverkats och druckits åtminstone sedan 1400-talet [1]. Whisky tillverkasi många olika länder världen över och spannmålet som används kan variera frånland till land. Det absolut vanligaste spannmålet som använts i whisky som säljs iSverige är kornmalt, men whiskyn kan också göras på t.ex. vete, majs eller ris. 84 %av all whisky som säljs på Systembolaget AB är maltwhisky [2] och denna rapportbegränsar sig därför till just denna typ av whisky.

Den största andelen maltwhisky som säljs i Sverige kommer från Skottland [2].Skottland har väldigt strikta regler för hur spriten ska produceras för att få kallasmaltwhisky. Maltwhiskyn ska till exempel lagras på ekfat, vars volym ej överstiger700 liter, i minst 3 år och spriten får ej tillsättas annat än vatten och karamellfärg[4]. Det är tydligt att skotsk whisky har influerat whiskyproducenter från andraländer, som i sin egen produktion har tillämpat samma eller snarlika regelverk.

1

Page 8: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 1. INLEDNING

1.3 Varumärke

En faktor som inte är en direkt följd av en kostnad är en produkts märke. Ettvarumärkes värde varierar med tiden och beror inte bara av konkreta faktorer utanpåverkas av psykologiska element. Varor som i övrigt uppfattas som väldigt lika kanha stora skillnader i pris om den ena producerats av en mer renommerad tillverkare. Idenna rapport kommer det inte att undersökas varför ett varumärke uppfattas olikaav konsumenter utan i stället statistiskt bestämmas om, och i så fall hur mycket,ett märke påverkar priset. Att just maltwhisky valdes att analyseras i detta arbetevar på grund av att produkterna i denna varugrupp i sig är väldigt lika varandra.Den tredje modellen i detta examensarbete behandlar därför olika varumärken avmaltwhisky och resultaten för denna modell kan hittas i kapitel 4.3

1.4 Land och region

En annan faktor som antogs ha påverkan på priset för maltwhisky är vilket landden är producerad i. Att veta en whiskys ursprung kan många gånger säga mycketom just dennes smak och karaktär. En whisky från skotska ön Islay är exempelviskomplex och rökig i sin smak [2] medan svenska Mackmyras whisky i stället ärmaltig och nyanserad [2]. Whiskydrickare fattar ofta tycke för whisky från en vissregion eftersom smaken till stor del är likadan för en whisky med samma härkomst.Av denna anledning ska det också undersöka hur en maltwhiskys ursprung påverkarpriset.

92 % av maltwhiskysorterna i den använda datafilen är från Skottland och därförhar ursprungsanalysen delats upp i två modeller. I den första modellen utreds detom det finns någon signifikant skillnad i pris på whisky från olika länder. I denandra modellen undersöks skillnaden i pris beroende på från vilken av de sex störstaregionerna i Skottland maltwhiskyn härstammar. Resultaten från dessa modellerhittas under kapitel 4.1 och 4.2.

1.5 Datainsamling och manipulation

För att kunna utföra analysen inhämtades data från Systembolaget ABs sortiments-fil [2]. Genom att välja Systembolagets sortiment som data är det samma inköpareoch prissättare. Systembolaget har inte heller något vinstsyfte [3] och som följd avdetta kommer inte priset sättas olika för att försäljningen av någon specifik varaska öka.

Dessvärre var sortimentsfilen inte komplett med alla de variabler som skulleanalyseras och således eftersöktes så många saknade värden som möjligt. De whiskyssom sedan inte hade komplett data togs bort. För att minimera feltermer har ocksåwhisky som kostar över 1500 SEK per flaska (700 ml) tagits bort. Att detta gjordesvar på grund av att whisky över detta pris endast finns i väldigt limiterade utgåvor

2

Page 9: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

1.5. DATAINSAMLING OCH MANIPULATION

och av just den anledningen fått ett väldigt högt pris. Att ta med dessa i analysenkommer endast ge en missanpassad modell och stora fel i vår regression.

3

Page 10: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK
Page 11: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Kapitel 2

Teoretisk bakgrund

Detta kapitels syfte är att ge en introduktion till begreppen, matematiken ochmetoderna som ligger till grund när en regressionsanalys genomförs. Materialet ärhämtat från Using Econometrics [5], Econometric analysis [6] och Topics on AppliedMathematical Statistics [7].

2.1 TerminologiI denna del presenteras kort en del centrala begrepp som används upprepade gångeri rapporten.

2.1.1 Beroende och oberoende variabler

I alla regressionsmodeller finns det ett antal oberoende variabler men som oftastbara en beroende variabel.

Den beroende variabeln är den som estimeras med regressionsmodellen och kallasibland även regressand eller observerad variabel. Vanlig notation: Y, Yi eller yi.

De oberoende variablerna är alla variabler som används i modellen för att esti-mera den beroende och kallas även regressor, kovariat eller endast variabel. Vanlignotation: X, Xi eller xi.

2.1.2 Dummyvariabel

En variabel i modellen som endast antar värdet 0 eller 1 som också kallas binärvariabel. Denna variabel kan användas då man exempelvis vill ha med kön i enmodell. Den kan då exempelvis ha värdet 1 om det är man och värdet 0 om det ären kvinna:

Dkön ={

1 om man0 om kvinna (2.1)

En viss försiktighet måste dock tas för att inte hamna i the dummy variable trapvilket innebär att man har en dummyvariabel för man och en dummyvariabel för

5

Page 12: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 2. TEORETISK BAKGRUND

kvinna:Yi = β0 + β1Dman + β2Dkvinna + ei (2.2)

Detta är en form för multikollinearitet och de problem som uppstår förklarasnärmare i avsnitt 2.4.3.

2.1.3 Koefficient

Regressionsmodellens koefficienter är de faktorer som estimeras när man anpassarsin modell till verkliga data. Vanlig notation: β eller βi.

Koefficienterna är viktiga i strukturtolkningen av modellen, se nedan.

2.1.4 Felterm

Även kallad residual. Är den del av vår modell som inte kan förklaras och är ett måttpå hur stor skillnad det är mellan observerat och beräknat värde för varje specifiktyi. Vanlig notation är ei, men andra notationer som ui och εi kan förekomma föratt kunna skilja på olika feltermer.

2.1.5 Signifikans

Ett uttryck som används för att beskriva hur relevant en variabel är i modellen. Högsignifikans betyder att variabeln är mycket relevant och användbar. Motsvarandebetyder låg signifikans att variabeln är irrelevant och en utvärdering om den skallinkluderas eller inte bör genomföras.

Ofta används olika signifikansnivåer för att bestämma om variabler skall inklu-deras eller inte, varav den vanligaste är 5 %.

2.1.6 Strukturtolkning

När man undersöker huruvida en oberoende variabel påverkar den beroende vari-abeln utförs en strukturtolkning. Då används koefficienterna och deras värden föratt skapa en bild av hur stor påverkning varje oberoende variabel har.

2.2 Matematisk bakgrund för regressionsanalysI denna del presenteras de viktigaste matematiska formlerna och begreppen somanvänds inom regressionsanalys. Det preciseras också vilka antaganden som görsoch vilken innebörd dessa har.

2.2.1 Linjära regressionsmodellen

Den klassiska, linjära regressionsmodellen ser ut på följande sätt

Yi = β0 + β1X1i + β2X2i + · · ·+ βnXni + ei (2.3)

6

Page 13: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

2.2. MATEMATISK BAKGRUND FÖR REGRESSIONSANALYS

där Yi är en observation som beror på variablerna Xni. Koefficienterna βi beräknasnär ekvationen anpassas till observerade data och är unika för varje variabel. Densista termen i högerledet, ei är den oförklarade feltermen eller avvikelsen som ärunik för varje, med ekvationen estimerad, beroende variabel Yi.

Av notationsmässiga orsaker kan det vara lämpligt att skriva ekvation 2.3 medmatrisnotation enligt följande

Y = Xβ + e (2.4)

där

Y =

Y1Y2...Yi

∈ n× 1, X =

1 X11 X12 · · · X1i

1 X21 X22 · · · X2i...

...... . . . ...

1 Xn1 Xn2 · · · Xni

∈ n× (i+ 1),

β =

β0β1β2...βi

∈ (i+ 1)× 1, e =

e1e2...ei

∈ i× 1

2.2.2 MinstakvadratmetodenRegressionsanalysens mål är att ta en rent teoretisk ekvation

Yi = β0 + βiXi + εi (2.5)

och använda en mängd datapunkter för att skapa en estimerad ekvation

Yi = β0 + βiXi (2.6)

där ”hatt” indikerar estimerade koefficienter/variabler.

Den absolut vanligaste metoden för att göra detta kallas minstakvadratmetoden.Detta är en estimationsteknik som bestämmer ekvationens alla β så att summan avde kvadrerade residualerna minimeras. Alltså, minstakvadratmetoden minimerar

n∑i=1

e2i (i = 1, 2, . . . , n) (2.7)

där ei = Yi − Yi vilket är ekvivalent med att säga att minstakvadratmetoden mini-merar

n∑i=1

(Yi − Yi)2 (i = 1, 2, . . . , n). (2.8)

7

Page 14: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 2. TEORETISK BAKGRUND

Minstakvadratmetoden lämpar sig bra som estimator då det framförallt är denenklaste av alla estimationstekniker. En annan viktig egenskap är faktumet att detär en kvadratsumma som minimeras. Residualerna mäter hur bra varje beräknadevärde passar till varje observerade datapunkt och beräknas enligt ei = Yi − Yi. Vidförsta anblick kan det tyckas bra att bara minimera summan över dessa, men resi-dualerna kan bli både positiva och negativa och således kancellera varandra, därförtillämpas kvadratsumman. Att minimera summan av absolutvärdena är ett annatalternativ men detta anses mer komplicerat matematiskt och strider därför motönskan att hålla analysen så enkel som möjligt.

En annan viktig egenskap hos minstakvadratmetoden är att summan av residu-alerna blir 0, för bevis se Langs bok Topics on Applied Mathematical Statistics [7].

Minstakvadratmetoden kallas ibland the Best Linear Unbiased Estimator (BLUES)när ett antal antaganden, som presenteras i nästa del, är uppfyllda.

2.2.3 AntagandenA.H. Studenmund [5] listar sju klassiska antaganden varav de sex första är nödvän-diga för att kunna utföra en linjär regression:

1. Regressionsmodellen är linjär, korrekt specifierad och har en additiv felterm.Att modellen är korrekt specifierad är ett viktigt antagande då en utelämnadvariabel eller fel funktionell form försämrar modellen.Feltermen måste vara additiv och skall inte kunna multipliceras eller dividerasmed någon av de oberoende variablerna.

2. Feltermerna, ei, har ett villkorat medelvärde lika med 0.Det vill säga att:

E(ei|X1i, X2i, . . . , Xni) = 0 (2.9)

Detta säger att medelvärdet för hela distrubitionen är 0. För ett litet utdragär det låg sannolikhet att medelvärdet är 0, men när antalet observationerökar närmar sig medelvärdet 0.

3. Alla förklarande variabler är oberoende av feltermen.Ett antagande som är nödvändigt då det annars kommer ge felberäknadekoefficienter. Till exempel om feltermen är positivt korrelerad med en variabelXi kommer den estimerade koefficienten βi att vara större än den borde varaoch således inkorrekt. Detta uppstår ofta när man saknar en variabel i sinmodell.

4. Feltermerna antas oberoende av varandra.Varje felterm beräknas oberoende från de andra. Om en systematisk korrela-tion mellan feltermer existerar kommer minsta kvadratmetoden inte kunna gekorrekta estimat av koefficienternas standardfel.

8

Page 15: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

2.3. TEST- OCH MODELLANPASSNINGSMETODER

5. Feltermen har konstant varians σ2:

E(e2i |X1i, X2i, . . . , Xni) = σ2 (2.10)

vilket innebär att feltermerna har samma varians. Om detta inte uppfylls kom-mer minstakvadratmetoden ge fel standardfel för koefficienterna. När dettaantagandet uppfylls råder homoskedasticitet, i motsatt fall råder heteroske-dasticitet vilket behandlas närmare i del 2.4.1.

6. Ingen förklarande variabel är en perfekt linjär funktion av en annan förkla-rande variabel.Om detta inte uppfylls är en eller flera av variablerna en linjär kombinationav varandra, men skiljer sig genom t.ex. en faktor. Modellen kommer ge felresultat då en relativ ändring i en av dessa variabler kommer leda till en exaktmotsvarande ändring i en annan variabel även om beloppet av förändringarnaskiljer sig.

7. Feltermerna är normalfördelade.Detta är ett frivilligt antagande som ofta behövs när det skall utföras hypo-testestande. Detta säger något om formen på feltermernas distribution.

2.3 Test- och modellanpassningsmetoder

Denna del syftar på att ge en kort introduktion till de metoder som användes för attavgöra vilka modeller som skulle användas och vilka variabler som hade tillräckligthög signifikans för att inkluderas.

2.3.1 R2 och R2adj

En regressionsmodells R2 är ett mått på hur stor del av modellens forändring i denberoende variabeln Yi som förklaras av dess oberoende variabler. R2 uttrycks alltidi en siffra mellan 0 och 1 och ett R2-värde nära 1 är därför önskbart. Således blir1 − R2 ett mått på den oförklarade delen i vår modell. Matematiskt definieras R2

som

R2 = 1−∑n

i=1 e2i∑n

i=1(Yi − Y )(2.11)

När R2 används för att uppskatta hur bra en modell förklarar givna data måstedet alltid tas hänsyn till att en inkluderad variabel sällan ger en förklarandegradlika med 0. R2 ökar alltså alltid en del när man lägger till nya variabler. Problemethär ligger i att R2 inte säger något om standardfelet hos koefficienten och såledesär ett opålitligt mått på om variabeln skall inkluderas eller inte. För att åtgärdadenna opålitlighet bör R2 justeras med någon faktor när en ny variabel adderas till

9

Page 16: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 2. TEORETISK BAKGRUND

modellen. Detta görs i R2adj

R2adj = 1− n− 1

n− k − 1

∑ni=1 e

2i∑n

i=1(Yi − Y )(2.12)

där n = antal observationer k = antal oberoende variabler i modellen För att R2adj

skall kunna öka måste∑n

i=1 e2i∑n

i=1(Yi−Y ) minska mer än n−1n−k−1 ökar. Detta betyder att

den oförklarande andelen måste minska mer än den nya större reduceringsfaktorn.

Som tidigare nämnt skall det alltid värderas om R2 och R2adj verkligen ger ett bra

mått på modellanpasningen, och andra kriterium som AICc och t-test bör också tasmed i utvärderingen. Dessa tas upp i nästkommande delar.

2.3.2 t-testI denna rapport tillämpas något som kallas ”One-sample t-test” vilket betyder attman beräknar ett t-värde enligt

t = x

σ2/n(2.13)

där x är de observerade variablernas aritmetiska medelvärdeσ2 är variansen hos den observerade datamängdenn är antalet observerade data.

Det antas sedan att detta värde följer Students t-distribution och sätts t-värdetin i denna fås ett signifikanstal mellan 0 % och 100 %. Beroende på vilken signifi-kansnivå som önskas förkastas eller behålls den testade variabeln. Till exempel, harman en signifikansnivå på 5 % och en variabel får efter insättning i t-distributionenett signifikanstal lika med 7 % anses denna insignifikant på 5 %-nivån.

2.3.3 AICcAkaike Information Criterion definieras enligt

AIC = ln(σ2) + 2(k + 1)n

(2.14)

där σ2 =∑k

i=1 e2i

n ,k är antalet oberoende variabler,n är antalet observationer.

AIC är ett mått på hur bra en modell passar till en given datamängd och inkluderarförutom ett mått på modellanpassning också ett straff för antalet oberoende vari-abler. AIC är därmed ett bra mått på om en variabel skall inkluderas i modelleneller inte. Önskvärt är att uppnå så lågt AIC som möjligt.

10

Page 17: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

2.4. ATT TÄNKA PÅ VID UTFÖRANDE AV REGRESSIONSANALYS

I detta arbetet användes Akaike Information Criterion corrected, AICc, som är

AICc = AIC + 2(k + 1)(k + 2)n− k

(2.15)

Korrektionstermen som har inkluderats här kommer straffa antalet inkluderade va-riabler kraftigare än vanliga AIC. AICc rekommenderas att användas när n är liteeller k är stort. AICc kommer dock att konvergera mot AIC när n blir stort ochkan därför användas i de flesta fall.

2.4 Att tänka på vid utförande av regressionsanalysNär regressionsanalys utförs kan i huvudsak tre problem uppstå. Antagandet omhomoskedasticitet kan vara felaktigt, det kan uppstå olika former för endogenitetoch dessutom kan det förekomma multikollinearitet. I detta avsnitt presenterasdessa tre fall, hur de upptäcks samt vissa möjliga åtgärder.

2.4.1 HeteroskedasticitetOm antagande 5 i avsnitt 2.2.3 inte gäller så råder heteroskedasticitet, d.v.s.E(e2

i |X1i, X2i, . . . , Xni) = σ2i och E(ei|X) = 0. Detta betyder i kort att varje fel-

term har egen varians. Om en heteroskedastisk modell används som om den vorehomoskedastisk kommer standardavvikelsen i de estimerade koefficienterna bli in-konsistent.

Heteroskedasticitet kan upptäckas genom att titta på en plot av de estimeradevärdena mot feltermerna. Om variansen ökar med högre predicerat värde rådertroligtvis heteroskedasticitet.

2.4.2 EndogenitetOm en eller flera av de oberoende variablerna er korrelerade med feltermen upp-står endogenitet. När detta fenomen råder kommer minsta kvadratmetoden inte attproducera konsistenta estimat av koefficienterna. Endogenitet kan uppstå på fleraolika sätt, några av de vanligaste listas nedan.

• Utelämnande av relevanta variabler:När en viktig variabel som korrelerar med en annen variabel saknas i modellenleder detta till att den inkluderade variabeln korrelerar med feltermen ochendogenitet uppstår.Ett exempel är en bils bränsleförbrukning. Låg bränsleförbrukning är önskvärtoch borde därför öka priset på en bil, men kör man en regression på bilprismot bränsleförbrukning kommer den antagligen visa att bilen blir dyrare närbränsleförbrukningen ökar. Här saknas variabeln motoreffekt som ger ökadbränsleförbrukning men också ökat pris. Feltermen inkluderar då motoreffekt

11

Page 18: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 2. TEORETISK BAKGRUND

som är korrelerad med bränsleförbrukning. Åtgärden här är enkel, inkluderamotoreffekt i modellen.

• Samtidighet:När den beroende variabeln påverkar en eller flera av de oberoende variablernafås samtidighet.Ett kort exempel: Det skall undersökas om en större poliskår minskar antaletbrott, men ett högre antal brott får också följden att myndigheterna ökarpoliskårens storlek, vilket är ett fall av samtidighet.

• Partiskt urval och självselektion:Om någon annan faktor än själva värdet på variabeln påverkar hur observa-tioner inkluderas i urvalet är urvalet partiskt. Självselektion är en form avpartiskt urval där observationernas värde påverkas av någon yttre faktor somgör att just de observationerna inkluderas i urvalet.Ett exempel på det senare: En lärare vill analysera om lektionerna bidrar tillbättre betyg och vill därför jämföra prestationerna från deltagande studentermed de som inte är närvarande. Här kan ett potensiellt problem vara att destudenter som väljer att studera hemma helt enkelt är duktigare och därför intekänner något behov av att delta på lektionerna. Således uppstår självselektioni variabeln väljer att stanna hemma och läraren kanske drar slutsatsen attlektionernas kvalité är låg.

2.4.3 MultikollinearitetMultikollinearitet uppstår när två eller flera variabler i modellen är perfekta ellernästan perfekta linjära kombinationer av varandra. Om korrelationskoefficientenmellan två variabler är 1 fås perfekt multikollinearitet, om den närmar sig 1 kallasdet imperfekt multikollinearitet.

Imperfekt multikollinearitet förhindrar inte minstakvadratmetoden från att ge ettresultat men kan innebära att flera koefficienter får dålig beskrivandegrad och såle-des en dålig modell. Vid perfekt multikollinearitet ger inte minstakvadratmetodenen unik lösning och rent matematisk blir detta division med noll.

Multikollinearitet kan upptäckas genom stora standardavvikelser på vissa koeffi-cienter och är oftast ett resultat av fel modellformulering. Lösningen på problemetär som oftast att utelämna en av de korrelerande variablerna, t.ex. utelämna varia-beln kvinna om variabeln man redan finns med då den ena variabeln här bestämmervärdet på den andra.

12

Page 19: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Kapitel 3

Metod

Att göra en regressionsanalys är inte bara att räkna ut minstakvadratsummor ochmatriser. Genom att följa en del riktlinjer kan man lättare göra en bättre modell.I detta examensarbete har en sexstegssekvens föreslagen av A.H. Studenmund [5]använts:

1. Litteraturstudier och utveckling av teoretisk modell

2. Specificering av modellen

3. Prediktion av koefficienter

4. Datainsamling och manipulation

5. Estimation och evaluering av modellen

6. Dokumentera resultaten

A.H. Studenmunds förslag på dessa riktlinjer är till för att utveckla en förståelse förhur professionella analytiker jobbar med ekonometri. Nedan i detta kapitel kommerde fem första delarna behandlas och den sjätte delen kommer sedan i nästa kapitel.

3.1 Litteraturstudier och utveckling av teoretisk modellDet första steget A.H. Studenmund rekommenderar är att söka litteratur som be-handlar samma eller ett snarlikt problem. Detta görs både för att inhämta inspi-ration till eget arbete och i det förebyggande syfte att inte gå i samma fälla somtidigare undersökningar redan gjort. Om den modell analysen har som avsikt attanvända redan har testats och i det fallet inte gett ett användbart resultat bordemodellen omvärderas och förslagsvis ändras.

Under litteraturstudierna som genomfördes för att utveckla modellen som kommerpresenteras i detta arbete gjordes extensiv sökning i databaser på internet. Dessasökningar gav inga givande resultat utan slutsatsen drogs att den typ av analys som

13

Page 20: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 3. METOD

skulle utföras var, om inte ensam, relativt ovanlig. Det rekommenderade nästa ste-get är då att hitta teori från liknande ämnen och försöka applicera dessa på ämnetsom skall analyseras.

Under utvecklingen av den teoretiska modellen har framförallt två böcker använts,Using Econometrics [5] och Econometric Analysis [6], men även kursen TillämpadMatematisk Statistik vid KTH, med tillhörande kurslitteratur [7], användes somteoretiskt underlag och inspiration. Detta arbetets syfte var att undersöka vilkafaktorer som påverkar priset på maltwhisky i allmänhet och varumärkets betydelsei synnerhet. Med detta, samt ovan nämnda källor, som utgångspunkt sattes denteoretiska modellen till

pris = (påverkande_faktor_1) + (påverkande_faktor_2)+ . . .+ (påverkande_faktor_n)

(3.1)

Detta är till synes en väldigt grov modell men det är också syftet med dennadel av arbetet. Här definieras hur problemet skall angripas och detta görs genomatt anta att priset påverkas av ett antal skilda faktorer vilka kommer specificerasi nästa del och analyseras i senare delar. Tanken som ligger till grund for detta äralltså den samma som nämndes i kapitel 1.1, att priset på en handelsvara varierarmed ett antal olika faktorer.

3.2 Specificering av modellenNär en rå teoretisk modell tagits fram fortsatte arbetet med specificering av model-len. För att få relevanta modeller har den råa modellen delats upp i tre olika mo-deller. Samtliga modeller hade maltwhiskypriset som beroende variabel. Den förstamodellen (landmodellen) specificerades med följande oberoende variabler: Land, ål-der, ålder2 och alkoholhaltsdifferens från 40 %. Ålder som variabel mäter hur mångaår whiskyn lagrats på fat efter att den destillerats. Anledningen till att differensenfrån 40 % valdes är på grund av att majoriteten av maltwhiskyn i SystembolagetABs sortimentsfil [2] (se nedan, kapitel 3.4) har en alkoholhalt i närheten av 40%. Genom att välja variablerna på detta sätt blev koefficienter och data enklareoch intuitivare att tyda. Varje land sattes som en dummyvariabel (se teorikapitlet2.1.2).

yi = β0 + x(ålder)i · β(ålder) + x(ålder2)i · β(ålder2)

+ x(alkoholhalt)i · β(alkoholhalt) +D(land)i · β(land) + ei

(3.2)

Den andra modellen (regionmodellen) specificerades med ålder och alkohol-haltsdifferens men landvariablerna byttes mot dummyvariabler för vilken skotskregion maltwhiskyn tillverkats i. Dessutom specificerades åldersvariabeln som mal-twhiskyns åldersdifferens från 3-årig maltwhisky. I denna modell infördes även en

14

Page 21: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

3.3. PREDIKTION AV KOEFFICIENTER

annan dummyvariabel kallad D(selection). Anledningen att denna dummyvariabel in-förs är på grund av att det finns något som kallas för oberoende buteljerare. Dessaföretag köper tunnor av en viss maltwhisky från destillerier och gör någon modifi-kation i lagringen och/eller förädlingen av maltwhiskyn till skillnad från originalet.Till exempel så säljs Laphroaig endast i ett fåtal officiella utgåvor vid Systembola-get AB medan det finns en stor mängd varianter av Laphroaig som buteljerats avflertalet av de oberoende buteljerarna. De kan ha modifierat maltwhiskyn genomatt ha lagrat den på sherryekfat istället för vanliga ekfat, låtit bli att kylfiltrerawhiskyn eller bara lagrat den längre på fat än vad den officiella utgåvan lagras.

yi = β0 + x(åldersdiff)i · β(åldersdiff) + x(åldersdiff2)i · β(ålderssdiff2)

+ x(alkoholhalt)i · β(alkoholhalt) +D(region)i · β(region)+D(selection)i · β(selection) + ei

(3.3)

Slutligen specificerades den tredje modellen (varumärkemodellen) med ålders-och alkoholhaltsdifferens och dummyvariabler för vilket märke det var på mal-twhiskyn. Också i denna modellen inkluderas dummyvariabeln D(selection).

y = β0 + x(ålder)i · β(ålder) + x(alkholhaltsdiff)i · β(alkoholhaltsdiff)

+ x(ålder2)i · β(ålder2)i +D(varumärke)i · β(varumärke)

+D(selection)i · β(selection) + e

(3.4)

Dessa tre modeller var dock inte slutgiltiga eftersom det vid detta tillfälle ännuinte gick att bestämma om alla länder/regioner/varumärken hade någon statistisksignifikans för priset. Detta gjordes senare i arbetet och mer om detta kommer ikapitel 3.5 och 4 av rapporten.

3.3 Prediktion av koefficienterNär de oberoende variablerna har valts är det viktigt att göra en prediktion av deolika koefficienternas påverkan på den beroende variabeln. I många fall användsgrundläggande kunskaper och sunt förnuft i denna del av analysen, men hela syftetär att skapa någon form av förväntan till hur modellen kommer bete sig vilket kangöra det lättare att inse om modellen är felspecificerad. Oavsett om så är fallet ska-par detta ett underlag för diskussion om modellens grad av riktighet och är såledesen bra utgångspunkt för vidare analys.

I nedanstående text används ”positiv påverkan” för att beskriva en koefficient somökar priset och vice versa för ”negativ påverkan”.

De tre modellerna som skall undersökas har alla två koefficienter gemensamt: ålderoch alkoholhalt. För maltwhisky anses hög ålder ge en exklusivare vara då spritenlagrats på fat längre tid och således går priset upp med ålder. Denna koefficientantas därför ha en positiv påverkan på priset.

15

Page 22: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 3. METOD

Alkoholhalt är en variabel som måste behandlas med viss försiktighet då svenskaalkohollagar gör att priset automatiskt ökar med högre alkoholhalt i spritdrycken.Detta kompenserade dock för innan modellerna estimerades (hur detta genomför-des beskrivs i kapitel 3.4) så att koefficienten enbart behandlar hur maltwhiskynsvärde varierar med alkoholhalten. För maltwhisky är alkoholhaltens påverkan litemer komplex än ålderns påverkan men i allmänhet kan man säga att också dennakoefficient kommer ha positiv påverkan på priset. Detta för att en maltwhisky medhögre alkoholhalt troligtvis inte tillsatts lika mycket vatten och mängden whiskyfrån varje fat blir därför mindre. Ett exempel på detta är så kallad ”cask strengthwhisky” som inte tillsätts vatten överhuvudtaget utan buteljeras direkt från tunnan.Sådan maltwhisky har ofta ett pris som är något högre än den vanliga utgåvan avsamma maltwhisky.

I den första modellen är de särskiljande variablerna olika länder. Då de flesta länderhar en viss spridning i sina whiskytyper är det svårt att förutspå hur varje landskoefficient kommer påverka priset, men ett antagande skulle kunna vara att Skott-land som whiskyns upphovsland kommer att ha en viss positiv påverkan. Dock ärSkottland den klart största whiskyproducenten och har därför också den störstaspridningen i pris vilket kan göra att påverkan inte blir lika tydlig som förväntadeller rentav helt motsatt. Ett land som Sverige, som bara finns representerat medett märke i analysen, kommer antagligen ha en mycket tydligare påverkan då alldess maltwhisky hamnar i en karakteristisk priskategori.

De särskiljande variablerna i den andra modellen är de klassiska skotska whisky-regionerna. De flesta regionerna i Skottland producerar väldigt mycket maltwhiskyoch spridningen i pris är stor inom varje region. Detta gör det extremt svårt attförutspå påverkan från varje enskild region och därför undviks detta i denna del avanalysen.

Den sista modellen särskiljdes genom att de oberoende variablerna var olika va-rumärken samt selectionvariabeln.

I kapitel 3.5 beskrivs vilka varumärken som analyseras och varför, men generelltantas det att de flesta kända maltwhiskyvarumärken har en viss positiv påverkanpå priset. För några maltwhiskys så som Macallan och Mackmyra förväntas en för-hållandevis stor positiv påverkan, om de skulle inkluderas i modellen. För Macallantros detta vara på grund av att detta är ett av de mer kända och exklusivare varu-märken av maltwhisky. Mackmyra lagras sällan längre än 5 år och ålderskoefficien-ten borde alltså inte ha lika stor påverkan som för många andra maltwhiskymärken.Mackmyrakoefficienten uppskattas alltså innehålla avsaknaden av prispåverkan frånålderskoefficienten.

Selectionvariabeln antas ha en positiv påverkan på priset då många av de såkallade buteljerarna anses ha mycket goda kunskaper om maltwhisky och därförlyckas välja speciellt goda kombinationer till sina egna utgåvor av redan kändamaltwhiskys. Dessa säljs också i begränsad utgåva vilket bör öka priset.

16

Page 23: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

3.4. DATAINSAMLING OCH MANIPULATION

3.4 Datainsamling och manipulation

En av de absolut viktigaste sakerna när man gör en regressionsanalys är att ha enbra uppsättning data. Hela regressionen bygger ju på just datan och om datan ärinkonsekvent kommer också resultatet bli detsamma.För att priset på varje maltwhisky skulle ha en så likvärdig prissättning som möj-ligt valdes till detta examensarbete Systembolaget ABs sortiment som underlag.Systembolaget har inte som syfte att gå med vinst (även om de går med vinst) [3]och priset borde alltså av Systembolaget sättas direkt relaterat till vad respektiveleverantör tar betalt för varan. Systembolagets sortiment finns öppet tillgängligt förnedladdning på deras hemsida [2] som en Microsoft Excelfil.

Dessvärre var Systembolagets sortimentsfil inte komplett för detta arbetets syf-te. För att datan skulle kunna användas i IBM SPSS Statistics behövde samtligavariabler som skulle undersökas ha en egen kolumn i kalkylarket. Sortimentsfilenbehövde alltså manipuleras: För en del maltwhisky saknades åldern helt vilken idessa fall söktes upp på internet. Åldern lades sedan som sin egen kolumn och dettagjordes också med alkoholhaltens differens från 40 %. Varje dummyvariabel för län-der, regioner och varumärken behövde läggas till och dummyvariabeln D(selection)lades även till i detta steg.

En undersökning av hur fördelningen av maltwhiskypriset såg ut gjordes för attse hur väl detta kunde anpassas till en linjär modell (se figur 3.1).

Figur 3.1. En graf över pris för varje maltwhisky i Systembolaget ABs sortimentsfil[2].

Med denna fördelning som underlag togs beslutet att exkludera de knappt 100observationer som översteg 1500 SEK (inklusive alkoholskatt och moms). De mal-twhiskys som översteg 1500 SEK var nästan uteslutande sådana som utgetts i myc-ket begränsad utgåva och på grund av detta fått en mycket hög prissättning. Denna

17

Page 24: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 3. METOD

typ av utgåvor var något som inte var tänkt att undersökas i detta arbete och kundedärför utan vidare tas bort.

I Sverige påförs alkoholskatt på alla typer av spritdryck. Denna är direkt re-laterad till alkoholhalten på spritdrycken (alkoholskatten ligger för närvarande på501,41 SEK per liter ren sprit). Med anledning av att en av variablerna i model-lerna är just alkoholhalt korrigerades priset för att utesluta alkoholskatten. Mer-värdesskatten exkluderas också på grund av att mervärdesskatten läggs på efteralkoholskatten och egentligen inte gör något annat än att öka priset med 25 %vilket inte har någon betydelse för regressionen eller analysen.

3.5 Estimation och evaluering av modellenNär arbetet kommit till denna punkt i A.H. Studenmunds sexstegssekvens [5] var detden sista förberedande delen innan en regression skulle köras. I detta stadium hadedet tagits fram tre modeller som med största sannolikhet innehöll flera irrelevantavariabler som av olika anledningarna inte hade någon signifikans för modellerna.För att få en så välanpassad modell som möjligt har Akaike Information Criteri-on corrected (AICc) och t-test (se teoridelen) använts i detta examensarbete. Atttesta AICc för alla delmängder av huvudmodellen var en inbyggd funktion (mo-dellbyggaren) i IBM SPSS Statistics. Modellbyggaren kördes på en huvudmodell åtgången (huvudmodellerna nämns i kapitel 3.2). När modellbyggaren hade körts iSPSS fanns de 10 modeller med lägst AICc specificerade. För att avgöra om varjevariabel som valts ut av modellbyggaren faktiskt var signifikant för modellen under-söktes t-värdet för variablerna när en regression kördes. För en del av modellernamed lägst AICc föreslogs att variabler som i ett t-test var statistiskt insignifikanta(för modelleringen av maltwhiskypriset) skulle tas med. Om detta var fallet, ochvariabeln i fråga inte ansågs vara signifikant i en rent logisk bemärkelse, undersöktesden modell med näst lägst AICc.

Efter att modellbyggaren körts och t-test utförts för att hitta de bästa modeller-na återstod själva regressionen. För vardera av de tre slutgiltiga modellerna kördesnu en regression i SPSS. Resultatet från residualerna evaluerades och en gransk-ning av feltermerna gjordes för att klargöra att dessa var normalfördelade. För attkontrollera att det inte fanns någon heteroskedasticitet plottades det från regressio-nen estimerade maltwhiskypriset (den beroende variabeln) mot residualerna. Omen antydan av att residualernas varians såg ut att öka med ett högre pris skulle detkunna vara ett tecken på heteroskedasticitet. Slutligen undersöktes regressionenskoefficienter och resultaten analyserades. Dessa presenteras i nästa kapitel.

18

Page 25: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Kapitel 4

Resultat

Nedan i detta kapitel finns resultatet för regressionskörningarna av de slutliga mo-dellerna landmodellen, regionmodellen och varumärkemodellen i nämnd ordning.Som nämndes i metodkapitlet ovan användes i detta arbete SPSS inbyggda funk-tion modellbyggaren. Denna funktion beräknar AICc för alla möjliga delmängder avhuvudmodellen.

4.1 Resultat för landmodellenAntal observationer i datafilen för denna modell var 939 stycken. För landmodellenkördes modellbyggaren med variablerna i tabell 4.1. Ålder och Ålder2 angavs i år,alkoholhalt angavs i antal procentenheter över 40 % (40 % är lägsta alkoholhaltenför maltwhisky i Systembolagets sortiment) och varje land hade en varsin dummy-variabel.

VariablerÅlder Ålder2Alkoholhalt AustralienEngland FrankrikeIndien IrlandJapan KanadaNederländerna SkottlandSverige TaiwanTjeckien USA

Tabell 4.1. Ursprungliga variabler som användes i modellbyggaren för landmodellen

Från modellbyggarens resultat kunde det klargöras att det fanns flera modellermed AICc-värde väldigt nära AICcmin (värdet för modellen med lägst AICc). Flerän 10 modeller låg inom |AICcmin −AICci| < 2 (se figur 4.1) och för att hittaden modell som faktiskt gav variabler med en signifikansnivå på högst 5 % kördes

19

Page 26: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 4. RESULTAT

regressioner på först modellen med lägst AICc och sedan modellen med näst lägstAICc o.s.v. tills alla variabler i modellen låg inom det 95 % konfidensintervallet.

Figur 4.1. Bild som visar hur AICc-värdet (Information Criterion) förändrades be-roende på inkluderade variabler för landmodellen. En bock betyder att variabelninkluderats i modellen.

Modell 3 i figur 4.1 gav variabler som alla låg inom signifikansnivån 5 % ochdenna valdes alltså till den slutliga modellen. Resultatet för de estimerade koeffici-enterna från regressionen visas nedan i tabell 4.2.

En graf över de standardiserade residualernas fördelning ritades upp för attkunna kontrollera att feltermerna var normalfördelade, se figur 4.2.

R2 och R2adj för regressionen av landmodellen kan ses i tabell 4.3.

20

Page 27: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

4.1. RESULTAT FÖR LANDMODELLEN

KoefficienterModell β Standard- t-värde Signifikans-

avvikelse nivåKonstant 281,611 27,995 10,059 0,000Ålder 19,745 3,407 5,795 0,000Ålder2 0,242 0,101 2,400 0,017

Alkoholhalt 13,173 0,788 16,726 0,000Australien 337,485 73,500 4,592 0,000Indien -181,388 58,461 -3,103 0,002Irland -265,227 43,158 -6,145 0,000

Skottland -245,324 23,376 -10,495 0,000Sverige 91,421 46,259 1,976 0,048Tjeckien -486,386 142,043 -3,424 0,001

Tabell 4.2. Koefficienter från regression av landmodellen. Resultat med 3 decimaler.

R2 R2adj

0,651 0,648

Tabell 4.3. R2 och R2adj för landmodellen.

Figur 4.2. Standardiserade residualernas (varje residual dividerad med standardav-vikelsen) fördelning för landmodellen. Svarta linjen är en normalfördelning.

21

Page 28: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 4. RESULTAT

4.2 Resultat för regionmodellenAntal observationer i datafilen för denna modell var 857 stycken. Denna datafil hademanipulerats för att endast innehålla maltwhisky från skotska regioner. För regi-onmodellen kördes modellbyggaren med variablerna i tabell 4.4. Ålder och Ålder2angavs i år, alkoholhalt angavs i antal procentenheter över 40 % (40 % är lägstaalkoholhalten för maltwhisky i Systembolagets sortiment) och varje region hade envarsin dummyvariabel. Denna modell innehöll även dummyvariabeln Selection somnämndes i metodkapitlet.

VariablerÅlder Ålder2Alkoholhalt CampbeltownHighlands IslandsSpeyside IslayLowlands

Tabell 4.4. Ursprungliga variabler som användes i modellbyggaren för regionmodel-len

Från modellbyggarens resultat fanns det i likhet med landmodellen en del model-ler med AICc-värde relativt nära AICcmin. 4 modeller låg inom |AICcmin −AICci|< 2 (se figur 4.3) och för att hitta den modell som faktiskt gav variabler med ensignifikansnivå på högst 5 % kördes regressioner på först modellen med lägst AICcoch sedan modellen med näst lägst AICc o.s.v. tills alla variabler i modellen låginom det 95 % konfidensintervallet.

Modell 2 i figur 4.3 gav variabler som alla låg inom signifikansnivån 5 % ochdenna valdes alltså till den slutliga modellen. Resultatet för de estimerade koeffici-enterna från regressionen visas nedan i tabell 4.5.

En graf över de standardiserade residualernas fördelning ritades upp för attkunna kontrollera att feltermerna var normalfördelade, se figur 4.4.

R2 och R2adj för regressionen av regionmodellen kan ses i tabell 4.6.

22

Page 29: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

4.2. RESULTAT FÖR REGIONMODELLEN

Figur 4.3. Bild som visar hur AICc-värdet (Information Criterion) förändrades be-roende på inkluderade variabler för regionmodellen. En bock betyder att variabelninkluderats i modellen.

KoefficienterModell β Standard- t-värde Signifikans-

avvikelse nivåKonstant 31,058 12,665 2,452 0,014Ålder 26,916 0,855 31,478 0,000

Alkoholhalt 9,378 0,847 11,071 0,000Selection 93,120 11,144 8,356 0,000

Campbeltown 119,950 26,123 4,592 0,000Islay 34,120 12,439 2,743 0,006

Lowlands 55,689 21,773 2,558 0,011

Tabell 4.5. Koefficienter från regression av regionmodellen. Resultat med 3 decima-ler.

R2 R2adj

0,689 0,687

Tabell 4.6. R2 och R2adj för regionmodellen.

23

Page 30: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 4. RESULTAT

Figur 4.4. Standardiserade residualernas (varje residual dividerad med standardav-vikelsen) fördelning för regionmodellen. Svarta linjen är en normalfördelning.

24

Page 31: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

4.3. RESULTAT FÖR VARUMÄRKEMODELLEN

4.3 Resultat för varumärkemodellenAntal observationer i datafilen för denna modell var 313 stycken. Denna datafil hademanipulerats för att endast innehåll maltwhisky från skotska regioner. För varumär-kemodellen kördes modellbyggaren med variablerna i tabell 4.7. Ålder och Ålder2angavs i år, alkoholhalt angavs i antal procentenheter över 40 % (40 % är lägstaalkoholhalten för maltwhisky i Systembolaget ABs sortiment) och varje varumärkehade en varsin dummyvariabel. Alla märken inkluderades inte utan de 19 märkenmed flest observationer valdes ut ur sortimentsfilen. Denna modell innefattade ävendummyvariabeln Selection som nämndes i metodkapitlet.

VariablerÅlder Ålder2Alkoholhalt BenRiachBladnoch BowmoreBruichladdich BunnahabhainCaol Ila ClynelishGlen Grant Glen KeithGlenlivet GlenrothesHighland Park LaphroaigLinkwood LongmornMacallan MackmyraMortlach Tamdhu

Tabell 4.7. Ursprungliga variabler som användes i modellbyggaren för varumärke-modellen

Precis som med resultatet från modellbyggaren för föregående modeller finns endel modeller med AICc-värde relativt nära AICcmin. 5 modeller låg inom |AICcmin

−AICci| < 2 (se figur 4.5) och för att hitta den modell som faktiskt gav variablermed en signifikansnivå på högst 5 % kördes regressioner på först modellen med lägstAICc och sedan modellen med näst lägst AICc o.s.v. tills alla variabler i modellenlåg inom det 95 % konfidensintervallet.

Det var först i modell 7 i figur 4.5 som alla variabler låg inom signifikansnivån5 % och denna valdes alltså till den slutliga modellen. Resultatet för de estimeradekoefficienterna från regressionen visas nedan i tabell 4.8.

En graf över de standardiserade residualernas fördelning ritades upp för attkunna kontrollera att feltermerna var normalfördelade, se figur 4.6.

R2 och R2adj för regressionen av varumärkemodellen kan ses i tabell 4.9.

25

Page 32: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 4. RESULTAT

Figur 4.5. Bild som visar hur AICc-värdet (Information Criterion) förändrades bero-ende på inkluderade variabler för varumärkemodellen. En bock betyder att variabelninkluderats i modellen.

KoefficienterModell β Standard- t-värde Signifikans-

avvikelse nivåKonstant -80,595 25,484 -3,163 0,002Ålder 26,907 1,360 19,788 0,000

Alkoholhalt 10,472 1,359 7,704 0,000Selection 151,113 19,007 7,950 0,000BenRiach -65,278 26,395 -2,473 0,014Bladnoch 72,338 32,134 2,251 0,025Glenlivet -119,447 34,467 -3,466 0,001Macallan 133,047 30,950 4,299 0,000Mackmyra 453,358 39,512 11,474 0,000

Tabell 4.8. Koefficienter från regression av märkemodellen. Resultat med 3 decima-ler.

R2 R2adj

0,744 0,737

Tabell 4.9. R2 och R2adj för märkemodellen.

26

Page 33: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

4.3. RESULTAT FÖR VARUMÄRKEMODELLEN

Figur 4.6. Standardiserade residualernas (varje residual dividerad med standardav-vikelsen) fördelning för varumärkemodellen. Svarta linjen är en normalfördelning.

27

Page 34: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK
Page 35: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Kapitel 5

Diskussion

Anledningen att regressionsanalysen delades upp i tre modeller var på grund avrisken för multikollinearitet. En maltwhisky av märket Macallan är ju alltid frånSpeyside i Skottland precis som Mackmyra alltid är från Sverige.

5.1 Landmodellen

Landmodellen ansågs från början vara svår att förutspå och det rådde viss osäkerhetkring om modellen skulle ge ett användbart resultat. I slutändan togs en modellfram med låg AICc, höga R2 och R2

adj-värden samt mycket god signifikansnivå, somkommer diskuteras närmare här.

Från tabell 4.2 ses att alla koefficienter ligger inom 5 % signifikansnivå och attenbart två koefficienter (Sverige och Ålder2) ligger utanför 1 %. Detta tillsammansmed att figur 4.2 indikerar normalfördelade residualer gör att modellen anses varaanvändbar för vidare analys.

5.1.1 De inkluderade variablerna

Alla variabler som slutligen inkluderades i landmodellen syns i tabell 4.2 och dis-kuteras nedan.

Ålder: Att just ålder skulle komma att inkluderas i modellen var föga förvånan-de. Detta är en av de främsta marknadsföringsfaktorererna för maltwhiskys, detsyns väldigt ofta tydligt på flaskorna vilken ålder maltwhiskyn har. Varje år extrawhiskyn legat på fat ökar alltså priset, allt annat lika, vilket är rimligt och i linjemed vad som förutspåddes.

Ålder2: Inkluderades för att undersöka om det fanns ett kvadratiskt beteende förhur åldern påverkade priset jämfört med en linjär åldersterm då en del observatio-ner indikerar att priset på väldigt gamla whiskys (t.ex. över 35 år) tenderar att varaextra högt. Denna variabel blev till synes signifikant på en 2 % nivå men koefficien-

29

Page 36: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 5. DISKUSSION

ten är väldigt liten. Men när åldern ökar kommer den influera priset mer och mer.För exempelvis en 20-årig whisky blir åldern i kvadrat 400 vilket multiplicerat medålder2-koefficienten 0,242 blir 96 kronor. Även detta är i linje med att maltwhiskymed väldigt hög ålder ofta har ett högt pris.

Alkoholhalt: Att ökande alkoholhalt ökar priset, allt annat lika, var till viss delförväntat. Så kallad ”cask strength maltwhisky” är till exempel mycket starkare än”klassisk” maltwhisky, men också lite dyrare.

Inkluderade länderna Australien, Indien, Irland, Skottland, Sverige, Tjeckien: Attjust dessa länder blev signifikanta är, förutom i fallet Skottland, inte lätt att för-klara. Dock har dessa länder förhållandevis många maltwhiskys i observerade data.Denna modell antyder dock kraftigt att ursprunget för en maltwhisky spelar storroll för priset.

Tittar man på ländernas koefficienter är det mest förvånande att Skottlandskoefficient fick så stor negativ påverkan, allt annat lika. En förklaring till kan dockvara att Skottland har klart flest maltwhiskys med i datamängden och därför ocksåflest billiga sådana. Tjeckien har den största negativa koefficienten vilket beror påett mindre antal observerade data från detta land som nästan uteslutande befinnersig i den lägre prisregionen.

5.1.2 De eliminerade variablernaAv variablerna som testades, se tabell 4.1, var det 7 som inte inkluderades i modellen:England, Japan, Nederländerna, Frankrike, Kanada, Taiwan och USA.

Att dessa länder inte fick var signifikanta nog för modellen kan tänkas bero på attdet fanns för få maltwhiskys med i datamängden från dessa länder. Utan tillräckligtmed data kommer signifikansen för dessa variabler inte att bli tillräckligt hög föratt kunna ge någon förklaring till priset och därför borde de heller inte inkluderasi modellen. Dock är de alla med och påverkar den konstanta koefficienten, β0, ochsåledes kan inkluderade maltwhiskys jämföras med detta i åtanke.

5.2 RegionmodellenMer än 90 % av maltwhiskyn i Systembolaget ABs sortimentsfil [2] är från Skott-land. Whiskyförsäljningen utgör också en stor del av Skottlands export [9]. Attgöra en specifik modell för hur priset varierar för de olika regionerna i Skottland varalltså helt i linje med detta examensarbetets syfte. I sortimentsfilen hade Systembo-laget redan specificerat regioner [10], men dessa modifierades något för att få störregrupper av maltwhisky och färre regioner i stället för enstaka whisky i många regi-oner. D.v.s. Western, Eastern och Northern Highlands lades i en gemensam regionHighlands. Islands (öarna) tillhör egentligen Highlands, men p.g.a. de olika öarnassäregna smaker har de behandlats som en egen region. I Speyside, som tidigaretillhörde Highlands, finns merparten av alla maltwhiskydestillerier och den största

30

Page 37: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

5.2. REGIONMODELLEN

delen av maltwhiskyn i sortimentsfilen kommer följdaktligen därifrån. RegionernaCampbeltown och Lowlands betraktas som egna regioner, av samma anledning somIslands, även om det bara finns tre destillerier i vardera region. Den sista regionenIslay, som också är en ö men betraktas som en egen region, är hemvisten till denrökiga whiskyn. Regionernas geografiska belägenhet kan ses i figur 5.1 på nästa sida.

Denna modell har vissa defekter. Som synes i tabell 4.5 finns inte de störstaregionerna med i modellen och en anledning till detta är troligtvis den stora sprid-ningen i priser på whisky därifrån, även inom samma regioner. Detta får stöd avatt två av de tre regioner som är signifikanta för modellen är de regioner där detendast finns tre destillerier (Campbeltown och Lowlands). På grund av det låga an-talet destillerier bör spridningen i priset vara relativt liten och standardavvikelsenblir då också liten vilket ger en signifikant variabel. Även om modellen inte ger enhelhetlig modell av hur maltwhiskypriset varierar i Skottland kan modellen beskrivahur whisky från de mindre regionerna skiljer sig från priset på whisky i de störreregionerna, som är representerade i konstanttermen.

Denna modell hade en relativt hög beskrivandegrad med R2 och R2adj på 0,689

respektive 0,687.När modellbyggaren kördes för regionmodellen (se resultatet i kapitel 4.2) var det

framförallt två oberoende variabler som var starkt korrelerade med priset, nämligenålder och alkoholhalt. Båda dessa variabler hade hög signifikans för modellen.

5.2.1 De inkluderade variablerna

Ålder : Se kapitel 5.1.1 ovan.

Alkoholhalt: Se kapitel 5.1.1 ovan.

Selection: Maltwhisky från Skottland är något som ofta köps på fat av oberoendebuteljerare för att få en smak som buteljeraren tycker maltwhiskyn bör ha. Whiskynfrån destillerierna är ju massproducerad medan dessa utvalda fat är en limiteradutgåva. Att denna koefficient skulle vara positiv och relativt stor var något som varförväntat och som även visade sig stämma (se tabell 4.5). En selectionwhisky ökarpriset på en whisky med 93,12 SEK.

Campbeltown: Som nämndes i inledningen till detta kapitel är Campbeltown enav två regioner i Skottland där det endast finns tre destillerier. Prissättningen påwhisky från de tre destillerierna i Campbeltown ligger alltså väldigt nära varandraoch ger en hög signifikans hos variabeln. Hålls de övriga variablerna konstant ökaren whisky från Campbeltown priset med 119,95 SEK.

Islay: Prisets spridning är för whisky från Islay relativt stor men detta hopp i prisär en följd av att en stor del av whisky från Islay är så kallad selectionwhisky. Defå whisky från Islay som inte är en selection ligger väldigt lika i prissättningen och

31

Page 38: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 5. DISKUSSION

Figur 5.1. Karta över de olika whiskyregionerna i Skottland [11]

.

ger därför relativt låg standardavvikelse. Hålls de övriga variablerna konstant ökaren whisky från Islay priset med 34,12 SEK.

Lowlands: I likhet med Campbeltown blir denna variabel signifikant på grund avden låga spridningen i priset hos whisky från denna region med få destillerier. Hållsde övriga variablerna konstant ökar en whisky från Lowlands priset med 55,69 SEK.

32

Page 39: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

5.3. VARUMÄRKEMODELLEN

5.2.2 De eliminerade variablerna

De eliminerade variablerna var Highlands, Islands och Speyside. De större regionernaeliminerades alltså i modellen och anledningen till detta torde vara att det storaantalet destillerier i dessa regioner har väldigt olika prissättning. En stor variationi pris blir alltså svår att anpassa i en linjär regression.

I denna modell eliminerades också Ålder2, även fast den var med i modellenmed lägst AICc. Variabeln var dock endast signifikant på 10 %-nivå och förkastadesalltså till fördel för modellen med näst lägst AICc där alla variabel var på 5 %-nivå. Vid regression med denna variabel kunde en slutsats dras om att prisökningenfaktiskt till viss del var kvadratisk men eftersom signifikansnivån 5 % satts somgräns i detta examensarbete uteslöts denna påverkan.

5.3 VarumärkemodellenExakt hur och varför ett varumärke påverkar priset är en fråga för ekonomer ochmarknadsanalytiker. I detta arbete behandlas frågan rent statistiskt för att påvisaatt det faktiskt finns en påverkan. Utgångspunkten för analysen var ändå att enmaltwhisky från ett mer känt märke skulle kosta mer än en maltwhisky från ettmindre känt sådant.

Till denna modell valdes 19 whiskys ut ur sortimentsfilen. Dessa 19 whiskys varde med flest antal observationer. Samtliga oberoende variabler i tabell 4.7 kördes imodellbyggaren och denna gav flertalet modeller med lågt AICc. De två modellermed lägst AICc innehöll tyvärr insignifikanta variabler vilket gjorde att modell 3i figur 4.5 valdes för att ha samtliga variabler på 5 % signifikansnivå. Det visadesig denna modell gav ett relativt högt R2 och R2

adj till författarnas glädje, och vardärför en bra utgångspunkt för vidare analys.

Målet med denna modell var att visa en signifikant skillnad mellan olika märken.

5.3.1 De inkluderade variablerna

Ålder : Se kapitel 5.1.1 ovan.

Alkoholhalt: Se kapitel 5.1.1 ovan.

Selection: Selectionvariabeln ger en stor prisökning för en whisky, vilket var förvän-tat i och med att dessa är limiterade utgåvor. Ökningen i SEK för en selectionwhiskyi denna modell är alltså 151,11 SEK.

De inkluderade märkena BenRiach, Bladnoch, Glenlivet, Macallan och Mackmyra:5 av de 19 märkena blir signifikanta nog att inkluderas i modellen. Tabell 4.8 visaratt det var en tydlig märkespåverkan från en del märken. Mackmyra får en väldigtstor positiv påverkan vilket är anmärkningsvärt. Detta är en whisky som skiljer sigmycket från de övriga i sortimentsfilen på det sättet att den lagrats väldigt kort

33

Page 40: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 5. DISKUSSION

tid på fat i förhållande till de övriga. Slutsatsen som kan dras från denna analysär att märket Mackmyra sätter största delen av priset eftersom ålderskoefficienteninte bidrar lika mycket till priset som för de övriga.

5.3.2 De eliminierade variablernaDe eliminerade variablerna var 14 märken och Ålder2. Att Ålder2 inte är signifikantnog visar att ålderns påverkan på priset faktiskt verkar vara linjär. De märken sominte inkluderades i modellen var sådana som endera inte gav någon större skillnadi priset utöver påverkan från ålder och alkoholhalt. Eller så var spridningen i prisetså stor att det inte gick att säga att det var varumärket som påverkade.

5.4 Jämförelse av de tre modellernaEn jämförelse av modellerna ger en tydlig bild av att ålderns och alkoholhaltenspåverkan är något som är relativt lika i samtliga modeller vilket är till belåtenhet.De små fluktuationer som finns hos dessa två variabler i de olika modellerna är såpass små att detta inte handlar om någon signifikant skillnad i ålderns och alkohol-haltens förmåga att förklara priset i de olika modellerna.

Även om de övriga variablerna i modellerna inte är direkt jämförbara kan det kon-stateras i landmodellen att skotska whiskys har ett lägre pris vilket stärks av attkoefficienterna i regionsmodellen är mycket mindre än i de två övriga modellerna.Om en jämförelse görs mellan två likvärdiga whiskys från landmodellen respektivemärkemodellen kan det konstateras att dessa ger väldigt likartade resultat. Om en3-årig svensk whisky med 40 % alkoholhalt från landmodellen jämförs med en 3-årigMackmyra med 40 % alkoholhalt fås ett tydligt resultat, se nedan. Koefficienternaär tagna från tabell 4.2 och tabell 4.8

Svensk whisky = 281, 611 + 19, 745 ∗ 3 + 0, 242 ∗ 32 + 13, 173 + 91, 421= 447, 618 SEK

(5.1)

Mackmyra = −80, 595 + 26, 907 ∗ 3 + 10, 472 + 453, 358= 463, 956 SEK

(5.2)

Skillnaden är alltså bara drygt 16 SEK.

5.5 FelkällorEn del felkällor hos koefficienternas utseende har tagits upp i diskussionen ovan, idetta kapitel diskuteras ytterligare felkällor i datamängd och metoder.

34

Page 41: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

5.5. FELKÄLLOR

Först är det viktigt att påpeka att datafilen från Systembolaget AB [2] kommerfrån en utomstående part. Även om det antas att filen och dess data är korrekt ärdet inget som kan garanteras. Det är dock väldigt många datapunkter så om detskulle förekommea små fel i datafilen kommer dessa inte ha någon speciellt stor på-verkan på modellens korrekthet. Det skall också påpekas att data har genomgåttsgrundligt och det har då inte hittats några större fel i filen.

Även om datamängden i denna undersökning var extensiv måste det också näm-nas att alla maltwhiskys i datafilen är utvalda av Systembolaget för deras sortiment.Det skulle vara önskbart att ha ytterligare datapunkter för analysen, men den an-vända datamängden anses vara tillräckligt stor och varierad för att ge en god analys.

Antagandet som gjorts att ålderns påverkan på priset är linjär eller eventuelltkvadratiskt är ett antagande som gjorts utifrån vad som ansågs passa bäst efterstuderande av datans beteende. Det skall dock påpekas att detta kunde lösts påannat sätt, till exempel genom att gruppera åldrarna i intervall. Den funktionellaform som valdes i slutet anses ändå ha gett ett bra resultat vilket stärks av residu-alplottarnas beteende, se figurerna 5.2, 5.3 och 5.4 på nästa sida.

Trots att den datamanipulation som gjorts har genomförts med största noggrannhetkan det inte garanteras att små fel inte uppstått. Dessa är dock så få att påverkanpå slutresultatet inte borde vara nämnbart stor. Ett exempel på sådan datamani-pulation är att vissa maltwhiskys saknade ålder i Systembolagets fil. I dessa fallhar extensiv internetsökning i whiskydatabaser [12] gjorts för att kunna bestämmaåldern. Här måste också utomstående källor värderas för validitet och vissa fel kanförekomma hos dessa. Återigen är mängden data som påverkas liten jämfört medhela datamängden och påverkan borde således inte bli så stor.

35

Page 42: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 5. DISKUSSION

Figur 5.2. Landmodellens estimerade pris plottade mot residualerna. Notera skalanpå axlarna.

.

Figur 5.3. Regionmodellens estimerade pris plottade mot residualerna. Notera skalanpå axlarna.

.

36

Page 43: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

5.5. FELKÄLLOR

Figur 5.4. Varumärkemodellens estimerade pris plottade mot residualerna. Noteraskalan på axlarna.

.

37

Page 44: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK
Page 45: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Kapitel 6

Slutsats

Huvudfrågan som ställdes innan detta examensarbete påbörjades, och som ocksåär titeln på arbetet, är vilka faktorer som påverkar priset på maltwhisky. Efter enmycket genomgående datainsamling och manipulation kunde det med hjälp av enlinjär multipel regression urskiljas vilka faktorer som gav störst påverkan, och påvilket sätt. I resultatet från tidigare kapitel i rapporten är det tydligt att framföralltålder och alkoholhalt är något som är starkt korrelerat med priset på maltwhiskyn.Landmodellen visade en skillnad i pris hos många länder vilket är en indikation påatt det är en stor skillnad på vilket land whiskyn kommer ifrån. Regionmodellenbeskriver inte hur priset på whisky från varje region i Skottland skiljer sig mendäremot ger den en indikation på hur whisky från de tre regionerna Campbeltown,Islay och Lowlands varierar gentemot de större regionerna som är underliggande ikonstanttermen. Varumärkemodellen visar att det för en del märken är stor skillnadi pris på grund av just ”märkesfaktorn”. Vad det är som gör att dessa whiskypro-ducenter kan ta mer betalt för likvärdiga produkter är olika från fall till fall ochibland svårt att bestämma.

Sammantaget uppfylls rapportens syfte med att bestämma vilka faktorer som påver-kar priset på maltwhisky. Rapportens andra syfte om att påvisa en varumärkesfaktorvid prissättning av maltwhisky bör också kunna anses vara uppfyllt.

6.1 Förslag till vidare undersökning

En idé som dykt upp under arbetets gång är att på något sätt inkludera försäljnings-statistik i analysen och på så sätt kunna analysera t.ex. pris mot efterfrågan. Dettaskulle också kunna ge en tydligare bild på hur personer som köper whisky tänkernär de handlar detta och hur mycket priset påverkar deras val. Sådan statistik finnstillgängligt från Systembolaget men fick inte plats i detta arbetets omfattning.

Data om marknadsföringskampanjer från olika destillerier är något som ocksåskulle kunna inkluderas, både tillsammans med märkesanalysen och försäljningssta-tistiken. En sådan undersökning säger något om det är varumärket i sig som ökar

39

Page 46: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

KAPITEL 6. SLUTSATS

priset mest eller om det är ett resultat av extensivt marknadsförande. Detta är docken analys av ekonomi- eller marknadskaraktär och ansågs inte lämplig för just denstatistiska sidan av analysen som genomförts här.

40

Page 47: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

Litteraturförteckning

[1] Annals of the Kingdom of Ireland. [Internet]. 2nd ed. Dublin: Hodges, Smith,and Co., Grafton-Street; 1856. Page 784. [Citerad 21 maj 2013]. Tillgänglig från:http://archive.org/stream/annalsofkingdomo04ocleuoft#page/784/mode/2up

[2] Systembolagets sortimentsfil [Internet]. Systembolaget AB 2013 [hämtad 21 maj2013]. Tillgänglig från: http://www.systembolaget.se/Assortment.aspx?Format=Excel

[3] Hellre hälsa än vinst [Internet]. Systembolaget AB 2013 [citerad 21 maj2013] Tillgänglig från: http://www.systembolaget.se/OmSystembolaget/IQ-initiativet/Hellre-halsa-an-vinst/

[4] The Scotch Whisky Regulations [Internet]. 2009 No. 2890 [citerad 21 maj 2013].Tillgänglig från: http://www.legislation.gov.uk/uksi/2009/2890/contents/made

[5] A.H. Studenmund. Using Econometrics - A Practical Guide. 6th ed. Massachu-setts: Pearson Education; 2011.

[6] William H. Greene. Econometric Analysis. 6th ed. New Jersey: Pearson Educa-tion; 2008.

[7] Harald Lang. Topics on Applied Mathematical Statistics. Version 0.93[Pamphlet]. Stockholm: KTH Teknikvetenskap; 2012.

[8] Alkoholskatten i Sverige [Internet] [citerad 21 maj 2013]. Tillgänglig från:http://www.skatteverket.se/foretagorganisationer/skatter/punktskatter/allapunktskatter/alkoholskatt/skattesatser.4.18e1b10334ebe8bc80003069.html

[9] Skotsk export [Internet] [citerad 21 maj 2013]. Tillgänglig från:http://webarchive.nationalarchives.gov.uk/20130130150421/http://www.scotlandoffice.gov.uk/scotlandoffice/8610.html

[10] Skotska whiskyregioner [Internet] [citerad 21 maj 2013]. Tillgäng-lig från: http://www.systembolaget.se/Dryckeskunskap/Om-sprit/Vara-spritsorter/Whisky/Skotska-whiskyregioner/

[11] Karta över skotska regioner [bild från internet]. 2012 [citerad 21 maj 2013].Tillgänglig från: http://dramaticwhisky.files.wordpress.com/2012/07/map.png

41

Page 48: Analysavvilkafaktorersompåverkarprisetpå maltwhisky651091/FULLTEXT01.pdf · Analysavvilkafaktorersompåverkarprisetpå maltwhisky Författare: VICTOR JANSSON, victorja@kth.se ERIK

LITTERATURFÖRTECKNING

[12] Whiskybase [Internet]. 2013 [citerad 21 maj 2013]. Tillgänglig från:http://www.whiskybase.com

42