chab m3e2 2013

33
Методи прогнозування часових рядів та проблема складності Д.М. Чабаненко Кафедра економічної кібернетики ЧНУ ім. Б. Хмельницького

Upload: dmitry-chabanenko

Post on 26-Jun-2015

149 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Chab m3e2 2013

Методи прогнозування часових рядів та проблема складності

Д.М. Чабаненко

Кафедра економічної кібернетики

ЧНУ ім. Б. Хмельницького

Page 2: Chab m3e2 2013

Стан проблеми моделювання і прогнозування складних систем

• Прості системи можуть бути описані простими моделями

• Системи середньої складності описуються простими моделями гірше, ніж складними (обгрунтована необхідність ускладнення)

• Складні системи погано описуються як простими, так і складними моделями

• ? При якій складності моделі можна отримати кращі прогнози складної системи?

Page 3: Chab m3e2 2013

Підходи до оцінювання складності моделі, порівняння

складності моделей• Розрахункова складність (складність

алгоритму побудови і використання моделі)

• Складність за кількістю факторів, які враховує модель

• Описова складність (множина станів системи, які можуть бути описані моделлю)

Page 4: Chab m3e2 2013

Приклад моделі зі змінною складністю – модель

поліноміального тренду

Y(t)=a0+a1t+a2t2+…+aktk

Горизонт прогнозу Np – задається дослідником

Степінь поліному k та довжина вибірки навчання –параметри, які треба визначити

N

ytyMSE

N

iii

1

2

%1001

NpN

Ni i

ii

y

yty

NpMAPE

Page 5: Chab m3e2 2013

Приклад моделі зі змінною складністю – модель поліноміального

тренду• Степінь полінома k – параметр складності.• Довжина навчальної вибірки N – теж

параметр складності.• Похибка на перевірочній вибірці – міра якості

моделі з заданими параметрами k та N.• Постановка задачі: знайти значення

параметрів k (степінь полінома) та N (довжина навч. вибірки), при яких середня абсолютна процентна похибка була б мінімальною.

Page 6: Chab m3e2 2013

Пошук оптимальних order та nlearn при прогнозуванні на 3 дні (за даними iндексу S&P 500)

Максимум по полю MAPE

nlearn                  

order 10 50 100 250 500 1000 2000 4500 7000Общий

итог

1 6,48 5,43 9,95 8,29 21,89 52,86 59,10 74,37 68,63 74,37

2 3,76 8,24 8,04 13,79 11,78 20,26 59,68 53,71 72,32 72,32

3 3,45 7,45 7,86 9,51 11,16 10,74 26,15 44,36 60,01 60,01

4 5,04 4,60 6,57 8,89 13,67 12,50 15,20 68,97 45,02 68,97

5 7,14 9,28 4,15 9,55 8,99 14,43 18,99 40,11 57,40 57,40

6 22,28 2,54 7,15 14,57 8,92 10,68 20,14 24,80 63,36 63,36

7 34,28 5,38 6,34 10,28 16,02 13,62 14,78 17,41 29,22 34,28

8 131,60 4,56 3,96 7,02 11,61 7,57 11,30 15,62 21,07 131,60

9 304,13 6,75 4,84 6,48 8,55 12,34 13,78 21,71 23,79 304,13

103801,9

49,73 6,56 10,35 6,03 10,45 13,26 23,03 25,60 3801,94

Общий итог3801,9

49,73 9,95 14,57 21,89 52,86 59,68 74,37 72,32 3801,94

Page 7: Chab m3e2 2013

Пошук оптимальних order та nlearn при прогнозуванні на 10 днів (за даними iндексу S&P 500)

Максимум по полю MAPE nlearn                  

order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 11,16 8,33 11,15 8,30 22,03 53,63 59,98 75,35 69,58 75,35

2 10,56 14,39 9,24 14,18 11,41 20,18 60,57 54,31 73,29 73,29

3 39,70 12,21 13,57 10,92 12,29 11,84 27,37 45,04 58,61 58,61

4 92,04 14,60 14,00 11,19 15,90 13,48 16,64 70,16 43,62 92,04

5 375,99 34,02 7,98 17,80 10,13 15,31 19,57 40,47 58,35 375,99

6 1893,43 28,28 18,32 26,79 12,21 13,93 22,76 25,74 64,46 1893,43

7 6524,69 93,34 14,35 17,67 19,41 16,05 15,23 17,68 29,18 6524,69

8 47974,03 82,86 49,65 16,29 15,89 10,32 12,81 18,41 21,7347974,0

3

9 295755,70205,5

9 65,03 14,64 17,24 16,73 16,13 24,81 24,86295755,

70

10 6555847,00372,5

8 92,21 33,56 12,80 16,85 14,31 26,17 25,176555847

,00

Общий итог 6555847,00372,5

8 92,21 33,56 22,03 53,63 60,57 75,35 73,296555847

,00

Page 8: Chab m3e2 2013

Nprogn=25Максимум

по полю MAPE nlearn                  

order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 15,65 13,58 10,67 10,63 27,60 62,12 68,98 85,26 79,15 85,26

2 49,52 23,84 21,23 19,71 14,41 25,13 69,62 57,62 83,10 83,10

3 330,46 20,12 23,31 12,75 14,60 15,30 29,47 52,92 57,74 330,46

4 1400,24 61,42 42,45 18,18 18,03 15,09 18,53 80,37 46,73 1400,24

5 12998,10 221,13 33,54 35,19 10,27 15,85 21,39 47,36 67,4612998,1

0

6 137585,00 491,66 96,15 57,92 25,49 18,62 26,10 26,92 74,22137585,

00

7 926874,001767,1

9 103,63 37,80 43,53 18,91 16,64 20,80 34,60926874,

00

8 15074860,001449,7

3 774,59 100,57 40,90 20,60 17,11 22,46 24,50

15074860,0

0

9200997400,0

0

10267,07

1042,82 87,43 44,14 31,96 24,68 29,69 27,39

200997400,00

108975297000,

00

24017,21

1642,17 205,17 53,01 44,60 21,48 31,11 26,92

8975297000,00

Общий итог

8975297000,00

24017,21

1642,17 205,17 53,01 62,12 69,62 85,26 83,10

8975297000,00

Page 9: Chab m3e2 2013

Nprogn=50

order 10 50 100 250 500 1000 2000 4500 7000Общий

итог

1 30,17 18,57 14,86 14,68 28,12 65,11 72,36 89,05 82,78 89,05

2 202,42 54,49 36,39 26,53 16,21 24,72 73,03 59,90 86,84 202,42

3 2089,63 49,37 47,19 14,79 20,51 24,85 31,55 55,53 58,94 2089,63

4 18419,37 294,38 153,76 47,11 28,32 21,72 23,14 85,01 48,92 18419,37

5 260232,70 1962,56 166,89 98,49 17,97 18,03 27,24 48,64 71,15 260232,70

65803432,0

0 7726,11 568,47 177,79 58,76 27,68 37,83 30,67 78,545803432,0

0

765455470,

0034865,9

0 903,61 164,18 102,87 31,14 20,33 25,55 34,2265455470,

00

8

2096270000,0

036546,6

910353,5

1 692,76 95,26 44,20 23,87 27,96 28,76

2096270000,0

0

9

50192010000,

00503721,

6019260,1

9 596,54 148,20 68,80 41,76 36,91 37,32

50192010000,

00

10

43521700000

00,00

1670006,00

35216,22 2143,14 214,51 109,41 37,06 45,71 33,96

43521700000

00,00

Общий итог

43521700000

00,00

1670006,00

35216,22 2143,14 214,51 109,41 73,03 89,05 86,84

43521700000

00,00

Page 10: Chab m3e2 2013

Nprogn=100order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 36,54 24,08 31,02 20,61 22,14 55,28 62,56 78,43 72,48 78,43

2 697,37 106,40 62,48 51,94 26,96 27,44 63,24 66,03 76,37 697,37

3 11924,40 221,09 129,38 28,27 38,44 36,25 33,92 45,88 65,10 11924,40

4 219838,80 1962,11 711,70 124,22 57,56 44,66 31,24 76,42 47,67 219838,80

5 5988953,00 21752,77 1224,78 299,62 51,73 37,32 35,03 37,00 62,085988953,0

0

6 278159400,00154649,3

0 5931,18 670,34 174,94 54,63 68,58 39,96 69,9927815940

0,00

7 5779644000,00993965,2

0 14801,69 1384,13 330,25 67,75 43,74 41,20 40,90

5779644000,0

0

8346871200000,0

02599520,

00271978,7

0 6710,82 358,96 139,63 39,10 39,68 45,71

34687120000

0,00

918045660000000

,00

51020920,0

0833355,4

0 7450,22 924,30 224,50 92,48 52,84 63,45

18045660000

000,00

1024422500000000

00,00

281481200,00

2305422,00 40609,37 1487,62 378,03 78,89 83,23 48,88

24422500000000

00,00

Общий итог

2442250000000000,00

281481200,00

2305422,00 40609,37 1487,62 378,03 92,48 83,23 76,37

24422500000000

00,00

Page 11: Chab m3e2 2013

Nprogn=250order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 93,21 56,03 67,81 33,78 32,56 37,24 44,89 59,37 53,94 93,21

2 3498,65 370,91 215,51 129,56 71,66 38,42 45,89 57,98 57,59 3498,65

3 135303,00 2372,84 952,36 102,17 98,39 85,00 42,17 44,49 59,71 135303,00

46485158,0

0 37286,54 10324,95 872,57 165,11 113,61 50,79 63,10 52,046485158,0

0

544884820

0,00899441,0

0 40617,25 2735,97 370,61 91,90 95,61 67,93 51,2244884820

0,00

6

64014320000,

00

14875760,0

0399126,0

0 12170,00 1692,65 238,74 176,44 101,95 56,58

64014320000,

00

7

2831991000000,00

224720600,00

1665734,00 59840,37 3981,63 332,05 183,97 104,07 78,38

2831991000000,00

8

377304100000000,

00

1839821000,00

58621780,0

0402531,9

0 6446,49 1390,28 201,29 91,15 115,23

377304100000000,

00

9

47777690000000000,00

66729830000,0

0

380470000,00

1095978,00 36460,68 2534,10 522,53 127,62 146,13

47777690000000000,00

10

14540530000000000000

,00

704080200000,00

2355935000,00

8219427,00 70165,60 5330,43 479,76 234,42 102,84

14540530000000000000

,00

Общий итог

14540530000000000000

,00

704080200000,00

2355935000,00

8219427,00 70165,60 5330,43 522,53 234,42 146,13

14540530000000000000

,00

Page 12: Chab m3e2 2013

Nprogn=500order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 176,79 84,31 115,78 64,10 46,13 57,58 66,11 48,32 51,56 176,79

2 13614,80 1207,31 683,85 287,24 146,85 68,83 72,09 51,63 48,39 13614,80

3 957593,10 14324,89 5748,30 498,81 239,67 190,09 69,43 75,86 71,43 957593,10

497159650,

00450322,9

0 95890,08 6109,34 704,37 271,48 117,54 79,35 88,8797159650,

00

5

13686330000,

0020817130

,00716936,1

0 30718,92 3177,79 409,08 279,21 128,65 83,64

13686330000,

00

6

4543667000000,00

671821400,0

015868790

,00198422,6

0 18789,10 1890,23 500,70 239,11 135,40

4543667000000,00

7

349736800000000,

00

23499150000,00

114226200,0

02206650,

00 72947,72 3033,68 854,52 244,01 175,92

349736800000000,

00

8

81745420000000000,00

388810400000,0

0

6720627000,00

22143230,00

153020,60 19419,42 1251,79 307,02 279,78

81745420000000000,00

9

21846480000000000000

,00

25134900000000,00

82166980000,00

107536300,0

01754308,

00 42370,19 3544,63 449,79 353,83

21846480000000000000

,00

10

12555440000000000000000,

00

536189000000000,0

0

1045540000000,00

1354498000,00

5612151,00

110562,40 5617,61 823,08 269,58

12555440000000000000000,

00

Общий итог

12555440000000000000000,

00

536189000000000,0

0

1045540000000,00

1354498000,00

5612151,00

110562,40 5617,61 823,08 353,83

12555440000000000000000,

00

Page 13: Chab m3e2 2013

Nprogn=1000or

der 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 276,59 112,09 192,03 112,02 79,40 85,03 71,65 44,57 53,80 276,59

2 62561,39 3947,81 2244,71 694,66 318,01 121,91 99,52 72,10 51,31 62561,39

3 6449697,00 93728,45 43434,57 2363,94 1051,36 490,78 190,60 120,97 88,206449697,0

0

41361029000,0

05656989,

001108622,

00 52198,20 6472,26 1005,16 305,75 133,95 115,32

1361029000,0

0

5478789600000

,00

499054100,0

017151620

,00424190,1

0 43488,99 3284,73 1309,24 334,12 139,12

478789600000

,00

6312687600000

000,00

31753160000,00

809238200,0

06161058,

00330685,9

0 17914,90 2195,84 722,79 276,41

312687600000000,

00

7

39284060000000000,0

0

2735363000000,00

13925630000,00

143620500,0

02263199,

00 54100,44 6850,78 851,53 464,65

39284060000000000,00

8

1863287000000000000

0,00

90156150000000,00

991617600000,0

0

1986344000,00

8827860,00

496532,80 16709,82 1486,44 919,79

18632870000000000000

,00

9

15208250000000000000000,00

10893330000000000,00

23202600000000,00

17903500000,00

149121100,0

01541439,

00 58077,83 2410,90 1209,44

15208250000000000000000,

00

10

10491980000000000000000000

,00

464445300000000000,0

0

548462400000000,0

0

408131900000,0

0

847127300,0

06745760,

00106228,2

0 5835,30 1739,70

10491980000000000000000000,0

0

Общий итог

10491980000000000000000000

,00

464445300000000000,0

0

548462400000000,0

0

408131900000,0

0

847127300,0

06745760,

00106228,2

0 5835,30 1739,70

10491980000000000000000000,0

0

Page 14: Chab m3e2 2013

Оптимальна складність поліноміальних моделей в залежності від горизонту прогнозування

Горизонт прогнозування

Оптимальна довжина

навчальної вибірки

Оптимальний степінь

полінома MAPE

3 100 8 3,96 10 100 5 7,98 25 250 1 10,63 50 250 1 14,08 100 250 1 15,5 250 500 1 32,56 500 500 1 46,13

1000 4500 1 44,57

Page 15: Chab m3e2 2013

Висновки з експерименту

• При збільшенні бажаної довжини прогнозу точність прогнозування зменшується.

• При бажаних довжинах прогнозу довше 25 днів оптимальний степінь полінома –1 (лінійний тренд, найпростіша модель)

• Оптимальна довжина вибірки навчання варіюється від Np до 4,5*Np (Np – довжина прогнозу), найкраща якість прогнозу продемонстрована для 2*Np (250 та 500 днів для більшості випадків)

• Для прогнозування на короткі відстані (менше 25 днів) найбільш оптимальне є застосування поліномів степеня 5.

Page 16: Chab m3e2 2013

Метод дискретного Фур’є-продовженняІтераційний метод визначення гармонік в методі дискретного Фур’є-продовження

- вихідний ряд.

• На кожному кроці за методом МНК мінімізується нев’язка

• одночастинне наближення,• двохчастинне наближення,…

0r t y t

m

jijijijii etdcbtatrtr

11 sin

1,2,...i

i ir t

y t

1m2m

Page 17: Chab m3e2 2013

Лінійно-гармонічна модель з одночастинним наближенням,

абсолютний варіант

Довжина навчальної вибірки nf 500 1000 2000 3000 4500

1 18,36 21,36 19,40 60,84 43,91 2 17,71 27,30 20,53 55,55 17,33 3 16,92 25,95 21,77 40,93 10,32 4 16,92 24,46 21,12 37,89 15,16 5 17,01 24,28 17,85 35,77 23,14 6 17,02 24,63 16,51 41,12 26,23 7 17,21 25,12 16,59 35,51 21,70 8 17,24 24,75 16,34 31,74 21,84 9 17,20 24,55 15,34 33,58 23,24

10 17,09 25,02 14,86 33,71 22,39

Page 18: Chab m3e2 2013

Лінійно-гармонічна модель з одночастинним наближенням, відносний

варіант

Довжина навчальної вибірки nf 500 1000 2000 3000 4500

1 18,50 15,51 15,73 47,84 30,37 2 17,83 21,18 14,67 44,69 18,43 3 17,13 18,45 21,73 32,99 24,58 4 17,12 17,53 20,88 30,19 26,60 5 17,18 18,07 18,63 28,43 22,39 6 17,15 18,17 17,58 31,74 18,83 7 17,32 19,39 17,98 32,43 17,11 8 17,33 19,17 18,05 31,39 15,34 9 17,19 19,70 19,06 30,17 15,76

10 17,18 19,74 19,22 30,22 16,74

Page 19: Chab m3e2 2013

Лінійно-гармонічна модель з двохчастинним наближенням,

абсолютний варіант Довжина навчальної вибірки nf

500 1000 2000 3000 4500 2 30,03 20,21 21,87 38,68 38,76 4 28,61 19,70 20,60 29,93 18,88 6 28,81 19,95 17,04 21,21 24,33 8 31,40 19,81 18,63 24,28 19,47

10 31,44 19,50 17,37 20,93 21,88

Page 20: Chab m3e2 2013

Лінійно-гармонічна модель з двохчастинним наближенням,

відносний варіант

Довжина навчальної вибірки nf 500 1000 2000 3000 4500

2 24,07 19,98 38,40 17,21 30,85 4 23,01 19,46 26,16 14,75 19,35 6 20,95 19,33 26,84 15,67 18,48 8 22,14 19,14 23,86 15,63 12,90

10 21,32 19,09 22,31 16,25 13,85

Page 21: Chab m3e2 2013

Лагові моделі прогнозування

tmtyttyttytyftty ,...,2,,

Метод групового урахування аргументів

jimjitjtyatitya

tjtytityatjtyatityaa

tjtytityftty

,,...2,1,,

,

25

24

3210

Зовнішній критерій - RMSE

Page 22: Chab m3e2 2013

Пошук значущих лагових змінних(дані індексу S&P 500)

Page 23: Chab m3e2 2013

Пошук значущих лагових змінних (дані ф’ючерсу на індекс UX)

Page 24: Chab m3e2 2013

Інтегровані процеси

ttytyr tabs )1

tty

tyr trel

1)2

tty

ttytyr trel

2)3

Page 25: Chab m3e2 2013

tty

tyr trel

1)2

ttytyr tabs )1

Page 26: Chab m3e2 2013

tty

tyr trel

1)2

Page 27: Chab m3e2 2013

Пошук значущих лагових змінних (дані індексу S&P 500)

ttytyr tabs )1

tty

ttytyr trel

2)3

Page 28: Chab m3e2 2013

Точність однокрокового прогнозу

• Часовий ряд – S&P 500• Оптимальна

максимальна кількість лагових змінних – 100

• Крок дискретизації 1 день

• Міра точності – MAPE, %

Без приростів

1абс 2відн 3Відн приб

40 5 9 6

Page 29: Chab m3e2 2013

Точність однокрокового прогнозу

• Часовий ряд – UX-C• Оптимальна

максимальна кількість лагових змінних – 50

• Крок дискретизації 1 день

• Міра точності – MAPE, %

Без приростів

1абс 2відн 3Відн приб

2,3 1,46 1,56 1,55

Page 30: Chab m3e2 2013

Точність багатокрокового прогнозу

• Часовий ряд – S&P 500• Оптимальна

максимальна кількість лагових змінних – 100

• Крок дискретизації 1 день

• Міра точності – MAPE, %

• Прогнозування на 100 днів

Без приростів

1абс 2відн

3Відн приб

6 6,4 4,5 6,4

Page 31: Chab m3e2 2013

Точність багатокрокового прогнозу

• Часовий ряд – UX-C• Оптимальна

максимальна кількість лагових змінних – 50

• Крок дискретизації 1 день

• Міра точності – MAPE, %

• Прогнозування на 100 днів

Без приростів

1абс 2відн 3Відн приб

3,4 16,2 4,9 4,8

Page 32: Chab m3e2 2013

Висновки і перспективи досліджень

• Оптимальні параметри прогнозної моделі (її складність) залежать від заданого горизонту прогнозування

• В класі поліноміальних моделей при довгостроковому прогнозуванні більш ефективними є моделі 1 порядку (лінійні)

• В класі лінійних гармонічних моделей оптимальним є апроксимація по одній гармоніці

Page 33: Chab m3e2 2013

Висновки і перспективи досліджень

Перспективи досліджень:

• Дослідження оптимальної складності поліноміальних моделей при короткостроковому прогнозуванні

• Створення методів пошуку оптимальної складності (крос-валідації) для авторегресійних, нейромережних, марківських моделей