Теория информационных систем
TRANSCRIPT
кандидат технических наук, доцент
Грекул Владимир Иванович
Учебный курс
Теория информационных
системЛекция 5
??Объем продаж за предыдущие 3 месяца
Март 2 345 тыс.р
Апрель 1 867 тыс. р
Май 2 480 тыс. р
Какой объем продаж следует ожидать в июне ?
0
500
1000
1500
2000
2500
3000
март апрель май июнь
???
Прогнозирование
ПроцессВнешние факторы
Внутренние факторы
Воздействие множества внешних и внутренних факторов приводит к изменениям характеристик процесса, которые можно рассматривать как случайные.
Задача прогнозирования – по имеющимся данным оценить состояние процесса в будущем.
Прогнозируемые показатели
Объем продаж;
Параметры управления запасами;
Объем выпуска продукции;
Объем закупок;
Изменение числа клиентов;
И т.д.
Временной ряд -последовательность упорядоченных во
времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления
164
143
182
121
ЗначениеВременной интервал
Значение
Время 1 2 3 4
20
15
10
Представление временных рядов
Таблицы Графики
Виды временных рядов• Стационарные• Нестационарные
Содержащие трендСодержащие сезонную составляющуюСодержащие циклическую составляющую
Нестационарный временной ряд
Стационарный временной ряд
Временной ряд с трендом
Отражает устойчивые средние изменения показателя
Временной ряд с сезонной компонентой
Отражает колебания показателя с определенным периодом
Временной ряд с циклической компонентой
Отражает непериодические колебания показателя с большой амплитудой
Прогнозирование для стационарных процессов
На практике для стационарности ряда достаточно выполнения трех условий:
E[yt] не зависит от t,D[yt] постоянная,Cov[yt,ys] - функция t-s.
0
0,05
0,1
0,15
0,2
0,25
0 5 10 15 20 25
E[yt]
E[yt] )(3 tyD
E[yt] )(2 tyD
Прогноз оправдается с вероятностью 0
При N>30 прогноз оправдается с вероятностью 0,75. (Для и нормального распределения - с вероятностью 0,95)
Прогноз оправдается с вероятностью 0,89 (0,997)
E[yt]
Прогнозирование тенденции изменения показателей
y = 0,5842x + 13,387
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11
Х
Y
=y(x)-Y
Тенденцию (тренд) определяет линия, проходящая максимально близко к точкам временного ряда
Типовые функции трендов • Линейная
• Степенная
• Показательная
• Экспоненциальная
• Гиперболическая
• Логарифмическая
bxaxy *)(
bxaxy *)(
xbaxy *)(
bxeaxy *)(
xbaxy /)(
)lg(*)( xbaxy
Различные виды тренда
Какую линию следует использовать?
Критерии оценки прогнозаАбсолютные величины
Средняя ошибка n
n
1i
i
МЕ
Среднее абсолютное отклонение n
n
1i
i
MAD
Среднеквадратичная ошибкаn
n
1i
i2
MSE
Стандартное отклонение ошибок1-n
n
1i
i2
SDE
Значение
Время 1 2 3
20
15
10
+ -
=0
Среднеквадратичная ошибкаn
n
1i
i2
MSE
Стандартное отклонение ошибок1-n
n
1i
i2
SDE
-2
-1
0
1
2
3
4
5
6
-5 -4 -3 -2 -1 0 1 2 3 4 5
-15
-10
-5
0
5
10
15
20
25
30
-5 -4 -3 -2 -1 0 1 2 3 4 5
При использовании среднеквадратичного отклонения функция является гладкой и допускает аналитическое исследование
При использовании абсолютного значения отклонения первая производная имеет область неопределенности , а вторая равна бесконечности
Критерии оценки прогнозаАбсолютные величины
Средняя ошибка n
n
1i
i
МЕ
Среднее абсолютное отклонение n
n
1i
i
MAD
Среднеквадратичная ошибкаn
n
1i
i2
MSE
Стандартное отклонение ошибок1-n
n
1i
i2
SDE
Максимальное абсолютное отклонение |)max(|MAXD
Критерии оценки прогноза Относительные величины
Процентная ошибка
Среднее процентной ошибки
Абсолютное среднее процентной ошибки
100)(
t
tt
Y
tyYPE
n
PEMPE
n
i
i 1
n
PEMAPE
n
i
i 1
Максимальная процентная ошибка
)max( iPEMAXPE
Резкие колебания показателей
Построение прогноза с использованием линии тренда эффективно только при наличии устойчивого и плавного изменения показателя.
Если временной ряд содержит скачкообразные изменения показателя, среднее и тренд не обеспечивают получение достоверного прогноза.
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10
Недели
Кл
ие
нты
Метод скользящего среднего
Используется для построения краткосрочных прогнозов
Позволяет:
• Учитывать наиболее актуальную (недавнюю) информацию
• Оценить погрешность прогноза в процессе его формирования
t
Nti
YiN
ty1
1)1(
Скользящее среднее
3
11333
1)4(
i
Yiy
Скользящее среднее
Скользящее среднее
Скользящее среднее
Выявление смены тенденции
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
1 2 3 4 5 6 7 8 9 10 11 12 13
Временной ряд Короткое среднее Длинное среднее
Область роста Короткое среднее располагается выше длинного
Область спада Короткое среднее располагается ниже длинного
Индикатор смены тенденции
Прогноз для временного ряда с сезонной составляющей
Последовательность построения прогноза:
Определить период сезонной волны
Вычислить индексы сезонности Iсез для всех составляющих моментов времени
Построить временной ряд, скорректированный с учетом
сезонности Yбс = Yфакт : Iсез
Построить тренд Yтр
Построить прогноз Yпр = Yтр * Iсез
К сезонным относят все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность: устойчиво повторяющиеся колебания уровней (сезонную волну).
Корреляционный анализИспользуется для выявления связи между
величинами х и у. Связь существует, если |rxy|~1.
Коэффициент корреляции:
N
ii
N
ii
N
iii
xy
YyXx
YyXxr
1
2
1
2
1
)()(
))((
Где: Х, Y – средние значения переменных.
Знак коэффициента корреляции отражает вид связи:
положительная или отрицательная (возрастает или убывает у при
росте х).Коэффициент детерминации rxy
2
отражает долю изменений у, обусловленную изменениями х.
Технология дисперсионного анализаИсходные данные объединяются в две группы, соответствующие различным значениям исследуемого фактора (до и после изменения политики, в ночную и в дневную смены…)
Вычисляются межгрупповая S1 и внутригрупповая S2 дисперсии
Оценивается дисперсионное отношение
Если F>Fтабл, то исследуемый фактор оказывает
существенное влияние на значение показателя y
12
2*)(2
1
2
1
jj YY
S2
)(2
1
2
12
N
Yy
S jjij
Nj
i
2
1
S
SF
Определения дисперсионного анализаМежгрупповая дисперсия S1 – отражает колебания
групповых средних Yj относительно общей средней YВнутригрупповая дисперсия S2 - отражает колебания
значения показателя y относительно групповых средних Yj
0
2
4
6
8
10
12
14
16
18
20
1 2 3 4 5 6 7 8 9 10 11 12 13
Y1
под воздействием исследуемого фактора
Изменения групповых среднихИзменения показателя y
при воздействии всех факторов
при исключении исследуемого фактора
0
2
4
6
8
10
12
14
16
18
20
1 2 3 4 5 6 7 8 9 10
Y2
8
8,5
9
9,5
10
10,5
11
11,5
12
12,5
13
1 2
Y
При отсутствии существенного влияния исследуемого фактора
Изменения показателя y
при воздействии всех факторов
при исключении исследуемого фактора происходят фактически
только под воздействием остальных факторов
Изменения групповых средних
фактически не зависят от воздействия исследуемого фактора
Межгрупповая и внутригрупповая дисперсии приблизительно одинаковы поскольку все случайные величины изменяются под воздействием одних и тех же факторов, следовательно, принадлежат одной генеральной совокупности.
Множественная регрессия
Используется для выявления связи между величиной у
и множеством факторов хj , j=1,M.
- остаток - погрешность аппроксимации.
MM xxxy ...2211
Коэффициенты регрессии - отражают линейную корреляционную зависимость между результирующей величиной и каким-либо из факторовпри средних значениях других факторов.
Литература
К. Карлберг, Бизнес-анализ с помощью Excel.
Г.П. Фомин, Математические методы и модели М Финансы и статистика, 2001г
М.Г. Зайцев, Количественные методы в менеджменте М., АНХ,2001