Использование Гамма распределения при решении задачи...

13
1 Использование Гамма распределения при решении задачи классификации. Свердлов Евгений

Upload: lidia-pivovarova

Post on 10-May-2015

1.236 views

Category:

Documents


4 download

DESCRIPTION

Евгений Свердлов"Использование Гамма распределения при решении задачи классификации"

TRANSCRIPT

Page 1: Использование Гамма распределения при решении задачи классификации

1

Использование Гамма распределения при решении

задачи классификации.

Свердлов Евгений

Page 2: Использование Гамма распределения при решении задачи классификации

2

Задача: Классификация элементов области (2-class).

Пример: Написан ли текст подписавшимся ? Элемент – (Текст1, Текст2).Автор1 = Автор2 ?(Есть база авторских текстов).

Page 3: Использование Гамма распределения при решении задачи классификации

3

Есть несколько характеристик текста. Использование одной недостаточно. Как использовать все?

Page 4: Использование Гамма распределения при решении задачи классификации

4

“Naive Bayes Classifer” ?ф-ии плотности для каждой гипотезы ? Н1 : (Автор 1 = Автор2) Н2 : (Автор 1 ≠ Автор2)

Плотности “Гамма-образны”:

Page 5: Использование Гамма распределения при решении задачи классификации

5

Page 6: Использование Гамма распределения при решении задачи классификации

6

Выяснение авторства по текстам:

1. Распределение биграмм букв (сравнение вероятностей наиболее частотных):

EER ≤ 0.28 (0.95).

Page 7: Использование Гамма распределения при решении задачи классификации

7

Page 8: Использование Гамма распределения при решении задачи классификации

8

Page 9: Использование Гамма распределения при решении задачи классификации

9

2. Распределение биграмм категорий слов (частей речи) (сравнение вероятностей наиболее частотных):

EER ≤ 0.25 (0.95).

Совмещение: EER ≤ 0.23 (0.95).

Page 10: Использование Гамма распределения при решении задачи классификации

10

Page 11: Использование Гамма распределения при решении задачи классификации

11

Page 12: Использование Гамма распределения при решении задачи классификации

12

Требования:

1. Нормальность характеристик.

2. «Хорошая» оценка дисперсий.

Page 13: Использование Гамма распределения при решении задачи классификации

13

Далее:

• Применить для n-class задач.

• Использовать информацию из предметных областей, чтобы улучшить результат.