jak dzieki data minning księgujemy automatycznie koszty w infakt

25
Jak dzięki Data Mining księgujemy automatycznie koszty w inFakt.pl ? Kraków, 20 października 2016

Upload: infakt

Post on 07-Feb-2017

48 views

Category:

Technology


3 download

TRANSCRIPT

Page 1: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Jak dzięki Data Mining księgujemy automatycznie koszty w inFakt.pl ?

Kraków, 20 października 2016

Page 2: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

O mnie

Sebastian Bobrowski, CTO, co-founder inFakt.pl

Page 3: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

O inFakt

InFakt.pl

• 3 produkty: • program do faktur • program do księgowości • ogólnopolskie Biuro Rachunkowe

• 400 000 użytkowników • 9 lat

Page 4: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Dlaczego AI?

Page 5: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Założenia

Księgowy ma bardzo powtarzalną pracę

Ludzie popełniają błędy

Szybkość księgowania

Page 6: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Założenia

Cele:

przyśpieszyć pracę księgowego

zautomatyzować

zmniejszyć ilość błędów

Page 7: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Założenia

Bazujemy na danych na fakturach (NIP) Mamy kilka mln danych uczących

Page 8: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Machine Learning

4 klasyfikatowy:

Passive Aggressive Perceptron

Stochastic Gradient Descent Naive Bayes for multivariate Bernoulli

Page 9: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Machine Learning

Wyniki:

15% skuteczności 95% poprawności

Page 10: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Memory Base Model

XClassifier

Memory Base Model

Page 11: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Memory Base Model

Wyniki:

55% skuteczności 97,5% poprawności

Page 12: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Memory Base Model Błędy

10% - obie decyzje poprawne

15% błąd Xclassifier

75% błąd księgowego

Page 13: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Czego się nauczyłem?

Page 14: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Czego się nauczyłem

Dobranie cech jest kluczowe

Page 15: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Czego się nauczyłem

Prosta implementacja na początek

Page 16: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Czego się nauczyłem

Szybko na produkcji

Page 17: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Czego się nauczyłem

Ludzie się mylą częściej niż niedoskonały algorytm

Page 18: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Co dalej?

Page 19: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Model globalny - wyniki

Analiza tekstu

Page 20: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Model globalny - wyniki

Analiza PKD

Page 21: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Model globalny - wyniki

Szukanie anomalii (kwot, dat)

Page 22: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Open source

Open Source

Page 23: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

infakt.com

Page 24: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Pytania?

Page 25: Jak dzieki Data Minning księgujemy automatycznie koszty w infakt

Kontakt

Sebastian Bobrowski CTO

e-mail: [email protected] mobile.:+48 508 457 847