analyse user generated content

20
- [email protected] Tirez profit des conversations sur le web! 1

Upload: business-on-line

Post on 18-Dec-2014

809 views

Category:

Business


3 download

DESCRIPTION

Solution to analize the User Generated Content. Solution d'analyse du contenu généré par les utilisateurs.

TRANSCRIPT

Page 1: Analyse user generated content

- [email protected]

Tirez profit des conversations sur le

web!

1

Page 2: Analyse user generated content

Que se passe-t’il en une minute sur le web?

2

Page 3: Analyse user generated content

Bla Bla Bla

Les conversations représentent la

majorité du trafic

3

Page 4: Analyse user generated content

Analyser le langage naturel est une obligation!

•U don't got da jack but remember we got da

screenin 2mro at 8

•C vré ke C pa + facil ! G mi 2x + 2 tan a lir C 2

post en langaj SMS ke 2 posts ékri normleman

• Hexo x ti y xa ti, tú pones las reglas

• Sda7med ya 5ouya Ma chba3tech biiik allah

ghaleb...nchallah kol 3aam wenti 7ay b5iiir

4

Page 5: Analyse user generated content

analyse en temps réel des

communications digitales pour fournir de

l’information décisionnelle aux éditeurs de logiciels,

a g e n c e s m a r k e t i n g é d i t e u r s d e s e r v i c e s …

fonctionnement

Forums, blogs E-mails Instant Messaging

Notre Text Meaning Technology est capable d’analyser en temps réel

u n f l u x d e c o m m u n i c a t i o n s t e x t e s , d e d é t e c t e r l e s é l é m e n t s v o u s i n t é r e s s a n t e t d ’ a l e r t e r b o n n ela personne ou de déclencher l’action appropriée –

tout cela automatiquement

Réseaux sociaux

Page 6: Analyse user generated content

A proposhttp://scanandtarget.com/ - [email protected]

Solution française. 10 personnes.

créée en 2008 par:

� Bastien Hillen, CEO, ex DG Digiplug

� David Tilloy, CTO, ex Neocom Multimedia

� Ian Sprunck, COO, ex Neocom Multimedia et Telestore

(chez.com, ibazar…)

� Crédit Agricole Private Equity

� Truffle Capital

fonds levés depuis la création: 2,5M€ auprès

d’investisseurs comme:

Page 7: Analyse user generated content

Références

Page 8: Analyse user generated content

Contrairement aux solutions à base de sémantique ou de mots-clés,

notre technologie peut traiter les différentes variantes et altérations des expressions pour analyser le contenu comme :

La technologie

� Utilisation lettres majuscules / minuscules ;

� Répétition de lettres (vvviiiagrrra par exemple) ;

� Variantes orthographiques (vi@gra, vlagra, v1@gra, v149r4) ;

� Elision de lettres dans certains cas (v|agra, v agra…)

� Utilisation de symboles non alpha numériques (v.i.a.g.r.a, v_i°ag#r:a, v-

iagra, viagr"a...) ;

� Altérations phonétiques ;

� Inversion, omission (hilter, v_agra, etc.) ;

� Formes plurielles et conjuguées ;

� Langages SMS et chat (« a 2m1 », etc.) ;

� Arabizi / translitération .

Ainsi que la combinaison de chacun de ces formes

Page 9: Analyse user generated content

La technologie ttp://scanandtarget.com/ -

[email protected]

La solution est basée sur un moteur intelligent qui note non seulement

les mots pris individuellement mais également le contenu dans son

intégralité. Les termes sont ainsi remis dans leur contexte afin

d’extraire le sens du contenu

La solution utilise des thesauri thématiques : les Smart Wordbooks.

L’analyse se fait au niveau des concepts et non seulement sur des mots-clés

Grâce à un système puissant et précis d’analyse conditionnelle nos

clients bénéficient d’un très faible niveau de faux positifs

Page 10: Analyse user generated content

Concurrence

•Solutions à base de mots

clés

– problème de précision

(V1@gr@)

–Bcp de faux positifs

•Solutions sémantiques:

– Pas adaptées aux

conversations + forte

volumétrie + temps réel

–Implémentation longue

et complexe

Page 11: Analyse user generated content

Big Data? Pas de problème.

•La solution est disponible en SaaS ou sous forme

d’appliance à héberger chez vous (matériel IBM)

•Capacité à traiter en temps réel de très fortes

volumétries

–L’intégralité du trafic de Twitter (10 TB / jour, moyenne de 2000

Tweets par seconde)* peut être analysé en temps réel avec un IBM

blade center

–*Source - Twitter

Page 12: Analyse user generated content

Notre offre

APIs

Applications

Page 13: Analyse user generated content

Centre

Que pouvons-nous identifier pour vous?

Intention d’achat

plaintes D’accord / Pas d’accord

questions Perception de la marque

d’intérêt J’aime / J’aime pas

Déjà client?

Page 14: Analyse user generated content

Nos APIs

•Nos APIs peuvent être implémentées sur n’importe

–Disponible en PHP5.2+, Java1.4+, C#.NET 2.0+, Ruby…

•Simple à implémenter

–Entre quelques heures à 2 jours en moyenne

•Possibilité de récupérer le contenu sur les réseaux sociaux

•Nos APIs sont aujourd’hui disponibles en Anglais et en

–Bientôt en Espagnol, Portugais, Arabe…

quelle plate-forme en utilisant le connector

Français

Page 15: Analyse user generated content

Use case: Moderation API

LB Poker chat rooms monitoring

Alerts for human

Approved

Le contenu non conforme est passé de 15% à < 3%

–Détournement de trafic

–Insultes, vulgarité

–Triche

Modération full automatique

0

100000

200000

300000

400000

500000

600000

Sep-10 Oct-10 Nov-10 Dec-10 Jan-11 Feb-11

Refused

700000

Page 16: Analyse user generated content

•Customer: Pixmania

•Challenge: analyser en 5 langues les avis

consommateurs à des fins de:

–Modération automatique (environ 80%), 20% avis

litigieux revus par agents

–Identification des problématiques clients dans les avis

(produit incomplet problème de livraison…) et alerte

•Résultats: diminution des coûts de modération,

avis publiés plus rapidement, amélioration

relation client

du service concerné

Use case: analyse avis

consommateurs

Page 17: Analyse user generated content

Use case: Fan Page monitoring

Modération: jusqu’ 7K

posts / comments par jour

CRM : détection des

questions / pb liés à la

vente de tickets

Page 18: Analyse user generated content

Use case: social profiling

•Customer: client US pour le compte de Motorola

•Challenge: –65K messages de différentes sources (blogs, Facebook, Twitter),

fort besoin de NLP (exemple utilisation de Motorola Zoom au

lieu de Motorola Xoom)

–Identification des clients existants (avec le produit associé),

intntions d’cht (vc l produit ssocié) qustions

répondre

•Résultats: –98% élimination du bruit

–Environ 500 positive hits avec précision > 95%

Page 19: Analyse user generated content

Interface Oorook CRM

Page 20: Analyse user generated content

Votre distributeur

SARL Business-on-Line 68, bd Garibaldi

75015 Paris www.business-on-line.fr

www.business-on-line.typepad.fr

Cyril BLADIER [email protected]

@businesson_line

09.50.16.21.98 06.42.67.30.43