faktabasert søk med recommind

26
1 Faktabasert, strukturert søk med Recommind Decisiv Search Sømløs virksomhet, Bouvet, 2011-12-14 Petr Vasilev, <[email protected] >

Upload: bouvet-asa

Post on 06-Jul-2015

460 views

Category:

Documents


7 download

DESCRIPTION

En beskrivelse av søkemotoren Recommind, og h

TRANSCRIPT

Page 1: Faktabasert søk med Recommind

1

Faktabasert, strukturert søkmed Recommind Decisiv Search

Sømløs virksomhet, Bouvet, 2011-12-14

Petr Vasilev, <[email protected]>

Page 2: Faktabasert søk med Recommind

2

Alt er i orden

• Definere forskjellige skjemer og system

spesifiske språk

• Oversette mellom de

• Synkronisere data kilder

• Federere mellom data

kilder

Page 3: Faktabasert søk med Recommind

3

Eller er det?

• Data er veldig absktrakt, generisk og fleksibel

• Det blandes masse forskjellige systemer

sammen

• Vanskelig å vise semantisk data til bruker

Page 4: Faktabasert søk med Recommind

4

Datapresentasjon lagTekonologiske viktig

• Skalere sammen med datakilder

• Levere resultater på det forteste

• Støtte eksisterende autorisasjon/autentisering

mekanismer

• Støtte datafleksebilitet

Page 5: Faktabasert søk med Recommind

5

Datapresentasjon lagViktig for brukerne

• Enkelt brukergrensesnitt

• Gi sjanse å navigere over data, ikke bare lete

• Vise koblet data

• Støtte språk

(lemmatisering, synonymer, stopord)

• Osv

Page 6: Faktabasert søk med Recommind

6

Høres kjent ut? Enterprise search.

Page 7: Faktabasert søk med Recommind

7

Alternativer?

• Direkte tilgang til RDF lagringsted/datakilder

med SPARQL

– Ingen indeksering ventetid

– Ingen OOTB (out of the box) støtte til sikkerhet

mekanismer og SSO (single sign on)

– Ingen OOTB brukergrensesnitt

– Ingen spårkstøtte

Page 8: Faktabasert søk med Recommind

8

Recommind? Fast? Noe annet?

• Recommind

– Fleksibelt data skjema

– Har muligheter for avansert data analyse

• Fast Search for Sharepoint

– Integreres utrolig bra i MS miljø

• Andre alternativer

– Attivio

– Expert Systems

Page 9: Faktabasert søk med Recommind

9

Arkitektur

Recommind Decisiv Search

Data source 1

Data source 1

Connector Indexing / Search

Querying component

Autorization and

authntication source

User interface

Publisher

External system

Page 10: Faktabasert søk med Recommind

10

Fleksibel data skjema

• Det tar inn alt som kommer fra konnektor

– Data sitter i indeksen som XML

• Det er mulig å definere felter etter data er inn

• Det er mulig å skrive sine egene konnektorer

– Vi har skrevet konnektor til SDShare

Page 11: Faktabasert søk med Recommind

11

Navigering over entiteter

• Det er mulig å definere søkefilterer etter data

er inn

– Vi kan opprette nye filterer uten komplett

reindeksering

• Det er mulig å binde etiketter til verdier

– http://psi.kunde.no/ifs/customer/1 = “Statnett”

Page 12: Faktabasert søk med Recommind

12

Oversetting av RDF tripler tilsøkeindeks

Spesifisk felte

Generisk felte

Dokument

<haf:Anlegg/1> <haf:is-part-of> <haf:Anlegg/2>

Anlegg/1 * is-part-of: Anlegg/2 * entity: Anlegg/2

Page 13: Faktabasert søk med Recommind

13

Navigering over objekter i søk

• Nedtrekksmenyen på hovedside

– Engasjerer brukerene

– Gir mulighet å naivgere, ikke å søke

• Søkefilter verdier i boksen

– Mye lettere å vite hva vi filtrer med

• Avansert søk for de modige

Page 14: Faktabasert søk med Recommind

14

Navigering over objekter på entitet

• Følge metadata lenker

– F eks departament nesten alltid har overordne

department

• Vise alle koblete objekter

– Vise alle anlegg og dokumenter, som er relatert til sak

KundestøtteOslo

KundestøtteOslo Sentrum

is part

of

Page 15: Faktabasert søk med Recommind

15

Personalisering

• Vis alle dine dokumenter

– Din avdeling

– Din selskap

• Framtid: OWL resonering

– Få info som er nytt for deg

ad/department/123 ifs/company/31same-as

ad/user/e29266

works-in

Page 16: Faktabasert søk med Recommind

16

Avansert dataanalyse

• OCR (Optical character recognition)

• Dyp tekstanalyse

– PSVM (Probabilistic Support Vector Machines)

– Skille mellom møtereferat og nabovarsel

• Spørringsutvidelse

– PLSA (Probabilistic Latent Semantic Analysis)

Page 17: Faktabasert søk med Recommind

17

Recommind sine ulemper

• Noe vanskelig problemer med arkitektur

– Spesielt med store taksonomier

• Ingen push API

• Sessjon basert Query API

• Lisens modell

Page 18: Faktabasert søk med Recommind

18

Demo!

Page 19: Faktabasert søk med Recommind

19

Page 20: Faktabasert søk med Recommind

20

Page 21: Faktabasert søk med Recommind

21

Page 22: Faktabasert søk med Recommind

22

Page 23: Faktabasert søk med Recommind

23

Page 24: Faktabasert søk med Recommind

24

Page 25: Faktabasert søk med Recommind

25

OppsummeringRecommind som søkemotor i semantisk miljø

• Kjempe god verktøy til å bygge opp sluttbruker

grensnitt

• Spiller bra sammen med RDF/SPARQL basert

løsninger

• Har noen ulemper, men de er ikke kritiske

Page 26: Faktabasert søk med Recommind

26

Petr Vasilev

[email protected]

Spørsmål? Svar!