wyszukiwarka korpusowa poliqarp2 - clarin...

22
q q t tq t t t q t tq t t q t t q t q t t tq tt t q t tq t tt tq tt ttt q tt ttt qt tt tq t ttt qt ttt qt t ttt qt tt qt t t q tt tq ttt tt q tt t q t q tt tt tq ttt tt tq t t ttt q ttt qt t ttt qt tt qt t ttt q t t q t t q tt tt q tt tt tq t tt qt t tt tq tt tt q tt tt qt t tq t t t t q tt tq ttt tt tq t tt tq t ttt q tt tt tq t q t q t tt q tt Wyszukiwarka korpusowa Poliqarp2 Bartosz Zaborowski j INSTITUTE OF COMPUTER SCIENCE POLISH ACADEMY OF SCIENCES ul. Jana Kazimierza 5, 01-248 Warszawa 25 kwietnia 2016

Upload: lyanh

Post on 01-Mar-2019

213 views

Category:

Documents


0 download

TRANSCRIPT

q q qt

tqt

ttq

ttq

tt

qtt

qt

qt

ttqt

tt

qt

tqt

tttqt

tttt

qtt

tttqt

tttq

tttt

qtttt

qtt

tttqt

ttqt

tt

qtt

tqttt

ttqtt

tq

tqt

ttt

tqttt

tttqt

tttt

qttt

qtt

tttqt

ttqt

tttt

qtt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tqtt

ttq

tttqt

tttt

tqttt

tqt

tttqt

ttt

tq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q qWyszukiwarka korpusowaPoliqarp2

Bartosz Zaborowski

jINSTITUTE OF COMPUTER SCIENCEPOLISH ACADEMY OF SCIENCESul. Jana Kazimierza 5, 01-248 Warszawa

25 kwietnia 2016

Wstęp Dane Wyszukiwanie Informacje dodatkowe Czym jest Poliqarp2 Możliwościq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jCzym jest Poliqarp2

Wyszukiwarka korpusowa,następca Poliqarp 1.x – cała funkcjonalność zachowana,szczególnie niejednoznaczność i wyrażenia regularne nasegmentach,obsługa wielu poziomów anotacji (anotacje z NKJP i nietylko),wsparcie dla różnych rodzajów korpusów/banków (korpusyhistoryczne, grafy składniowe, struktury LFG. . . ).

2 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Czym jest Poliqarp2 Możliwościq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jMożliwości

Obsługa dużych korpusów (miliardy segmentów),REST API – łatwa integracja,graficzny interfejs z wizualizacją wyników,modułowa budowa.

3 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jTypy danych

typy proste (int, float, bool, string, enum)struktury atrybutowe (np. węzeł, krawędź, interpretacja,F-struktura)listalista wieloznaczna (np. wszystkie interpretacje segmentu)

wyróżnione rodzaje struktur: węzły wielkoskalowe, węzłyzwykłe i krawędzie2 rodzaje krawędzi: pierwotne i wtórnewęzły i krawędzie pierwotne tworzą DAG (składnia)wyróżniony atrybut type – nadaje sens poszczególnymstrukturom

4 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jTypy danych

typy proste (int, float, bool, string, enum)struktury atrybutowe (np. węzeł, krawędź, interpretacja,F-struktura)listalista wieloznaczna (np. wszystkie interpretacje segmentu)

wyróżnione rodzaje struktur: węzły wielkoskalowe, węzłyzwykłe i krawędzie2 rodzaje krawędzi: pierwotne i wtórnewęzły i krawędzie pierwotne tworzą DAG (składnia)wyróżniony atrybut type – nadaje sens poszczególnymstrukturom

4 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jModel NKJP na obrazku

doc (dokument)(metadane)

p (akapit)

s (zdanie)

syngr:. . . (grupa)orth

named:. . .(j. nazw.)

basecertainty

. . .synw (sowo sk.)

orthmsd

seg (segment)orthmsdsense

sub (podsegment)text,

newword, endword

morph (interpretacja)base

pos, case, . . .

synh : true/falsesemh : true/false

5 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jImportowanie korpusów

Poliqarp2 czyta tylko własny format .pqz,udostępniamy konwertery dla TEI (NKJP, PCC, PSC),Składnicy, wyjścia z POLFIE,łatwe tworzenie nowych konwerterów.

Najprostszy konwerterDołączony przykładowy „konwerter” z .txt to ~100 linii kodu wPythonie (z czego połowa to prosty segmentator).

6 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jImportowanie korpusów

Poliqarp2 czyta tylko własny format .pqz,udostępniamy konwertery dla TEI (NKJP, PCC, PSC),Składnicy, wyjścia z POLFIE,łatwe tworzenie nowych konwerterów.

Najprostszy konwerterDołączony przykładowy „konwerter” z .txt to ~100 linii kodu wPythonie (z czego połowa to prosty segmentator).

6 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jMożliwości języka zapytań

Proste zapytania frazowe,specyfikacja wartości atrybutów struktur,specyfikacja relacji między węzłami

sekwencje węzłów w porządku segmentowym,relacje zadane krawędziami grafu,wyrażenia regularne na węzłach (poziome i po krawędziach)

zmienne,post-processing podobny do SQL.

7 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jMożliwości języka zapytań

Proste zapytania frazowe,specyfikacja wartości atrybutów struktur,specyfikacja relacji między węzłami

sekwencje węzłów w porządku segmentowym,relacje zadane krawędziami grafu,wyrażenia regularne na węzłach (poziome i po krawędziach)

zmienne,post-processing podobny do SQL.

7 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jMożliwości języka zapytań

Proste zapytania frazowe,specyfikacja wartości atrybutów struktur,specyfikacja relacji między węzłami

sekwencje węzłów w porządku segmentowym,relacje zadane krawędziami grafu,wyrażenia regularne na węzłach (poziome i po krawędziach)

zmienne,post-processing podobny do SQL.

7 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jZapytania proste

Nie chciałbym

Ciąg słów: [Nie] [chciał][by][m]

8 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jAtrybuty struktur

[syngr:AdjG && sons.size > 3]

Grupa przymiotnikowa z co najmniej trzema dziećmi

9 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jAtrybuty morfoskładniowe

[pos˜adj && case˜nom && {pos,case}!˜{adj,nom}]

Być może przymiotnik i być może w mianowniku, ale nie naraz

10 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jWyrażenia regularne na węzłach

[pos=adj]{3,5}

Ciąg od trzech do pięciu przymiotników

11 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jRelacje i wyrażenia regularne pionowe

[syngr:NG && span.size > 5] >[-1]+ [seg]

Skrajny prawy potomek grupy nominalnej mającej łącznie ponad 5 potomków

12 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jZapytania ogólne

($X:=Sejm && $Y:=[base=komisja]) within [doc &&taxonomy_type="#typ_qmow"]

Słowo Sejm oraz forma słowa komisja w dokumencie quasi-mówionym, przypisanieznalezionych słów na zmienne

13 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jPost-processing

[seg && orth=$O && base=$B]/pa ;;group $O, $B ;;

zip($O, ", ") group $B sort count() desc

najróżniej odmieniane formy bazowe w korpusie

14 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jStrona techniczna

wyszukiwarka:kompilowana z kodu źródłowego,dla Linuksa (i UNIX-ów),konsolowa (demon).

GUI:Aplikacja WEB-owa Django,wieloplatformowa,można używać lokalnie,łatwe przeróbki, mini-CMS.

15 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jStrona techniczna

wyszukiwarka:kompilowana z kodu źródłowego,dla Linuksa (i UNIX-ów),konsolowa (demon).

GUI:Aplikacja WEB-owa Django,wieloplatformowa,można używać lokalnie,łatwe przeróbki, mini-CMS.

15 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jInformacje dodatkowe

strona projektu na SourceForge (pobieranie, bug-tracker):https://sourceforge.net/projects/poliqarp2/

licencja: GPL3publiczny dostęp do wyszukiwarki w ramach infrastrukturyCLARIN-PL: http://poliqarp.clarin-pl.eu/

Pytania?

16 / 16

Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q

ttq

ttt

qt

tqt

tq

ttq

tq

tt

tqtt

tq

ttq

ttt

tqtt

tttqt

tttt

qttt

tqt

tttqt

tttqt

tttt

qttt

qtt

tq

tttqt

tttt

qttt

qt

qtt

tttqt

tttt

tqtt

tttq

tttqt

tttt

qttt

qtt

tttqt

tq

ttqt

ttt

qtt

tttq

ttt

qtt

tttqt

ttt

qtt

ttqt

ttqt

ttt

qtt

tqttt

tttqt

tttq

tttt

qtt

tttq tq

tq

ttt

qtt

ttq

ttt

qttt

qtt

tttqt

tttt

tqt

tq

tttqt

tttt

qttt

qtt

qtt

ttqt

ttt

tqt

ttqt

ttt

tqtt

ttqt

ttt

qtt

tttqt

ttqt

ttt

qttt

qt

tq

ttqt

ttttt

qttt

qttt

tqttt

tttqt

ttt

qt

tq

ttqt

tttt

qtttt

qttt

qtt tqtt

ttq

ttq

ttt

qtt

ttqt

ttqt

ttt

qttt

tq

ttqtt

ttt

qt

tttqt

tttqt

ttt

qt

tttqtt

tt

qtt

qtt

tqttt

tttqt

ttq

ttt

tqtt

ttqt tqt

ttt

qttt

qtt

ttq

ttt

tqtt

ttqt

tttt

qt tqtt

tqt qt q q q jInformacje dodatkowe

strona projektu na SourceForge (pobieranie, bug-tracker):https://sourceforge.net/projects/poliqarp2/

licencja: GPL3publiczny dostęp do wyszukiwarki w ramach infrastrukturyCLARIN-PL: http://poliqarp.clarin-pl.eu/

Pytania?

16 / 16