wyszukiwarka korpusowa poliqarp2 - clarin...
TRANSCRIPT
q q qt
tqt
ttq
ttq
tt
qtt
qt
qt
ttqt
tt
qt
tqt
tttqt
tttt
qtt
tttqt
tttq
tttt
qtttt
qtt
tttqt
ttqt
tt
qtt
tqttt
ttqtt
tq
tqt
ttt
tqttt
tttqt
tttt
qttt
qtt
tttqt
ttqt
tttt
qtt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tqtt
ttq
tttqt
tttt
tqttt
tqt
tttqt
ttt
tq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q qWyszukiwarka korpusowaPoliqarp2
Bartosz Zaborowski
jINSTITUTE OF COMPUTER SCIENCEPOLISH ACADEMY OF SCIENCESul. Jana Kazimierza 5, 01-248 Warszawa
25 kwietnia 2016
Wstęp Dane Wyszukiwanie Informacje dodatkowe Czym jest Poliqarp2 Możliwościq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jCzym jest Poliqarp2
Wyszukiwarka korpusowa,następca Poliqarp 1.x – cała funkcjonalność zachowana,szczególnie niejednoznaczność i wyrażenia regularne nasegmentach,obsługa wielu poziomów anotacji (anotacje z NKJP i nietylko),wsparcie dla różnych rodzajów korpusów/banków (korpusyhistoryczne, grafy składniowe, struktury LFG. . . ).
2 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Czym jest Poliqarp2 Możliwościq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jMożliwości
Obsługa dużych korpusów (miliardy segmentów),REST API – łatwa integracja,graficzny interfejs z wizualizacją wyników,modułowa budowa.
3 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jTypy danych
typy proste (int, float, bool, string, enum)struktury atrybutowe (np. węzeł, krawędź, interpretacja,F-struktura)listalista wieloznaczna (np. wszystkie interpretacje segmentu)
wyróżnione rodzaje struktur: węzły wielkoskalowe, węzłyzwykłe i krawędzie2 rodzaje krawędzi: pierwotne i wtórnewęzły i krawędzie pierwotne tworzą DAG (składnia)wyróżniony atrybut type – nadaje sens poszczególnymstrukturom
4 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jTypy danych
typy proste (int, float, bool, string, enum)struktury atrybutowe (np. węzeł, krawędź, interpretacja,F-struktura)listalista wieloznaczna (np. wszystkie interpretacje segmentu)
wyróżnione rodzaje struktur: węzły wielkoskalowe, węzłyzwykłe i krawędzie2 rodzaje krawędzi: pierwotne i wtórnewęzły i krawędzie pierwotne tworzą DAG (składnia)wyróżniony atrybut type – nadaje sens poszczególnymstrukturom
4 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jModel NKJP na obrazku
doc (dokument)(metadane)
p (akapit)
s (zdanie)
syngr:. . . (grupa)orth
named:. . .(j. nazw.)
basecertainty
. . .synw (sowo sk.)
orthmsd
seg (segment)orthmsdsense
sub (podsegment)text,
newword, endword
morph (interpretacja)base
pos, case, . . .
synh : true/falsesemh : true/false
5 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jImportowanie korpusów
Poliqarp2 czyta tylko własny format .pqz,udostępniamy konwertery dla TEI (NKJP, PCC, PSC),Składnicy, wyjścia z POLFIE,łatwe tworzenie nowych konwerterów.
Najprostszy konwerterDołączony przykładowy „konwerter” z .txt to ~100 linii kodu wPythonie (z czego połowa to prosty segmentator).
6 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Modelowanie korpusu Importowanie korpusówq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jImportowanie korpusów
Poliqarp2 czyta tylko własny format .pqz,udostępniamy konwertery dla TEI (NKJP, PCC, PSC),Składnicy, wyjścia z POLFIE,łatwe tworzenie nowych konwerterów.
Najprostszy konwerterDołączony przykładowy „konwerter” z .txt to ~100 linii kodu wPythonie (z czego połowa to prosty segmentator).
6 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jMożliwości języka zapytań
Proste zapytania frazowe,specyfikacja wartości atrybutów struktur,specyfikacja relacji między węzłami
sekwencje węzłów w porządku segmentowym,relacje zadane krawędziami grafu,wyrażenia regularne na węzłach (poziome i po krawędziach)
zmienne,post-processing podobny do SQL.
7 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jMożliwości języka zapytań
Proste zapytania frazowe,specyfikacja wartości atrybutów struktur,specyfikacja relacji między węzłami
sekwencje węzłów w porządku segmentowym,relacje zadane krawędziami grafu,wyrażenia regularne na węzłach (poziome i po krawędziach)
zmienne,post-processing podobny do SQL.
7 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jMożliwości języka zapytań
Proste zapytania frazowe,specyfikacja wartości atrybutów struktur,specyfikacja relacji między węzłami
sekwencje węzłów w porządku segmentowym,relacje zadane krawędziami grafu,wyrażenia regularne na węzłach (poziome i po krawędziach)
zmienne,post-processing podobny do SQL.
7 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jZapytania proste
Nie chciałbym
Ciąg słów: [Nie] [chciał][by][m]
8 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jAtrybuty struktur
[syngr:AdjG && sons.size > 3]
Grupa przymiotnikowa z co najmniej trzema dziećmi
9 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jAtrybuty morfoskładniowe
[pos˜adj && case˜nom && {pos,case}!˜{adj,nom}]
Być może przymiotnik i być może w mianowniku, ale nie naraz
10 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jWyrażenia regularne na węzłach
[pos=adj]{3,5}
Ciąg od trzech do pięciu przymiotników
11 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jRelacje i wyrażenia regularne pionowe
[syngr:NG && span.size > 5] >[-1]+ [seg]
Skrajny prawy potomek grupy nominalnej mającej łącznie ponad 5 potomków
12 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jZapytania ogólne
($X:=Sejm && $Y:=[base=komisja]) within [doc &&taxonomy_type="#typ_qmow"]
Słowo Sejm oraz forma słowa komisja w dokumencie quasi-mówionym, przypisanieznalezionych słów na zmienne
13 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkowe Język Przykłady zapytańq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jPost-processing
[seg && orth=$O && base=$B]/pa ;;group $O, $B ;;
zip($O, ", ") group $B sort count() desc
najróżniej odmieniane formy bazowe w korpusie
14 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jStrona techniczna
wyszukiwarka:kompilowana z kodu źródłowego,dla Linuksa (i UNIX-ów),konsolowa (demon).
GUI:Aplikacja WEB-owa Django,wieloplatformowa,można używać lokalnie,łatwe przeróbki, mini-CMS.
15 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jStrona techniczna
wyszukiwarka:kompilowana z kodu źródłowego,dla Linuksa (i UNIX-ów),konsolowa (demon).
GUI:Aplikacja WEB-owa Django,wieloplatformowa,można używać lokalnie,łatwe przeróbki, mini-CMS.
15 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jInformacje dodatkowe
strona projektu na SourceForge (pobieranie, bug-tracker):https://sourceforge.net/projects/poliqarp2/
licencja: GPL3publiczny dostęp do wyszukiwarki w ramach infrastrukturyCLARIN-PL: http://poliqarp.clarin-pl.eu/
Pytania?
16 / 16
Wstęp Dane Wyszukiwanie Informacje dodatkoweq q q
ttq
ttt
qt
tqt
tq
ttq
tq
tt
tqtt
tq
ttq
ttt
tqtt
tttqt
tttt
qttt
tqt
tttqt
tttqt
tttt
qttt
qtt
tq
tttqt
tttt
qttt
qt
qtt
tttqt
tttt
tqtt
tttq
tttqt
tttt
qttt
qtt
tttqt
tq
ttqt
ttt
qtt
tttq
ttt
qtt
tttqt
ttt
qtt
ttqt
ttqt
ttt
qtt
tqttt
tttqt
tttq
tttt
qtt
tttq tq
tq
ttt
qtt
ttq
ttt
qttt
qtt
tttqt
tttt
tqt
tq
tttqt
tttt
qttt
qtt
qtt
ttqt
ttt
tqt
ttqt
ttt
tqtt
ttqt
ttt
qtt
tttqt
ttqt
ttt
qttt
qt
tq
ttqt
ttttt
qttt
qttt
tqttt
tttqt
ttt
qt
tq
ttqt
tttt
qtttt
qttt
qtt tqtt
ttq
ttq
ttt
qtt
ttqt
ttqt
ttt
qttt
tq
ttqtt
ttt
qt
tttqt
tttqt
ttt
qt
tttqtt
tt
qtt
qtt
tqttt
tttqt
ttq
ttt
tqtt
ttqt tqt
ttt
qttt
qtt
ttq
ttt
tqtt
ttqt
tttt
qt tqtt
tqt qt q q q jInformacje dodatkowe
strona projektu na SourceForge (pobieranie, bug-tracker):https://sourceforge.net/projects/poliqarp2/
licencja: GPL3publiczny dostęp do wyszukiwarki w ramach infrastrukturyCLARIN-PL: http://poliqarp.clarin-pl.eu/
Pytania?
16 / 16