Zapytanie LPMN jest opisem potoku przetwarzania tekstu za pomocą narzędzi językowych, który definiuje ich kolejność i parametry. Składa się z nazw narzędzi z ewentualnymi parametrami i jest zapisywany w notacji JSON. Spis narzędzi jest dostępny tutaj.
JSON to tekstowy format zapisu danych, który w LPMN służy do zapisu potoku przetwarzania tekstu za pomocą narzędzi językowych. W LPMN jest zapisywany w postaci tablicy JSON czyli listy uporządkowanych wartości. Każdą listę zapisuje się w nawiasach kwadratowych zgodnie ze wzorem:
['narzędzie1','narzędzie2','narzędzie3']
Oznacza to, że tekst zostaje przetworzony najpierw przez narzędzie1, następnie narzędzie2, a na końcu narzędzie3.
Część narzędzi umożliwia szczegółowe zdefiniowanie parametrów przetwarzania. Aby zdefiniować narzędzie wraz z parametrami, należy użyć zapisu w postaci obiektu JSON. Obiekt to zbiór wartości składający się z par {klucz : wartość}. Każda para musi być zamknięta w nawiasach klamrowych zgodnie ze wzorem:
{'narzędzie':{'parametr':'wartość'}}
W przypadku użycia kilku narzędzi kolejność przetwarzania powinna zostać zapisana w następujący sposób:
['narzędzie1','narzędzie2',{'narzędzie3':{'parametr':'wartość'}},'narzędzie4']
na przykład: ['any2txt','morphodita',{'liner2':{'model':'n82'}}]
Uwaga!
Przykłady zapytań LPMN dla usług Clarin znajdują się przy odpowiadających im opisach.
Niektóre narzędzia np. TermoPL wymagają danych wejściowych w formie folderu zawierającego pliki .xml w formacie CCL. Aby oznaczyć przekazanie wyniku zapytania jako folderu, należy wykorzystać zagnieżdżoną listę, czyli ująć poprzedzające TermoPL narzędzia generujące dane wyjściowe w formie folderu w nawias kwadratowy. Na przykład:
[['any2txt',{'postagger':{'lang':'pl','output':'ccl'}}],'termopl']
Program przetworzy dokumenty wejściowe kolejno przez narzędzia:
lang
= pl
, output
= ccl
.Następnie dane wyjściowe powyższej części potoku zostaną spakowane do folderu i przekazane do narzędzia TermoPL.
Zapytanie LPMN w systemie Linux można zapisać w ten sam sposób, w jaki zapisywane jest w Windowsie, jednak dodatkowo całe zapytanie należy wtedy umieścić w cudzysłowie na przykład:
"['any2txt','morphodita',{'liner2':{'model':'n82'}}]"
Oryginalny sposób zapisu oraz informacje dotyczące pracy w Linuksie są dostępne w dokumencie LPMN Client. Przewodnik użytkownika w rozdziale [4] LPMN CLI Tool w systemie Linux.
(C) CLARIN-PL