Zapytanie LPMN jest opisem potoku przetwarzania tekstu za pomocą narzędzi językowych, który definiuje ich kolejność i parametry. Składa się z nazw narzędzi z ewentualnymi parametrami i jest zapisywany w notacji JSON. Spis narzędzi jest dostępny tutaj.
JSON to tekstowy format zapisu danych, który w LPMN służy do zapisu potoku przetwarzania tekstu za pomocą narzędzi językowych. W LPMN jest zapisywany w postaci tablicy JSON czyli listy uporządkowanych wartości. Każdą listę zapisuje się w nawiasach kwadratowych zgodnie ze wzorem:
['narzędzie1','narzędzie2','narzędzie3']
Oznacza to, że tekst zostaje przetworzony najpierw przez narzędzie1, następnie narzędzie2, a na końcu narzędzie3.
Część narzędzi umożliwia szczegółowe zdefiniowanie parametrów przetwarzania. Aby zdefiniować narzędzie wraz z parametrami, należy użyć zapisu w postaci obiektu JSON. Obiekt to zbiór wartości składający się z par {klucz : wartość}. Każda para musi być zamknięta w nawiasach klamrowych zgodnie ze wzorem:
{'narzędzie':{'model':'nazwa_modelu'}}
W przypadku użycia kilku narzędzi kolejność przetwarzania powinna zostać zapisana w następujący sposób:
['narzędzie1','narzędzie2',{'narzędzie3':{'model':'nazwa_modelu'}},'narzędzie4']
na przykład: ['any2txt','morphodita',{'liner2':{'model':'n82'}}]
Uwaga!
Nazwy narzędzi i parametrów należy zapisać w pojedynczym cudzysłowie.
Jeśli narzędzia przyjmują wartości logiczne true/false, należy zapisać je małą literą i bez cudzysłowu.
Jeśli narzędzia przyjmują wartości liczbowe, należy zapisać je bez cudzysłowu.
W LPMN CLI Tool znaków występujących w zapytaniu nie można rozdzielać spacją.
Przykłady zapytań LPMN dla usług Clarin znajdują się przy odpowiadających im opisach.
Niektóre narzędzia np. TermoPL wymagają danych wejściowych w formie folderu. Aby oznaczyć przekazanie wyniku zapytania jako folderu, należy wykorzystać zagnieżdżoną listę, czyli ująć narzędzia generujące dane wyjściowe w formie folderu w nawias kwadratowy, na przykład:
[['any2txt',{'postagger':{'lang':'pl','output':'ccl'}}],'termopl']
Program przetworzy dokumenty wejściowe kolejno przez narzędzia:
lang
= pl
, output
= ccl
.Następnie dane wyjściowe powyższej części potoku zostaną spakowane do folderu i przekazane do narzędzia TermoPL.
Zapytanie LPMN w systemie Linux można zapisać w ten sam sposób, w jaki zapisywane jest w Windowsie, jednak dodatkowo całe zapytanie należy wtedy umieścić w cudzysłowie na przykład:
"['any2txt','morphodita',{'liner2':{'model':'n82'}}]"
Oryginalny sposób zapisu oraz informacje dotyczące pracy w Linuksie są dostępne w dokumencie LPMN Client. Wytyczne dla użytkownika w rozdziale [4] Praca z LPMN CLI Tool w systemie Linux.
(C) CLARIN-PL