LPMN CLI Tool to narzędzie służące do komunikacji z serwerem zapytań LPMN za pomocą wiersza polecenia na lokalnym komputerze. Należy je pobrać przed uruchomieniem.
Pozwala na przetwarzanie tekstu według wybranego zapytania LPMN i wywołanie dowolnej usługi NLP Clarin poprzez wskazanie w zapytaniu właściwych jej narzędzi przetwarzania tekstu.
Praca z LPMN CLI Tool wymaga podstawowej znajomości obsługi wiersza polecenia.
Aby korzystać z LPMN CLI Tool należy:
Pobieranie następuje za pomocą menedżera projektów Python – pip. W wiersz polecenia należy wpisać komendę:
pip install --extra-index-url https://pypi.clarin-pl.eu/simple/ lpmn_client_biz
Poprawne pobranie powinno zakończyć się komunikatem z informacją zwrotną o pobranej wersji programu:
Successfully installed lpmn_client_biz-2.*
Aby sprawdzić poprawność pobierania, należy wpisać w wiersz polecenia komendę:
lpmn_client_biz
Jeśli program został poprawnie pobrany, zostanie wyświetlona informacja:
usage: lpmn_client_biz [-h] [-v] [-it {text,file,file_id}] [-o OUTPUT] [-ot {text,file,file_id}] [-f FILENAME] [-t TIMEOUT] [-u USERNAME] [-p PASSWORD] [--url URL] [-c CONFIG] lpmn input
Aby uruchomić LPMN CLI Tool, należy wprowadzić w wierszu poleceń poprawną składniowo komendę z zapytaniem lpmn. Na przykład:
lpmn_client_biz ['any2txt','morphodita',{'liner2':{'model':'n82'}}] "Ala ma kota" nazwa.uzytkownika@pwr.edu.pl -p "moje&haslo72" -ot text -v
Komenda zawierająca opis potoku przetwarzania tekstu powinna zawierać następujące elementy:
lpmn_client_biz – nazwa uruchamianego programu
Argumenty pozycyjne – elementy wymagane, muszą zostać wpisane w podanej kolejności:
lpmn – zapytanie lpmn w formie JSONa, czyli kolejność narzędzi do przetwarzania tekstu np.: ['any2txt','morphodita',{'liner2':{'model':'n82'}}]
Uwaga!
Informacje dotyczące składni zapytania LPMN są dostępne tutaj.
input – dane wejściowe. Mogą być wpisane bezpośrednio w komendę np. "Ala ma kota"
lub wprowadzone w postaci ścieżki do pliku na komputerze lokalnym, albo ścieżki na serwerze. W przypadku podania ścieżki do pliku lub na serwerze wymagane jest zdefiniowanie w komendzie opcji -it file/file_id
. Podanie tekstu bezpośrednio w komendzie nie wymaga definiowania dodatkowych opcji, ponieważ tekst jest pobierany domyślnie.
Opcje – elementy dodatkowe, kolejność dowolna, mogą zostać wpisane lub nie w zależności od zadania:
-h
– pomoc
-v
– tryb gadatliwy czyli tryb informacji pełnej. Ten tryb wypisuje szczegółowe informacje o procesie wykonywanych operacji w formie m. in. paska postępu, dzięki czemu wiadomo, jaka część zadania została do przetworzenia.
-it
– definiuje typ danych wejściowych według trzech możliwych:
text
– zawarty w cudzysłowie tekst do przetworzenia wpisany w komendę np. "Ala ma kota"
. Jest to opcja zdefiniowana domyślnie, dlatego nie wymaga dodatkowego definiowana w komendzie.file
– ścieżka do pliku, folderu lub folderu .zip na komputerze lokalnym zawierającym dane wejściowe. Wymaga zdefiniowania w komendzie jako: ~\plik.txt -it file
. Typ danych wejściowych zależy od użytych narzędzi przetwarzania tekstu.file_id
– ścieżka na serwerze do danych wejściowych pobieranych z serwera np. jako wynik poprzedniej operacji-o
– definiuje nazwę folderu, w którym zostaną zapisane wyniki przetwarzania np. -o Zadanie1
. Jeśli dany folder nie istnieje, zostanie utworzony. Możliwe jest też wskazanie ścieżki do folderu np. ~\Desktop\LPMN\Outputs\Zadanie1
. Jeśli podana ścieżka nie istnieje, również zostanie utworzona, a dane wyjściowe zostaną zapisane w folderze końcowym.
-ot
– określa typ danych wyjściowych. Podobnie jak w przypadku danych wejściowych istnieją trzy typy danych wyjściowych:
text
– wyświetla w wierszu polecenia wynik przetwarzania tekstu, wymaga zdefiniowania jako -ot text
file
– pobiera plik z wynikiem przetwarzania na lokalny komputer, jest to opcja zdefiniowana domyślniefile_id
– ścieżka na serwerze do danych wyjściowych. Plik wyjściowy nie jest pobierany, lecz zwracana jest jego ścieżka na serwerze. Wymaga zdefiniowania jako -ot file_id
.-f
– pozwala zdefiniować nazwę pobranego pliku z wynikami przetwarzania. Podanie w komendzie: -f result.xml
spowoduje utworzenie pliku .xml o nazwie result, w którym znajdować się będą wyniki przetwarzania. Brak zdefiniowanego -f
spowoduje utworzenie domyślnej nazwy pliku. Plik jest zapisywany w folderze zdefiniowanym za pomocą -o
.
Uwaga! Część narzędzi LPMN, np. TermoPL, zwraca dane wyjściowe w folderze .zip. W ich przypadku podanie -f result.xml
nie spowoduje utworzenia pliku .xml, lecz result.zip.
-t
– limit czasu na wykonanie zadania. Domyślnie program zakończy działanie po wykonaniu wszystkich operacji, dlatego opcja nie wymaga dodatkowego definiowana. W przypadku dużych operacji można ustawić limit czasu w sekundach np. -t 10
. Jeśli limit czasu zostanie ustawiony i przekroczony, a przetwarzanie nie zostanie ukończone, zadanie zostanie anulowane i zostanie wyświetlony komunikat o błędzie.
-u
– nazwa użytkownika taka jak w danych logowania do strony CLARIN-PL np. -u nazwa.uzytkownika@pwr.edu.pl
. Wymaga zdefiniowania w komendzie.
-p
– hasło użytkownika takie jak w danych logowania strony CLARIN-PL np. -p moje&haslo72
. Wymaga zdefiniowania w komendzie. Uwaga! Niektóre znaki specjalne wymagają użycia cudzysłowu: -p "moje&haslo72!"
.
-c
– konfiguracja. Pozwala na uwierzytelnienie użytkownika za pomocą danych logowania do strony CLARIN-PL zapisanych na komputerze lokalnym bez konieczności podawania ich w komendzie.
Jeśli plik config.yml
zostanie zapisany w dowolnej lokalizacji, ścieżkę do pliku należy zdefiniować w komendzie za pomocą np. -c ~\Desktop\LPMN\config.yml
.
Definiowanie ścieżki nie jest wymagane, gdy plik został zapisany:
C:\Users\nazwa_użytkownika
. Jeśli lpmn_client_biz jest uruchamiany z tej lokalizacji, bieżącym folderem jest nazwa_użytkownika. Bieżący folder można zmienić, uruchamiając lpmn_client_biz z innej lokalizacji.C:\Users\nazwa_uzytkownika\AppData\Local\.clarin\config.yml
.Przygotowanie danych wejściowych zależy od wybranych usług przetwarzania tekstu. Mogą być podane w postaci tekstu w komendzie, ścieżki do pliku/folderu/folderu .zip lub ścieżki na serwerze.
Lokalizacja pobranego pliku z danymi wyjściowymi zależy od ustawień danych wyjściowych. Jeśli opcja -o
zostanie zdefiniowana, plik zostanie pobrany do wskazanego folderu. Jeśli nie, plik zostanie pobrany do aktualnego katalogu roboczego (ang. current working directory).
W Windowsie po uruchomieniu wiersza polecenia domyślną lokalizacją użytkownika jest C:\Users\nazwa_użytkownika. Jeśli lpmn_client_biz jest uruchamiany z tej lokalizacji, jest ona domyślną lokalizacją pobierania. Można ją zmienić, uruchamiając lpmn_client_biz z innej lokalizacji.
Wynik przetwarzania będzie też dostępny na liście zadań zakończonych na stronie. Aby go pobrać, należy zalogować się do CLARIN-PL i w menu bocznym wybrać opcję Lista zadań. Aby przejść do listy poprawnie zakończonych zadań, należy wybrać opcję Zakończone. Pobrane wyniki zostaną zapisane na komputerze lokalnym w folderze Pobrane.
Typ danych wyjściowych zależy od wybranych usług przetwarzania tekstu.
Wersję aktualnie używanego narzędzia można sprawdzić za pomocą komendy:
pip show lpmn_client_biz
natomiast komenda:
pip install -U --extra-index-url https://pypi.clarin-pl.eu/simple/ lpmn_client_biz
zaktualizuje LPMN CLI Tool do najnowszej dostępnej wersji. Dostępność aktualizacji można sprawdzić, porównując lokalny numer wersji z najnowszą dostępną na serwerze PyPI.
Jeśli praca z LPMN CLI Tool została zakończona i narzędzie nie będzie potrzebne w przyszłości, można je usunąć za pomocą komendy:
pip uninstall lpmn_client_biz
Konieczne będzie potwierdzenie akcji przez wpisanie znaku y
– yes w linii polecenia. Aby anulować usuwanie, należy wpisać n
– no.
Jeśli dla pip nie na dodanego aliasu pip3, wszystkie komendy zaczynające się od pip należy wpisać jako pip3.
Informacje dotyczące pracy w Linuksie są dostępne w dokumencie LPMN Client. Wytyczne dla użytkownika w rozdziale [4] Praca z LPMN CLI Tool w systemie Linux.
(C) CLARIN-PL