Przed skorzystaniem z usługi należy zapoznać się z informacjami wstępnymi zawierającymi opis kroków umożliwiających dostęp do interfejsu programistycznego CLARIN-PL.
Any2txt to usługa konwertująca plik zawierający tekst na tekst. Wykorzystuje pakiet Apache Tika.
Uwaga!
Jeśli dane wejściowe są importowane w formie pliku, usługa powinna być używana jako pierwsza w potoku przetwarzania.
Any2txt można uruchomić za pomocą zapytania LPMN w usłudze LPMN Client:
Any2txt można wywołać w systemie Windows za pomocą następującego zapytania LPMN: ['any2txt']
.
[['any2txt']]
- dane wejściowe w postaci folderu skompresowanego (.zip)
Brak parametrów do ustawienia.
Plik zawierający tekst np. w formacie doc, docx, xlsx, txt.
Plik tekstowy w kodowaniu UTF-8 ograniczony do 1 GB.
W Colabie: Any2txt - konwersja pliku zawierającego tekst na tekst
(C) CLARIN-PL