Usługa poprawia błędy w gramatyczne w dokumentach po polsku. Do poprawy tekstu wykorzystuje narzędzie LanguageTool.
any2txt|speller
any2txt|spacy({"method":"speller","lang":"pl"})|speller({"format":"spacy"})
Plik tekstowy zakodowany w UTF8 lub zip z plikiem tekstowym zakodowanym w ccl, plikiem tektowym zawierającym indexy nazw własnych, plikiem tekstowych zawierającym indexy zdań w języku innym niż polski.
Plik tekstowy zakodowany w UTF8 z poprawionymi wykrytymi błędami.
speller({"format":"spacy","lang":"pl"})
format
może przyjmować następujące wartości:Każda inna wartość opcji format
jest traktowana jako domyślna. Domyślne jest przyjęcie na input pliku tekstowego.
lang
może przyjmować następujące wartości (domyślna pogrubiona):from lpmn_client import download_file, upload_file
from lpmn_client import Task
task = Task(lpmn='any2txt|speller')
task.email = "example@mail.com" # change e-mail
file_id = upload_file("./test.zip") # zip file with some documents (for example docx files)
output_file_id = task.run(file_id)
download_file(output_file_id, "./out")
(C) CLARIN-PL