Przed skorzystaniem z usługi należy zapoznać się z informacjami wstępnymi zawierającymi opis kroków umożliwiających dostęp do interfejsu programistycznego CLARIN-PL.
Dewulgaryzator to usługa umożliwiająca zastąpienie wyrażeń wulgarnych ich niewulgarnymi odpowiednikami przy jednoczesnym zachowaniu pierwotnego charakteru tekstu. Jest dostępna dla języka polskiego. Wykorzystuje narzędzie DEPOTx IPI PAN.
Działa w oparciu o model t5-DEPOTxT5-base.
Usługa może pomóc w utrzymaniu odpowiedniego poziomu kultury wypowiedzi, a zdewulgaryzowany tekst przyda się wszędzie tam, gdzie kluczowe są profesjonalizm, zrozumienie i kulturalna komunikacja. Dzięki niej tekst może być bardziej odpowiedni i akceptowalny dla szerszej publiczności.
Dewulgaryzator można uruchomić:
Dewulgaryzator można wywołać w systemie Windows z wartościami domyślnymi za pomocą następującego zapytania LPMN: ['any2txt','txt2txt']
[['any2txt','txt2txt']]
- dane wejściowe w postaci folderu skompresowanego (.zip)Brak parametrów do ustawienia.
Plik tekstowy.
Zdewulgaryzowany plik tekstowy.
W Colabie: Dewulgaryzator - podmiana wulgaryzmów w tekście
Cezary Klamra, Grzegorz Wojdyga, Sebastian Żurowski, Paulina Rosalska, Matylda Kozłowska & Maciej Ogrodniczuk (2022) "Devulgarization of Polish Texts Using Pre-trained Language Models", Computational Science – ICCS 2022. Lecture Notes in Computer Science, vol. 13351, Springer, Cham, 49--55.
(C) CLARIN-PL