Dostępne modele:
To model generujący streszczenia tekstu bazujący na modelu plT5. Był trenowany na dostępnych zbiorach streszczeń oraz dodatkowych danych wygenerowanych z użyciem modelu gpt3.5.
Jako dane wejściowe przyjmuje tekst do streszczenia o maksymalnej długości 512 tokenów w postaci: "summarize: <text_do_streszczenia>".
Model t5-DEPOTxT5-base umożliwia zastąpienie wyrażeń wulgarnych ich niewulgarnymi odpowiednikami przy jednoczesnym zachowaniu charakteru tekstu. Jest dostępny tylko dla języka polskiego.
Szczegółowe informacje można znaleźć tutaj.
Model t5-utterance-rewriting-v2-plt5-large służy do parafrazowania tekstu. Był uczony na zbiorach podlinkowanych na danych wygenerowanych automatycznie za pomocą GPT3.5 i wyłącznie dla języka polskiego. Model w obecnej wersji nie daje użytkownikowi kontroli nad tym, jak bardzo wygenerowany tekst różni się od tekstu wejściowego.
(C) CLARIN-PL