Dostępne modele:
t5-clarin-keywords-plt5-small-shuffle
i t5-voicelab-vlt5-base-keywords
- wydobywanie słów kluczowycht5-plt5-large-poquad-dst-v2
- śledzenie stanu dialoguOba modele generują słowa kluczowe na podstawie tekstu wejściowego.
Model t5-clarin-keywords-plt5-small-shuffle to model generatywny trenowany na zbiorze 93 143 abstraktów artykułów naukowych w języku polskim zawartych w korpusie POSMAC (Polish Open Science Metadata Corpus) zebranym przez inicjatywę CURLICAT. Został nauczony z dodatkową augmentacją danych, co pozwala na otrzymywanie lepszych słów kluczowych niż w przypadku drugiego modelu.
Model t5-voicelab-vlt5-base-keywords to model generatywny trenowany na zbiorze 216 214 abstraktów artykułów naukowych pochodzących z tego samego korpusu POSMAC. Generuje adekwatne, choć nie zawsze wszystkie możliwe do wydobycia słowa kluczowe.
Model służy do śledzenia stanu dialogu poprzez rozpoznawanie wartości wskazanego atrybutu.
Był wstępnie uczony na danych do QA, a następnie dotrenowany na maszynowo tłumaczonych danych ze zbioru Schema-Guided Dialogue oraz danych wygenerowanych przez duży model językowy. Wspiera tylko język polski.
[U] Wypowiedź użytkownika [S] Wypowiedź agenta [U] ... [U] Najnowsza wypowiedź użytkownika. [Dziedzina] Nazwa: opis dziedziny [Atrybut] Nazwa: opis atrybutu
gdzie:
[U]
to Użytkownik,[S]
to SystemNa przykład dla danych wejściowych:
[U] Chciałbym zarezerwować stolik na godzinę 17:30 dla 3 osób w restauracji X. [Dziedzina] Restauracje: serwis rezerwacji stolików [Atrybut] Godzina: czas rezerwacji stolika
oczekiwanym rezultatem jest 17:30
.
(C) CLARIN-PL