Przed skorzystaniem z usługi należy zapoznać się z informacjami wstępnymi zawierającymi opis kroków umożliwiających dostęp do interfejsu programistycznego CLARIN-PL.
Herference to usługa służąca do wykrywania relacji koreferencji w tekście w języku polskim. Wynik przetwarzania zapisywany jest do pliku html zawierającego wizualizację wykrytych koreferencji. Usługa wykorzystuje narzędzie Herference IPI PAN wdrożone w zasobach infrastruktury Clarin-PL.
Wykorzystuje model HerBERT3 czyli model BERT po wstępnym treningu generujący tekst dla języka polskiego. Maksymalna długość danych wejściowych to 512 tokenów, więc dłuższe teksty są dzielona na kawałki po końcach zdań, jeśli to tylko możliwe.
Usługę można uruchomić:
Usługę można wywołać w systemie Windows z wartościami domyślnymi za pomocą następującego zapytania LPMN: ['any2txt','herference']
[['any2txt','herference']]
- dane wejściowe w postaci folderu skompresowanego (.zip)Brak parametrów do ustawienia.
Tekst
Plik html zawierający wizualizację wykrytych koreferencji
W Colabie: Herference - wykrywanie relacji koreferencji w tekście
Karol Saputa (2022) "Coreference Resolution for Polish: Improvements within the CRAC 2022 Shared Task", Proceedings of the CRAC 2022 Shared Task on Multilingual Coreference Resolution, Association for Computational Linguistics: Gyeongju, Republic of Korea, 18–22.
(C) CLARIN-PL