Przed skorzystaniem z usługi należy zapoznać się z informacjami wstępnymi zawierającymi opis kroków umożliwiających dostęp do interfejsu programistycznego CLARIN-PL.
Textclass to klasyfikator przypisujący kategorie artykułom prasowym spośród z góry określonej i skończonej listy klas inspirowanej klasami z artykułów papowych. Przypisuje artykułowi jedną lub więcej klas. Usługa powstała w celu automatyzacji klasyfikacji notek prasowych.
Jest częścią składową usługi Keytool.
album, armia, artysta zawodowy, badania, badania medyczne, bezpieczeństwo narodowe, biblioteki i muzea, bilans, biznes, broń jądrowa, budownictwo, ciekawostki, cyberbezpieczeństwo, do przerwy, dyplomacja, dyscyplina sportowa, edukacja, elektromobilność, eliminacje, ekologia, ekonomia, emisja, energia, festiwal, festiwale filmowe, festiwale muzyczne, gastronomia, gospodarka, gry, handel energią, handel międzynarodowy (zagraniczny), historia kultury, imprezy masowe, internet, inżynieria przyrządowa, katastrofy i wypadki, koncerty, konflikty, kontrakty, kopalnie węgla, kultura, kwalifikacje, literatura, ludzie, marketing, mass media, mecz, mityng, moda, monarchia, motoryzacja, mp, muzyka, nagrody, nauka, nc, niepełnosprawni, obchody, obronność, odpady, olej napędowy, oprogramowanie, organizacje międzynarodowe, oszczędność energii, otwarcie, pakiety, paliwa, papier i opakowania, policja, polityka, polityka nuklearna, pomoc rządowa, pop, praca, prawo, produkcja, produkty gumowe, przemysł, rada nadzorcza, rakiety, ranking, raport półroczny, raporty roczne, rekomendacja, renowacje budowli, rolnictwo, ropa, sieci komputerowe, siły zbrojne, sklepy specjalistyczne, spedycja i usługi pocztowe, społeczeństwo, sport, spółka, spółki przeżywające trudności finansowe, sprzęt komputerowy, sprzęt telekomunikacyjny, sprzęt wojskowy, stolica, stosunki międzynarodowe, strzelcy, styl życia i wypoczynek, surowce syntetyczne i tworzywa sztuczne, sztuka, śmierć i umieranie, środowiska kreatywne, świat, technologia, telewizja, tematyka antymonopolowa, tenis, towary rekreacyjne i sportowe, transfer, transport, turniej, turystyka, upamiętnienie, uroda, urządzenia elektryczne, usługi, usługi doradcze, wezwanie, wiadomości techniczne, wojna, wojsko, wskaźniki, wydarzenia sportowe, wydarzenie, wydawcy internetowi, wydawcy prasowi, wydawnictwa i księgarnie, wynik, wyniki, wyroki i kary, zaawansowane szkolenia, zabytki i pomniki, zagadnienia konsumenckie, zagadnienia społeczne, zagranica, zamknięcie, zamówienia, zaopatrzenie w wodę, zdrowie, zaufanie konsumentów, związki zawodowe, zwierzęta.
Usługę można uruchomić:
Usługę można wywołać w systemie Windows z wartościami domyślnymi za pomocą następującego zapytania LPMN: ['any2txt','textclass-article-tagger']
[['any2txt','textclass-article-tagger']]
- dane wejściowe w postaci folderu skompresowanego (.zip)Brak parametrów do ustawienia.
Tekst, plik tekstowy lub katalog plików .zip.
Długość pojedynczej notki powinna wynosić ok 400-500 słów.
Plik JSON zawierający następujące informacje:
filename
- nazwa plikulabel
- wyznaczone tematyprobabilities
- odpowiadające im wartości prawdopodobieństwa występowania.W Colabie: Textclass - klasyfikacja tematyczna artykułów prasowych
(C) CLARIN-PL