Spokes jest multimodalną wyszukiwarką dla korpusu polszczyzny konwersacyjnej. Umożliwia bardzo zaawansowaną eksplorację korpusu na podstawie formułowanych zapytań oraz wizualizację danych. Interfejs i dokumentacja są dostępne tylko w języku angielskim. Możliwy jest też dostęp programistyczny do danych tekstowych i nagrań poprzez dedykowane usługi.
Spokes jest rozwijany na Uniwersytecie Łódzkim przez zespół PELCRA w ramach Polskiej Infrastruktury CLARIN.
Korpus zawiera obecnie 658,181 wypowiedzi (8,535,617 słów, 1024 godzin), które zostały wyekstrahowane z 1,594 transkrypcji głównie nieformalnych rozmów. Zawiera swobodne rozmowy, które zostały nagrane w naturalnych kontekstach komunikacyjnych, a następnie przetranskrybowane, zanonimizowane, opatrzone metadanymi socjolingwistycznymi i zsynchronizowane z oryginalnym nagraniem audio. Większość transkrypcji jest powiązana z nagraniami audio.
Pełna dokumentacja Spokes dostępna jest na stronie PELCRA Tools.
Między innymi w badaniach z zakresu językoznawstwa oraz innych dyscyplin nauk humanistycznych czy społecznych wymagających analizy próbek naturalnego języka mówionego z użyciem narzędzi do eksploracji i wizualizacji danych.
Spokes jest dostępny tutaj. Nie wymaga założenia konta ani logowania się.
Spokes zawiera też eksperymentalną instancję udostępnioną dla części mówionej Brytyjskiego Korpusu Narodowego bez nagrań dostępną tutaj. Pozwala ona na eksplorację udostępnionych zbiorów danych mówionych BNC, które powstały w wyniku współpracy The British Library Sound Archive i Phonetics Laboratory (University of Oxford).
Spokes używa składni zapytań SlopeQ 2. Opis struktury zapytań jest dostępny w dokumentacji Spokes na stronie PELCRA Tools.
Piotr Pęzik (2015) "Spokes – a Search and Exploration Service for Conversational Corpus Data", Selected Papers from the CLARIN 2014 Conference, October 24-25 2014, Soesterberg, The Netherlands, 99–109. Linköping Electronic Conference Proceedings. Linköping University Electronic Press, Linköpings universitet.
(C) CLARIN-PL