Clarin PL Logo CTJ Logo
 

Zasoby mowy projektu CLARIN-PL

Korpus nagrań studyjnych

Korpus można ściągnąć w formacie EMU-SDMS z linku poniżej. Tak ściągniętego korpusu można użyć do analizy przy pomocy narzędzia R oraz biblioteki emuR. Więcej informacji pod tym linkiem.

Link do korpusu

Przeglądarka EMU-WebApp

Korpus można też objerzeć bez ściągania korzystając z linku poniżej:

Link do usługi

Licencja do korpusu

LICENSE

Kaldi baseline

Pod linkiem poniżej można znaleźć informacje na temat wersji korpusu przygotowanej do wytrenowania systemu rozpoznawania mowy opartego o system LVSCR Kaldi. Tam znajdują się wszystkie opisy i skrypty pozwalające na samodzielne wytrenowanie systemu.

https://github.com/danijel3/ClarinStudioKaldi