Strona główna Strona główna projektu Repozytorium Kontakt

Normalizacja audio

Powrót

Opis narzędzia

Konwersja pliku multimedialnego (audio lub wideo) na plik audio typu WAV, o częstotliwości próbkowania 16 kHz, jednym kanale (mono) oraz rozdzielczości 16 bitów.

Wczytaj plik audio:

Przykład korzystania z usługi z linii poleceń

Usługę uruchamiamy następującym poleceniem:

curl -s -F "file=@audio.mp3" http://mowa.clarin-pl.eu/tools/audio/normalize

Co wygeneruje identyfikatory plików wejścia i wyjścia w formacie JSON, np:

{"input": "59a29a9939ec7816a70529e3", "output": "59a2eaad39ec785da49ac86a"}

Plik można pobrać według identyfikatora poleceniem download, np:

curl http://mowa.clarin-pl.eu//tools/download/59a2eaad39ec785da49ac86a -o output.wav

Jeśli plik jest jeszcze przetwarzany, otrzymamy kod statusu 503. W przypadku błędu, otrzymamy kod 500. Status można sprawdzić również poleceniem status, np:

curl http://mowa.clarin-pl.eu//tools/status/59a2eaad39ec785da49ac86a

Polecenie to może zwrócić wartości ok, kiedy plik jest gotowy do ściągnięcia, wait, jeśli jest wciąż przetwarzany, oraz error (z opisem), jeśli wystąpił błąd.

Plik wejściowy można też nagrać poleceniem upload, np:

curl -s -F "file=@audio.mp3" http://mowa.clarin-pl.eu/tools/upload/audio

Co wygeneruje identyfikator pliku wejściowego, który można przekazać do pierwszego polecenia, jak wyżej:

curl http://mowa.clarin-pl.eu//tools/audio/normalize/59a29a9939ec7816a70529e3

Co wygeneruje identyfikator pliku wyjściowego, który można przekazać do poleceń download oraz status, tak jak pokazano wyżej.

Cytowanie

Osoby korzystające z zasobów lub narzędzi proszone są o cytowanie następującej publikacji:

Danijel Koržinek, Krzysztof Marasek, Łukasz Brocki and Krzysztof Wołk: Polish Read Speech Corpus for Speech Tools and Services, Selected papers from the CLARIN Annual Conference 2016, Aix-en-Provence, 26–28 October 2016, CLARIN Common Language Resourcesand Technology Infrastructure, number 136, pages 54–62. LinköpingUniversity Electronic Press, Linköpings universitet, 2017.

Link do pracy