XII edycja - abstrakty
Główna | Organizacja | Abstrakty | Program | Ankieta |
Prezentujemy listę referentów oraz tytułów wystąpień wraz ze streszczeniami. Zapraszamy do lektury!
Przypominamy, że język, w którym podany jest tytuł, jest równoznaczny z językiem całego wystąpienia.
Pod każdym streszczeniem widoczny jest skrócony program (aktualny na 19.10.2020), dzięki któremu można dowiedzieć się, jakie inne referaty będą wygłaszane podczas danej sekcji.
Piotr Maleszewski (Uniwersytet im. Adama Mickiewicza w Poznaniu)
Techniki syntezy mowy w oparciu o odtworzenie struktur formantowych głosek
Współczesne technologie syntezy mowy skoncentrowane są na wykorzystaniu nagranych fragmentów mowy. Przetworzone z tekstu na mowę frazy wykorzystywane są w powszechnych nośnikach typu: nawigacja, asystent głosowy w telefonie czy komputerze, w punktach obsługi klienta itp. Synteza mowy opiera się na przekształceniu tekstu pisanego na sygnał dźwiękowy. Dynamicznie rozwijające się technologie, zjawisko globalizacji prowokują dążenia do udoskonalania syntezatorów mowy, czyli umożliwienia tworzenia mowy syntezowanej w taki sposób, by jak najwierniej pod względem fonetycznym odpowiadała mowie człowieka. W latach 30. prekursor badań, Homer Dudley, porównywał tor sygnału mowy do toru sygnału radiowego. Udowodnił tym samym, że możliwe jest stworzenie sygnału mowy bez nagrywania ludzi. Z jego badań wynika, że przy zastosowaniu filtrów pasmowo – przepustowych można symulować ułożenie aparatu mowy. Inną perspektywę zaprezentował Philip Rubin. Zauważył on, że możliwe jest wygenerowanie tych samych częstotliwości za pomocą zestawów oscylatorów o przestrajalnej częstotliwości.
Celem artykułu jest przegląd technik syntezy mowy opierających się na odtworzeniu struktury formantowej głosek przy zastosowaniu urządzeń elektronicznych lub ich symulacji cyfrowych. Przegląd został oparty na literaturze opisującej m.in. formantową strukturę głosek oraz techniki syntezy dźwięku. Analiza przedstawiona została w kontekście oceny jakości produkowanej mowy pod względem zrozumiałości i naturalności, co w efekcie pozwoli na określenie kierunków rozwoju syntezatorów mowy oraz ich przydatność w zastosowaniach technologicznych.
Gdzie i kiedy:
W tym samym czasie ... sekcja 3 | sekcja 4 moderacja: Agata Rosicka / Michał Buss |
11:30-11:50 | Natika Puthran (Uniwersytet im. Adama Mickiewicza w Poznaniu) - Bambaiya Hindi - Pidgin or Dialect? |
11:50-12:10 | Aleksandra Dekielińska (Uniwersytet im. Adama Mickiewicza w Poznaniu) - Interpersonal communication and deaf people. A brief introduction to Indian Sign Language |
12:10-12:30 | Łukasz Putko (Uniwersytet im. Adama Mickiewicza w Poznaniu) - Infelicity of dexterity? Repairing talk in conversations |
12:30-12:50 | Piotr Maleszewski (Uniwersytet im. Adama Mickiewicza w Poznaniu) - Techniki syntezy mowy w oparciu o odtworzenie struktur formantowych głosek |
12:50-13:20 | dyskusja |