
Tell your friends about this item:
Quem falou quando?
Maral Dadvar
Quem falou quando?
Maral Dadvar
A diarização do orador é o processo que detecta os oradores activos e agrupa os sinais de fala que foram proferidos pelo mesmo orador. Geralmente podemos encontrar duas aplicações principais para a diarização de alto-falantes. Os sistemas de reconhecimento automático da fala fazem uso dos grupos homogéneos de alto-falantes para adaptar os modelos acústicos para serem dependentes do altifalante e, portanto, aumentar o desempenho do reconhecimento. Os sistemas de indexação e rica transcrição do altifalante também utilizam a saída de diarização do altifalante como uma das informações extraídas de uma gravação, que permitem a sua indexação automática e outros processamentos posteriores. Neste estudo é desenvolvida uma aplicação de diarização do altifalante - utilizando gravações de fala binaural multipartidárias - para acompanhar a actividade do altifalante com base em sinais de diferença de tempo interaural (ITD). Estas indicações, para um determinado quadro de sinal de fala, são computadas utilizando a técnica de filtragem gammatone e de correlação cruzada. Os seus valores são utilizados para determinar qual dos oradores na gravação produz o fragmento de fala considerado. Este estudo foi supervisionado pelo Dr. Jon Barker, e defendeu o cumprimento dos requisitos para o grau de Mestrado em Ciência Informática Avançada, Universidade de Sheffield, Reino Unido, 2007.
Media | Books Paperback Book (Book with soft cover and glued back) |
Released | January 2, 2021 |
ISBN13 | 9786203172423 |
Publishers | Edicoes Nosso Conhecimento |
Pages | 68 |
Dimensions | 152 × 229 × 4 mm · 119 g |
Language | Portuguese |