Até pouco tempo atrás, a ideia pareceria ter saído de um roteiro de filme de ficção científica: um sistema de conversão de textos para fala que, sem utilizar gravações, consegue reproduzir emoções humanas. Contudo, expressões de raiva, tristeza, alegria e outros estados de humor podem ser simulados por uma voz artificial, mostra um estudo da Universidade Estadual de Campinas (Unicamp), que aprimorou o modo como se obtém fala a partir de textos com base em modelos estatísticos e aproximou, um pouco mais, a realidade da ficção.
De acordo com a pesquisadora Sarah Negreiros de Carvalho, autora do projeto, a ideia de aprimorar o modo como textos são convertidos em falas digitais surgiu da percepção de que essa área de pesquisa é muito promissora. “Existem várias técnicas para a síntese de voz, transformando textos em fala ou mesmo realizado o processo contrário. Utilizamos as técnicas mais recentes que permitem novas possibilidades, como poder inserir emoções no discurso lido pelo sistema, alterar características da voz, apenas trabalhando com modelos matemáticos”, explica.
Até pouco tempo atrás, a ideia pareceria ter saído de um roteiro de filme de ficção científica: um sistema de conversão de textos para fala que, sem utilizar gravações, consegue reproduzir emoções humanas. Contudo, expressões de raiva, tristeza, alegria e outros estados de humor podem ser simulados por uma voz artificial, mostra um estudo da Universidade Estadual de Campinas (Unicamp), que aprimorou o modo como se obtém fala a partir de textos com base em modelos estatísticos e aproximou, um pouco mais, a realidade da ficção.
De acordo com a pesquisadora Sarah Negreiros de Carvalho, autora do projeto, a ideia de aprimorar o modo como textos são convertidos em falas digitais surgiu da percepção de que essa área de pesquisa é muito promissora. “Existem várias técnicas para a síntese de voz, transformando textos em fala ou mesmo realizado o processo contrário. Utilizamos as técnicas mais recentes que permitem novas possibilidades, como poder inserir emoções no discurso lido pelo sistema, alterar características da voz, apenas trabalhando com modelos matemáticos”, explica.
Fonte: Correio Braziliense