2168
CONVERSÃO DE SINAIS DE ÁUDIO PARA TEXTO ATRAVÉS DA REDE NEURAL DEEP SPEECH;
REINALDO BORGES SALLA, BLANCA ROSA MAQUERA SOSA;
Arquivo não encontrado
COBENGE19
[35] 13. Temas Transversais à Educação em Engenharia
[126] 13.1 Outros aspectos relevantes relacionados à Educação em Engenharia de uma maneira geral
Este trabalho possui o objetivo de promover a conversão de fala para texto utilizando técnicas de inteligência artificial. Redes neurais profundas vêm ganhando a atenção da comunidade acadêmica e consistem em uma metodologia atraente para solucionar problemas envolvendo a conversão de sinais sequenciais no tempo em um conjunto de letras e palavras que podem ser processadas em máquinas e computadores. A rede neural Deep Speech foi lançada em 2017 pelo grupo Mozilla e pode ser considerada um modelo eficiente treinado de ponta-a-ponta. Assim, utilizando a linguagem de programação Python e conduzindo testes através do conjunto de dados VoxForge, foi possível implementar um sistema que promove a conversão de fala para texto efetuando o reconhecimento correto das letras e a separação correta das palavras.
Inteligência Artificial, Redes Neurais Profundas, DeepSpeech
Voltar