ABENGE

Código:
2168

Título do Artigo:
CONVERSÃO DE SINAIS DE ÁUDIO PARA TEXTO ATRAVÉS DA REDE NEURAL DEEP SPEECH;

Autores:
REINALDO BORGES SALLA, BLANCA ROSA MAQUERA SOSA;

Arquivo não encontrado

Evento:
COBENGE19

Área:
[35] 13. Temas Transversais à Educação em Engenharia

Sub-área:
[126] 13.1 Outros aspectos relevantes relacionados à Educação em Engenharia de uma maneira geral

Resumo:
Este trabalho possui o objetivo de promover a conversão de fala para texto utilizando técnicas de inteligência artificial. Redes neurais profundas vêm ganhando a atenção da comunidade acadêmica e consistem em uma metodologia atraente para solucionar problemas envolvendo a conversão de sinais sequenciais no tempo em um conjunto de letras e palavras que podem ser processadas em máquinas e computadores. A rede neural Deep Speech foi lançada em 2017 pelo grupo Mozilla e pode ser considerada um modelo eficiente treinado de ponta-a-ponta. Assim, utilizando a linguagem de programação Python e conduzindo testes através do conjunto de dados VoxForge, foi possível implementar um sistema que promove a conversão de fala para texto efetuando o reconhecimento correto das letras e a separação correta das palavras.

Palavras-chaves:
Inteligência Artificial, Redes Neurais Profundas, DeepSpeech

Voltar