Ajit R Patil*, Kamlesh Patil e Sonal Patil
Nas últimas décadas, com o advento da internet e das redes sociais, formou-se uma comunidade global e a sua aplicação direta a uma comunidade subdesenvolvida. A aprendizagem cognitiva é um dos campos de investigação mais procurados que procura melhorar a interação humano-computador. Este artigo apresenta uma aplicação para tradução de voz em voz utilizando uma combinação de serviços na nuvem e modelos de aprendizagem automática de última geração. Para a tradução de fala em fala, é investigada uma arquitetura trifásica que contém fala em texto baseada na nuvem, tradução de fala, extração de tokens, modelo de síntese de fala baseado em redes neuronais profundas e um vocoder também baseado em redes neuronais profundas. O nosso foco principal neste estudo é a criação de um sistema robusto para a tradução de voz em voz e a aplicação deste sistema.