Universidad de Costa Rica
  • Sobre Kérwá
  • Acceso Abierto
  • Cómo Depositar
  • Políticas
  • Contacto
    • español
    • English
  • español 
    • español
    • English
  • Acceder
Ver ítem 
  •   Repositorio Kérwá
  • Investigación
  • Ingeniería
  • Ingeniería eléctrica
  • Ver ítem
  •   Repositorio Kérwá
  • Investigación
  • Ingeniería
  • Ingeniería eléctrica
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Improving post-filtering of artificial speech using pre-trained LSTM neural networks

artículo científico
Thumbnail
Ver/
Artículo principal (427.8Kb)
Fecha
2019
Autor
Coto Jiménez, Marvin
Metadatos
Mostrar el registro completo del ítem
Resumen
Several researchers have contemplated deep learning-based post-filters to increase the quality of statistical parametric speech synthesis, which perform a mapping of the synthetic speech to the natural speech, considering the different parameters separately and trying to reduce the gap between them. The Long Short-term Memory (LSTM) Neural Networks have been applied successfully in this purpose, but there are still many aspects to improve in the results and in the process itself. In this paper, we introduce a new pre-training approach for the LSTM, with the objective of enhancing the quality of the synthesized speech, particularly in the spectrum, in a more efficient manner. Our approach begins with an auto-associative training of one LSTM network, which is used as an initialization for the post-filters. We show the advantages of this initialization for the enhancing of the Mel-Frequency Cepstral parameters of synthetic speech. Results show that the initialization succeeds in achieving better results in enhancing the statistical parametric speech spectrum in most cases when compared to the common random initialization approach of the networks.
URI
https://hdl.handle.net/10669/86280
Enlace externo al ítem
10.3390/biomimetics4020039
https://www.mdpi.com/2313-7673/4/2/39
Colecciones
  • Ingeniería eléctrica [93]



  • Repositorios universitarios

  • Repositorio del SIBDI-UCR
  • Biblioteca Digital del CIICLA
  • Repositorio Documental Rafael Obregón Loría (CIHAC)
  • Biblioteca Digital Carlos Melendez (CIHAC)
  • Repositorio de Fotografías
  • Colección de videos de UPA-VAS
  • Sitios recomendados

  • Buscador regional de LA Referencia
  • Buscador del Open ROAR
  • Scientific Electronic Library Online (SciELO)
  • Directory of Open Access Journals (DOAJ)
  • Redalyc
  • Redes sociales

  • facebook.com/repositoriokerwa
  • @Ciencia_UCR
  • Sobre Kérwá
  • Acceso Abierto
  • Cómo depositar
  • Políticas
Contacto | Sugerencias
Repositorio Institucional de la Universidad de Costa Rica. Algunos derechos reservados. Este repositorio funciona con DSpace.
 

 

Listar

Todo KérwáComunidades & ColeccionesTítulosAutoresPalabra clavePor procedenciaPor tipoEsta colecciónTítulosAutoresPalabra clavePor procedenciaPor tipo

Mi cuenta

AccederRegistro

  • Repositorios universitarios

  • Repositorio del SIBDI-UCR
  • Biblioteca Digital del CIICLA
  • Repositorio Documental Rafael Obregón Loría (CIHAC)
  • Biblioteca Digital Carlos Melendez (CIHAC)
  • Repositorio de Fotografías
  • Colección de videos de UPA-VAS
  • Sitios recomendados

  • Buscador regional de LA Referencia
  • Buscador del Open ROAR
  • Scientific Electronic Library Online (SciELO)
  • Directory of Open Access Journals (DOAJ)
  • Redalyc
  • Redes sociales

  • facebook.com/repositoriokerwa
  • @Ciencia_UCR
  • Sobre Kérwá
  • Acceso Abierto
  • Cómo depositar
  • Políticas
Contacto | Sugerencias
Repositorio Institucional de la Universidad de Costa Rica. Algunos derechos reservados. Este repositorio funciona con DSpace.