Investigation of VITS Text-to-Speech for the Lithuanian Language

Vytautas Lėveris; Gražina Korvel

doi:10.15388/LMITT.2026.15

Articles

Vytautas Lėveris

Vilnius University

Gražina Korvel

Vilnius University

Published 2026-05-08

https://doi.org/10.15388/LMITT.2026.15

PDF

Keywords

Text-to-Speech
Lithuanian language
VITS
Speech Synthesis
Phoneme-based modeling

Abstract

This study investigates the performance of the VITS model for Lithuanian speech synthesis under different training configurations. Experiments were conducted using datasets with phoneme-based and grapheme-based text representations, accented text, and both single-speaker and multi-speaker setups. The goal was to evaluate how linguistic pre-processing and speaker diversity influence synthesis quality. Model outputs were compared using objective measures. The results provide insights into the impact of phoneme representation and accent information on the quality of Lithuanian neural TTS systems.

PDF

References

This work is licensed under a Creative Commons Attribution 4.0 International License.

Downloads

Download data is not yet available.

Most read articles by the same author(s)

Paulius Zaranka, Gražina Korvel, Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius , Vilnius University Open Series: 2024: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"
Donata Petkutė, Gražina Korvel, Draudimo sektoriaus klientų atsiliepimų ir vertinimų nuotaikų kaitos analizė laike , Vilnius University Open Series: 2024: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"
Evelina Vaitkevičiūtė, Gražina Korvel, Propagandos technikų lingvistinių požymių lyginamoji analizė taikant natūralios kalbos apdorojimo metodus , Vilnius University Open Series: 2025: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT". 2025
Eglė Kondrataitė, Gražina Korvel, Early Detection of Rare Diseases using Natural Language Processing , Vilnius University Open Series: 2024: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"
Aidas Žygas, Gražina Korvel, Muzikos garso šaltinių atskyrimo giliojo mokymosi modelio SCNet apmokymas skirtingais duomenų rinkiniais , Vilnius University Open Series: 2025: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT". 2025
Emilija Bareikaitė, Gražina Korvel, Ieva Kilienė, Matematinių uždavinių klasifikavimas taikant natūralios kalbos apdorojimo ir mašininio mokymosi metodus , Vilnius University Open Series: 2026: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"
Ignas Černiauskas, Gražina Korvel, Teksto požymių analizė ir jų efektyvumo vertinimas emocijų klasifikavimo uždavinyje , Vilnius University Open Series: 2026: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"