Daugiakalbio šnekos modelio atpažinimo gerinimas lietuvių kalbai
Straipsniai
Juras Ezerskis
Vilniaus universitetas image/svg+xml
Asta Slotkienė
Vilniaus universitetas image/svg+xml
Publikuota 2026-05-08
https://doi.org/10.15388/LMITT.2026.8
PDF

Esminiai žodžiai

automatinis šnekos atpažinimas
lietuvių kalba
LoRA
papildomas apmokymas

Anotacija

Lietuvių spontaninės kalbos automatinis atpažinimas išlieka sudėtinga užduotis dėl ribotų išteklių, tarimo variacijų ir nuostolingo garso įrašų poveikio transkribavimo kokybei. Šio straipsnio tikslas – ištirti Whisper large‑v3 modelio pritaikymą lietuvių spontaninės kalbos atpažinimui taikant Low‑Rank Adaptation (LoRA) strategiją, palyginti jį su baziniu modeliu ir išanalizuoti, kaip papildomas apmokymas veikia transkribavimo kokybę. Gauti rezultatai parodė, kad LoRA strategija reikšmingai pagerino modelio veikimą ir sumažino tiek tekstinį, tiek fonetinį nutolimą nuo tikrųjų transkripcijų.

PDF

Nuorodos

Creative Commons License

Šis darbas apsaugotas Creative Commons priskyrimo 4.0 viešąja licencija.

Atsisiuntimai

Nėra atsisiuntimų.

Dažniausiai skaitomi to paties autoriaus (-ių) straipsniai