Innholdsfortegnelse:
Definisjon - Hva betyr Text to Speech (TTS)?
Text to speech (TTS) er en naturlig språkmodelleringsprosess som krever å endre tekstenheter til taleenheter for lydpresentasjon. Dette er det motsatte av tale til tekst, der en teknologi tar inn talte ord og prøver å registrere dem nøyaktig som tekst. Tekst til tale er nå vanlig i teknologier som søker å gi lydutgang fra digital tekst for å hjelpe de som ikke er i stand til å lese, eller til andre typer bruk.Techopedia forklarer Text to Speech (TTS)
Utvikling av tekst-til-tale-evne inkluderer noen unike utfordringer. Spesielt på det engelske språket, der et stort antall homonymer har varierte uttaler, er datamaskinprogrammer avhengige av sannsynlighetsmodellering for å gjette ønsket uttale av et ord i digital tekst. Programmet må også konvertere tekstenheter til fonemer, de minste taleuttale. Resultatet er at mange tekst-til-tale-teknologier er mindre enn ufeilbarlige, selv om utviklere har gjort store fremskritt på disse teknologiene gjennom flere år.
Over tid har eksperter observert noen gode fremgangsmåter for TTS-utvikling. Disse inkluderer fonemebaser og konkatenative tilnærminger med prediktiv analyse. De beste programmene kan også arbeide med minimale minnekrav og er enkle å sette opp. Utviklere fortsetter å jobbe med TTS-ressurser for ethvert gitt språk, og arbeider gjennom de store utfordringene med tvetydighet og andre hindringer for mer nøyaktig gjengivelse.