L'être humain communique prioritairement par la
parole. Pourtant, il doit souvent utiliser différents
dispositifs (clavier, souris, boutons, écrans tactiles,
etc.) pour échanger de l'information. «Il
est certain que l'interaction homme-machine serait considérablement
simplifiée, et l'utilisation quotidienne de dispositifs
électroniques accrue, si les utilisateurs pouvaient
communiquer avec les systèmes en utilisant leur
voix», explique Daniel Rappo, professeur à
la Haute école d'ingénierie et de gestion
du canton de Vaud (HEIG-VD) et coordinateur du projet
de recherche Humavox. Celui-ci regroupe une dizaine de
chercheurs de la Haute Ecole spécialisée
de Suisse occidentale (HES-SO) répartis entre Sion,
Fribourg et Yverdon-les-Bains.
Ce projet a pour but de développer des solutions
homme-machine. Des chercheurs de la HEIG-VD se consacrent
à la synthèse vocale, à savoir la
production et la diffusion d'informations sonores à
partir de textes. Premiers concernés, les aveugles
et les malvoyants. Ils ont déjà la possibilité
d'écouter certains articles de presse via ordinateur
connecté à Internet. Cependant, l'accessibilité
et la qualité sonore sont souvent médiocres.
De plus, la voix, très artificielle et monocorde,
ne reflète pas la structure du texte lu.
Pour y remédier, les ingénieurs de la HEIG-VD
«vocalisent» un texte après en avoir
fait une analyse sémantique permettant de rendre
son contenu plus intelligible. Grâce à cette
méthodologie, la vitesse, le volume ou l'intonation
de la voix de synthèse peuvent ainsi être
modifiés en fonction des phrases interprétées.
En résulte une lecture plus riche et plus agréable
de l'information.
«Le marché actuel de la synthèse
vocale est en plein essor», note Luc Fontolliet,
ingénieur en gestion des médias. Les performances
des moteurs de synthèse s'améliorent et
les voix sont de plus en plus naturelles. Toutefois, ces
systèmes restent chers et nécessitent un
développement important. Les ingénieurs
de la HEIG-VD travaillent à la réalisation
d'une plate-forme capable de diffuser automatiquement
la transcription vocale de contenus rédactionnels.