fbpx

Aujourd’hui, il est devenu possible de faire lire une page web ou un document numérique à haute voix par une machine : c’est la synthèse vocale. Cette technologie se retrouve aussi bien sur nos ordinateurs, tablettes et smartphones que sur des outils spécialisés. Le but premier de la synthèse vocale est de favoriser la communication et de la rendre accessible à tous. Qu’est-ce que la synthèse vocale ? À quoi ça sert ? Qui est concerné ? Et quelles sont les synthèses vocales les plus connues ? Vous découvrirez des réponses à ces questions dans cet article.

Qu’est-ce qu’une synthèse vocale ? 

La synthèse vocale (« text-to-speech » ou TTS an anglais), encore désignée par les termes « synthèse texte-parole » ou « synthèse de la parole », est l’ensemble des outils qui permettent de produire automatiquement de la parole artificielle en contenu audio. Cette technologie est utilisée dans plusieurs buts : favoriser l’accessibilité, utilisation publicitaire, développement technologique…

Définition : Il s’agit d’une technologie de transformation du texte numérique en paroles lues à haute voix au moyen d’une voix synthétique. La voie synthétisée est généralement naturelle et proche de la voie humaine grâce à l’apport de l’intelligence artificielle (Machine learning & Deep Learning). 

Cette fonctionnalité est de plus en plus répandue dans les sites web pour améliorer l’expérience utilisateur. Les utilisateurs ont ainsi la possibilité de lire le texte ou de le faire lire par le dispositif de synthèse vocale. 

Mais les solutions de synthèse vocale vont bien au-delà de la simple transformation de textes en audios. Elles constituent des outils d’enseignements assistés par ordinateur ou encore des aides à la communication pour les personnes handicapées.

2 – À qui s’adresse la synthèse vocale ? 

La synthèse vocale s’adresse à un public large et s’adapte aux différents besoins des utilisateurs :

Les personnes atteintes de troubles visuels

La synthèse vocale permet aux malvoyants ou non-voyants d’entendre ce qu’ils ne peuvent pas lire. Les logiciels de voix virtuelle transcrivent phonétiquement le texte et offrent la possibilité aux handicapés visuels et aux personnes qui ont des difficultés à lire d’accéder plus facilement aux contenus textes grâce au text-to-speech. 

Plu globalement, la synthèse est aussi utile aux personnes qui ont des difficultés à décoder un texte. Ils utilisent alors un logiciel de synthèse vocale pour renforcer la lecture des textes numériques (courriers, documents Word, PDF, pages internet, etc.). Cette technologie peut également les accompagner pendant le processus d’écriture. Ils peuvent notamment réécouter le texte écrit autant de fois qu’ils le veulent pour réviser leurs écrits.

En effet, un grand nombre d’utilisateurs assimile plus vite en écoutant le texte plutôt qu’en le lisant. Puis, la synthèse et la reconnaissance vocale constituent une mesure conforme aux règles de l’accessibilité numérique du World Wide Web Consortium (W3C).  

Les personnes privées de communication orale

La synthèse vocale permet également aux personnes qui ne peuvent pas parler d’exprimer haut et fort ce qu’ils ont à dire. Les voix de synthèse, intégrées à un appareil d’aide à la communication, facilitent la communication à des personnes qui n’ont pas la possibilité de parler ou qui ont perdu la voix (aphasie, dysphasie).

Le célèbre Astrophysicien Stephen Hawking, atteint de Sclérose Latérale Amyotrophique (SLA) ou maladie de Charcot, utilisait une synthèse vocale pour communiquer. Il se servait d’un contacteur qu’il pouvait activer en contractant un muscle de sa joue pour sélectionner les caractères d’un clavier virtuel affiché sur une tablette fixée sur son fauteuil roulant. Il pouvait ainsi écrire du texte qui était ensuite converti en contenu audio sous forme de voix de synthèse.

test de la commande oculaire

Découvrez JIB EYES, la technologie de commande oculaire qui permet aux personnes coupées de toute communication de pouvoir s’exprimer avec les yeux via un clavier numérique ou des pictogrammes.

Aujourd’hui, certaines applications d’aide à la communication pour smartphones Android ou IOS intègrent une fonctionnalité de synthèse vocale permettant de vocaliser des phrases mémorisées. Généralement, ces applications permettent également de composer librement un texte qui sera ensuite converti en voix humaine par la synthèse vocale.

L’utilisateur peut saisir (avec un clavier ou virtuel alphabétique, phonétique ou à défilement) et enregistrer des expressions fréquemment utilisées ou au contraire formuler un message instantané qui sera lu à haute voix.

Par ailleurs, certaines sociétés opérant dans le domaine de la voix synthétique ont entrepris ces dernières années de développer des systèmes plus avancés. Il s’agit de dispositifs permettant aux personnes qui risquent de perdre l’usage de la voix de synthétiser leur propre voix. La voix étant une partie importante de la personnalité de l’homme, ces dispositifs permettent de la conserver pour une utilisation ultérieure dans un appareil d’aide à la communication.

Les autres champs d’application de la synthèse vocale

En dehors de son utilisation dans les dispositifs pour lire sans regarder l’écran, la synthèse vocale s’applique également à d’autres services de notre quotidien :

  • Les services d’annonces vocales (services météo, voix off, etc.)
  • Les unités de réponse vocale générant des phrases ou mots préenregistrés (voitures, poupées, appareils vocaux…)
  • Les services de réponse pour des systèmes de vente notamment dans les commerces qui fournissent des informations par téléphones
  • Les services téléphoniques sans interlocuteurs humains
  • Autres services commerciaux et publicitaires

3 – Liste des synthèses vocales les plus connues

De nombreux logiciels, applications et outils ont vu le jour pour permettre à tous de profiter des avantages de la synthèse vocale. Parmi les plus connus, nous avons :

ReadSpeaker

ReadSpeaker est un fournisseur de solutions de synthèse vocale naturelles basées sur le web. La plateforme utilise la technologie text-to-speech pour activer la parole sur des sites web, des documents et des formulaires en ligne, ainsi que sur des applications mobiles comme l’iPhone, Android ou BlackBerry Apps.

Les applications ReadSpeaker offrent la possibilité aux personnes malvoyantes souffrant de déficience visuelle, de dyslexie, de difficultés de lecture ou d’illettrisme ou simplement aux personnes qui n’ont simplement pas le temps de lire d’avoir accès à des documents textes.

Ces applications sont gratuites pour les utilisateurs finaux et fonctionnent avec plus de 130 voix dans 45 langues, dont le français, l’anglais, l’espagnol et l’allemand. Elles s’utilisant aussi bien dans le secteur éducatif que dans les secteurs public, privé, média et éducatif.

ClaroRead

ClaroRead est une application d’aide à la lecture pour les personnes souffrant de troubles DYS ou troubles spécifiques du langage. Le logiciel s’installe localement sur un ordinateur. 

D’autres logiciels Text-To Speech sont disponibles sous forme d’appareils de synthèse vocale, le Quick Link Pen de WizCom Technologies en est un parfait exemple. Le logiciel permet des textes avec un stylo pour ensuite les lire à voix haute.

Les systèmes d’exploitation informatique

Les concepteurs de logiciels AT&T, Google et Amazon Web Services ont également fait le pas et développent leurs propres outils de synthèse vocale. Les systèmes d’exploitation informatiques se sont également mis au diapason en utilisant la synthèse vocale pour améliorer l’expérience utilisateur. 

Les applications sur système d’exploitation mobile tel que Google Text-to-Speech permettent de convertir des textes en paroles. On retrouve cette technologie dans des applications telles que Google Traduction pour traduire des documents ou encore dans Google Play Books pour lire des livres numériques.

Ces articles peuvent vous intéresser :

Vous souhaitez un devis pour l'une de nos solutions ?

X