Quelle application en ligne pour convertir un fichier audio en texte gratuitement ?

Cet article présente un rapide état des lieux des solutions gratuites de transcription automatique de l’audio en texte.

Ces solutions ne garantissent pas toujours une bonne qualité de texte, mais peuvent dépanner si vous n’avez pas les moyens de recourir à un service de transcription payant (consulter les tarifs).

En effet, la saisie au clavier d’un enregistrement audio, très longue et fastidieuse, rebutera tout débutant s’essayant pour la première fois à la transcription d’en enregistrement audio en texte.

Les outils de transcription automatique représentent ainsi une alternative sérieuse qui vous fera gagner du temps pour transcrire un fichier audio en texte plus rapidement.

Il y aura néanmoins une perte de qualité importante par rapport à la saisie au clavier, car une saisie manuelle permet plus de nuances dans la ponctuation, de faire moins de contresens et d’avoir une meilleure précision.

Pour les curieux, cet article permet de découvrir avec quels logiciels en ligne il est possible de convertir un fichier audio (mp3, m4a, aac, wma, wav) en texte gratuitement.

Tuto express : les logiciels gratuits de transcription automatique

La vidéo ci-dessous propose un guide rapide des meilleurs logiciels gratuits pour la transcription automatique de l’audio en texte.

Deux applications, en ligne et gratuites, vous seront particulièrement utiles : Google Docs et YouTube.

Ceci dans l’hypothèse de trois types d’enregistrements différents à transcrire :

1. L’utilisation de Google Docs pour retranscrire automatiquement un enregistrement de bonne qualité et assez court.

2. L’utilisation de Google Docs pour transcrire en dictée vocale un enregistrement de mauvaise qualité et assez court.

3. L’utilisation de YouTube pour la transcription automatique d’un enregistrement plutôt de bonne qualité et assez long.


1. Pour un enregistrement court et de bonne qualité : Google Docs + enregistrement mixage stéréo


Si vous disposez d’un court enregistrement avec une bonne qualité audio, vous pouvez utiliser l’outil de dictée vocale de Google Docs et régler le mixage stéréo comme périphérique d’enregistrement. Ainsi, une fois que vous cliquez sur l’icône de saisie vocale de Google Docs, tout ce qui sera lu par vos enceintes d’ordinateur sera considéré comme venant de votre microphone et sera transcrit sans perte de qualité.

  • Un petit guide si l’icône « mixage stéréo » n’apparaît pas sous Windows : ici
  • Si vous êtes sous Mac, le logiciel Soundflower vous permettra d’enregistrer le son diffusé.

2. Pour un enregistrement court et de mauvaise qualité : Google Docs + respeaking


Si la transcription automatique de votre enregistrement fonctionne mal du fait d’une qualité trop faible de l’audio, vous pouvez adopter la méthode du « respeaking ». Cela consiste à répéter en direct dans votre microphone l’enregistrement qui vous passe sur les oreilles. Cette dictée vocale sera d’autant plus efficace que vous pourrez en même temps ajouter la ponctuation par des commandes vocales.


3. Pour un enregistrement long et de bonne qualité : transcription automatique YouTube


Si l’enregistrement que vous avez à convertir en texte est assez long, vous pouvez utiliser la transcription automatique de YouTube.

En effet, toute vidéo uploadée sur YouTube sera automatiquement sous-titrée peu de temps après sa mise en ligne et vous pourrez ensuite récupérer le texte qui sera la transcription fidèle de votre enregistrement.

La transcription automatique de YouTube représente un gain de temps non négligeable par rapport aux deux méthodes précédentes.

Vous pourrez ensuite extraire le texte du sous-titrage YouTube et le mettre en forme dans un fichier texte sous Word avec l’outil « remplacer ».

  • Logiciel pour convertir un fichier audio en fichier vidéo accepté par YouTube : Sonic Candle sur Windows ou ScreenFlow sur Mac.
transcription automatique audio en texte gratuit

Transcription automatique et gratuite avec Google Docs

S’il est assez fréquent d’utiliser Google Docs comme logiciel de traitement de texte, on ne sait pas forcément que ce service en ligne propose également une option de saisie vocale à l’aide de son microphone. Cela permet la dictée vocale de tous les mots prononcés oralement.

Cette option gratuite peut être très utile pour la dictée d’un document que l’on a en tête, mais l’est plus encore si l’on a besoin de produire la transcription audio d’un fichier déjà enregistré.

Écouter un fichier audio et le dicter en même temps est par contre assez fastidieux et une astuce pour éviter d’avoir à réaliser cette dictée vocale en « perroquet » consiste à régler dans ses paramètres d’enregistrements le mixage stéréo comme microphone externe (tutoriel pour activer le mixage stéréo sur Windows 10). Avec ce réglage, tous les fichiers audio qui seront lus par votre ordinateur seront considérés comme venant de votre microphone. Il n’y a donc plus ni à répéter l’enregistrement ni à placer un microphone devant ses enceintes, mais c’est directement l’audio source qui est enregistré et il n’y a aucune perte par rapport à la qualité audio initiale de l’enregistrement.

Une fois ce réglage fait, il ne vous reste plus qu’à activer la saisie vocale sur Google Docs et lancer l’enregistrement audio à transcrire. Votre fichier audio va alors se transcrire automatiquement à mesure que vous l’écoutez.

En ce qui concerne la qualité du résultat, si l’enregistrement audio est de très bonne qualité, la qualité du texte transcrit automatiquement sera de qualité passable. Par contre, si l’enregistrement audio est de mauvaise qualité, le texte en transcription automatique sera aussi de très mauvaise qualité. Cette méthode de transcription peut toutefois dépanner et fournir un premier brouillon sur lequel ensuite retravailler le texte.

Dans l’hypothèse où l’enregistrement audio que vous avez à transcrire est vraiment de très mauvaise qualité dès le départ, la dictée vocale avec votre propre microphone s’avère ici utile, car vous produirez une meilleure élocution que sur un enregistrement audio où les voix sont difficilement perceptibles.

Transcription automatique avec Google Docs, en résumé :

  • Si vous voulez transcrire un enregistrement audio de bonne qualité : il est dommage d’en faire la dictée vocale dans Google Docs (avec un mauvais microphone ou en lançant l’enregistrement devant les enceintes de son ordinateur), car on perd en qualité d’enregistrement et donc en qualité de transcription. Pour atteindre le meilleur résultat possible sans effort, réglez votre périphérique d’enregistrement comme « stéréo mix » et lancez votre enregistrement afin de récupérer une transcription automatique gratuite.
  • Si vous voulez transcrire un enregistrement audio de mauvaise qualité : la transcription automatique marchera très mal et il vaudra mieux répéter l’intégralité de votre enregistrement audio en dictée vocale dans votre microphone (avec la meilleure élocution possible).

Tutoriel vidéo pour la transcription automatique de l’audio en texte sur Google Docs

Nous allons voir dans cette vidéo comment convertir votre audio en texte gratuitement avec le logiciel en ligne Google Docs.

Cette méthode de transcription nécessite un réglage au niveau de votre périphérique audio d’enregistrement par défaut en sélectionnant le « mixage stéréo » comme microphone. Ainsi, tout ce qui passera sur vos enceintes sera considéré comme microphone.

Ensuite, allez dans les outils pour activer la saisie vocale au niveau de Google Docs et cliquez sur le petit microphone rouge.

Il ne vous reste plus qu’à lancer votre enregistrement audio qui sera alors saisi automatiquement et gratuitement.

Cette technique marche assez bien, mais n’est pas parfaite et nécessite un nouveau travail afin de corriger les erreurs de sens et ajouter la ponctuation. Le texte généré constituera toutefois une première base utile si vous n’avez pas les moyens de recourir à un prestataire externe.

Transcription automatique et gratuite avec YouTube

Une autre façon de transcrire gratuitement de l’audio en texte en ligne est l’utilisation de l’outil de sous-titrage automatique de YouTube. En effet, les dialogues de toute vidéo envoyée sur YouTube seront automatiquement transcrits de façon automatique par leur logiciel interne de reconnaissance vocale (ou application d’ASR, Automatic Speech Recognition).

Malheureusement, YouTube n’accepte pas l’upload direct en format audio et il faudra d’abord convertir votre fichier audio en vidéo. Un logiciel gratuit comme Sonic Candle le fait très bien.

Une fois votre fichier vidéo envoyé sur YouTube (en mode privé si vous ne voulez pas que votre enregistrement soit vu par tous), il faut attendre que les serveurs de YouTube produisent la transcription automatique. Généralement ce temps de calcul n’excède pas la durée totale de l’enregistrement que l’on a envoyé.

L’avantage d’utiliser cette méthode de transcription automatique est que vous ne bloquez pas votre ordinateur à la lecture d’un fichier audio et que pouvez continuer à boire votre café tranquillement pendant que les serveurs de YouTube travaillent sur votre transcription. Cette méthode de transcription automatique va donc vous faire gagner beaucoup de temps si votre enregistrement audio est très long.

Si vous n’avez que quelques minutes d’audio à transcrire, privilégiez plutôt la première méthode de transcription automatique en direct avec Google Docs. En utilisant Google Docs, vous évitez aussi l’étape de transformation de votre fichier audio (mp3) en fichier vidéo (mp4).

Une fois la transcription automatique traitée par YouTube, vous pouvez l’afficher en activant le sous-titrage de la vidéo. Il suffit ensuite de copier ce texte (ou de récupérer le fichier .srt) et le coller dans votre logiciel de traitement de texte préféré (.doc ou .txt), par exemple avec Word. C’est une bonne manière pour convertir un mp3 en texte gratuit.

La transcription automatique de YouTube, comme celle de Google Docs, est d’assez mauvaise qualité si l’enregistrement audio n’a pas une qualité parfaite. Il est aussi à noter que ni la transcription automatique de Google Docs ni celle de YouTube ne propose de ponctuation et qu’il devient donc particulièrement difficile de se repérer dans ces textes transcrits automatiquement.

Transcription automatique Le Scribe Audio vs transcription automatique Google Docs

En rouge sont miss en évidence les problèmes de la transcription automatique proposée par Le Scribe Audio :

transcription automatique vs transcription manuelle

En rouge sont mis en évidence les problèmes de la transcription automatique Google Docs :

transcription auto google vs transcription manuelle

Ce rapide comparatif met en évidence que la transcription automatique proposée par Le Scribe Audio (0,25€ la minute d’enregistrement) est la seule a proposer une ponctuation et que son algorithme de transcription vocale est plus performant.

Transcription automatique de l’audio en texte gratuit ?

3 réflexions au sujet de « Transcription automatique de l’audio en texte gratuit ? »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *