Transcribe.Wreally : Avis, Test et Avantages - Est-ce le Meilleur Choix pour 2024 ?

Qu'est-ce que Wreally Transcribe ?

transcribe_logo

Transcribe est une solution logicielle de transcription basée sur le modèle SaaS. Cette plateforme permet à son moteur de conversion de la parole en texte et à son intelligence artificielle (IA de STT) d'effectuer des transcriptions précises et efficaces.

Transcribe prend en charge divers formats audio, notamment mp3, wma, wav, m4a, aac, amr et mp4. De plus, il offre la possibilité de télécharger des vidéos directement depuis YouTube vers la base de données de l'application en vue de leur transcription.

En outre, Transcribe propose une prise en charge multilingue et peut convertir des fichiers audio dans un large éventail de langues, notamment l'anglais américain et britannique, le mandarin, l'arabe, le portugais, l'espagnol, le français, l'allemand, l'hébreu, l'hindi, le japonais, le coréen, l'italien, le néerlandais, le russe, le roumain, le catalan et le grec.

Caractéristiques

Voici un aperçu des fonctionnalités intégrées de Transcribe :

Éditeur de texte intégré.

L'éditeur de texte intégré de Transcribe fonctionne de manière synchronisée avec le lecteur multimédia pour permettre l'ajout d'horodatages au texte, ce qui s'avère extrêmement utile pour la transcription de discours et la création de sous-titres vidéo. Cela assure une synchronisation précise entre les segments de sous-titres et les moments correspondants dans la vidéo.

Cet éditeur de texte intégré offre des fonctionnalités complètes de traitement de texte, y compris la possibilité de formater les documents, d'appliquer des styles tels que le gras, l'italique, et le souligné, de créer des listes, et d'ajouter des hyperliens. Cette flexibilité permet de corriger les erreurs et de réduire au minimum le taux d'erreurs de reconnaissance (WER). De plus, l'éditeur peut être configuré pour étendre les abréviations spécifiques, par exemple en remplaçant "imo" par "à mon avis", ce qui améliore la capacité de développement du texte.

Pédale de transcription.

Transcribe prend également en charge une pédale de transcription, qui sert de dispositif d'entrée pour contrôler la lecture des médias.

Dictionnaire intégré.

Transcribe utilise le dictionnaire de Google dans son éditeur de texte intégré. Pour une expérience optimale, il est recommandé d'utiliser l'application web avec le navigateur Chrome sous Windows ou MacOS, ou avec Chromium sous Linux ou les systèmes d'exploitation basés sur BSD.

De plus, l'enregistrement automatique du texte dans la mémoire cache du navigateur permet de sauvegarder le travail en cours. Il est important de ne pas vider la mémoire cache avant d'exporter le texte, afin de ne pas perdre les données enregistrées.

Transcription multilingue.

Comme précédemment mentionné, Transcribe prend en charge la transcription dans plusieurs langues grâce à l'utilisation de dictionnaires spécifiques à chaque langue.

Actuellement, les langues prises en charge comprennent l'anglais américain et britannique, le mandarin, l'arabe, le portugais, l'espagnol, le français, l'allemand, l'hébreu, l'hindi, le japonais, le coréen, l'italien, le néerlandais, le russe, le roumain, le catalan et le grec.

Facteurs ayant un impact sur les transcriptions

Plusieurs facteurs peuvent influencer la qualité des transcriptions automatiques réalisées en mode dictée, avec l'efficacité du STT-AI dépendant en grande partie de la qualité du signal audio introduit dans le système.

La qualité de la transcription générée par Transcribe est fortement influencée par les caractéristiques suivantes des clips audio sources :

  1. Qualité sonore du fichier audio ou vidéo : La clarté et la netteté du son d'origine jouent un rôle crucial dans la qualité de la transcription.
  2. Bruit de fond : Les bruits parasites, y compris les échos et les interférences électriques (comme celles causées par une mauvaise mise à la terre du microphone) ainsi que les bruits ambiants (comme les sons d'usine ou de circulation), peuvent perturber la précision de la transcription.
  3. Caractéristiques du locuteur : L'accent, la nasalité, le volume et la vitesse de la parole du locuteur peuvent tous influencer la manière dont les mots sont transcrits.
  4. Distance entre le locuteur et le microphone : Une distance importante entre le locuteur et le microphone peut entraîner une perte de qualité audio, affectant ainsi la précision de la transcription.
  5. Type de codage audio utilisé : La méthode de codage audio employée peut avoir un impact sur la qualité du signal sonore.
  6. Qualité du codage audio : La qualité de l'encodage audio initial est également un facteur déterminant dans la qualité de la transcription finale.

Dans le mode dictée, de nombreux problèmes liés à la qualité audio du fichier source peuvent être atténués car l'utilisateur dicte directement à l'application, garantissant ainsi une entrée audio de haute qualité. Cependant, dans des situations où le bruit de fond est très prononcé, la qualité de la source audio est médiocre ou l'accent du locuteur est difficile à comprendre, certaines erreurs de transcription peuvent subsister.

En outre, la qualité de la transcription peut être affectée par des facteurs liés au système de reconnaissance automatique de la parole (SRS), notamment :

  1. Taille et diversité du vocabulaire dans la base de données : Un SRS avec une base de données limitée peut avoir du mal à reconnaître des mots moins courants ou spécifiques.
  2. Confusion : Le SRS peut confondre des mots similaires en prononciation (homonymes) ou des mots mal articulés.
  3. Contrainte syntaxique : Le moteur de grammaire du SRS peut négliger des erreurs syntaxiques ou des phrases maladroites, même si les mots individuels sont clairs dans le discours.

D'autres facteurs peuvent également influencer la qualité de la transcription générée par le système.

Capacité de transcription de la parole fluide.

Ainsi, la compétence du STT-AI du SRS pour transcrire des paroles distinctes et hachées influence la précision de la transcription.

Habituellement, dans un énoncé haché, des phrases entières sont démarquées par un silence, permettant à Transcribe de distinguer facilement une phrase de l'autre et d'ajouter la ponctuation appropriée.

Transcribe est aussi capable de transcrire des paroles fluides qui sont enregistrées au rythme d'une conversation humaine ordinaire.

Cela implique qu'on ne peut pas donner un extrait audio qui se joue à une vitesse deux fois supérieure à celle d'une discussion normale pour obtenir une transcription accélérée.

Aptitude à transcrire une parole improvisée VS une parole préparée.

Cela est influencé par la qualité de l'entraînement de l'IA qui soutient le SRS. En outre, la parole improvisée possède un vocabulaire plus restreint et est parsemée de balbutiements, de phrases inachevées et d'expressions courantes (telles que euh, oh, hmm) ; sans oublier des bruits comme les rires, les toux ou même le reniflement !

En contraste, la parole préparée est typiquement plus riche en termes et est prononcée à un rythme constant avec des pauses clairement perceptibles entre les phrases.

C'est pourquoi le mode dictée nécessite de transformer la parole improvisée en parole préparée en récitant ce que l'on capte à l'application.

Exactitude de la transcription

L'efficacité d'une transcription effectuée par une machine se mesure à travers les erreurs identifiées dans celle-ci en la comparant à une transcription manuelle faite par un expert reproduisant fidèlement le contenu de l'enregistrement audio.

Cette exactitude est évaluée grâce au taux d'erreur par mot (WER), qui se formule de la manière suivante :

Exactitude (WER) = (Erreurs dans la transcription automatisée / Nombre total de mots de la transcription manuelle) x 100

Naturellement, la transcription manuelle parfaite est considérée avoir un taux de détection des mots de 100%. En outre, le WER tend à croître avec la durée de l'enregistrement audio.

Pour minimiser le WER, Wreally's Transcribe utilise le mot identifié par son système de reconnaissance vocale et le compare à sa version dictionnaire pour vérifier l'orthographe, ainsi que la correspondance de la prononciation.

Cette comparaison est réalisée via l'alignement dynamique de séquences, où chaque phonème ou lettre du mot détecté est juxtaposé au phonème/lettre équivalent de sa version dictionnaire.

Tarifs

Tarif transcribe.wreally

Sécurité

La nature délicate des enregistrements et des transcriptions peut, pour certains, soulever des préoccupations de confidentialité.

Un point saillant de la sécurité offerte par Transcribe est que toutes les données ne sont pas transférées sur le cloud lors de la transcription automatique. Par conséquent, les transcriptions d'un compte ne sont consultables qu'à partir de l'appareil sur lequel elles ont été réalisées.

Cette approche est intentionnelle, bien que ce ne soit pas toujours le cas pour les transcriptions automatisées, où, par nécessité, les données audio et les transcriptions sont stockées sur le cloud.

Toutefois, dans cette situation, les fichiers audio ou vidéo ajoutés sont effacés après cinq heures une fois traités, et l'utilisateur peut à tout moment supprimer la transcription produite.

Synthèse

À première vue, Wreally peut sembler un peu ancien, mais avec Transcribe, ils ont vraiment concentré leurs efforts sur l'essentiel.

Ils annoncent une exactitude de 90% pour leur transcription automatique. Suite à nos évaluations, Transcribe a même surpassé cette promesse, du moins quand la qualité de l'enregistrement initial est satisfaisante.

La capacité de dicter manuellement les segments complexes ou flous d'un fichier audio facilite grandement la transcription de discours longs.

Les multiples langues disponibles, les dictionnaires sur mesure, l'intégration des codes temporels et la capacité à éditer l'audio directement dans l'interface sont des atouts majeurs.

De plus, les innovations récentes, telles que la détection des locuteurs ou l'inclusion de langues en phase de test, indiquent un potentiel d'évolution significatif.

Nous avons été très séduits par la fonction d'auto-transcription, la rendant parfaite pour ceux qui veulent ajouter leurs propres analyses à un enregistrement préexistant.

En résumé, pour ceux qui mènent des entrevues et souhaitent les transcrire pour consultation future, Transcribe de Wreally offre une solution polyvalente, sans nécessiter l'installation d'un programme spécifique.

Vous voulez développer votre blog plus rapidement ?

Abonnez-vous et obtenez un accès gratuit aux guides, modèles et listes de contrôle réservés aux abonnés. 👇

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.