
MacWhisper est depuis longtemps l’une des solutions les plus fiables et les plus simples pour transcrire n’importe quel contenu sur Mac. Personnellement, j’en fais un usage intensif depuis son lancement, et je ne peux que le recommander. Aujourd’hui, ce précieux outil s’améliore avec une mise à jour ajoutant la prise en charge du modèle de transcription Parakeet, extrêmement rapide, d’Nvidia.
ALORS QU’OPENAI S’ÉLOIGNE DE WHISPER, MACWHISPER PROFITE DE L’ACCÉLÉRATION PARAKEET
Lorsque OpenAI a lancé sa série de modèles de transcription Whisper, ceux-ci semblaient magiques. Ils offraient une vitesse et une précision bien supérieures à tout ce qui existait, notamment sur le marché open-source. Cependant, avec le recentrage d’OpenAI sur des modèles de transcription commercialement plus viables, tels que les modèles gpt-4o-transcribe, Whisper commence à paraître désuet. De nouveaux modèles de transcription ont rapidement surpassé Whisper, tout comme il avait surpassé ses prédécesseurs.
Parmi ces modèles, le Parakeet d’Nvidia se distingue. Annoncé le mois dernier, il promet de transcrire « 60 minutes d’audio en seulement 1 seconde », à condition de disposer du matériel requis, tels que les GPU A100, H100, T4 ou V100.
Bien que Parakeet ait été accessible via des outils open-source, la complexité de son déploiement et de son utilisation dans des interfaces en ligne de commande a rebuté certains utilisateurs.
Heureusement, cela change aujourd’hui : MacWhisper ajoute la prise en charge du modèle Parakeet, qui se révèle être incroyablement rapide. Le développeur de l’application, Jordi Bruin, explique :
« Grâce à notre collaboration avec l’équipe d’Argmax, MacWhisper prend désormais en charge les modèles Parakeet. Pour illustrer l’ampleur de cette avancée, regardez le gif ci-dessous où nous avons transcrit et diarisé un podcast de 30 minutes en moins de 8 secondes ! »
J’ai testé cette nouvelle fonctionnalité sur mon MacBook Pro M2 Pro en utilisant un récent épisode de 3 heures de Happy Hour, et le résultat a été impressionnant : la transcription a été réalisée en seulement 1 minute et 22 secondes, avec reconnaissance de locuteur incluse.
A noter que le modèle Parakeet est disponible uniquement pour les utilisateurs Pro et ne prend actuellement en charge que la transcription en anglais. Bruin mentionne qu’une version multilingue sera bientôt proposée.