MacWhisper 8: Transkriptions-App für den Mac bekommt neuen Video-Player und WhisperKit-Integration

Marcel Am 20.05.2024 veröffentlicht Lesezeit etwa 2:13 Minuten

Die auf OpenAIs Whisper-KI aufsetzende Transkriptions-App MacWhisper ist in einer neuen Version 8 veröffentlicht worden. Das Update bringt unter anderem einen neuen Videoplayer und eine WhisperKit-Unterstützung mit.

Sofern ihr häufiger Audiodateien transkribieren – also in Text umwandeln – müsst, könnt ihr vor allem seit dem aufkommen von ChatGPT beziehungsweise der Whisper-KI auf eine Reihe an Anwendungen wählen, die wirklich gute Ergebnisse liefern. Für den Mac wären das kostenlose Aiko von Sindre Sorhus oder das in Berlin entwicklete AI Transciption eine Nennung wert, umfangreicher wird es mit MacWhispher und MacWhisper Pro von Jordi Bruin, der sich inzwischen ein ganzes Portfolio an Apps verantwortlich zeichnet, unter anderem auch für MacGPT. MacWhisper kümmert sich im Kern um die Sprache-zu-Text-Umwandlung von Audiodateien und setzt dabei auf die die Whisper-KI von OpenAI, wobei die Transkription rein lokal stattfindet, also keine Daten euren Mac verlassen. Darüber hinaus bringt das Tool vor allem in der kostenpflichtigen Pro-Version viele Annehmlichkeiten mit, die die Arbeit zusätzlich vereinfachen machen und mit der Version 8 hat Jordi seine Tools nochmals ausgebaut und mächtiger gestaltet.

Die größte Neuerung und laut Entwickler auch das Hauptmerkmal der jüngsten Version ist der neue Video-Player, der das Transpirieren von Audio aus Videodateien erheblich verbessert. Transkribierte Audiodaten werden als Untertitel angezeigt, wobei der übersetzte Text als separate Untertitel eingeblendet wird. Von Haus aus wird der Videoplayer als Inline-Element angezeigt, kann aber auch in ein eigenes Fenster verfrachtet werden. Parallel dazu gibt es auch eine große Verbesserung rund um YouTube, denn heruntergeladene Videos können im Mini-Player abgespielt werden, Downloads können in hoher oder niedriger Qualität erfolgen und Downloads sind generell schneller. Weiterführend könnt ihr auch zwischen reinen Video- oder Audio-Downloads von YouTube wählen.

Darüber hinaus führt MacWhisper 8 auch die Unterstützung des quelloffenen WhisperKit ein, mit der auf Apple-Slicon-Macs eine Spracherkennung in Echtzeit möglich ist. Hierbei wird auf die Vorteile der Hardware-Beschleunigung, einschließlich der Neural Engine und des CoreML-Frameworks von Apple zurückgegriffen, was die Engine besonders effizient machen soll. WhisperKit selbst kann in den Einstellungen unter “Erweitert” aktiviert werden, anschließend können auch WhisperKit-Modelle zum Download ausgewählt werden. Auch die neuen ChatGPT-Sprachmodelle GPT-4 Turbo und GPT-4o werden von der achten Integration von MacWhisper unterstützt, Voraussetzung hierzu ist aber natürlich, dass ein eigener OpenAI-API-Key in den Einstellungen hinterlegt wird und dieser für die Nutzung der neuen Modelle freigegeben ist.

Weitere Verbesserungen und Optimierungen beinhalten unter anderem ein neues Menübar-Icon (welches sich stärker von dem Standard-Mikrofon-Symbol differenziert), die Qualitäts- und Sprachauswahl ist in die Toolbar gewandert, das virtuelle Mikrofon von Microsoft Teams wird aus der Mikrofon-Auswahl gefiltert und derlei Kleinigkeiten. Die Basisversion von MacWhisper ist kostenlos verfügbar, ermöglicht aber lediglich die Transkription von Audiodateien mit dem kleinen und dem Basis-Sprachmodell – und verzichtet des Weiteren auf das ein oder andere funktionelle Extra. Den kompletten Funktionsumfang (unter anderem besagte YouTube-Umwandlung, Podcasts-Transkription oder auch eine Menübar-App) und die Nutzung der Sprachmodelle Medium und Large bietet wiederum MacWhisper Pro, welches für eine Einzellizenz mit runden 30 US-Dollar (etwa aufgerundete 28 Euro) zu Buche schlägt. Für den privaten Einsatz dürfte die kostenlose Version ausreichen, für knapp 30 Euro muss man schon regelmäßigen Bedarf haben…

Projektseite von MacWhisper ansurfen

Artikel teilen

Kaufempfehlung*

  • Dremel Lite 7760 Akku Multifunktionswerkzeug 3.6V, Set mit 15 Zubehörteilen, Variable Drehzal 8.000-25.000 U/min - zum Schnitzen, Gravieren, Schleifen, Schärfen, Reinigen, Polieren, Schmirgeln,Schwarz
  • Neu ab 63,70 €
  • Auf Amazon kaufen*

Schreibe den ersten Kommentar

Schreibe eine Antwort

⚠ Mit dem Nutzen des Kommentarbereiches erklärst du dich mit der Datenschutzerklärung einverstanden.