Audio-Transskription MP3--> TXT lokal via noScribe

Für diejenigen, die öfters den Bedarf haben, gesprochenes Wort in geschriebenen Text umzusetzen ist noScribe eine feine Sache:

What is noScribe?

  • An AI-based software that transcribes interviews for qualitative social research or journalistic use
  • noScribe is free and open source (GPL-3.0)
  • It runs completely local on your computer. No data is sent to the internet. No cloud, no worries
  • It can distinguish different speakers and understands around 60 languages (more or less, see below)
  • It includes a nice editor to review, verify and correct the resulting transcript
  • It is standing on the shoulders of giants: Whisper from OpenAI, faster-whisper by Guillaume Klein and pyannote from Hervé Bredin

https://github.com/kaixxx/noScribe/tree/main#download-and-installation

Es transkribiert Audiodateien recht flott in Textdateien und zwar rein lokal auf dem PC, also voll offlinefähig.

Funktioniert das, ohne, dass es trainiert werden muss auf die Sprache einer Person? (das war früher mit Transskriptionssoftware der Fall)

Es wird ein trainiertes neuranales Netz installiert, welches die Erkennung durchführt. Das funktioniert „out-of-the-box“ für alle Stimmen. Man muss da nichts zusätzlich antrainieren.

@Galaga Danke für den Hinweis. Ich habe bisher dafür Whisper CPP (github) genutzt, lokal auf einem 2020 MacBook Pro, nur ist das nicht wirklich performant und bei noScribe, das auch Whisper nutzt, wird die Rechenpower natürlich auch ein wesentlicher Faktor sein. Ich werde noScribe auf jeden Fall testen.

Wir haben früher Dragon Software benutzt, die nicht billig war und die eigentlich nur nutzbar war, wenn man eine saubere Audiodatei hatte. Der Unterschied zu heutigen LLM basierten Lösungen ist wie Tag und Nacht.