Effizientere Erfassung von Text/Sprache per Smartphone

Hallo,

möchte Text (z.B. Zitat aus einem Buch, halbe Buchseite oder Gedanken) schneller als Text im Smartphone erfassen. Mit HeliBoard und Swipe dauert es mir zu lange.
Nachfolgend meine Gedanken dazu:

Hab gesehen Whisper scheint aktiv entwickelt zu werden (häufige Updates). Ist eine offline Spracherkennung für Aufnahmen bis 30. Sekunden. Charmant ist der Eingabemethodeneditor (IME) womit dies über die Mikrofontaste in HeliBoard aktiviert werden kann. Damit könnte ich kurzen Text/Gedanken schnell erfassen.

Für längeren Text fallen mir zwei Möglichkeiten ein:

  • Foto → OCR → Text kopieren
    Foto der Buchseite mit OSS Document Scanner erstellen, in der App die Texterkennung ausführen und anschließend daraus kopieren. Getestet und funktioniert gut.
  • Sprachaufnahme erstellen → Am PC in Text umwandeln
    Fossify Voice Recorder scheint eine geeignete App zu sein. Für die Umwandlung der Audioaufnahme in Text am PC suche ich noch.

Wenn jemand Erfahrung, Tipps oder App Empfehlungen hat würde ich mich über eine Rückmeldung freuen.s

Edit: Folgende Apps für die Spracherkennung hab ich noch gefunden

1 „Gefällt mir“

Moin!

Ich finde deine Gedanken spannend und wäre ebenso gespannt auf einen Praxisbericht von dir!

Ich selbst nutze seit Jahren die Fossify-Recorder-App. Die ist absolut gut! Achtung Hinweis: du kannst in den Einstellungen der App die Soundquelle/Art des Mikrofons wählen. Je nachdem, was du da wählst, ist eine Hintergrundgeräuch-Unterdrückung mit dabei oder auch nicht. Mir ist das letztens bei einer Musikaufnahme passiert, dass wegen dieser Einstellung (die ich irgendwann mal gedankenlos gemacht habe) meine gesamte Gitarrensongaufnahme „weggefiltert“ wurde…

Hier meine Erfahrungen zu dem Thema:

Whisper

  • Mit dem Modell „Mehrsprachig, langsam“, ca. 450 MB groß, funktioniert die Spracherkennung gut.
  • Schön ist ein Balken der während der Aufnahme kürzer wird bis man das max. von 30 Sekunden erreicht hat.
  • Unter System->Sprachen->Spracheingabe wird Whisper aufgeführt, bei FUTO ist das nicht der Fall.

FUTO Voice Input

  • Das Modell „Multilingual-244 (slow)“ ca. 250 MB groß funktioniert nach einem kurzen Test vergleichbar gut wie bei Whisper. Die schnellen Modelle bringen bei beiden Apps dagegen keine brauchbaren Ergebnisse für mich.
  • Es gibt viele Einstellungsmöglichkeiten im Vergleich zu Whisper.

Um die Spracheingabe über HeliBoard durch eine Mikrofontaste aufzurufen hab ich nur die Symbolleisten gefunden:
HeliBoard-Einstellungen->Symbolleiste->Angeheftete Tasten der Symbolleiste auswählen->Spracheingabe
Unter Einstellungen->System->Tastatur->Bildschirmtastatur muss die Tastatur aktiviert sein.

Die App Transcribro hab ich über Accrescent installiert. Ein Drücken bzw. halten der Mikrofontaste hat nichts bewirkt. Berechtigungen waren alle gesetzt und eine Fehlermeldung gab es nicht. Daher konnte ich die Spracherkennung damit nicht testen.

Hab mich für die App FUTO Voice Input entschieden und funktioniert soweit.

Zum Thema längeren Text aufnehmen und am PC umwandeln:
Die App Fossify Voice Recorder funktioniert soweit und hat viele Einstellungsmöglichkeiten.
Hier gibt es eine Anleitung der c’t - Whisper wandelt Gesprochenes in Text um wie man das umsetzen kann. Aus Zeitgründen hab ich das noch nicht getestet, aber gehe davon aus es diesen Zweck erfüllt.