Diktiersoftware für Vielschreiber

0
1169
Diktiersoftware für Vielschreiber

Was schätzen Sie: Wie viele Wörter schreiben Sie pro Tag auf dem Computer? Wie fühlen sich ihre Finger am Ende des Tages an? Ihre Handgelenke? Und ihr Nacken? Text mit der Tastatur einzugeben ist eine uralte Methode. Sie wurde zu einer Zeit erfunden, in der es noch keine Computer gab und in welcher die Schreibmaschine den Gipfel des technologischen Fortschrittes darstellte. Moderne Diktiersoftware könnte die Lösung für Sie sein.

Ergonomisch waren Tastaturen noch nie wirklich. Die menschlichen Finger sind einfach nicht dazu gemacht, 10.000 Tastenanschläge oder mehr pro Tag auszuführen. Professionelle Texter trainieren sich darauf, mit dieser Steinzeitmethode effizient zu arbeiten.

Leider können wir unsere Texte noch nicht durch blosse Gedankenübertragung in den Computer eingeben. Aber wir könnten wenigstens eine Diktiersoftware dazu benutzen.

Vorteile und Nachteile von Diktiersoftware

Diktiersoftware hat viele Vorteile gegenüber der manuellen Texterfassung:

  • Das Schreiben von Text geht bis zu dreimal schneller als von Hand.
  • Der Computer macht keine Tippfehler. Wenn er ein Wort erkannt hat, schreibt er es richtig. (Dass dies auch gefährlich sein kann, wird unter «Nachteilen» erklärt.)
  • Diktieren ist wesentlich ergonomischer als Tippen. Es schont Finger, Handgelenke und Nacken.
  • Man kann es sich bequem machen. Die Hände müssen nicht nach vorne ausgestreckt werden. Man kann sie stattdessen dazu nutzen, in den Unterlagen zu blättern. Oder Kaffee zu trinken.

Nicht verschwiegen werden sollten die Nachteile von Diktiersoftware:

  • Man braucht einen Arbeitsplatz, an welchem man andere nicht durch das Diktieren stört. Vielleicht deshalb ist Diktiersoftware in Grossraumbüros nicht weit verbreitet. Man will ja nicht, dass alle hören, was man seinem Computer anvertraut.
  • Fehler werden weniger schnell erkannt. Wir sind darauf trainiert, falsch geschriebene Wörter zu erkennen. Dasselbe gilt für Rechtschreib-Programme. Nur: Diktiersoftware begeht keine Tippfehler. Alle Wörter sind immer korrekt geschrieben. Beim Diktieren entsteht aber eine andere Art von Fehlern: falsch verstandene Wörter. Dies ist gefährlich, weil wir den Text sehr aufmerksam lesen müssen, um solche Fehler zu bemerken.
  • Es braucht eine deutliche Aussprache. Wenn man erkältet oder betrunken ist, funktioniert das Diktieren nicht besonders gut. (Das Schreiben übrigens ebenfalls nicht.)

Spracherkennung beruht auf künstlicher Intelligenz (Machine Learning). In diesem Bereich hat die Computerindustrie gewaltige Entwicklungssprünge vollbracht. Dies beweisen die zahlreichen Sprachassistenten, mit welchen heutzutage die meisten Betriebssysteme ausgerüstet sind: Siri (Apple), Cortana (Microsoft), Bixby (Samsung), «Ok Google», usw.

Diktiersoftware hat enorm viel vom Fortschritt der Computerindustrie profitiert. Aktuelle Programme arbeiten mit einer Erkennungsrate von 99%. Diese Erkennungsrate bedeutet, dass das Programm auf einer A4-Seite höchstens 3-4 Fehler schreibt.

Arbeiten mit Diktiersoftware

Arbeiten mit Diktiersoftware

Die erste Voraussetzung ein gutes Diktierprogramm. Es lohnt sich nicht, hier zu sparen. Denn schlechte Programme verursachen Ihnen mehr Arbeit, als sie Ihnen abnehmen.

Gute Hardware

Weil Diktierprogramme auf künstlicher Intelligenz basieren, erfordern sie eine hohe Rechenleistung. Hier gilt: viel bringt viel. Je leistungsfähiger der Computer-Prozessor (CPU) ist, desto präziser arbeitet die Software und desto weniger Korrekturaufwand generiert sie.
Ebenfalls Pflicht ist ein gutes Mikrofon. Am besten eignen sich Headsets, weil die Position des Mikrofons zum Mund unverändert bleibt, auch wenn Sie den Kopf bewegen.

Diktiersoftware

Training des Diktierenden

Das Arbeiten mit Diktiersoftware muss genauso gelernt werden wie zum Beispiel das Arbeiten mit Photoshop oder Excel. Dabei geht es weniger um die Bedienung des Programmes, sondern vielmehr um die Arbeitsweise: Mit Diktiersoftware schreibt man anders als mit der Tastatur.
Mit Diktiersoftware schreibt man mühelos und schnell ganze Seiten voll, hat aber wenig Einfluss auf die Fehler. Manchmal versteht die Software ein Wort einfach nicht korrekt, egal, wie deutlich man es ausspricht. Kontrollfreaks kann dies in den Wahnsinn treiben. Dies ist also das Erste, was sie lernen müssen, wenn sie mit Diktiersoftware arbeiten wollen: Fehlertoleranz. Seien Sie nett und geduldig, wenn die Software ein Wort falsch schreibt und lassen Sie sich nicht dazu verlocken, es sofort korrigieren zu wollen. Und schreien Sie den Computer nicht an. Bleiben Sie cool und bringen Sie dem Programm bei, was Sie sagen wollten. Diktiersoftware ist lernfähig und Sie sind der Lehrer oder die Lehrerin.

Eine Hauptschwierigkeit sämtlicher Diktierprogramme ist die Interpunktion. Wie soll das Programm erkennen, wann Sie das Wort «Punkt» schreiben wollen und wann das Interpunktionszeichen «.»? Hier braucht es Übung und ein bisschen tüfteln.

Telefonie & Digital

Auch das Korrigieren will gelernt sein. Beim Tippen arbeiten wir mit Maus und Rücktaste. Text mithilfe von Diktat zu korrigieren muss zuerst gelernt werden.
Die meisten von uns sprechen Deutsch mit einem lokalen Akzent. Egal ob wir schweizerisch, bayerisch, öster- reichisch, sächsisch, usw. sprechen: Nichts davon versteht die Diktiersoftware. Die kann nur «Hochdeutsch». Es braucht also eine korrekte, deutliche Aussprache, damit die Wörter richtig verstanden werden.
Wenn Sie beim Diktieren lachen, versteht die Software kein Wort. Auch dies müssen sie trainieren: Das Lachen unterdrücken und ernst bleiben, auch wenn sie etwas Lustiges schreiben – oder wenn die Software einen lustigen Fehler produziert.

Training der Diktiersoftware

Diktiersoftware muss laufend dazu lernen:

  • Welchem Wort ein bestimmtes akustisches Muster zuzuordnen ist. «Akustisches Muster» ist eine Kombination von Aussprache, Störgeräuschen und Hintergrundrauschen. Wenn diese Parameter konstant bleiben, kann die Software lernen, das Gesagte mit fast 100-prozentiger Sicherheit einem bestimmten Wort zuzuordnen.
  • Vokabular. Wir Menschen verwenden in unserer Alltagssprache zwischen 30.000-50.000 Wörter. Hinzu kommen Fachbegriffe, die sich je nach Beruf unterscheiden. Besonders krass ist das Vokabular von Medizinern und Juristen. Hier kommen Wortungetüme vor, die Normalsterbliche noch nicht mal entziffern, geschweige denn verstehen können. Professionelle Diktiersoftware verfügt über starke Importfunktionen, damit Sie Spezialvokabulare bequem einlesen können. Die führenden Programme bieten Versionen für Mediziner und Juristen, in denen diese Vokabulare bereits integriert sind.

Welche Diktiersoftware gibt es überhaupt?

Dragon

Der Markt der Diktiersoftware ist extrem klein. In den neunziger Jahren des letzten Jahrhunderts gab es zwei Konkurrenten: Dragon Dictate und ViaVoice von IBM. Beide waren einander ebenbürtig. Dann verlor IBM das Interesse an ViaVoice und Dragon verblieb als einziges ernstzunehmendes Diktierprogramm auf dem Markt.

Dragon wurde mehrfach aufgekauft und gehört heute der Firma Nuance.
Dragon markiert den aktuellen Goldstandard der Diktier-Software. Die wichtigsten Features sind:

  • Automatische Anpassung an die Sprechweise und die Audio-Umgebung mithilfe von künstlicher Intelligenz. Die Spracherkennung funktioniert bereits ohne Sprechtraining sehr gut. Allerdings kann die Erkennungsgenauigkeit mit individuellem Training weiter gesteigert werden.
  • Sehr hohe Erkennungsgenauigkeit. Dies bezieht sich nicht nur auf das Erkennen von Wörtern, sondern auch auf Interpunktion und die Unterscheidung von Gross- und Kleinschreibung.
  • Das Programm lernt durch Korrekturen. Wenn ein Wort falsch erkannt wird, kann man es korrigieren. Dadurch lernt Dragon, wie sie dieses Wort aussprechen.
  • Formate für Zahlen, Datumsangaben, Währungen und dergleichen können individuell festgelegt werden.
  • Direktes Diktieren in Anwendungen wie zum Beispiel Microsoft Word. Für Anwendungen ohne Integration bietet Dragon ein Diktierfenster, das sich automatisch öffnet. Der dort erfasste Text wird über die Zwischenablage in die Anwendung kopiert.
  • Befehle für das Formatieren von Text. «Mach das gross» schreibt das Wort gross, «mach das fett» in Fettdruck, usw.
  • Befehle für das Steuern von Windows und Anwendungsprogrammen, für das Ausführen von Tastendruck und Mausklick sowie das Navigieren im Web.

Einige Funktionen sind nur in der teuren Produktversion «Professional » verfügbar

  • Import von Wortlisten, um das Vokabular zu erweitern
  • Lernen von neuen Wörtern anhand vorhandener Dokumente
  • Diktate aufzeichnen und später von Dragon in Text umwandeln lassen

Dragon bietet umfassende Funktionen, um die Leistung zu optimieren. So können nicht benötigte Programmbereiche (zum Beispiel das Navigieren im Web) deaktiviert werden oder der Anwender kann wählen, ob auf Tempo oder auf Präzision hin optimiert werden soll. Auch das Anpassen an das Audioprofil und die Sprechweise kann beliebig trainiert werden, was die Erkennungsgenauigkeit nochmals erheblich steigert.
Die preisgünstigste Version ist «Dragon Home»; sie kostet ungefähr CHF 160. Die Version «Professional Individual» schlägt mit rund CHF 700 zu Buche.
Zusätzlich bietet Dragon eine Smartphone-App namens «Dragon Anywhere». Diese kostet im Monatsabo CHF 15, im Jahresabo CHF 150. Diktate können mit Dragon Professional synchronisiert werden.

Von Dragon sind diverse Branchenlösungen erhältlich, unter anderem für das Gesundheitswesen, Rechtswesen, Finanzwesen und Bildungswesen.

Linguatec Voice Pro 12

Die Softwareschmiede von ViaVoice, Linguatec, hatte vor rund zehn Jahren einen neuen Kooperationspartner gefunden: Microsoft. Heute wird ViaVoice unter dem Markennamen Linguatec Voice Pro 12 angeboten. Voice Pro 12 bietet in etwa denselben Leistungsumfang wie Dragon:

  • Direktes Diktieren in Microsoft Office Programme
  • Spezialvokabular für Fachgebiete
  • Umfassende Sprachsteuerung des Computers (Befehle, Navigation, usw.)

Voice Pro 12 kommt mit einem eigenen Textverarbeitungsprogramm («Voice Pad»), das ähnlich funktioniert wie Microsoft Word, aber auf Diktate mit Voice Pro ausgelegt ist.
Die Standardversion von Voice Pro kostet etwa gleich viel wie die Home Version von Dragon, enthält jedoch viele Funktionen, die bei Dragon erst in der teuren Version «Professional Individual» verfügbar sind:

  • Das Vokabular erweitern, indem das Programm von vorhandenen Dokumenten lernt
  • Umsetzen von Audioaufzeichnungen (sie zeichnen ihr Diktat auf und lassen es später vom Computer in Text umwandeln)
  • Benutzerdefinierte Sprachbefehle für das Einfügen von Textbausteinen

Im Gegensatz zu Dragon liefert Linguatec ein 300 Seiten starkes deutschsprachiges Benutzerhandbuch (Download) und eine deutschsprachige Befehlsreferenzkarte zum Ausdrucken.
Voice Pro 12 Premium kostet rund CHF 100, bzw. CHF 180 inklusive mitgeliefertem Headset. Spezialversionen mit medizinischem oder juristischem Vokabular kosten rund CHF 300 (ohne Headset).
Alles in allem bietet Voice Pro 12 ein massiv günstigeres Preis-Leistungs-Verhältnis als Dragon. Allerdings ist diese Software nicht für Windows 10 erhältlich. Laut Auskunft von Linguatec (Mail im Dezember 2019) ist sie nur bis und mit Windows 8 freigegeben. Aus diesem Grund konnte sie für diesen Artikel nicht getestet werden. Eine Demo-Version existiert übrigens auch nicht. Unklar bleibt daher, wie gut die Software in der Praxis funktioniert.

Speechnotes

Von Google gibt es die kostenlose Software Speechnotes. Google nennt sie «Online Diktier-Notepad». Man öffnet im Chrome-Browser die Website https://speech- notes.co, diktiert seinen Text und lädt ihn herunter. Dies funktioniert erstaunlich gut. Da keine Anpassung an das individuelle Sprecherprofil möglich ist, muss man sich aber um eine besonders deutliche Aussprache bemühen.
Speechnotes verfügt über einen erstaunlichen Wortschatz. Auch Fremdwörter und komplizierte Ausdrücke werden problemlos erkannt. Das Geheimnis dahinter: Google sitzt auf einem gigantischen Datenberg und kennt daher so ziemlich jedes Wort, das jemals im Internet zu lesen war.
Die Hauptschwäche von Speechnotes ist das Erkennen von Interpunktionszeichen. Es ist beispielsweise schlicht unmöglich, das Wort «Interpunktion» zu schreiben. Speechnotes macht daraus immer «Inter.ion». Sprachbefehle wie «neuer Absatz» oder «neue Zeile» werden meistens nicht erkannt.
Die diktierten Texte werden automatisch gespeichert. Man kann sie als Word- oder Textfile herunterladen oder über die Zwischenablage in eine Anwendung kopieren. Ausdrucken geht ebenfalls.
Speechnotes eignet sich sehr gut als Gratisprogramm, wenn man mit den erwähnten Einschränkungen leben kann.

Eingebaute Diktierfunktion von Microsoft Office

Microsoft Office verfügt über eine eingebaute Diktierfunktion. Diese basiert auf den Spracherkennungsalgorithmen von Cortana. Man klickt oben auf das Feld «diktieren» und diktiert einfach drauflos. Wie gut oder schlecht das funktioniert, sehen Sie im Screenshot. Dort wurde dieser Text diktiert. Ein anderes Problem dieser Diktierfunktion: Sie schaltet sich manchmal von selbst aus und muss manuell wieder aktiviert werden. Insgesamt wirkt diese Diktierfunktion nicht ausgereift und erlaubt kaum ein professionelles Arbeiten.

Fazit

Es gibt de facto nur ein einziges Diktierprogramm, welches für Vielschreiber taugt: Dragon Naturally Speaking. Der einzige ernst zu nehmende Konkurrent, Voice Pro 12 von Linguatec, wird anscheinend nicht mehr weiter entwickelt und nicht für Windows 10 angeboten.
Der gesamte Text dieses Beitrags wurde mit Dragon diktiert. Selbstverständlich waren manuelle Korrekturen erforderlich, diese beschränkten sich jedoch auf Kleinigkeiten.
Wer nicht gleich CHF 700 ausgeben will, kann sich mit «Dragon Home» begnügen. Im Internet findet man auch preisgünstige Lizenzen für «Dragon Professional Individual», welche aus Gruppenlizenzen stammen. Diese bieten den vollen Funktionsumfang, aber weder Update- noch Registrierungs-Berechtigung.

Jan Strasser

 

Diese Artikel könnten Sie ebenfalls interessieren:

Chat GPT Präsentation erstellen – so wird es zum Erfolg – Flow (flowbusinessmag.com)

Mit ChatGPT Geld verdienen – so funktioniert es (flowbusinessmag.com)

Identitätsbasierte Markenführung – Vorteile für Unternehmen (flowbusinessmag.com)

8 Dinge, die die Schweiz zur wahren Innovationskraft macht – Flow (flowbusinessmag.com)