Update: Spracherkennung für Juristen
Im Jahr 2013 hatten wir die Spracherkennungssoftware Dragon NaturallySpeaking einem ausgiebigen Test unterzogen, um herauszufinden, ob das juristische Lernen und Arbeiten hierdurch erleichtert wird. Den ausführlichen Beitrag mit einigen hilfreichen Fragen/Antworten im Kommentarbereich findet ihr hier. Das Urteil fiel damals äußerst positiv aus. In den letzten Jahren hat sich allerdings noch einiges im Bereich Spracherkennung getan. Grund genug also die aktuellste Version der Spracherkennungssoftware zu testen. Unten findet ihr die Aussagen des damaligen Tests, die nach wie vor unverändert fortgelten, jedoch angereichert um Hinweise in eckigen Klammern, die die neuste Version 13 der getesteten Spracherkennungssoftware betreffen.
Einleitung
Juristisches Lernen ließ sich schon immer gut durch die Arbeit mit dem Computer unterstützen. Insbesondere diejenigen, die nicht mit einer makellosen Handschrift gesegnet sind, sind froh, wenn sie ihre Notizen, Schemata oder sonstigen Lernunterlagen mithilfe von Textverarbeitungssoftware erstellen können. Spätestens beim Anfertigen einer juristischen Hausarbeit wird der Einsatz des Computers sogar obligatorisch. Das Problem beim Erstellen von Lernunterlagen und Texten mithilfe des Computers besteht indes darin, dass das Abtippen – auch für diejenigen, die mit zehn Fingern tippen können – äußerst mühsam, monoton und langwierig ist.
Abhilfe schafft hier der Einsatz von Spracherkennungssoftware. Unangefochtener Marktführer in diesem Segment ist das amerikanische Unternehmen Nuance. Mit der Software Dragon NaturallySpeaking in der aktuellen zwölften [nunmehr dreizehnten] Version lässt sich die Eingabe von Texten bequem einsprechen (Anmerkung: In diesem Sinne wurde z.B. der vorliegende Beitrag ausschließlich mithilfe der vorgenannten Software erstellt.). Die Software basiert an und für sich auf der gleichen Basis wie etwa Apples semantisch-kontextsensitive Spracherkennung Siri. Im Unterschied zu Siri lässt sich NaturallySpeaking jedoch auf einen speziellen Anwender und dessen Sprachgewohnheiten kalibrieren, sodass die Erkennungsrate beim Einsatz dieser Software um ein Vielfaches höher ist als bei Apples Spracherkennung.
Installation, Kalibrierung und Inbetriebnahme
Die Installation gestaltet sich denkbar einfach. Man hat lediglich den selbsterklärenden Anweisungen des Setups zu folgen. Im Anschluss an Installation von NaturallySpeaking Version 12 erfolgt allerdings noch ein recht langwieriges Update auf Version 12.5, sodass hierfür eine gute halbe Stunde anfällt.
Sobald die Software installiert ist, kann man ein Nutzerprofil erstellen und es folgt ein kurzes Training sowie eine Einführung in die Funktionen, damit sich die Software auf die Stimme des Anwenders einstellen kann. Dieser Vorgang dauert auf keinen Fall länger als 10 Minuten. Je nach Version kann hier ein spezielles Fachvokabular direkt ausgewählt werden; für Rechtsanwender gibt es etwa eine sog. Legal Edition, welche jedoch weitaus teurer als die Basis- oder Premium-Version der Software ist. Auch ein Diktieren in englischer Sprache ist – je nach erworbener Version – möglich.
[In der neuesten Version 13 der Software gestaltet sich die Installation noch einfacher. Es bedarf nicht einmal mehr eines Trainings, sondern die Software kann unmittelbar nach der Erkennung des Mikrofons Diktate erkennen. Ebenso entfällt der vorstehend genannte Updateprozess, das heißt, man kann direkt loslegen mit dem Diktieren.]
Sobald man hiermit fertig ist, kann auch schon mit dem Diktieren begonnen werden. Diktiert werden kann in jegliches Texteingabefeld, also insbesondere auch in Texte unter Microsoft Word oder Libre Office. Die Erkennungsgenauigkeit ist nach dem Abschluss des vorgenannten Trainings ohne zusätzliche Einstellungen bereits enorm hoch. Texte ohne spezifische Fachwörter (wie etwa dieser hier) lassen sich so im Grunde fehlerfrei runterschreiben. Ab und an werden einzelne Wörter „falsch“ transkribiert, jedoch lassen sich ebenfalls durch Spracheingabe äußerst zügig die entsprechenden Korrekturen vornehmen.
[Dieses Urteil gilt nach wie vor uneingeschränkt. Gefühlt ist die Erkennungsrate in der neusten Version jedoch geringfügig höher, d.h., es gibt bei Texten ohne Fremdwörter wirklich nur noch in Ausnahmefällen eine falsche Erkennung. Darüber hinaus lernt die neueste Version der Software noch aktiver mit, sodass eingesprochene Korrekturen eines Textes (z.B. „Schreib XX anstelle von YY“) beim Lernprozess der Software berücksichtigt werden und sich die Erkennung noch einmal merklich verbessern.]
Lieferumfang und Systemanforderungen
Im Lieferumfang enthalten ist standardmäßig ein für die Spracherkennung geeignetes Headset, das über USB angeschlossen wird, die Installations-DVD sowie eine Kurzanleitung. Wer mit der Software aber richtig Freude haben möchte, dem sei dringend der Erwerb eines kabellosen Headsets angeraten, da man so beim Diktieren auch einmal vom Schreibtisch aufstehen und munter durch die Gegend spazieren kann, während man seiner Texteingabe frönt.
Damit der eingesprochene Text auch umgehend auf dem Bildschirm erscheint, bedarf es eines halbwegs ordentlichen Computersystems. Die Software lässt sich wohl auch auf langsameren PCs installieren, jedoch macht das Arbeiten auf solchen aufgrund von Hängern und Verzögerungen nicht wirklich Spaß. Auf einem mittelmäßigen Quad-Core-Prozessor sowie 8 GB RAM mit Windows 8 läuft NaturallySpeaking allerdings tadellos. Zwischen dem Einsprechen und dem Erscheinen des diktierten Textes auf dem Bildschirm findet bei einem derartigen System quasi keine Verzögerung statt.
Lernen mit Spracherkennung
Nun aber zur interessanten Frage: Ist der Einsatz von Spracherkennungssoftware wirklich sinnvoll für Jurastudenten oder Rechtsreferendare? Als Antwort kann an dieser Stelle nur ein klares „Ja“ gegeben werden. Dies jedenfalls dann, sofern sich das Diktieren mit dem jeweiligen Lerntypus vereinbaren lässt.
Der Verfasser spricht aus eigener Erfahrung, denn er hat seinerzeit zum Zwecke der Vorbereitung auf sein erstes Staatsexamen mehrere 100 Seiten lange Skripten mittels einer älteren Version von Dragon NaturallySpeaking erstellt. Dies gestaltete sich wie folgt: Man nehme sich ein durchzuarbeitendes Lehrbuch, Skript bzw. einen Aufsatz oder Urteil und lese den Text aufmerksam. Während des Lesens kann sich der Lernende sodann unter Zuhilfenahme von NaturallySpeaking sowie Microsoft Word bzw. eines anderen Textverarbeitungsprogramms Notizen machen. Dies funktionierte (bei Einsatz der älteren Version) am besten, wenn man im Fließtext diktiert. Die neueste Version der Software hat indes eine so hohe Erkennungsrate, dass auch das Diktieren von Stichpunkten kein Problem mehr darstellen sollte.
Der Vorteil bei dieser Methode besteht jedenfalls darin, dass auf diese Weise kaum mehr zusätzlicher Zeitaufwand durch das Abtippen (in Relation zum Lesen der Inhalte) entsteht. In äußerst kurzer Zeit kann so ein eigenständiges Skript, eine Sammlung von Schemata oder auch der Inhalt von Karteikarten diktiert werden. Da die Erkennungsrate mittlerweile – je nach Nutzer und Konfiguration – hin zu 100 % tendiert, bedarf es im Anschluss nur noch einer äußerst geringfügigen Nachbearbeitung und Korrektur des erstellten Textes. Sofern sich Fehler bei der Spracherkennung eingeschlichen haben, die man versehentlich nicht korrigiert hat, ist dies in den meisten Fällen auch nicht weiter schlimm, da auch bei falscher Erkennung in fast allen Fällen erkennbar ist, was der Diktierende gemeint hat (es kann etwa sein, dass statt „§ 13 BGB“ „Prager 13 BGB“ erkannt wurde).
Der Vorteil beim Diktieren mit der Spracherkennung liegt darin, dass man juristische Inhalte nur dann Eindiktieren kann, wenn man diese auch wirklich verstanden hat. Durch das Diktieren wird man zudem gezwungen sich auf das Wesentliche zu fokussieren, da man beim Einsprechend relativ schnell merkt, wann ein Satz oder eine Formulierung zu kompliziert wird.
Der in Augen des Verfassers größte Vorteil gegenüber dem „manuellen“ Niederschreiben besteht zuletzt aber auch darin, dass man beim Diktieren die Augen nicht vom Lehrbuch abwendet. Man erspart sich also das ständige Aufschauen hin zum Bildschirm beim Abtippen bzw. das Entgleiten vom Text beim Erstellen von handschriftlichen Übersichten oder Karteikarten.
Spracherkennung als Arbeitshilfe im Referendariat [oder in der beruflichen Praxis]
Auch im Referendariat ist die Zeitersparnis durch den Einsatz dieser Software nicht zu unterschätzen. Insbesondere das Bearbeiten von Akten, sei es etwa für die Gerichtsstage oder die Staatsanwaltschaft, kann so deutlich vereinfacht werden. Beim Durchgehen einer Akte lassen sich mittels der Spracherkennungssoftware effizient Notizen samt Verweisen auf das jeweilige Blatt der Akte anfertigen. Auf Basis dieser Notizen lassen sich im Anschluss sehr schnell etwa ein Tatbestand für ein Urteil oder ein Konkretum für eine Anklageschrift zusammenfügen.
[In der beruflichen Praxis ist der Nutzen einer gut funktionierenden Diktiersoftware ebenfalls enorm. Der Vorteil im Vergleich zum Diktat, das z.B. von einer Schreibkraft abgetippt wird, besteht v.a. darin, dass der eingesprochene Text unmittelbar auf dem Bildschirm erscheint (und nicht erst am nächsten Tag als fertige Word-Datei). Bei der Aufnahme eines längeren Diktats wird es zudem meist schwer fallen, ganze Textblöcke zu verschieben, wohingegen dies bei dem Diktieren mit Software ohne weiteres direkt am Bildschirm umgesetzt werden kann. Zuletzt besteht bei komplizierten / schwer verständlichen Fachwörtern ein Vorteil beim Einsatz von Diktiersoftware, da man der Software einen komplizierten Begriff nur einmal erklären muss (danach wird der Begriff stets fehlerfrei transkribiert). Beim Diktat mit einer Schreibkraft ist das Risiko, dass sich bei derartigen Wörtern (Tipp)Fehler einschleichen hingegen oftmals höher, insbesondere dann, wenn Diktate teilweise von unterschiedlichen Personen abgetippt werden.]
Wissenschaftliches Arbeiten mit Spracherkennung
Ebenfalls aus eigener Erfahrung spricht sich der Verfasser für den Einsatz von Spracherkennungssoftware beim wissenschaftlichen Arbeiten aus. Wer etwa eine Dissertation, einen Aufsatz für eine Fachzeitschrift oder eine Seminararbeit anfertigt, sieht sich oftmals damit konfrontiert, zunächst Herr über eine gewisse Stoffmenge im Hinblick auf Judikatur sowie den literarischen Meinungsstand zu werden. Beim Lesen und Analysieren der jeweils einschlägigen Quellen kann man sich durch das beiläufige Diktat sehr schön Notizen zu den Kernthesen und relevanten Aspekten der Quellen machen. Hierbei bietet es sich an, auch direkt die Fundstelle mit zu diktieren, da so ein erneuter Blick in die Quelle erspart bleibt.
Des Weiteren besteht ein erheblicher Vorteil beim Diktieren darin, dass das Paraphrasieren der jeweils zitierten Quellen oftmals einfacher fällt als beim sturen Abtippen. Auf diese Weise vermeidet man, dass aus Versehen eines der heutzutage gefürchteten Plagiate in den Text eingebaut wird.
Im Übrigen bietet sich der Einsatz von Spracherkennungssoftware an, wenn ein Gedankenkonstrukt des Autors in Fließtext umgewandelt werden soll. Als Autor steht man am Anfang nämlich erst vor einem weißen Blatt. Beim Diktieren füllt sich dieses jedoch in Sekundenschnelle. Den Gedanken kann erst einmal freier Lauf gelassen werden. Überflüssige oder unsinnige Formulierung können später immer noch gestrichen werden. Wer viele Texte verfasst oder korrigiert kennt das Phänomen, dass das Umformulieren und Streichen von Textstellen zumeist viel einfacher und schneller von der Hand geht als das erstmalige Formulieren.
Finetuning
Wer längerfristig mit Spracherkennungssoftware arbeiten möchte, hat mit dem hier rezensierten Produkt von Nuance den Vorteil, dass etliche Sprachbefehle und Gewohnheiten individuell eingestellt werden können. In diesem Sinne ist es z.B. möglich, bereits existierende Textdateien mithilfe des Programms zu analysieren, um noch nicht unterstützte Fremdwörter in die Wörterbuchdatenbank aufzunehmen. Dies ist für Juristen insbesondere notwendig, wenn nicht mit der äußerst teuren Legal Edition gearbeitet wird (so musste zumindest in einer älteren Basisversion zunächst eingestellt werden, dass beim Diktieren des Wortes „Paragraph“ ein Paragraphenzeichen geschrieben wird. Ähnlich verhielt es sich zumindest bei der alten Version mit den Abkürzungen von wichtigen Gesetzen). Der Bedarf an Sonderbefehlen und Programmierung hält sich auch hier (abgesehen von den vorgenannten Besonderheiten) im Übrigen jedoch in Grenzen.
Sofern das Programm bestimmte Begriffe nicht richtig erkennt, lassen sich zudem mannigfaltige Einstellungen zur Optimierung vornehmen. Eine Vielzahl von Verbesserungen der Erkennungsrate wird hierbei aber bereits während des Diktats von der Software vorgenommen, ohne dass sich der Nutzer gezielt hierum kümmern muss.
Unterstützung von Smartphones
Die neuste Version von Dragon NaturallySpeaking unterstützt auch Smartphones. D.h. man kann sich eine App (Anmerkung: Dieses Wort erkannte die Software etwa nicht auf Anhieb) auf seinem Mobiltelefon installieren, womit das Telefon als Diktiergerät genutzt werden kann. Das so erstellte Diktat kann dann mittels der Software in eine Textdatei transkribiert werden.
Spracherkennung im Alltag
Die Spracherkennungssoftware kann nicht bloß für das Erstellen von längeren Texten eingesetzt werden. Es lässt sich darüber hinaus noch jedes der gängigen Betriebssysteme mit der Software steuern. E-Mail-Programme wie GoogleMail oder Outlook können auch mit der Software bedient werden.
Der Nutzen dieser Funktionen erschließt sich für den Verfasser indes nicht wirklich. Wer eine kürzere E-Mail schreiben will, wird mit Tastatur und Maus in den meisten Fällen schon noch schneller sein als mit der Spracherkennung. Bei längeren Texten machen sich die Vorteile, wie bereits angedeutet, jedoch bemerkbar.
Nachteile beim Einsatz von Spracherkennung
Auch wenn der Verfasser dieser Rezension ein großer Verfechter vom Diktieren von Texten ist, so hat der Einsatz von Spracherkennungssoftware auch einige Nachteile. Der für Studenten relevanteste Nachteil besteht darin, dass das Diktieren in öffentlichen Bibliotheken oder im Rahmen einer Lerngruppe nur schwerlich möglich ist. Wer sich also nicht total zum Affen machen möchte, bleibt lieber zuhause.
Darüber hinaus ist der große Vorteil des schnellen Perpetuierens von Gedanken gleichzeitig auch der größte Nachteil der Software. Man neigt dazu (wie bereits aus dem Umfang dieses Beitrags erkennbar wird), sehr viel niederzuschreiben, obwohl in manchen Fällen auch eine konzisere Formulierung und Komprimierung des Inhalts möglich wäre. Dem lässt sich, wie bereits angemerkt, jedoch effektiv entgegenwirken, indem man den diktierten Text noch einer kritischen Abschlusskorrektur und Kürzung unterzieht.
Fazit
Die Spracherkennungssoftware Dragon NaturallySpeaking arbeitet in der aktuellen Version erschreckend genau. Sofern Fehler beim Diktieren entstehen, liegt dies in den allermeisten Fällen nicht an der Software, sondern an demjenigen, der den Text undeutlich oder fehlerhaft eingesprochen hat. Für die oben genannten Zwecke kann der Einsatz der Software (sofern man sich generell mit dem Diktieren anfreunden kann) äußerst lohnenswert und vor allem zeitsparend sein. Die Angabe des Herstellers, dass die Spracherkennung ca. dreimal schneller sei als herkömmliches Tippen, dürfte selbst für die geübtesten Zehnfingerschreiber (Anmerkung: Dieses Wort hat die Software ohne Fehler umgesetzt) zutreffen. Wer sich noch umfassender über das Thema informieren möchte, dem sei im Übrigen noch dieser Artikel empfohlen.
[Die neue Version 13 bringt gegenüber der Vorversion keine großen Änderungen, sondern stellt lediglich ein Update dar, was sich z.B. beim verbesserten Installationsprozess oder der (allerdings nicht wesentlichen) Steigerung der Erkennungsrate zeigt. Wer bereits mit der damaligen Version gut arbeitet, kann sich den Erwerb der neuesten Version deshalb sparen. Wer zuvor noch keine Spracherkennungssoftware genutzt hat, kann mit Dragon NaturallySpeaking in der neuesten Version 13 indes nichts falsch machen. Der oft geäußerte Hinweis, dass die Produkte von Apple/Google/Microsoft doch auch Spracherkennungsfunktionen bieten, so dass es keiner zusätzlichen Software bedarf, steht (zumindest derzeit noch) entgegen, dass diese Funktionen nicht für die professionelle Textverarbeitung, sondern eher für das Diktieren von kurzen Texten bzw. die Bedienung von Smartphones/Tablets ausgelegt sind. Wer einmal mit richtiger Spracherkennungssoftware im im Zusammenspiel mit Textverarbeitungssoftware wie Microsoft Word gearbeitet hat, wird den Unterschied bemerken.]
Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!