Spracherkennung in der Kanzlei – 3 mal schneller?

0
288

1968 war es noch pure Science-Fiction. In der Serie Raumschiff Enterprise stand ein Mann in einem Apartment und diktierte ein Memo. Die Schreibmaschine hinter ihm auf dem Schreibtisch tippte fleißig jedes seiner Wörter, ohne dass sie jemand bedienen musste. Das Konzept der Spracherkennung feierte also als Nebendarsteller in einer US-Serie Premiere, ohne dass jemand groß Notiz davon nahm.

Über 50 Jahre später ist dieses Konzept nicht nur Realität geworden, es unterstützt die Abläufe in Büros, Kanzleien und Gerichten und überall dort, wo naturgemäß viele und lange Briefe erstellt, häufig E-Mails geschrieben und Gutachten formuliert werden. Dabei ist es nicht nur die Texterkennung, die den Workflow unterstützt. Automatisierte Abläufe, Computersteuerung und auch mobiles Diktieren sind inzwischen weitere Vorteile, die eine vernünftige Spracherkennung bietet.

Anders als bei Raumschiff Enterprise ist aber weiterhin kein Computer, der sich auf dem Markt befindet, dazu in der Lage, die Absichten seines Anwenders zu verstehen. Spracherkennung ersetzt darum in keiner Weise einen Menschen, sondern vor allem andere Werkzeuge, die wir im Verlauf der letzten Jahrzehnte als notwendig kennengelernt und akzeptiert haben: Tastatur und Maus.

Dennoch hilft Spracherkennung heute immens dabei, Latenzzeiten zu eliminieren. Die Wartezeiten zwischen Diktat und Korrektur des Geschriebenen fallen weg, natürliche Grenzen durch Arbeitszeiten oder Wochenenden behindern nicht mehr die Fertigstellung eines Dokuments und wertvolle Stunden, die mit der Beantwortung von E-Mails verbracht werden, schrumpfen im praktischen Alltag deutlich zusammen.

Dabei gilt es immer, das Vorhergegangene zu beachten: Spracherkennung ist kein Mensch, es ist der Ersatz für eine Tastatur. Drücken Sie auf der Tastatur keine Interpunktionszeichen, erscheinen sie auch nicht auf dem Bildschirm. Diktieren Sie beim Diktat keine Interpunktionszeichen, kann ein Mensch sie vielleicht aus kognitivem Verständnis heraus einsetzen, Spracherkennung wird das nicht. Das Diktieren für einen Computer ist etwas anderes als das Diktieren für einen Menschen.

Gewöhnt man sich jedoch an diesen fundamentalen Unterschied, bietet Spracherkennung heutzutage für alle Anforderungen eine Lösung. Wird gerne im Auto diktiert, kann das Diktat bereits mit mobilen Daten versendet, im Büro von der Spracherkennung umgesetzt werden und fertig von den Mitarbeitern korrigiert den Diktierer im Büro erwarten. Ein Mitarbeiter, der sich häufig in den Geschäftsräumen des Kunden aufhält, kann Protokolle, Gesprächsnotizen und Dokumente bequem und zeitnah vor Ort erstellen. Dokumente, die am Freitagabend diktiert, aber aufgrund von Wochenende und Arbeitszeiten erst am Montagmittag geschrieben sind, werden durch den Einsatz von Spracherkennung am gleichen Abend versandbereit.

Beim vernünftigen Einsatz von Spracherkennung gilt es dabei nur, einige wenige Punkte zu beachten:

Welche Spracherkennung nutze ich?

Inzwischen gibt es eine Reihe von Lösungen, die für den Windows-PC auf dem Markt erschienen sind. Die meisten von ihnen tragen den Namen Dragon, haben aber eine deutliche Spannbreite beim Preis. Nun kostet ein Fiat Panda auch deutlich weniger als eine S-Klasse von Mercedes, obwohl beides Autos sind. Fahre ich am Tag nur jeweils 3 km zur Arbeit und wieder zurück, wird mich der Unterschied zwischen den Wagen nicht belasten. Muss ich allerdings dreimal in der Woche von Hamburg nach München fahren, könnte das schon ganz anders aussehen. Jeder kennt den Spruch: wer billig kauft, kauft zweimal – und auch hier ist er nicht falsch. Gerade die Legal-Editionen von Dragon liegen preislich im oberen Bereich, bieten aber bei weitem nicht nur eine größere Wortliste, deutlich mehr und für den Berufsstand notwendige Abkürzungen, sondern greifen auf Sprachmodelle zurück, die in der Rechtsarbeit vonnöten sind.

Welches Mikrofon nutze ich?

Spracherkennung funktioniert. Der Flaschenhals ist zum Beispiel das passende Mikrofon. Ein Consumer-Produkt aus dem Elektronikmarkt um die Ecke ist dabei nicht per se auszuschließen, bietet aber mehr als einen Nachteil, den ein professionelles Produkt nicht hat. Dabei ist es nicht hilfreich, dass solche Begriffe wie Noise Cancelling oder Rauschunterdrückung nicht geschützt, sondern von jedem Anwender frei verwendbar sind.

Was für einen Rechner benötige ich?

Die Einschränkungen sind hier minimal. Die größte Einschränkung ist der Bezug auf Windows. Gerade für den Drachen gibt es keine im professionellen Bereich vernünftig nutzbare Edition für einen Apfel-Rechner. Ein Windows PC benötigt lediglich 2 halbwegs schnelle Prozessorkerne, mindestens 4 GB RAM und ein Betriebssystem ab Windows 7 aufwärts. Zusammen mit einer freien Schnittstelle (zum Beispiel einem USB-Port) für ein Mikrofon bildet das die Grundausstattung für den Umgang mit dem Drachen.

Worauf muss ich sonst noch achten?

Es gibt eine Reihe von Anforderungen, die Sie haben. Je mehr Sie den Drachen an diese Anforderungen anpassen wollen, je mehr Konfigurationen müssen vorgenommen werden. Sei es mobiles Diktieren, das Einbinden von Mitarbeitern oder die Erstellung von Texten an mehreren Arbeitsplätzen, die zum Beispiel räumlich getrennt sind. Das wichtigste ist allerdings die Erkenntnis, dass Spracherkennung kein Mensch ist. Gewöhnt man sich beim Diktieren daran, ist der Erfolg quasi garantiert.

Achtet man auf all diese Dinge, lässt sich einmal vernünftig in die Software einweisen und an die eigenen Anforderungen konfigurieren, verspricht Dragon nicht zu viel, wenn die Herstellerfirma behauptet, ihren Workflow schneller zu machen. Dreimal.


Installation, Konfiguration und ein zertifiziertes Training vor Ort erhalten in den Soldan Inhouse-Seminaren zum Thema Spracherkennung