Linguatec, Deutscher Spezialist im Bereich der Sprachtechnologien, hat ein breites Produktangebot und mit Voice Pro Enterprise eine Speech-to-Text-Software für den professionellen Einsatz in Unternehmen mit einer eigenen Server-Struktur im Programm.
Linguatec - Sprachtechnologie aus Deutschland
Die Deutsche Softwareschmiede Linguatec wurde mit kostenlosen Web-Angeboten wie dem Online-Wörterbuch linguaDict bekannt. Mittlerweile hat sich das auf Sprachtechnologien fokussierte Unternehmen allerdings von diesem Marktsegment wieder verabschiedet und bietet eine breite Produktpalette an Sprachlösungen zum Kauf an, die sowohl für den privaten Einsatz als auch für die Nutzung in Unternehmen geeignet sind.
Dazu gehören Text-to-Speech Angebote (Voice Reader), Übersetzungs-Software und Spracherkennungslösungen für den privaten Einsatz ebenso wie zur professionellen Nutzung.
Voice Reader Studio ist etwa eine in 45 Sprachen erhältliche Software, die unter anderem für Verkehrs- und Haltestellendurchsagen in öffentlichen Verkehrsmitteln, Informationsdurchsagen an Flughäfen oder Bahnhöfen, im E-Learning oder zum Erstellen von Hörbüchern eingesetzt wird (Preis: ab 499 €).
Der Personal Translator ist in der x-ten Generation der Nachfolger des Online-Wörterbuchs. Die Software, die 7 Sprachenpaare beinhaltet, generiert automatisch Übersetzungen für den professionellen Einsatz (ab 249 € für Einzelplatz-Lösungen)
Voice Pro Enterprise ist schließlich eine Speech-to-Text-Lösung für den Einsatz in Unternehmen, die Sprache in Texte aller Art (E-Mails, Briefe, Protokolle) umwandelt oder Audiodateien automatisch transkribiert. (Einstiegspreis ab 999 €)
Das bietet Voice Pro Enterprise
Voice Pro Enterprise ist eine eine sprecherunabhängige Spracherkennung für den Einsatz in Unternehmen jeder Größe an. Das bedeutet, dass die jeden Sprecher mit einer hohen Erkennungsgenauigkeit verstehen kann, ohne dass sie zuvor auf den jeweiligen Sprecher trainiert wurde
Die Software baut auf neuronalen Netzen, einem Gebiet der Künstlichen Intelligenz (KI) auf und siet sowohl für den Einsatz am Arbeitsplatz als auch unterwegs geeignet. "Wer tippt denn heute noch selbst?", fragt der Anbieter Linguatec auf seiner Website und wirbt damit, dass Voice Pro Enterprise dreimal schneller als Tippen ist
Die Anwendung basiert auf zwei Services: Einerseits dem Client für Windows und/oder als Java Anwendung und andererseits der eigentlichen Spracherkennungs-Engine, die als Anwendung auf einem Server läuft. Für den Server sind relativ hohe Systemanforderungen zwingend – dabei können sowohl Windows- als auch Linux Server zu Einsatz kommen.
Mit Deutsch und Englisch unterstützt Linguatec Voice Pro Enterprise prinzipiell zwei Sprachen, die Lizenzen dafür müssen jedoch gesondert bezahlt werden.
Linguatec Voice Pro Enterprise beinhaltet in der Standard-Version einen Wortschatz von über 1 Million Worten und Wortabwandlungen. Zusätzlich besteht auch die Möglichkeit, Zusatzpakete mit fachspezifischen Wortschätzen zu den Bereichen Juristik und Medizin zu kaufen. Dadurch eignet sich die Spracherkennungssoftware auch sehr gut für Gemeinschaftskanzleien oder -praxen. Dort kann sich der Einsatz einer solchen angepassten Lösung mit zentraler Datenverarbeitung auch schnell amortisieren.
Der Betrieb der Software funktioniert über die Clientanwendung für Windows. So kann in dieser Software entweder direkt diktiert werden, oder aber auch Sprachdateien beziehungsweise Audioaufnahmen importiert und transkribiert werden. Die transkribierten Audiofiles können anschließend auch synchron zum Text wiedergegeben werden, um das Korrekturlesen und die Überarbeitung zu erleichtern. Auch Plugins für Microsoft Word und Microsoft Outlook existieren – damit kann Text direkt in Dokumente und E-Mails eingefügt werden.
Vor- und Nachteile
Vor allem in sensiblen Branchen mit hohen Datenschutzanforderungen ist die Lösung mit eigenem Server vorteilhaft. Durch das lokale Setup besteht die Sicherheit, dass keinerlei Daten außerhalb des Firmennetzwerks verarbeitet werden. Auch gibt es keine Abhängigkeiten von externen Serverbetreibern.
Ein Nachteil der Lösung von Linguatec sind die nicht vorhandenen Lösungen für mobile Geräte: So können zwar Audiodateien von Diktiergeräten oder auch Smartphones unkompliziert in die Software importiert und somit in Text umgewandelt werden, jedoch gibt es keine Apps für Smartphones, mit denen dies direkt geschehen könnte.
Der größte Nachteil gegenüber einfacheren Lösungen ist der größere technische Aufwand in den Unternehmen selbst und die damit verbundenen höheren Anlaufkosten. Dazu gehören die Server-Setup-Kosten durch IT-Fachleute und eine eventuelle laufende Wartung desselben sowie die Einrichtung der Clients auf neuen Geräten.
Voraussetzung für die Nutzung
Die Software wird auf einem eigenen Server installiert und ist anschließend via Intranet oder von unterwegs mit VPN nicht nur von PCs, sondern auch von Smartphones und Tablets erreichbar.
Durch die vergleichsweise aufwendige Installation der Komponenten empfiehlt sich die Software vor allem für Betriebe mit mehreren Mitarbeiten, in denen eine gemeinsame und zentrale Software zur Spracherkennung eingesetzt werden soll.
Linguatec Voice Pro Enterprise ist frei skalierbar und die Leistung hängt ausschließlich vom verwendeten Server ab. In einer Beispielkalkulation geht Linguatec von 16 CPU-Kernen und 96 GB RAM für das System aus: Damit können neben dem Softwarekern mit Datenbank und Processmanager 10 gleichzeitige Erkennungsprozesse ausgeführt werden.
Größere und schwächere Installationen sind möglich – pro Erkennungsprozess sollte 8 GB Arbeitsspeicher und ein CPU-Kern kalkuliert werden, neben einem Grundbedarf von 8 GB RAM für Betriebssystem und Kernprozesse.
Für IT-Administratoren interessant: Neben der Hauptinstallation mit den Kernkomponenten können Decoder/Erkennungsprozesse auch auf verteilten Systemen installiert werden und nach Bedarf hinzu- und weggeschaltet werden – je nach Last oder Anforderungsprofil. Die gesamte Installation läuft unter Microsoft Windows 10, Server 2012R2, 2016 und 2019, genauso wie auf Ubuntu, Red Hat Enterprise und CentOS.
Fazit: Aufwändig, aber sicher und zuverlässig
Zusammenfassend stellt Linguatec Voice Pro Enterprise eine gut funktionierende Alternative zu anderen Anbietern von Speech-to-Text Software dar. Die größten Vorteile der Lösung liegen in ihrer lokalen Architektur mit Software auf firmeninternen Servern und einem umfangreichen Wortschatz. Auch die Sprachpakete für Juristik und Medizin überzeugen und können den Einsatz in Kanzleien und Gruppenpraxen lohnend machen.
Unternehmen müssen neben den vergleichsweise hohen Investitionskosten auch das eher komplizierte Setup mit umfangreicher Installation nicht nur des Servers auf sich nehmen. Zusätzlicher Aufwand fällt für die Endgeräte der Benutzer an.
Sprachsteuerung und Spracherkennung:
Die besten Lösungen im Vergleich