Ihre Daten sind bei uns sicher

Als Datenschutzexpert*innen klären wir transparent darüber auf, welche Daten wie und warum verarbeitet werden (zur Datenschutzerklärung, zum Impressum). Auf dieser Website verwenden wir Cookies. Das sind kleine Dateien, die lokal im Browser gespeichert werden. Einige dieser Cookies sind unbedingt erforderlich, damit Sie diese Website nutzen können und alles richtig funktioniert. Über die Verwendung anderer Cookies entscheiden Sie selbst. Ganz gleich wie Sie sich entscheiden – wir respektieren Ihre Privatsphäre und wir gehen stets verantwortungsvoll mit den Daten um, die Sie uns anvertrauen.

Die Technik hinter dSprachKI Wenn das Protokoll sich selbst schreibt

02.03.2026

4 min.

Nach wenigen Minuten ist das Protokoll fertig. Eine Stunde Sitzung, Wort für Wort transkribiert, inklusive Schlagworte und Zusammenfassung. Was im Verwaltungsalltag bislang einen halben Arbeitstag kosten konnte, erledigt dSprachKI deutlich effizienter. Dataport hat das Transkriptionstool gemeinsam mit IBM für den sicheren Einsatz in Behörden entwickelt.

Protokollieren gehört zum Verwaltungsalltag. Mitschriften von Sitzungen, Verhandlungen oder internen Besprechungen sind oft Pflicht und binden entsprechend viel Arbeitszeit. dSprachKI beschleunigt diesen Prozess erheblich und wandelt das gesprochene Wort in Text um. Ob direkt aus einem Gespräch mit mehreren Sprecher*innen oder aus hochgeladenen Audio- oder Videodateien: Innerhalb weniger Minuten liegt die fertige Mitschrift vor. Das bedeutet eine dauerhafte Arbeitserleichterung für Behörden. „Man muss das Transkript nur noch überprüfen und anpassen, statt alles von Grund auf abzutippen“, erzählt Jill Sammet, Data Scientistin bei Dataport. Sie ist seit Beginn der Entwicklung von dSprachKI im Jahr 2024 dabei.

Jill Sammet, Data Scientistin bei Dataport

Ich stelle mir KI gerne als eine Art Praktikanten vor, der neu ist, und von dem man noch nicht genau weiß, was er kann. Man gibt ihm Aufgaben und überprüft natürlich immer alles – und mit der Zeit merkt man, dass er das doch ganz gut kann.“

Jill Sammet

Data Scientistin bei Dataport

Automatic Speech Recognition als Grundlage

Zuerst suchten sie und ihr Team nach einer robusten, sicheren und praxistauglichen technischen Grundlage für dSprachKI. Letztlich fiel die Wahl für die „Automatic Speech Recognition“, also die automatische Spracherkennung, auf das Open-Source-Modell „Whisper“: Dabei überzeugte Jill Sammet und ihr Team insbesondere, dass die transkribierten Resultate in Tests die geringste Fehlerrate zeigten. Selbst Dialekte waren kein Hindernis, wie Jill Sammet erzählt: „Wir haben dSprachKI unter anderem mit Schweizerdeutsch und Bayerisch getestet, das hat ohne Probleme funktioniert. Das Tool ist auch gegenüber Störgeräuschen robust – bis zu einem gewissen Grad ist selbst Nuscheln kein Problem.“

Der Weg zum fertigen Transkript

Doch dSprachKI kann noch mehr, als nur Sprache in Text umzuwandeln: Beispielsweise sorgt die Sprecherkennung dafür, dass verschiedene Sprecher*innen in einer Aufnahme erkannt und gesprochene Worte entsprechend zugeordnet werden. Wer wiederum mit dem fertigen Transkript weiterarbeiten möchte, kann gezielt Fragen zum Inhalt stellen, nach bestimmten Schlüsselbegriffen suchen oder sich Zusammenfassungen generieren lassen. Für diese Funktionen kommt ein weiteres Open-Source-Sprachmodell zum Einsatz – „Mistral“. Während „Whisper“ für die präzise Transkription sorgt, übernimmt „Mistral“ die intelligente Verarbeitung und Analyse des Textes. So profitieren die Nutzer*innen von einer leistungsstarken Kombination aus Spracherkennung und künstlicher Intelligenz.

Screenshot der Titelseite von dSprachKI

Hohe Anforderungen für den Einsatz in Behörden

Eine der größten Hürden für das Team von Dataport und IBM war der Datenschutz, denn für den Einsatz im behördlichen Umfeld gelten besondere Maßstäbe. Gerade bei Gerichtsverhandlungen oder polizeilichen Vernehmungen etwa geht es um sensible Daten, die höchsten Schutzanforderungen unterliegen. dSprachKI wird deshalb vollständig im BSI-zertifizierten Rechenzentrum von Dataport betrieben. Die eingesetzten Sprachmodelle laufen auf der data[port]ai KI-Plattform. Sensible Inhalte bleiben somit in einer kontrollierten, digital souveränen Infrastruktur. Damit wird der Einsatz von KI transparent und kontrollierbar.

Diese Sicherheitsaspekte stellten das Entwicklerteam schon in der Testphase vor hohe Anforderungen. Jill Sammet: „Wir konnten nicht mit echten Daten mit hoher Schutzstufe arbeiten. Also haben wir viel Zeit investiert, um möglichst realitätsnahe Daten zu generieren. Wir haben unter anderem Beispiele selbst eingesprochen und auf simulierte Gerichtsverhandlungen zurückgegriffen, um möglichst nah an echte Use Cases heranzukommen.“

Screenshot der Chatfunktion mit dem Protokoll

KI als Frage des Vertrauens

Mittlerweile ist dSprachKI bereit für den Einsatz. Gleichwohl ist künstliche Intelligenz im Verwaltungsalltag oftmals eine Frage des Vertrauens. Jill Sammet kennt die anfängliche Skepsis und begegnet ihr mit einem pragmatischen Bild: „Ich stelle mir KI gerne als eine Art Praktikanten vor, der neu ist, und von dem man noch nicht genau weiß, was er kann. Man gibt ihm Aufgaben und überprüft natürlich immer alles – und mit der Zeit merkt man, dass er das doch ganz gut kann.“ Genau diesen Vertrauensaufbau in die Technik will das Team mit dSprachKI schaffen – und hat bei der Entwicklung von Anfang an darauf geachtet, das Tool möglichst benutzerfreundlich zu gestalten: Wenige Klicks reichen aus, um eine Audiodatei hochzuladen und kurze Zeit später das fertige Transkript zu erhalten. 

Große Pläne, großes Interesse

Mit dem Rollout endet die Arbeit von Jill Sammet und ihrem Team nicht. Perspektivisch soll dSprachKI etwa Videokonferenzen live untertiteln und so zur Barrierefreiheit beitragen. Auch die Transkription von Audioaufnahmen aus anderen Sprachen direkt ins Deutsche ist denkbar. Jill Sammet freut sich jedenfalls über das große Interesse am Transkriptionstool von Dataport und IBM. Denn so wird KI zum praktischen Helfer im Behördenalltag und gibt Arbeitszeit dort zurück, wo sie gebraucht wird. 

 

Screenshot der Transkriptionsseite von dSprachKI

Zur Produktseite von dSprachKI:

Ihr direkter Weg zum Ziel

Ansprechpartner*innen

Zentrale:

Mo–Fr: 06:30–18:00 Uhr

Störungsmeldung

Jobs

Arbeiten bei Dataport: #smellsliketeamspirit

nach oben

Ihre Einstellungen für diese Webseite

Treffen Sie hier Ihre persönlichen Einstellungen

Diese Cookies helfen uns bei der Analyse des Nutzerverhaltens, um die Qualität unserer Webseite fortlaufend zu verbessern.

Details Statistik

Cookiename: _pk_id.*
Anbieter: Dataport
Zweck: Erhebung statistischer Daten in Matomo darüber, wie die Webseite von Besucher*innen genutzt wird
Speicherdauer: 12 Monate

Cookiename: _pk_ref.*
Anbieter: Dataport
Zweck: Erhebung statistischer Daten in Matomo darüber, woher die Besucher*innen dieser Webseite gekommen sind
Speicherdauer: 6 Monate

Cookiename: _pk_ses.*, _pk_cvar.*
Anbieter: Dataport
Zweck: Erhebung statistischer Daten in Matomo darüber, wie die Webseite von Besucher*innen genutzt wird
Speicherdauer: 30 Minuten

Erforderliche Cookies sind für die Nutzung der Webseite zwingend erforderlich. Die Webseite kann ohne diese Cookies nicht richtig funktionieren.

Details Erforderliche Cookies

Cookiename: cookieconsent
Anbieter: Dataport
Zweck: Dieser Cookie speichert die Einstellung zu Cookies
Speicherdauer: 1 Jahr

Weitere Informationen zu Cookies finden Sie in der Datenschutzerklärung