KIDOU Sprachbaukasten mit leistungsstarken KI-Komponenten
Entwicklung von maßgeschneiderten Sprachassistenzsystemen durch die Integration verschiedener KI-Komponenten
Offline Sprachassistenz
Wir bieten Sprachassistenzsysteme an, die ohne Internetverbindung funktionieren, für Anwendungsfälle, in denen möglicherweise kein Netzwerk verfügbar ist (z. B. kein WLAN, Funklöcher oder Krisensituationen), oder in Situationen, in denen Daten lokal bleiben müssen.
On-Premises Sprachassistenz
Maximaler Datenschutz, höchster Schutz von Intellectual Property (IP), ideal für Behörden und sensible Daten. Die Spracherkennung erfolgt „On-Premises“ in Ihrem Rechenzentrum.
Cloud Sprachassistenz
Unkomplizierte Einrichtung, müheloser Betrieb, einfache Modell-Aktualisierungen, kein Bedarf an eigenen Ressourcen für den Betrieb der Sprachassistenz, geringerer Akkuverbrauch auf dem Endgerät und die Möglichkeit der nahtlosen Integration in die Cloud für eine optimale Leistung.
Passgenaue Sprachassistenz
Unsere Sprachassistenten sind darauf ausgerichtet, Fachbegriffe in bestimmten Domänen, regionale Dialekte sowie Umgebungen mit vielen Stör- und Hintergrundgeräuschen präzise zu erkennen und zu verstehen.
Ihre Vorteile mit unseren intelligenten Sprachassistenzsystemen!
That´s why KENBUN
Flexibilität, Skalierbarkeit und Anpassungsfähigkeit
Unser eigens entwickelter Sprachbaukasten KIDOU umfasst eine breite Palette von KI-Komponenten für die Verarbeitung von Sprache und Text. Er bewältigt Herausforderungen wie präzise Spracherkennung bei regionalen Dialekten und in lauten Umgebungen, verarbeitet spezielle Fachbegriffe und kann mit umfangreichen Zahlenkolonnen umgehen.
KI-Komponente im Überblick
Unsere KI-Komponenten sind darauf ausgelegt, flexibel, skalierbar und anpassungsfähig zu sein, um den Anforderungen verschiedenster Anwendungsfälle des Unternehmens gerecht zu werden.
Noise reduction / Rauschunterdrückung
In der Einsatzumgebung werden hohe Stör- oder Hintergrundgeräusche erwartet.
Hochpräzise Rauschunterdrückung, die speziell auf Ihre Umgebung zugeschnitten ist, um eine optimale Sprachqualität zu gewährleisten.
Technologien: Signal Processing, MEL, Deep Learning
Voice recognition / Voice Activity Detection
Präzise Erkennung von Sprachaktivitäten, unabhängig von Hintergrundgeräuschen.
Anwendungsfall: Automatische Transkription von Meetings, bei denen nur gesprochene Inhalte erfasst werden sollen.
Technologien: Machine Learning, Signal Processing.
Text-to-speech / tts
Das System soll auch in natürlicher Sprache antworten, z.B. in Situationen, in denen nicht auf einen Bildschirm gesehen werden kann wie im Auto, im Operationssaal, etc.
Generiert natürliche Sprachausgabe, die individuell an Ihre Markenidentität angepasst werden kann.
Anwendungsfall: Personalisierte Kundenkommunikation, z.B. automatische Antwort auf Kundenanfragen per Telefon.
Technologien: Deep Learning, Natural Language Processing
Dialogue guidance / Dialogführung
Unterstützt natürliche und effektive Gespräche zwischen Benutzern und Systemen, angepasst an Ihre spezifischen Anwendungsfälle.
Anwendungsfall: Chatbot zur Kundenbetreuung, der komplexe Anfragen bearbeiten kann.
Technologien: Natural Language Understanding, Dialog Management, Deep Learning
Speaker identification / Sprechererkennung
Identifiziert zuverlässig individuelle Sprecher und ermöglicht personalisierte Interaktionen.
Anwendungsfall: Zuordnung der unterschiedlichen Sprecher in der Transkription z.B. einer Gerichtsverhandlung oder Besprechung, Authentifizierung von Benutzern in Sprachsteuerungssystemen.
Technologien: Machine Learning.
Wakeword / Hey KIDOU
Aktiviert Sprachsysteme präzise und zuverlässig, verhindert die Transkription im deaktivierten Zustand und spart massiv Batterielebensdauer.
Anwendungsfall: Aktivierung eines Sprachassistenten durch ein spezifisches Wort. Technologien: Deep Learning, Signal Processing.
Speech-to-text / stt
Wandelt gesprochene Wörter in textuelle Formate um und bietet eine präzise Spracherkennung. Dies ist in fast jedem Anwendungsfall enthalten. Durch spezielles Training erkennt unsere Komponente die spezielle Fachbegriffe, Dialekte, Akzente und Formulierungen Ihrer Domäne und ist extrem robust gegenüber störenden Umgebungsgeräuschen.
Anwendungsfälle: Freies Diktat in beliebige Anwendungen, Dokumentation der Mängel bei Inspektionen und Wartungen, Erfassen einer Diagnose oder Behandlung, Transkription von Gerichtsverhandlungen oder Meetings.
Technologien: Deep Learning.
Matcher / Speech-to-structure
Einfaches und schnelles ausfüllen von Formularen und Kommando-steuerung
Erkennt und extrahiert strukturierte Informationen aus Text, auch wenn dieser fehlerhaft ist. Diese Informationen werden dann strukturiert und in einem einheitlichen Format, z.B. JSON zur weiteren Verarbeitung zur Verfügung gestellt.
Anwendungsfälle: Inspektionen und/oder Wartung zur Identifikation von Fehler mit Ort, Schweregrad und beteiligten Bauteilen.
Technologien: Deep Learning.
Text and Document classification
Analysiert große Mengen von Textdaten, um diese zu klassifizieren und relevante Informationen zu extrahieren.
Anwendungsfall: Automatisierte Kategorisierung von Kundenfeedbacks.
Technologien: Machine Learning, Natural Language Processing.
Question & Answering
Ermöglicht präzise Antworten auf komplexe Fragen aus umfangreichen Dokumenten oder Datenbanken. Wenn es aus Intellectual Property (IP) oder Datenschutzgründen erforderlich ist, auch mit einem eigenen Large Language Model (LLM), das OnPrem in Ihrem Haus betrieben werden kann.
Anwendungsfälle: Internes System, das Fragen zu Verfahrensdokumentation beantwortet, automatisierte Kundenunterstützung, z.B. Beantwortung von FAQs.
Technologien: Large Language Models, Deep Learning, Natural Language Processing
Voice command for apps
Mit den beschriebenen Komponenten kann Ihre bestehende App sprachfähig gemacht werden, Ihre Kunden und Mitarbeiter können mit Ihrer gewohnten App arbeiten und zusätzlich Sprache zur Steuerung und Eingabe nutzen,
Anwendungsfall: Firmeneigene App zur Dokumentation von Fehlern bei Inspektionen und/oder Wartungen
Sentimental analysis
Erkennt und versteht die Stimmung und Emotionen in geschriebenem oder gesprochenem Text.
Anwendungsfall: Reaktion im Dialog je nach Kundenstimmung in einem telefonischen Voicebot.
Technologien: Machine Learning, Natural Language Processing.
Sie haben weitere Fragen zu unseren KI-Komponenten oder wollen Sie sich kostenlos beraten lassen?
Dann freuen wir uns über Ihre Kontaktanfrage.
„Mit den KIDOU Sprachkomponenten der KENBUN IT AG erweitern wir unsere Software zur Kfz- Hauptuntersuchung in Deutschland und Frankreich, um eine komfortable und sehr effiziente „handsfree“ Sprachbedienung zu erhalten.“
DEKRA Mitarbeiter
„Durch die Integration der Voice-Technologie von KENBUN IT AG in unsere oxando ONE Platform erfolgt die mobile Datenerfassung hands-free per Spracheingabe. Das einfache Eintragen und die direkte Übermittlung der Daten durch die Sprachassistenz, sorgt für vereinfache und beschleunige Arbeitsprozesse in Instandhaltung und Service.“
Andreas Schmidt, Geschäftsführer und Lösungsarchitekt bei oxando.
Digitale Anamnesebogen in Vetinf, erfasst mit dem KIDOU Sprach-Modul der KENBUN IT AG und die Anbindung der eigenen veterinärmedzinischen Vokabular-Datenbank, unterstützen und vereinfachen die notwendigen Dokumentationspflichten der tierärztlichen Tätigkeiten.“
Gerd Zimmermann, Geschäftsführer Vetinf
Selbstentwickelt & Unabhängig
Nahtlose KIDOU Integration und maximale Flexibilität
Alle KI-Komponente von KIDOU wurden von KENBUN selbst entwickelt und sind vollständig unabhängig von Produkten oder Diensten anderer Hersteller. Dadurch bieten wir Ihnen eine nahtlose Integration und maximale Flexibilität, um Ihre individuellen Anforderungen zu erfüllen.
Willkommen bei KENBUN – Ihrem zuverlässigen Partner für maßgeschneiderte Sprachassistenzsysteme mit KIDOU.