Neue B2B-Commerce Studie
Jetzt downloadenOptimierte Nutzererfahrung mit KI: Intelligente Volumenerkennung durch Computer Vision
Automatische Getränkeauswahl an Kaffeemaschinen per KI
Ein häufiges Szenario bei Bildverarbeitung mit KI sind Erkennungen und Volumenbestimmungen von Gegenständen oder Gefäßen. Insbesondere in vertraulichen Produktionsumgebungen, aber auch bei Geräten ohne oder mit langsamer Datenanbindung muss dabei die Verarbeitung lokal und offline erfolgen.

Die Herausforderung
Objekterkennung und Volumenmessung in Echtzeit
Wir sind angetreten, die Interaktion von Mensch und Maschine immer weiter zu verbessern – im Großen wie im Kleinen. Dafür denken wir auch über unmittelbare Kundenanfragen hinaus. Wir haben uns gefragt, wie wir die Nutzererfahrung bei der Produktauswahl an einem Kaffeevollautomaten weiter verbessern können.
Unser Ansatz: Höherer Benutzerkomfort durch eine intelligente Erkennung der Kaffeebecher.
Die Lösung
Bedarfsgerechte Kombination von AI-Modellen zur Erfüllung der Anforderungen
Wir haben eine praktische Anwendung eines solchen Szenarios erarbeitet auf Basis von Computer Vision mit KI-Unterstützung zur präzisen Erkennung und Volumenbestimmung verschiedener Gefäße. Durch die Kombination von KI-Modellen und Embedded-Hardware wird eine effiziente und zuverlässige Lösung geschaffen, die offline eingesetzt werden kann. Denn KI-Modelle auf Embedded Hardware ermöglichen lokale Echtzeitverarbeitung. Dabei sind Architekturen und Optimierungstechniken erforderlich, um die Leistungsfähigkeit der Modelle auf begrenzten Ressourcen zu maximieren.
Unsere Lösung erkennt verschiedene Bechertypen und wählt auf dieser Basis automatisch das passende Getränk aus. Kameras erkennen die Behältertypen KI-basiert mithilfe von Embedded Computer Vision.
Um das zu ermöglichen, haben wir ein maßgeschneidertes Convolutional Neural Network (CNN) entwickelt, das auf dem TensorFlow-Framework basiert und in der Lage ist, verschiedene Tassentypen zuverlässig zu klassifizieren. Diese Technologie wurde über eine API direkt in die Kaffeemaschinen integriert und ermöglicht eine effiziente und fehlerfreie Tassenerkennung, woraufhin die Maschine automatisch das passende Kaffeegetränk auswählt.
Für den Hersteller bietet die Implementierung einer automatischen Getränkeauswahl basierend auf KI-gesteuerter Tassenerkennung mehrere signifikante Vorteile. Erstens kann die erhöhte Benutzerfreundlichkeit und die damit verbundene positive Nutzererfahrung zu einer höheren Kundenzufriedenheit und damit zu einer gesteigerten Kundenbindung führen. Zweitens kann die fortschrittliche Technologie als Alleinstellungsmerkmal im Marktumfeld dienen, was den Wettbewerbsvorteil des Herstellers stärkt und die Marktposition festigt. Schließlich bietet die Integration von KI-Lösungen Möglichkeiten für zukünftige Erweiterungen und Upgrades, wodurch die Maschinen langfristig flexibel und anpassungsfähig bleiben.
Der Hintergrund
Robuste KI-Modelle für Segmentierung und Regression
Die Lösung wurde mit Kamera und Modellen erarbeitet. Bildverarbeitungsnetzwerke erkennen Strukturen in den Bildern der Tassen. Wir haben das Training der Modelle selbst übernommen, einschließlich der Berechnungen und Optimierungen durch das TensorFlow-Framework. Das ursprünglich untrainierte Modell war nicht initialisiert, und wir entwickelten eine eigene Trainingsmethodik, um eine hohe Genauigkeit in der Tassenerkennung zu erreichen.
Ein weiterer Schwerpunkt liegt auf der Verbesserung der Robustheit und Resilienz der KI-Modelle durch das Training mit generierten Bilddaten. Unser Ansatz zur automatisierten Erzeugung von Trainingsdaten simuliert verschiedene Umgebungsbedingungen, um die Zuverlässigkeit des Systems unter realen Bedingungen zu steigern. Dies erleichtert Veränderungen mit Auswirkungen auf die optischen Verhältnisse erheblich: Austausch oder Positionswechsel der Kameras, Änderungen der Beleuchtungsverhältnisse oder veränderte Objekte können somit mit erheblich kleinerem Aufwand realisiert werden.
In diesem Projekt verwenden wir insgesamt drei KIs: Eine zur Identifizierung des Tassentyps und zwei weitere zur Erkennung des Volumens des Gefäßes. Die Volumen-KIs sind speziell in zwei Teile untergliedert: Segmentierung und Regression.
1. Segmentierungs-KI: Diese KI nimmt das Kamerabild und entfernt alles, was kein Gefäß ist. Dies erleichtert die genaue Bestimmung des Bereichs, der das Volumen des Gefäßes enthält.
2. Regressions-KI: Das von der Segmentierungs-KI bearbeitete Bild wird dann an die Regressions-KI weitergegeben, die aus diesem Bild das Volumen des Gefäßes ableitet. Dies geschieht mit Hilfe von Filtern, die in der Lage sind, verschiedene Eigenschaften wie die Größe zu erkennen.
Umsetzung und Technologie
Agile Entwicklung für optimale Performance
Der Prozess begann mit einer detaillierten Anforderungsanalyse, gefolgt von der Entwicklung der KI-Modelle und der Integration in die bestehenden Systeme. Dabei setzen wir stets auf agile Entwicklungsmethoden und kontinuierliche Tests, um die Lösung optimal an die Anforderungen anzupassen, was für jede API- und rezeptfähige Maschine möglich ist.
Die erfassten Bilder werden an die Rezepte für verschiedene Getränke wie etwa Latte Macchiato, Espresso und Americano angepasst. Das Training der KI wurde durch die Kombination aus echten und generierten Daten optimiert, was eine erhebliche Zeitersparnis durch den Einsatz generierter Bilder ermöglichte und die Leistungsfähigkeit des Systems weiter steigerte.

Phytec
Seit 1985 entwickelt und fertigt Phytec in Deutschland Embedded Komponenten für zuverlässige Elektronik-Serienprodukte. Prozessormodule wie System on Modules und Single Board Computer sowie darauf basierende OEM-Produkte gehören ebenso zum Kerngeschäft wie kundenspezifische Embedded Systeme inklusive Software, Gehäusedesign und -montage. Das Familienunternehmen beschäftigt über 400 Mitarbeiter in 5 Niederlassungen weltweit.