Der Kunde
Valeo ist ein globaler Automobilzulieferer mit Hauptsitz in Frankreich und einem Jahresumsatz von 19 Milliarden Euro. Das Unternehmen beschäftigt mehr als 100.000 Mitarbeiter an 187 Produktionsstandorten in 33 Ländern und bietet eine breite Palette von Produkten für Automobilhersteller und den Ersatzteilmarkt. Mit 63 F&E-Zentren weltweit investiert Valeo in erheblichem Umfang in die Zukunft der Mobilität, ist führend im Bereich Sensoren und hat eine Vorreiterrolle in der Entwicklung des autonomen Fahrens.
Die Herausforderung
Für die Erforschung des autonomen Fahrens und das Training von neuronalen Netzen und Validierungssystemen werden große Mengen Bilddaten benötigt. Aus diesem Grund hat Valeo den WoodScape dataset erstellt. Was diesen Datensatz so wertvoll macht, ist die Tatsache, dass es sich dabei um den ersten umfassenden Fisheye-Datensatz für Fahrzeuge handelt, der aus Bildern von vier Surround-View-Kameras besteht, die in mehreren Ländern gesammelt wurden. Aufgrund strenger Datenschutzbestimmungen in den jeweiligen Ländern und der großen Bedeutung, die Valeo deren Einhaltung und der damit einhergehenden sozialen Verantwortung beimisst, hatte die Anonymisierung der Bilder hohe Priorität. Gleichzeitig „verursachen herkömmliche Ansätze wie die Verpixelung Artefakte im Bild und können die Qualität des trainierten Modells erheblich beeinträchtigen” (Valeo, 2021). Die Herausforderung bestand also darin, die Daten zu anonymisieren und gleichzeitig den einzigartigen Wert des WoodScape-Datensatzes zu erhalten, einschließlich der semantischen Segmentierungsmerkmale und der Kompatibilität von ML und Analysen. Daher ist ein natürliches Erscheinungsbild und eine minimale Pixelbeeinflussung der visuellen Daten wichtig.
Die Lösung
Mit Deep Natural Anonymization, der fortschrittlichen Anonymisierungstechnik von brighter Redact, waren wir in der Lage, die komplexen Anforderungen von Valeo an diesen Datensatz zu erfüllen. Da die Lösung kameraunabhängig ist, funktioniert sie bei jeder Art von Einstellung und jedem Format, auch dem Fischaugen-Format. Personenbezogene Informationen werden genau erkannt und mit einem künstlich erzeugten Ersatz überlagert. Das ermöglicht die Nutzung der Daten zur Segmentierung, für Analysen und für maschinelles Lernen unter gleichzeitiger Einhaltung der Datenschutzbestimmungen. Die flexiblen Einsatzoptionen von brighter Redact machen es möglich, die Anonymisierung entweder in der Cloud auf zertifizierten Servern oder On-Prem durchzuführen. Valeo entschied sich für Letzteres, um die volle Kontrolle über die Umgebung zu behalten.
Erfahren Sie mehr über die Kompatibilität von Deep Natural Anonymization mit maschinellem Lernen.
Lesen Sie mehr über unsere umfangreiche Erfahrung im Automobilsektor.

Bilder
Das Ergebnis
Nach einem erfolgreichen Proof of Concept mit ersten Daten einigten sich Valeo und brighter AI auf eine längerfristige Zusammenarbeit, um die Einhaltung aktueller und zukünftiger Datenschutzanforderungen für visuelle Daten sicherzustellen. Das ermöglichte die Erstellung des WoodScape-Datensatzes, der nun aus über 10.000 Bildern mit semantischer Annotation von über 40 Klassen auf Instanz-Ebene besteht. Es hat sich also einmal mehr gezeigt, dass brighter Redact mit der einzigartigen Deep Natural Anonymization die ideale Redaktionssoftware für Trainingsdaten im Automobilsektor ist, die höchste Genauigkeit gewährleistet, ohne maschinelle Lernmodelle negativ zu beeinflussen.
Finden Sie den Datensatz auf GitHub.
Erfahren Sie mehr über brighter Redact.
"WoodScape hat öffentlich Bilddaten aus mehreren Ländern gesammelt, somit besteht ein erhebliches Risiko, gegen Datenschutzbestimmungen zu verstoßen. Die Anonymisierung personenbezogener Daten wie Gesichter und Nummernschilder mit herkömmlichen Ansätzen wie der Verpixelung führt zu Artefakten im Bild und kann erhebliche negative Auswirkungen auf die Qualität des trainierten Modells haben. Um dieses Dilemma zu lösen, haben wir Deep Natural Anonymization von brighter AI genutzt."
woodscape.valeo.com/dataset