Pfeil zurück zur Übersicht

Data-Centric AI

Mit Datenpräzision die KI-Effizienz steigern
In der sich schnell entwickelnden Welt der Künstlichen Intelligenz (KI) und mit der rasanten Zunahme an Informationen, die durch die digitale Transformation generiert werden, rückt die zentrale Bedeutung von Daten für innovative IT-Lösungen immer stärker in den Fokus.
In der sich schnell entwickelnden Welt der Künstlichen Intelligenz (KI) und mit der rasanten Zunahme an Informationen, die durch die digitale Transformation generiert werden, rückt die zentrale Bedeutung von Daten für innovative IT-Lösungen immer stärker in den Fokus.

(pressebox) (Bonn, 13.06.2024) Data-Centric AI (DCAI) stellt einen wegweisenden Ansatz in der KI dar, indem es die Qualität und Relevanz von Daten in den Mittelpunkt rückt, um Modelle des maschinellen Lernens und die Performance von Systemen zu optimieren. Dieser bedeutende Paradigmenwechsel findet auch im Bereich der Computer Vision seine Anwendung. Um bestmögliche Lösungen zu schaffen, setzt das CONET-Data-Analytics und -AI-Team auf die Integration von DCAI in Computer-Vision-Projekten.

Im folgenden Blog-Artikel erläutern wir das Konzept von DCAI und gehen insbesondere darauf ein, wie es sich vom klassischen, modellzentrierten Entwicklungsprozess für KI-Lösungen unterscheidet und welche Auswirkungen dies auf den Bereich der Computer Vision hat. Abschließend stellen wir eine standardisierte DCAI-Pipeline vor.

Was ist Data-Centric AI?

Data-Centric AI ist ein Ansatz in der Künstlichen Intelligenz und dem Machine Learning (ML), bei dem der Schwerpunkt auf der Verbesserung und Optimierung der Datenqualität liegt. DCAI konzentriert sich darauf, die Qualität, Relevanz und Sauberkeit der Daten zu verbessern, die man für das Training von KI-Modellen verwendet. Im Gegensatz zu modellzentrierten Ansätzen, die auf die Entwicklung komplexerer Algorithmen abzielen, sieht dieser Ansatz die Daten selbst als Schlüsselfaktor für die Leistung der KI. Data-Centric AI ermöglicht effizientere und präzisere KI-Systeme, indem es die Grundlage verbessert, auf der diese Systeme aufbauen.

Warum Data-Centric AI in der Computer Vision?

Auch in Computer-Vision-Projekten spielt die Datenqualität eine entscheidende Rolle. Ein diversifizierter und sorgfältig aufbereiteter Datensatz befähigt Modelle dazu, effektiv zu generalisieren und eine umfangreiche Vielfalt an Mustern zu identifizieren. Ein datenzentrierter Ansatz rückt daher in den Mittelpunkt, um aktiv Bias in Computer-Vision-Systemen entgegenzuwirken. Unter Bias versteht man die Neigung zu verzerrten oder nicht repräsentativen Inhalten, die die Unvoreingenommenheit von maschinellem Lernen beeinträchtigen können.

Dies kann zu algorithmischer Diskriminierung führen, bei der Systeme in bestimmten Anwendungen, wie der Gesichtserkennung, Fehler oder Ungerechtigkeiten aufzeigen. Dies erfolgt insbesondere, wenn die Trainingsdaten nicht divers und umfassend sind. Forschungen, beispielsweise von der Gruppe Fairness and Accountability in Machine Learning (FAT/ML) bei Microsoft Research, unterstreichen die Bedeutung der Bekämpfung von Bias in visuellen Daten für faire und ethische KI-Praktiken. Durch eingehende Datenanalysen und sorgfältige Datenaufbereitung lassen sich Verzerrungen erkennen und korrigieren. So wird die Fairness von KI-Anwendungen gegenüber verschiedenen Bevölkerungsgruppen gewährleistet.

Was genau kann der DCAI-Ansatz in Computer-Vision-Projekten optimieren?

Ansätze zur Implementierung von Data-Centric AI in der Computer Vision

Obwohl die Datenqualität auch in einem modellzentrischen KI-Entwicklungsansatz wichtig ist, nimmt sie bei der Entwicklung nach dem DCAI-Prinzip eine zentrale Rolle ein. Im Folgenden stellen wir Methoden vor, die typischerweise in der Entwicklung mit einem DCAI-Ansatz zur Anwendung kommen.

Eine typische Data-Centric-AI-Pipeline

Die Integration von Data-Centric AI in Computer-Vision-Projekte folgt einem klaren Prozess. Zunächst werden Daten gesammelt und sorgfältig ausgewählt, um realistische Szenarien abzudecken. Darauffolgend werden die Daten analysiert und bereinigt und so für das maschinelle Lernen vorbereitet. Der nächste Schritt ist das Training eines Grundmodells mit dem bereinigten Datensatz – gefolgt von Tests und Bewertungen. Eine kontinuierliche Überwachung der Datenqualität ist essentiell, um die Integrität des KI-Modells zu gewährleisten und es an neue Gegebenheiten oder Daten anzupassen. Ein datenzentrierter KI-Ansatz optimiert den gesamten Entwicklungsprozess und gestaltet ihn effizient.

Ansprechpartner:

Herr Simon Vieth
Kommunikation
Telefon: +49 (2242) 939-246
Fax: +49 (2242) 939-333
Zuständigkeitsbereich: Pressesprecher

Über conet Holding GmbH: „Erfolg. Unsere Leidenschaft.“ CONET ist der Digitalisierungspartner mit Fokus auf Consulting, Customer Experience, Data Intelligence, Managed Services, SAP und Software Development. Namhafte Unternehmen und Organisationen aus Industrie, Fertigung und Handel sowie dem öffentlichen Sektor vertrauen seit 1987 auf IT Consulting und IT Services von CONET. Mit der Unternehmenszentrale in Bonn unterhält CONET mehr als 20 Standorte in Europa.

Datei-Anlagen:
Pfeil zurück zur Übersicht