Die neuen Versionen von Talend Open Profiler und Talend Data Quality sorgen für eine noch bessere Kontrolle und Konsistenz von Unternehmensdaten. Dabei kosten diese Lösungen nur einen Bruchteil anderer Systeme und sind weit weniger komplex.
Fabrice Bonan, Mitbegründer und COO von Talend, erläutert: "Die Qualität von Daten ist für den Erfolg eines jeden Projekts essentiell, das vornehmlich auf Daten beruht. Dennoch wurde sie bei vielen Organisationen oft vernachlässigt. Der Open-Source-Ansatz von Talend bietet allen Firmen die Möglichkeit, ihre Daten auf ganz einfache Weise zu verbessern. Die jetzt verfügbaren neuen Versionen werden die ohnehin schon hohe Marktakzeptanz unserer Produkte noch weiter stärken."
Talend Open Profiler - Datenqualität rasch ermitteln
Talend Open Profiler ist der weltweit erste quelloffene Datenprofiler und kann kostenlos heruntergeladen werden. Unternehmen können damit in kürzester Zeit die Qualität ihrer Daten kontrollieren. Der Datenprofiler prüft dazu jedes einzelne Element gemäß bestimmter Indikatoren. Die Software ist trotz ihrer Leistungsfähigkeit denkbar einfach zu bedienen, denn sie wurde so programmiert, dass sie auch IT-Laien anwenden können.
Talend Data Quality - korrekte und saubere Daten
Talend Data Quality ist die erste Open-Source-basierte Unternehmenslösung, um Datenprofilierung und Datenpflege in einer einzigen IT-Umgebung durchzuführen. Damit gewinnen Anwender korrekte Daten, können falsche oder beschädigte Daten finden und löschen und Daten vervielfältigen.
Die Produkte von Talend für Datenqualität werden in vielen Branchen eingesetzt wie zum Beispiel in Handel, Digitale Medien, Gesundheitswesen und öffentliche Verwaltung.
Die Neuerungen im Überblick:
1. Qualitätsregeln selbst bestimmen - Anwender können jetzt ihre eigenen Regeln definieren, nach denen wonach die Qualität der Daten überprüft wird. Zum Beispiel kann eine Regel formuliert werden, durch die wonach die Validität von Postleitzahlen auf der Grundlage der Landeskennzahlen überprüft wird, die sich in einem anderen Datensatz befinden. Oder es wird definiert, dass die Telefonvorwahlen mit dem Ort der Adresse abgeglichen werden sollen.
2. Muster finden - der "Pattern Finder" erkennt vorherrschende Muster in Datensätzen. Beispielsweise lässt sich dadurch herausfinden, dass ein Kommentarfeld für die Eingabe der Versicherungsnummer oder der Handy-Nummer benutzt wurde.
3. Erweitertes Daten Profiling - hiermit lassen sich Redundanzen aufspüren. Es wird eingesetzt, um Beziehungen zwischen Einheiten festzustellen und Korrelationen zu bestimmen. Es wird auch genutzt, um externe Werte und mögliche inkorrekte Datenpunkte zu identifizieren.
4. Neue Komponenten zur Datenbereinigung - damit werden auf Grundlage der Fuzzy-Logic Technologie doppelte Daten beseitigt oder zusammengeführt. Beispiel: Obwohl die Städte Marlborough und Marlboro unterschiedlich geschrieben werden, sind die beiden Städtenamen oft austauschbar. Die Fuzzy-Technologie verringert die Sorge, dass diese beiden Städte getrennt klassifiziert werden.
Talend bietet darüber hinaus ein Internet-Portal an, auf dem jeder Anwender, der für die Qualität und Stimmigkeit von Daten verantwortlich ist, sehr schnell erfährt, wie sich die Qualität seiner Daten nach der Bearbeitung verbessert oder verschlechtert. Er kann jede potenzielle Fehlerquelle erkennen und beseitigen. Das Portal bietet die Möglichkeit, einen detaillierten Bericht abzurufen und zentrale Benachrichtigungen besser einzustellen, sowie den eigenen Datenbestand besser zu verstehen.