Datenqualität mit KI verbessern: Automatisierte Klassifikation von NOGA-Codes
Ein Unternehmen aus dem Bereich Wirtschaftsförderung und Standortentwicklung verwaltet eine grosse Anzahl an Unternehmensdaten, unter anderem für statistische Auswertungen und wirtschaftliche Analysen. Ein zentrales Problem: Die automatische oder manuelle Zuweisung von NOGA-Codes war oft uneinheitlich, fehleranfällig und intransparent, insbesondere bei neuen oder ungewöhnlichen Firmennamen und Tätigkeitsbeschreibungen. Zur Lösung dieser Herausforderung wurde ein neuer Ansatz entwickelt, um die Datenqualität mit KI zu verbessern.
Lösung mit Comitas: KI-gestützte Klassifikation auf Basis von GPT
Comitas entwickelte gemeinsam mit dem Kunden einen Prototyp, der mithilfe von GPT-gestützter Textanalyse:
- Freitextbeschreibungen von Unternehmen analysiert
- Branchenschlagwörter erkennt und mit offiziellen NOGA-Kategorien verknüpft
- Vorschläge mit Konfidenz-Werten zur Auswahl bereitstellt
- inkonsistente oder fehlende Einträge automatisiert kennzeichnet
Die Lösung wurde in die bestehende Datenbankumgebung eingebettet und über ein einfaches Webinterface nutzbar gemacht.
Ergebnis:
- Verbesserung der Datenkonsistenz und deutlich weniger manuelle Korrekturen
- Nachvollziehbare, dokumentierte Vorschlagslogik für Fachabteilungen
- Beschleunigte Datenpflege und Qualitätsmonitoring in Echtzeit
„Die KI erkennt Branchentexte, die für Menschen schwer zuzuordnen wären – und spart uns so täglich viele manuelle Zuordnungen.“ – Datenverantwortliche (anonym)