Was ist Dark Data? Bedeutung, Definition, Erklärung

Was ist Dark Data, Bedeutung, Definition, Erklärung


Unter Dark Data versteht man Datenmengen und Datenflüsse, die in der täglichen Kommunikation zwischen Unternehmern und Endbenutzern zwar abgefragt und gespeichert werden, tatsächlich aber niemals von den Systemen dahinter verwertet werden. Es ist eine Art von blinder Masse, die bei der Datenverarbeitung anfällt und auf den Systemen bleibt, aber aus unterschiedlichsten Gründen nicht in die nachfolgenden Prozesse eingebunden wird. Schuld daran ist in der Regel die schiere Menge an Daten, die derzeit bei digitalen Prozessen erhoben wird. Technische Aspekte machen es zwar notwendig, dass auch die Dark Data erfasst wird, verarbeitet wird sie aber nicht und nur die wenigsten Unternehmen und Behörden sind sich der Existenz der Dark Data überhaupt im größeren Maße bewusst.

Unterschiedliche Szenarien für die Existenz von Dark Data

Generell kann Dark Data in ganz unterschiedlichen Formen auf Systemen vorliegen und auch aus ganz verschiedenen Gründen überhaupt erzeugt werden. Mit der Zunahme von Digitalisierungsprozessen und der allgemeinen digitalen Kommunikation begann auch die umfassende Speicherung eben dieser Daten und Dateien. Dabei geht es sowohl um die Interaktion zwischen Endbenutzer und System – in diesem Fall beispielsweise ein Kunde und das Unternehmen dahinter – aber auch um die Daten, die durch automatisierte Prozesse anfallen und im Hintergrund gespeichert werden. Alleine das Prinzip Big Data sorgt heute dafür, dass jedes Unternehmen Gigabytes bis Terrabytes an Daten jeden Tag auf den eigenen Systemen speichert. Während manche weiterverwendet und andere nach kurzer Zeit gelöscht werden, gibt es durchaus die sogenannte Dark Data, die vollkommen ungenutzt weiterhin auf dem System verbleibt.

Wann genau nun Dark Data entsteht ist in der Regel von der Infrastruktur des Systems abhängig. Es gibt Dark Data, die beispielsweise dadurch entstanden ist, dass sie einfach auf dem System vergessen wurde. Das kann durch inkorrekte Auswertungsprozesse passiert sein oder weil sich zu diesem Zeitpunkt noch kein tieferer Zweck für genau diesen Datensatz ergeben hat. Es gibt darüber hinaus Informationen, die einfach nicht brauchbar sind. Sie sind beispielsweise beschädigt oder liegen in einem Format vor, das für die eigenen internen Prozesse nicht brauchbar ist. Auch veraltete Daten sind nicht selten noch lange auf den Systemen zu finden und fallen irgendwann in die Kategorie von Dark Data, da sie in Vergessenheit geraten und nicht in die Prozesse eingebunden werden.

Die möglichen Folgen und Potentiale von Dark Data

Dass Daten im Zeitalter des Internets zu einer der wichtigen Währungen überhaupt geworden sind, beweisen nicht nur die sozialen Netzwerke und Advertiser Tag für Tag. Eine intelligente und vor allem zielgeführte Auswertung von allen Daten auf dem eigenen System ist wichtig – nicht nur um Prozesse zu optimieren, sondern auch um möglichst viel von den Menschen zu erfahren, mit denen das eigene System interagiert. Nun können Daten im Laufe der Zeit wieder interessanter werden. Vielleicht entwickelt man einen Prozess, mit den die bisherigen Datenreste oder falschen Formate doch noch ausgewertet und in die Datenbasis überführt werden können. Oder es entsteht ein neuer Trend, für den man eine ganz bestimmte Form von Daten benötigt, die bisher nicht genutzt wurde, aber in umfassender Form auf den Systemen vorhanden ist.

Gleichzeitig entstehen natürlich auch sicherheitsrelevante und nicht zuletzt datenschutzrechtliche Probleme mit Dark Data. In Europa sind Unternehmen generell zur Datensparsamkeit angehalten. Sie sollen nur Daten von Kunden und Nutzern speichern, die direkt weiterverarbeitet und für eigene Prozesse genutzt werden können. Liegen nun größere Mengen an Dark Data auf dem System, bei dem man nicht einmal genau weiß, was sie eigentlich beinhaltet, könnte das bei einem Sicherheitsleck zu einem Problem werden. Dazu kommen die Kosten für die Speicherung, die bei einer beständigen Zunahme der Datenmenge auch mittelfristig zu einem Problem werden können. Unternehmen müssen sich daher damit beschäftigen, was sie mit dieser dunklen Masse an Daten in ihrem eigenen System machen wollen.

Autor: Pierre von BedeutungOnline

Hallo, ich bin Autor und Macher von BedeutungOnline. Bei BedeutungOnline dreht sich alles um Worte und Sprache. Denn wie wir sprechen und worüber wir sprechen, formt wie wir die Welt sehen und was uns wichtig ist. Das darzustellen, begeistert mich und deswegen schreibe ich für dich Beiträge über ausgewählte Worte, die in der deutschen Sprache gesprochen werden. Seit 2004 arbeite ich als Journalist. Ich habe Psychologie und Philosophie mit Schwerpunkt Sprache und Bedeutung studiert. Ich arbeite fast täglich an BedeutungOnline und erstelle laufend für dich neue Beiträge. Mehr über BedeutungOnline.de und mich erfährst du hier.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert