ICT-News Dach

Big Data und die nächste Herausforderung – Datenintegrität

Holm Landrock

Digitalisierung und digitale Transformation bedeutet, dass noch viel mehr Wirtschafts- und Lebensbereiche - als vor ein paar Jahren denkbar  digitalisiert werden. Im Zuge von Industrie 4.0 (I4.0) und IoT liefern jetzt auch Maschinen und Geräte Daten. Seit kurzem kommen Daten von Verbrauchen und Privatanwendern ins Spiel. Nein, gemeint sind nicht die Daten, die von Privatpersonen in Sozialen Netzwerken hochgeladen (und dort analysiert) werden. Gemeint sind die Daten, die von Personen freiwillig und zum Zweck von Analysen im Internet, einem Unternehmen oder in einer Public Cloud bereitgestellt werden. Demnächst gehören zum Beispiel auch private Gesundheitsdaten dazu, wie einige Krankenkassen und Krankenversicherungen jüngst meldeten. Durch die DSGVO sind die Anbieter der Lösungen und der darunterliegenden IT-Schichten einigermaßen für die Einhaltung der Vorschriften, Verfahren und den Einsatz der Technologien für die Datensicherheit sensibiliert.

Neue Herausforderungen

Allerdings haben schon vor Jahren die Analysten der Experton Group (seit 2016 Teil von ISG) auf die Herausforderung Datenintegrität im Zusammenhang mit Big Data hingewiesen. Ganz gleich, wie man Big Data definiert – über das Volumen allein oder die Anzahl der Quellen, ob über die Verarbeitungsgeschwindigkeit oder die Anzahl der Nutzer – mit dem schier unendlichen Datenwachstum existierte von Anfang die Herausforderung der Datenintegrität.

Einen Vorgeschmack liefern die Sozialen Netzwerke und Onlinemassenmedien mit den sogenannten Fake News. Dort, wo jeder posten kann, entstehen schnell blühende Geschichten, Verschwörungstheorien, üble Nachrede und eben ganz einfach falsche Informationen. Im Zusammenhang mit einer Erziehung der Individuen für die neue Medienkultur werden hier künftig vielleicht die verheerendsten Folgen vermieden.

Mit dem Wachstum der Datenmengen, Datenquellen und Datenarten entstehen jedoch vor allem für die Unternehmen nahezu aller Branchen neue Herausforderungen jenseits von Datenvolumen, Datenschutz und Datensicherheit. Diese neue Anforderung heißt Datenintegrität. Die Sorge ist berechtigt. Als die IT noch EDV hieß, entstanden Daten innerhalb eines Unternehmens auf Lochkarten oder Lochstreifen, und sie wurden vielleicht auf Magnetbändern oder auf Wechselplattenspeicherlaufwerken von der Größe einer Waschmaschine gespeichert. Dort Daten zu verändern war aufwändig. Man benötigte nicht nur den Zugang zu den Systemen und die Fähigkeiten, sondern auch zugewiesene Rechenzeit.

Heute funktionieren oft immer noch die gleichen Mechanismen: man muss das System hacken und wissen, wo zu fälschende Daten liegen. Doch wie schwach viele Lösungen – und hier ist eben nicht nur Facebook gemeint – hinsichtlich der Datenintegrität sind, wird sich erst in den nächsten Jahren zeigen. Der Schutz der Daten gegen eine nachträgliche Veränderung ist durch diese Mechanismen oft gewährleistet. Doch wie sieht es aus, wenn die Daten schon in der Quelle verfälscht werden, ob nun mutwillig, irrtümlich oder aufgrund einer Systemstörung?

Auch Maschinendaten müssen kritisch betrachtet werden

Bleiben wir bei der Industrie: Die an Maschinen entstehenden Daten und werden nun Dank I4.0 an IT-Systeme übergeben und dort analysiert. Gerne verlassen sich die Anwender hier darauf, dass die Daten stimmen. Das muss nicht sein. Störquellen, die elektromagnetische Effekte verursachen, oder ein kleiner Fehler im Controller kann dafür sorgen, dass für lange Zeit unerkannt fehlerhafte Daten in die IT eingepflegt werden. Auch menschliche Fehler können hier eine Rolle spielen, wenn zum Beispiel am Gerät ein anderer Messbereich eingestellt ist, als es die IT-Lösung erwartet. Lachen Sie jetzt nicht. Aufgrund solcher Fehler haben schon Flugzeuge, Brücken und Satelliten nicht funktioniert.

Unlautere Absichten erfordern ebenfalls Lösungen

Spannend wird die Herausforderung Datenintegrität, wenn auch Individuen imstande sind, Daten an eine IT-Lösung zu senden. Nehmen wir hier den Fall der eingangs genannten privaten Gesundheitsakten oder der Daten von Fitness Apps. Manche Menschen verfügen leider über eine kriminelle Energie. Wie ist das, wenn dann beispielsweise Dokumente hochgeladen werden, die dem Arzt falsche Laborwerte zeigen? Menschen mit Medikamentenabhängigkeiten könnten hier durchaus dazu neigen, gefälschte Laborberichte in die Gesundheitscloud zu laden. Völlig legal. Unerkannt. Beim nächsten Arztbesuch wird der Laborbericht auf dem Smartphone, natürlich völlig plausibel aus der „Gesundheitswolke“, vorgezeigt. Muss nun der Arzt künftig die Echtheit von Laborberichten mit forensischen IT-Methoden prüfen? In jüngsten Gespräch mit IT-Anbietern setzte man noch auf die menschliche Intelligenz – und verlegte so einen Teil der Verantwortung beispielsweise auf den Arzt. Ob sich der Begriff „Fake Health“ durchsetzt, können wir nicht abschätzen. Fake Health News gibt es ja in den Social Media schon seit einigen Jahren.

Offene Datenpools und Data Hubs müssen künftig also nicht nur hinsichtlich Datensicherheit und Datenschutz gestärkt werden, sondern auch hinsichtlich der Datenintegrität. Die Verfahren und Technologien sind indes noch nicht wirklich sichtbar.