Was ist Big Data?
Big Data ist der Oberbegriff für sämtliche Datensammlungen. Der Begriff bezeichnet die grosse Menge an strukturierten und unstrukturierten Daten, die Unternehmen Tag für Tag überschwemmen. Dabei wird häufig das 3V-Modell genannt, das die drei Schlüsselelemente von Big Data aufzeigt:
- Volume oder Masse: Unternehmen sammeln Daten aus geschäftlichen Transaktionen, von intelligenten Geräten (Internet of Things, abgekürzt IoT, zum Beispiel Staubsaugerroboter, Smart-TV), Industrieanlagen, Videos, Social Media und anderen Quellen. Die Speicherung dieser Unmenge von Daten ist heute dank günstiger Speicherplattformen viel einfacher möglich als früher.
- Velocity oder Geschwindigkeit: Seit dem Siegeszug des IoT strömen die Daten in nie da gewesener Geschwindigkeit in Unternehmen und wollen verarbeitet werden.
- Variety oder Vielfalt: Die eingehenden Daten haben unterschiedlichste Formate – von strukturiert und numerisch, etwa aus herkömmlichen Datenbanken, bis hin zu unstrukturierten Daten aus Textdateien, Videos, Audioquellen, Finanztransaktionen und anderen mehr.
Wieso werden Daten analysiert?
Da Big Data meist sehr grosse oder sehr komplexe Datensätze aufweist, kommen Standardprogramme wie Excel schnell an ihre Grenzen. Doch es gibt mittlerweile viele Alternativen, mit denen sich die Daten analysieren, ordnen und visualisieren lassen. Gerade im Marketingbereich ist es von enormem Vorteil, Daten effizient analysieren und nutzen zu können, einen Einblick geben hier Analytics oder der Algorithmus.
Big Data und Datenschutz
Aus Sicht des Datenschutzes ist die automatisierte Analyse von Big Data schon in Bezug auf die Informationspflicht problematisch. Wenn Betroffene nicht darüber informiert werden, was mit ihren Daten passiert, verstösst man gegen die Vorgaben des Datenschutzes und kann auf Antrag als Individuum mit bis zu 250‘000 Franken bestraft werden. Die automatisierte Analyse von Big Data muss zudem insbesondere bei automatisierten Einzelentscheiden überprüft werden. Automatisierte – durch AI herbeigeführte Entscheide – dürfen keinen Eingriff in die Grundrechte der Betroffenen bewirken. Wichtige Aspekte sind also: die korrekte Information der Betroffenen, die Notwendigkeit der Daten und der Analyse, die Zuordnung der Daten und die Verweildauer in den Systemen des Unternehmens.