Definition “Big Data” und “Data Mining”: Was ist Big Data? Was ist Data Mining?

Der Begriff “Big Data” ist in vielen themenspezifischen Inhalten zu Technologien, Internet und Datenschutz zu finden und hat gerade in unserem digitalen Zeitalter eine große Präsenz. Doch was verbirgt sich hinter dem Begriff “Big Data”? Und welche Rolle spielt “Data Mining” in diesem Zusammenhang?

Soziales Handeln kann mithilfe der digitalen Medien heutzutage unabhängig von Raum und Zeit nachvollzogen werden (Venturini, Latour, & Meunier, 2015, S. 18). Von Bedeutung ist dabei die Speicherung und Prozessierung von Big Data: große, gespeicherte Volumen an Daten, oftmals „menschliche Informationen aller Art […]“ (Schwanebeck, 2017, S. 10). Jeder Mensch, der digitale Geräte (Schwanebeck, 2017, S. 10) bei sich trägt und Programme darauf nutzt, von einer Straßenkamera erfasst wird (Petersson, Leuuw, Breul, & Leuuw, 2017, S.1) oder sein Geld durch E-Banking managet (Venturini et al., 2015, S. 17), trägt zur Generierung solcher Big Data bei.

Ersichtlicher wird dies bei der beispielhaften Betrachtung eines Handys: Der Handykörper hinterlässt Spuren in Form von Verbindungsdaten, Daten über den Aufenthalt einer Person und mithilfe verbundener Geräte (z.B. Smartwatches) sogar Daten über den körperlichen und gesundheitlichen Zustand des Handynutzers (Lindemann, 2015, S. 53). Diese Daten können dann in den Endgeräten, Datenbanken oder in sogenannten “Clouds” gespeichert und prozessiert werden (Ladeur, 2015, S. 231).

Durch die Aufzeichnungen von diesen personenbezogenen Daten ist das Herausfinden von Mustern für wirtschaftliche Zwecke, z.B. das Schalten gezielter Werbung, möglich (Schwanebeck, 2017, S. 11). Dies gelingt mithilfe von Auswertungsverfahren, „die uns erlauben bedeutungstragende Strukturen aus riesigen, unübersichtlichen Datenmengen zu gewinnen“ (Niekler, 2015, S. 35).

Diese Transformierung der Daten in nützliche Informationen erfolgt mithilfe von Algorithmen (Scholz, 2017, S. 21) und wird als Data Mining bezeichnet (Han, Kamber, & Pei, 2012). Mithilfe von Data Mining können „unsere persönlichen Vorlieben, unsere Interessen, die Konsumgewohnheiten und das komplette Kommunikationsverhalten […]“ (Schwanebeck, 2017, S. 12) ermittelt werden. Außerdem ist die Wiedergabe von „Einstellungen, Verhaltensweisen und sozialen Interaktionen […]“ (Haustein, 2015, S. 264) eines Individuums möglich.

Zusammenfassend beschreibt der Begriff Big Data also die große, unübersichtliche Menge an Daten, die bei der Internetnutzung durch ein Individuum entsteht (u.a. Neuberger & Nuernbergk, 2015, S. 206).
Mithilfe von Data Mining – dem Vorgang der Veredelung von Daten durch die automatische Erfassung und Verarbeitung dieser Big-Data-Datenmengen (Haustein, 2015, S.262) – kann man zum Beispiel Verhaltensmuster von Individuen generieren und für wirtschaftliche Zwecke nutzen (Ladeur, 2015, S. 231).

Mit dem Siegel von “fair.digital” haben Nutzer die Möglichkeit, der Speicherung von personenbezogenen Daten zu Nutzen der Steigerung des wirtschaftlichen Erfolges eines Unternehmens zu entgehen und ihre digitale Souveränität zu erhalten.

Quellenverzeichnis:

  • Han, J., Kamber, M., & Pei, Jian (2012). Data mining. Concepts and techniques. Morgan Kaufmann. Zitiert in Scholz, T. M. (2017). Big Data in Organizations and the Role of Human Resource Management. A Complex Systems Theory-Based Conceptualization (S. 9—81, genau: S. 20). PL Academic Research.
  • Haustein, B. H. (2015). Datenschutz jenseits der Papierakte. Systematische Herausforderungen des Datenschutzrechts unter den Bedingungen der Digitalisierung. In Süssenguth, F. (Hg.), Die Gesellschaft der Daten. Über die digitale Transformation der sozialen Ordnung (S. 253—282). transcript Verlag.
  • Ladeur, K. (2015). Die Gesellschaft der Netzwerke und ihre Wissensordnung. Big Data, Datenschutz und die „relationale Persönlichkeit“. In F. Süssenguth (Hg.), Die Gesellschaft der Daten. Über die digitale Transformation der sozialen Ordnung (S. 225—251). transcript Verlag.
  • Lindemann, G. (2015). Die Verschränkung von Leib und Nexistenz. In F. Süssenguth (Hg.), Die Gesellschaft der Daten. Über die digitale Transformation der sozialen Ordnung (S. 41—66). transcript Verlag.
  • Neuberger, C., & Nuernbergk, C. (2015). Verdatete Selbstbeschreibung der Gesellschaft. Über den Umgang des Journalismus mit Big Data und Algorithmen. In F. Süssenguth (Hg.), Die Gesellschaft der Daten. Über die digitale Transformation der sozialen Ordnung (S. 199—224). transcript Verlag.
  • Niekler, A. (2018). Journalismus, Big Data, Algorithmen. Digitale Praktiken im modernen Journalismus. In G. Hooffacker, W. Kenntemich, & U. Kulisch (Hg.), Die neue Öffentlichkeit. Wie Bots, Bürger und Big Data den Journalismus verändern (S. 35—53). Springer VS.
  • Petersson, G. J., Leuuw, F., Breul, J., Leeuw, H.B.M. (2017). Cyber Society, Big Data, and Evaluation: An Introduction. In G. J. Petersson, & J. Breul (Hg.), Cyber Society, Big Data, and Evaluation (S. 1—17). New York: Routledge.
  • Scholz, T. M. (2017). Big Data in Organizations and the Role of Human Resource Management. A Complex Systems Theory-Based Conceptualization. PL Academic Research.
  • Schwanebeck, A. (2017). Gefangen im Netz. Medialer Wandel und kontinuierliche Überwachung in digitalen Welten. In M. Schröder, & A. Schwanebeck (Hg.), Big Data – In den Fängen der Datenkraken. Die (un-)heimliche Macht der Algorithmen (S. 9—37). Nomos Verlagsgesellschaft/Edition Reinhard Fischer.
  • Venturini, T., Latour, B., & Meunier, A. (2015). Eine unerwartete Reise. Einige Lehren über Kontinuität aus den Erfahrungen des Sciences Po médialab. In F. Süssenguth (Hg.), Die Gesellschaft der Daten. Über die digitale Transformation der sozialen Ordnung (S. 17—39). transcript Verlag.