Was ist Big Data?

Big Data, umfangreich und stetig wachsend

Was ist Big Data? Um diesen Begriff (Big Data) wirklich zu verstehen, ist es hilfreich, den historischen Hintergrund zu erfahren. Hier ist Gartners Definition von 2001 von Big Data (was immer noch die Definition ist): Es sind Daten, die eine größere Vielfalt enthalten, die in immer größeren Mengen und mit immer höherer Geschwindigkeit gesammelt werden.

Was ist Big DataEinfacher gesagt, große Daten sind größere, komplexere Datensätze, insbesondere aus neuen Datenquellen. Diese Datensätze sind so umfangreich, dass herkömmliche Datenverarbeitungssoftwares diese nicht verwalten können. Diese enormen Datenmengen können jedoch genutzt werden, um Geschäftsprobleme anzugehen, die Sie vorher nicht bewältigen konnten.

  1. Die drei wichtigsten Big Data Punkte
  2. Was ist Big Data?
  3. Die Geschichte von Big Data und Data Mining
  4. Vorteile von Big Data und Data Analytics

Die drei wichtigsten Big Data Punkte

Volumen
Die Menge der Daten ist wichtig. Bei großen Datenmengen müssen Sie große Mengen an unstrukturierten Daten mit geringer Dichte verarbeiten. Dies können Daten mit unbekanntem Wert sein, z. B. Twitter-Datenfeeds, Clickstreams auf einer Webseite oder einer mobilen App oder sensorgestützte Geräte. Für einige Organisationen sind dies möglicherweise mehrere zehn Terabyte an Daten. Für andere können es Hunderte von Petabyte sein.

Geschwindigkeit
Die Geschwindigkeit, mit der Daten empfangen und (vielleicht) bearbeitet werden: Normalerweise ist die höchste Geschwindigkeit der Datenströme direkt im Speicher gegenüber dem Schreiben auf der Festplatte gemeint. Einige internetfähige Smart-Produkte arbeiten in Echtzeit oder nahezu in Echtzeit und erfordern Echtzeit-Evaluierung und -Aktion.

Vielfalt
Vielfalt bezieht sich auf die vielen Arten von Daten, die verfügbar sind. Traditionelle Datentypen wurden strukturiert und passen in eine relationale Datenbank. Mit dem Aufkommen von BD kommen Daten in neuen unstrukturierten Datentypen vor. Unstrukturierte und semistrukturierte Datentypen wie Text, Audio und Video erfordern zusätzliche Vorverarbeitung, um Bedeutungs- und Unterstützungsmetadaten ableiten zu können.

Was ist Big Data? Der Wert und die Wahrheit darüber

Zwei weitere Punkte sind in den letzten Jahren entstanden:  Wert und Wahrhaftigkeit von Daten

Daten haben einen inneren Wert. Aber es ist nutzlos, bis dieser Wert entdeckt wird. Ebenso wichtig: Wie wahr sind Ihre Daten – und wie viel können Sie darauf geben?

Heute ist Big Data zu Kapital geworden. Denken Sie an einige der größten Technologieunternehmen der Welt. Ein großer Teil des Wertes, den sie bieten, kommt von ihren Daten, die sie ständig analysieren, um mehr Effizienz zu erzielen und neue Produkte zu entwickeln.

Jüngste technologische Durchbrüche haben die Kosten für Datenspeicherung und Datenverarbeitung exponentiell gesenkt, wodurch die Speicherung von mehr Daten als je zuvor einfacher und kostengünstiger wird. Da eine größere Menge von Daten jetzt billiger und zugänglicher ist, können Sie genauere und präzisere Geschäftsentscheidungen treffen.

Den Mehrwert in den Daten zu finden (Metadaten/Deep Learning) bedeutet nicht nur, sie zu analysieren (was ein ganz anderer Vorteil ist). Es ist ein vollständiger Erkennungsprozess, der aufschlussreiche Analysten, Geschäftsanwender und Führungskräfte erfordert, die die richtigen Fragen stellen, Muster erkennen, fundierte Annahmen treffen und Verhalten vorhersagen.

Die Geschichte von Big Data und Data Mining

Obwohl das Konzept der Datensammlung(Data Mining) selbst relativ neu ist, gehen die Ursprünge großer Datenmengen in die 1960er und 1970er Jahre zurück, als die Datenwelt gerade erst begonnen hatte, mit den ersten Rechenzentren und der Entwicklung der relationalen Datenbank.

Um das Jahr 2005 herum begannen die Menschen zu erkennen, wie viele Daten Nutzer über Facebook, YouTube und andere Online-Dienste generiert haben. Hadoop (ein Open-Source-Framework, das speziell für die Speicherung und Analyse großer Datenmengen entwickelt wurde) wurde im selben Jahr entwickelt. NoSQL begann ebenso an Popularität in dieser Zeit zu gewinnen.

Die Entwicklung von Open-Source-Frameworks wie Hadoop (und neuerdings Spark) war wesentlich für das Wachstum von Big Data, da sie die Arbeit damit einfacher und die Speicherung kostengünstiger machten. In den Jahren ist das Volumen von Big Data sprunghaft angestiegen. Benutzer generieren immer noch große Datenmengen – aber nicht nur Menschen machen es.

Mit dem Aufkommen des Internets der Dinge (Internet of Things, IoT) werden mehr Objekte und Geräte mit dem Internet verbunden, um Daten über Kundennutzungsmuster und Produktleistung zu sammeln. Das Aufkommen des maschinellen Lernens hat noch mehr Daten hervorgebracht.

Während „große Daten“ weit gekommen sind, hat ihre Nützlichkeit gerade erst begonnen. Cloud Computing hat die Möglichkeiten für große Datenmengen noch erweitert. Die Cloud bietet eine wirklich flexible Skalierbarkeit, bei der Entwickler einfach Ad-hoc-Cluster zum Testen einer Teilmenge von Daten entwickeln können.

Vorteile von Big Data und Data Analytics

Big Data ermöglicht es Ihnen, vollständigere Antworten zu erhalten, weil es mehr Informationen sind, als wenn sie andere Quellen nutzen. Vollständigere Antworten bedeuten mehr Vertrauen in die Daten – was einen völlig anderen Ansatz zur Lösung von Problemen bedeutet.

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.