
Der Begriff "Big Data" ist seit langem bekannt, und viele verstehen sogar, was es wirklich ist und wie man es verwendet. Gleichzeitig haben Datenanalysespezialisten viele andere Abstufungen der gesammelten Informationen entwickelt, je nach Größe, Relevanz, Relevanz usw. Überraschenderweise können die Daten "schnell", "heiß", "lang" und "langsam" sein, sogar "schmutzig". Obwohl dieser ganze analytische Zoo zahlreichen Analysten nicht geholfen hat, die Entscheidung der Briten, die EU zu verlassen, und Trumps Sieg richtig vorherzusagen.
Big Data ist nicht nur eine sehr große Informationsmenge, sondern eine Kombination von Ansätzen, Methoden und Werkzeugen zur Verarbeitung verschiedener Daten kolossaler Volumina.
Big Data ist nicht nur Information, sondern ein sozioökonomisches Phänomen, das sich aus der Notwendigkeit ergibt, große Informationsmengen auf globaler Ebene zu analysieren.
Big Data basiert auf drei Vs: Volumen (Volumen), Sorte (Sorte) und Geschwindigkeit (Geschwindigkeit). Mit der Lautstärke ist alles klar. Die Vielfalt hängt von der Breite des Spektrums der Quellen ab, die die Datenbank versorgen. Und Geschwindigkeit ist im Allgemeinen der Hauptindikator der modernen Welt, die nicht einmal für eine Sekunde stehen bleibt.
Aber können zum Beispiel Umfragen zu „Big Data“ betrachtet werden, selbst wenn sie Tausende von Menschen abdecken? Die Menge an Informationen, die aus verschiedenen Umfragen erhalten werden kann, ist ziemlich groß, aber immer noch nicht so groß, so dass sie eher den "
durchschnittlichen Daten " zugeordnet werden können. Wenn die Analyse vor den Wahlen Millionen von Befragten abdecken würde, wäre dies wahrscheinlich bereits „Big Data“. Big Data kann auch aus
kleinen Datenbausteinen bestehen.
Einer der heutigen Trends sind „
schnelle Daten “. In der modernen Welt geschieht alles blitzschnell. In Anwendungen und sozialen Netzwerken sind Informationen, die 1-2 Stunden alt sind, nicht mehr relevant, jede Sekunde steht auf dem Spiel. Schnelle Daten sind wichtig für Bankanwendungen und für Anwendungen in sozialen Netzwerken, insbesondere für Instant Messenger. Jede Sekunde erhalten Benutzer neue Benachrichtigungen, auf deren Grundlage sie wichtige Entscheidungen treffen.
Das Sammeln von „
langsamen Daten “ wird viel Zeit in Anspruch nehmen. Im Gegensatz zu schnellen Daten, die durch sofortiges Abrufen erhalten werden können, sammeln sich langsame Daten buchstäblich Stück für Stück an. Sie interviewen beispielsweise Teilnehmer einer Entwicklungskonferenz. Jeder Teilnehmer wird vor, während und nach der Veranstaltung interviewt. Dann werden alle Informationen sehr sorgfältig verarbeitet und zusammengefasst.
Und wenn die Akkumulationsdauer über Jahrhunderte hinweg gemessen wird, werden langsame Daten zu "
langen " Daten. Seit Beginn der Big-Data-Ära müssen relativ lange Daten heute nicht mehr im Internet, sondern in Büchern, Manuskripten, an den Wänden von Baudenkmälern und bei archäologischen Ausgrabungen gesucht werden. Der historische Aspekt kann für eine bestimmte Studie sehr wichtig sein!
Obwohl die Daten keine Kuchen sind, können sie
"heiß" und "kalt" sein . Hier funktioniert das Prinzip der „Frische“: Mehr „frische“ - heiße - Daten sind von größerem Wert. Für einen einfachen Benutzer ist der lang erwartete Kommentar im Messenger mit einer „Frische“ von 10 Sekunden wichtiger als der bereits vor 2 Stunden erstellte „kalte“ Kommentar. Natürlich kann es dennoch nützlich sein, beispielsweise einige Fakten aus der Korrespondenz zu klären: Denken Sie an den Namen des von einem Freund vorgeschlagenen Buches oder Films, geben Sie den Zeitpunkt des Meetings an und so weiter. Der Zugriff auf heiße Daten sollte dauerhaft sein. Wir brauchen nicht so oft kalte Daten, daher ist ein ständiger Zugriff auf diese Daten keineswegs eine erste Notwendigkeit.
Neben der Charakterisierung von Größe, Geschwindigkeit oder Temperatur können Daten auch nach ihrer Reinheit klassifiziert werden. "
Schmutzig " bezieht sich auf Daten, die entweder fehlerhaft sind oder unvollständige oder inkonsistente Informationen enthalten und normalerweise praktisch nutzlos sind. Schmutzige Daten machen den größten Teil der in vielen Unternehmen gesammelten Informationen aus. Gleichzeitig echte Informationsschätze - hier können wertvolle langfristige Ideen entstehen. Aber es gibt genug Probleme mit schmutzigen Daten. Laut GovTechWorks kosten solche unstrukturierten und irrelevanten Informationen US-Unternehmen jährlich 6 Milliarden US-Dollar!

Der Begriff „
verantwortliche Daten “ beschreibt eine Situation, in der nur zuverlässige Informationen gesammelt werden, die aus überprüften Quellen stammen, gespeichert und unter Einhaltung strenger Sicherheitsmaßnahmen übertragen werden.
„
Dicke Daten “ ist der nächste Schritt, nachdem wir mit Big Data herumgespielt haben: Neben quantitativen Merkmalen werden auch qualitative Daten berücksichtigt. Das heißt, trockene Zahlen allein in gigantischen Mengen reichen nicht mehr aus, um Trends und laufende Prozesse tief zu verstehen. Für die Vollständigkeit der Analyse müssen beispielsweise menschliche Emotionen berücksichtigt werden.
Big Data regiert die Welt
Bei einer solchen Vielfalt von Definitionen stellt sich die Frage: Was sind diese Daten tatsächlich? Zuallererst groß, riesig! Big Data sammelt sich in unserer Nähe, um uns herum und sogar um jeden von uns. Kleine Sandkörner bilden sie langsam und sicher.
Der beliebte Satz „Großer Bruder beobachtet dich“ fällt mir sofort ein. Bestimmte Datenbanken werden aus den überall gesammelten Informationen gebildet und für verschiedene Studien und Manipulationen der öffentlichen Meinung verwendet. Anschließend werden alle empfangenen Informationen analysiert und es erfolgt eine sogenannte Wahrsagerei über den Ausgang wichtiger Ereignisse. Diese Wahrsagerei generiert alle möglichen Vorhersagen über Wahlsiege, Veränderungen in der politischen Situation des Landes oder Schwankungen in der Popularität einer Musikgruppe unter jungen Menschen.

Drei Big Whales wie Google, Facebook und Amazon haben sich den Big Data-Titel verdient. Diese Unternehmen erfassen den kleinsten Mausklick jedes Benutzers ihrer Portale. Und das alles zum Zwecke der globalen Informationserfassung. Es gibt große Hoffnung für Big Data. Die Forscher prognostizieren ihre enormen Auswirkungen auf alle Bereiche des menschlichen Lebens und Handelns. Dieses Schicksal hat sowohl die Medizin als auch die Wissenschaft nicht umgangen.
Wie kann Big Data in der Medizin nützlich sein? Hier geht es nicht einmal um die Menge der Informationsakkumulation, sondern um die Methoden ihrer Verarbeitung und Analyse. Das Volumen medizinischer Daten in einer Reihe von Bereichen hat seit langem eine Größe erreicht, die nicht nur zu verarbeiten, sondern sogar zu speichern problematisch ist. Das auffälligste Beispiel ist die Entschlüsselung des menschlichen Genoms, das aus mehr als 3 Milliarden Zeichen besteht. Diese Arbeit unter der Schirmherrschaft der US National Health Organization dauerte 13 Jahre (von 1990 bis 2003). Dank des Wachstums der Computerleistung und der Entwicklung von Theorie- und Softwaretools wird eine ähnliche Aufgabe im Jahr 2017 Wochen oder sogar Tage dauern.
Die Hauptaufgabe von Big Data in der Medizin besteht darin, die vollständigsten und bequemsten Register medizinischer Informationen mit der Möglichkeit des gegenseitigen Austauschs zu erstellen, die es ermöglichen, überall vollständige elektronische Patientenakten einzuführen, die die gesamte Krankengeschichte von Geburt an enthalten. Dies wird die Arbeit der Gesundheitseinrichtungen erheblich optimieren.
Aber kehren wir zu den neuesten sensationellen Ereignissen zurück, die im wahrsten Sinne des Wortes die Welt des Internets auf den Kopf gestellt haben - dem Sieg von Donald Trump bei den Wahlen. Obwohl sein Sieg für viele Menschen, darunter Analysten und politische Strategen, eine Überraschung war, ist er wahrscheinlich größtenteils das logische Ergebnis des kompetenten Einsatzes von Big Data.
Das Schweizer Magazin
Das Magazin behauptet, dass dieser Sieg von zwei Wissenschaftlern, Big Data und moderner Technologie errungen wurde. Jemand Michal Kosinski hat ein einzigartiges System entwickelt, mit dem Sie die maximale Information über eine Person nur durch ihre Vorlieben in sozialen Netzwerken herausfinden können - das sogenannte "Mikrotargeting". Später begann Kosinskis Entwicklung gegen seinen Willen in großen politischen Spielen eingesetzt zu werden. Später funktionierte das gleiche System im Wahlkampf eines amerikanischen Geschäftsmannes. Niemand wusste von der Verbindung zwischen dem Politiker und der Analysefirma, weil Donald nicht einmal einen Computer auf seinem Schreibtisch hatte. Aber der derzeitige US-Präsident hat sich selbst verraten. Er twitterte in seinem Konto, dass sie ihn bald Mr. nennen würden. Brexit.
In ihrem Wahlkampf handelte Hillary Clinton traditionell - sie sprach verschiedene Bevölkerungsgruppen des Landes an und formulierte getrennte Appelle an die schwarze Bevölkerung und die Frauen. Cambridge Analytica verhielt sich anders. Nachdem sie Datenbanken von erwachsenen US-Bürgern gekauft hatten, untersuchten sie jede von ihnen mit der OCEAN-Methode unter Berücksichtigung persönlicher Vorlieben und Interessen. Abhängig von ihrem Charakter und ihrer Mentalität wurden Nachrichten aus den Datenbanken an jede Person gesendet, in denen sie aufgefordert wurden, für einen Cambridge Analytica-Kunden zu stimmen, und die Begründung wurde in Abhängigkeit von dem zuvor erstellten individuellen Adressatenprofil ausgewählt. Einige der Botschaften beruhten sogar auf dem Prinzip der Kontroverse und schlugen vor, für Hillary zu stimmen.
Kosinski, ein Wissenschaftler, der ein Mikrotargeting-System entwickelt hat, beobachtet diese Nutzung seiner Entwicklung bisher nur von außen. Laut Michael war es nicht seine Schuld, dass die Erfindung eine Bombe in den falschen Händen war. Hervorzuheben ist, dass die Veröffentlichung des Schweizer Magazins von zahlreichen europäischen Medien kritisiert wurde, die behaupten, unbewiesene Informationen zu sein.
Während darüber diskutiert wird, ob Big Data die US-Wahlen wirklich beeinflusst hat, werden diese Daten weiterhin untersucht und systematisiert. Hüten Sie sich vor sozialen Netzwerken - wer weiß, wen Sie sonst noch wählen oder kaufen werden, nachdem Sie die Auswirkungen von Big Data erlebt haben?