Zeit, den Big-Data-Mythos zu entschlüsseln

June 14, 2016
Zeit, den Big-Data-Mythos zu entschlüsseln

Beitrag von Annette Maier, Country Manager Germany, VMware

Annette_Maier_Country Manager Germany_2Dass Big Data für nahezu jede Branche unverzichtbar geworden ist, steht außer Frage: In der Produktion dient die intelligente Datenauswertung zur Qualitätsverbesserung und Produktionsplanung, im Marketing zur Kundenanalyse, in der Logistik zur Kostensenkung. Wie einfach man sich Datenmengen zunutze machen kann, scheint vielen Unternehmen jedoch nicht klar zu sein. Kundengespräche zeigen: Um das Projekt Big Data ranken sich weiterhin alte Mythen. Vor allem kleine und mittelständische Unternehmen tun sich damit noch schwer – ausgerechnet. Wo sich unter ihnen doch so viele Hidden Champions tummeln, für die der ROI von Big Data Analytics enorm hoch erscheint, um auch weiterhin an der Weltspitze zu bleiben. Warum dies so ist? Organisationen scheuen oft vor dem Thema Big Data zurück, weil sie denken, sie bräuchten riesige – und entsprechend kostspielige – Server für die Archivierung und Management der „großen Daten”. Völlig aus der Luft gegriffen ist dieser Gedanke zwar nicht. Waren doch früher tatsächlich dedizierte, hochleistungsfähige Serverranches nötig, um dem kontinuierlich wachsenden Datenberg Herr werden zu können.

Alternative zu Bare Metal: Hadoop

Dieses Szenario ist aber längst Geschichte und Big Data Analytics hat zu Unrecht den Ruf, schwer umsetzbar zu sein. Tech-Professionals wissen, dass riesige Datenmengen inzwischen genau wie alle anderen Datenbank-Workloads behandelt werden können: Denn seit über zehn Jahren gibt es Hadoop, eine Open-Source Software, die auf virtuellen Servern läuft. Theoretisch funktionieren Big Data Applikationen natürlich auch mit Hadoop auf dedizierten Servern oder Server-Clustern als Bare Metal Installation. Doch die Servervirtualisierung erleichtert die Aufbereitung der Daten immens: Dieselbe Anzahl an Hardware, die für eine native Hadoop Implementierung nötig gewesen wäre, hat nun das Potential über mehr als nur einen Hadoop Cluster geteilt zu werden. Datenbank-Workloads können simultan verarbeitet werden – undenkbar bei einer physischen Hadoop Implementierung. Big Data Applikationen können nun also ganz einfach auf einer virtualisierten Plattform innerhalb des Rechenzentrums laufen und wie jeder andere Workload gemanagt werden. Virtualisierung bringt bei Big Data Applikationen drei bedeutsame Vorteile:

1. Effizienz

Ein virtuelles Rechenzentrum schafft Arbeitsraum: So kann die Nutzung jedes einzelnen physischen Servers maximiert werden, was bei physischen Big Data Clustern nicht der Fall ist. Denn verarbeiten sie nicht gerade spezifische Big Data Workloads, laufen diese leer – verschwenderisch oder? Wenn Big Data hingegen virtualisiert wird, können die Ressourcen zu anderen Zwecken und dauerhaft genutzt werden.

2.Flexibilität

Es gibt verschiedenste Versionen bzw. Distributionsmöglichkeiten bei Hadoop und etliche Möglichkeiten, die Workloads auf Server Cluster zu verteilen. Mix and Match! Jede Verteilung hat ihre Vorteile. Welche für Ihr Unternehmen die richtige Variante ist, können Sie einfach ausprobieren. Genau das ist das Praktische an der Virtualisierung von Hadoop. Dadurch dass Verarbeitungsprozesse gleichzeitig auf denselben Clustern laufen, können ganz leicht Verteilungen geändert oder weitere Versionen dazu genommen werden.

3.Lernkurve

Neue Hardware = neue Tools und Prozesse. Sich mit diesen zurechtzufinden nimmt oft wertvolle Zeit in Anspruch. Bei virtuellen Infrastrukturen ist das jedoch anders – keine extra Tools, keine Lernkurve! Die meisten Unternehmen nutzen Virtualisierung bereits in anderen Bereichen. Somit besitzen ihre IT-Teams bereits das nötige Know-how für die Virtualisierung von Hadoop.

Sie fragen sich jetzt bestimmt: Ist Hadoop etwas für uns?

Trotz all der theoretischen Vorteile bleiben oft Skepsis und Fragen über die Anwendung von Hadoop in der Praxis. Um Ihre Zweifel gleich aus dem Weg zu räumen, hier die wichtigsten Fragen beantwortet:

Bringt Hadoop in virtualisierter Form tatsächlich die gleiche Leistung wie auf einem dedizierten Server?

Natürlich hängen Leistungsresultate von Konfiguration und der Art eines Workloads ab. VMware hat mit seiner VMware vSphere Plattform zahlreiche Tests durchgeführt und ist zum Schluss gekommen, dass die Leistung in virtuellen Umgebungen sogar gesteigert wird – um ganze 12 Prozent!

Wurde Hadoop in Produktionsumgebungen schon ausreichend getestet bzw. ist Hadoop in Produktionsumgebungen schon kampferprobt?

Ja. Beispielsweise die Digital Marketing Abteilung von Adobe benutzt Hadoop bereits seit einigen Jahren intern für verschiedenste Anwendungen und berichtet, dass dadurch bedeutende Gewinne bei der Analyse von Kundendaten erzielt werden konnten. Auch Skyscape, eine britisches Unternehmen, das über ein Regierungsprogramm Cloud Computing Services anbietet, verwendet und verwaltet virtualisierte Hadoop Cluster. Skyscape bietet einer großen Endnutzer-Community Infrastructure-as-a-Service (IaaS), Platform-as-a-Service (PaaS) und Software-as-a-Service (SaaS).

Unterstützen namhafte Anbieter die Virtualisierung?

Ja. In der Tat pflegt VMware sogar Arbeits- und Zertifizierungsbeziehungen mit Cloudera, Hortonworks und MapR, die für Big Data-Virtualisierung bereit sind und diese unterstützen. Die neu gewonnene Möglichkeit, Big Data Operationen in einem virtuellen Umfeld laufen zu lassen, ohne spezielle Hardware dafür bereitstellen zu müssen, bietet also etliche Vorteile: schnellere Ergebnisse, einfachere Handhabung und unter dem Strich eine große Kostenersparnis.

Tatsächlich stellt Hadoop für Big Data-Projekte eine Schlüsseltechnologie dar. Doch wie bei vielen jungen Technologien fällt es Unternehmen schwer zwischen Hype und echten Mehrwert zu unterscheiden. Der „Big Data Use Cases Survey 2015″ des Business Application Research Center (BARC), bei dem 261 Teilnehmer aus Deutschland, Österreich und der Schweiz zu ihren Erfahrungen in der Schweiz befragt wurden, zeigt: IT-Professionals sehen Hadoop einerseits als Chance für neue Business-Modelle und Dienstleistungen aufgrund einer reaktionsschnellen Plattform, andererseits fehlt es 68 Prozent von ihnen noch an technischem Know-how. Trotzdem scheinen die Vorteile zu überwiegen. So verwiesen bei der Umfrage 57 Prozent der Unternehmen mit Hadoop-Projekten auf eine gesteigerte Wettbewerbsfähigkeit und 38 Prozent berichteten von einer messbaren Umsatzerhöhung. Die große Mehrheit von mehr als 80 Prozent messen dieser jungen Big Data Technologie eine entscheidende Rolle bei der Datenstrategie ihres Unternehmens bei.


Welche Pros und Cons sehen Sie bei Big Data Analytics? Und wie sind Ihre Erfahrungen mit Hadoop-Projekten? Ich freue mich auf Ihre Reaktionen auf https://twitter.com/maier_vmware

 
Related Posts
 

Die Erwartungen und Vorstellungen der Regierung sind hoch an die digitale Strategie 2025, die Deutschland bereits als digitalen Vorreiter sieht. Mit gleich mehreren Silicon Valleys, die sich thematisch fokussiert haben, sollen diese Erwartungen erfüllt werden. Aber ob das so zielführend ist?

Der selbstverständliche Umgang mit IT ebenso wie mit digitalen Medien ist heutzutage nahezu in jedem Berufsfeld unverzichtbar. Die Digitalisierung ist Fakt und aus der Arbeitswelt der Zukunft nicht mehr wegzudenken! Es wird in Schulen heute also wichtiger denn je zuvor, die Schüler auf die Herausforderungen der Arbeitswelt von heute und morgen vorzubereiten und sie auch in Bezug auf den korrekten Umgang mit Daten aufzuklären.

Stiften, spenden und sponsern sind definitiv gute Taten, die sowohl der Wirtschaft als auch dem Gemeinwesen zu Gute kommen. Bei VMware sind wir der Überzeugung: Wer gesellschaftliches Engagement sowie eine soziale und ökologische Unternehmensverantwortung fest in der eigenen Unternehmensstrategie verankert, der gewinnt nicht nur im Kerngeschäft, sondern auch langfristig bei Mitarbeitern und Arbeitskultur.

Insbesondere große Unternehmen möchten nicht mit einem Sicherheitsvorfall in den Schlagzeilen landen und haben den Ernst der Lage erkannt. Deshalb schaffen viele von ihnen eine weitere strategische Position: Die des CISOs (Chief Information Security Officer), der sich vorrangig um die IT-Sicherheit im Unternehmen kümmern soll. Doch welche Verantwortlichkeiten bringt diese Position mit sich?

 
 
Blog Archive