Business Analytics mit SAP HANA
Möglichkeiten und Grenzen

Andre Kaiser und Anja Tetzner

Business Analytics hat sich im Fokus von Big Data verändert und weiterentwickelt. Eine umfangreichere Datenbasis lässt dabei nicht nur Analysen und Berichte zum Status quo zu, sondern auch Vorhersagen über mögliche Ereignisse in der Zukunft. An dieser Stelle setzt das Predictive Analytics an. Zu dessen Umsetzung existieren bereits eine Reihe an Systemlösungen. SAP HANA ist ein Beispiel, welches die Anforderungen im Bereich Big Data und Predictive Analytics erfüllen soll. Um die Einsatzmöglichkeiten zu testen und konkrete Anwendungsbeispiele aufzeigen, bezieht sich der Beitrag auf die Ergebnisse einer Fallstudie, die im Jahr 2016 in mehreren Gruppen durchgeführt wurde. Dabei sollen kritisch Möglichkeiten und Grenzen des Systems aufgezeigt werden.

Der immense Anstieg von Datenmengen, deren Speicherung und Nutzbarmachung stellt Unternehmen vor großen Herausforderungen. Die Chancen und Risiken, die mit großen und insbesondere wenig strukturierten Datenbeständen verbunden sind, werden seit einiger Zeit unter dem Schlagwort Big Data diskutiert. Dabei stehen nicht mehr nur die unternehmensinternen, in der Regel stärker strukturierten Datenbestände im Mittelpunkt. Es sind zunehmend unstrukturierte und semi-strukturierte Daten externen Ursprungs von Interesse, wie diejenigen aus sozialen Netzwerken oder Geodaten. Das Erkennen von Mustern und das Aufzeigen von Prognosen in solchen Daten wird unter dem Begriff Business Analytics subsumiert. Bezogen auf die neuen Herausforderungen im Kontext von Big Data ist zudem immer häufiger von „Big Data Analytics“ zu lesen [1]. Von ganz besonderem Interesse sind dabei Vorhersagen, Prognosen und Trends, die zur Entscheidungsunterstützung in der Gegenwart einen Blick in die Zukunft ermöglichen. Diese Anwendungen repräsentieren einen weiteren Teilbereich und sind als Predictive Analytics (PA) derzeit in der Diskussion [2]. Diese dienen zur Entscheidungsunterstützung, wenn komplexe Verfahren zur Auswertung zukunftsorientierten Datenbestände notwendig sind [3].

SAP bietet mit SAP HANA und SAP Predictive Analytics (SAP PA) Lösungen zu PA, die Architekturen und Analysealgorithmen zur Speicherung und Auswertung komplexer Datenbestände bereitstellen sollen. Anwendungen im Bereich Big Data und PA werden von HANA insbesondere forciert [4]. Daten mit unterschiedlichen Strukturierungsgraden können verarbeiten werden [5]. In Hinblick auf die Problemstellung, im Kontext von PA und Big Data auch semi-strukturierter oder unstrukturierte Datenbestände zu berücksichtigen, erweist sich die Systemauswahl als geeignet.

Um die Funktionen und Bedienbarkeit zu testen und praktische Anwendungsbeispiele aufzuzeigen, wurde im Jahr 2016 eine Fallstudie mit mehreren Gruppen durchgeführt. Diese basierte auf einem fiktiven Unternehmen, für das auf Basis der HANA-Plattform eine Lösung zu erstellen war. Ziel war es, ein Analyse- und Berichtssystem zur Auswertung kundenbezogener Daten, sowie Produkt- und Finanzdaten zu erstellen. Die Fallstudie umfasste den gesamten Entwicklungsprozess von der Analyse der Datenquellen über die Erstellung von ETL-Prozessen bis hin zur Entwicklung konkreter Reporting-Lösungen. Zunächst erfolgt die Beschreibung des Entwicklungsprozesses und der zugrundeliegenden Datenmodelle. Darauf aufbauend folgt die Beschreibung exemplarischer Analysemöglichkeiten. Das hier beschriebene Vorgehen ist beispielhaft zur Implementierung eines Prototyps für eine Anwendung von Business Analytics und PA, sodass Überlegungen zur Datenhaltung, Anforderungen der Informationsempfänger und Prozesse der Datenmigration gesammelt und abstrahiert werden können.
 

Datenmodell und ETL-Prozesse

Um einen Überblick über die Anforderungen und Erwartungen der Fachanwender zu erhalten, zeigten sich UML-Use-Case-Diagramme als sinnvoll, die neben den Anwendungsfällen auch die Informationsempfänger integrieren. Als übergeordnete Anwendungsbereiche sollten die Auswertung von Kundendaten, Produktdaten und finanziellen Kennzahlen im Vordergrund stehen. Jeder Anwendungsbereich konnte schließlich in weitere Use-Cases untergliedert werden. Zur semantischen Modellierung der multidimensionalen Datenbestände war zunächst ein mehrdimensionales Datenmodell zu erstellen, das für das vorliegende Beispiel als ADPAPT-Modell realisiert wurde. Für unser Beispiel bildete zunächst ein Cube mit den Dimensionen Zeit, Kunde, Produkt und Vertriebsweg die Grundlage. Ferner wurden eine oder mehrere Hierarchien für die einzelnen Dimensionen definiert. Diese repräsentierten die Über- und Unterordnungsverhältnisse in den Dimensionen und waren damit die Grundlage für die Operationen drill-down und roll-up [6]. Bild 1 fasst die beschriebene Anforderungserhebung für Kundendaten zusammen.

Bild 1: Anforderungen der Fallstudie.

Für das logische Modell hat sich das Star-Schema bewährt, da dieses die spätere Überführung in das physische Modell in HANA in geeigneter Weise unterstützt. Im Kern bestehen diese aus Dimensionstabellen und einer Faktentabelle. Die Faktentabelle enthält dabei die Bewegungsdaten, wohingegen die die Dimensionstabellen Stammdaten beinhalten [6].

Nach der Auswahl der Quelldaten konnten diese transformiert und ins System geladen werden. Für die notwendigen ETL-Prozesse boten sich unterschiedliche Varianten an. Für unser Beispiel wurden die Daten per csv-Export aus der zur Verfügung stehenden Access-Datenbank geladen. HANA stellt hierzu einen Flatfile-Import bereit, mit dem sich Daten aus einer lokalen csv-Datei direkt in die HANA-Datenbank laden lassen. Für die tatsächliche Realisierung ist eine Implementierung automatischer ETL-Prozesse eher zu empfehlen als dieser manuelle Prozess.
 

[ Wenn Sie den kompletten Beitrag lesen möchten, klicken Sie hier ]
 

 

Das könnte Sie auch interessieren: Alternativen zu HANA
 

 

 

Schlüsselwörter:

Big Data, Business Analytics, Predictive Analytics, SAP HANA

Literatur:

[1] Gluchowski, P: Business Analytics – Grundlagen, Methoden und Einsatzpotenziale, In: HMD – Praxis der Wirtschaftsinformatik, 53(3), 2016, S. 273–286.
[2] Larose D.; Larose, C.: Data mining and predictive analytics, Hoboken, New Jersey: John Wiley & Sons, 2015.
[3] Felden, C.; Koschtial, C.; Buder, J.: Predictive Analytics in der Strategischen Anlagenwirtschaft. In: Mertens, P.; Rässler, S. (Hrsg.): Prognoserechnung, Heidelberg: Physica-Verlag HD, 2012, S. 519-537.
[4] Prassol, P.: SAP HANA als Anwendungsplattform für Real-Time Business, In: HMD – Praxis der Wirtschaftsinformatik, 52(3), 2015, S. 358-372.
[5] Prassol, P.: In-Memory-Platform SAP HANA als Big Data-Anwendungsplattform, In: Fasel, D.; Meier, A. (Hrsg.): Big Data: Grundlagen, Systeme und Nutzungspotenziale, Wiesbaden: Springer Fachmedien, 2016, S. 195–209.
[6] Hahne, M.: Mehrdimensionale Datenmodellierung für analyseorientierte Informationssysteme, In: Chamoni, P.; Gluchowski, P. (Hrsg.): Analytische Informationssysteme: Business Intelligence-Technologien und –Anwendungen, Berlin, Heidelberg: Springer, 2006. S. 177-206.
[7] Hippner, H.; Wilde, K.D.: Data Mining im CRM, In: Helmke, S.; Uebel, M.; Dangelmaier, W.(Hrsg.): Effektives Customer Relationship Management: Instrumente - Einführungskonzepte – Organisation, Wiesbaden: Springer Fachmedien, 2013, S. 179–196.