Sie sind hier: gkd-el » SAP-Kompetenz 
Google Custom Search

Data Warehousing mit SAP BI

Unternehmensrelevante Daten unterschiedlichster Herkunft werden in einem Data Warehouse zusammengeführt und konsolidiert, so dass eine einheitliche Datenbasis entsteht. Der Anwender des Data Warehouse - vielfach Entscheidungsträger mit Management-/Controllingfunktion - kann diese Datenbasis hinsichtlich seiner persönlichen Anforderungen und Fragestellungen untersuchen und komplexe Analysen und Auswertungen durchführen.

Daten entstehen größtenteils in den Anwendungssytemen (OLTP-Systeme) der Unternehmen. Diese Anwendungssysteme können z.B. SAP R/3 und ERP-Systeme anderer Anbieter sein oder selbst entwickelte Lösungen.  Der Begriff OLTP bezeichnet das OnLine Transactional Processing, d.h. das Ausführen von kleinen einfachen Transaktionen in möglichst kurzer Zeit.  Um aus den dabei anfallenden Daten relevante Informationen für die Unternehmenssteuerung zu gewinnen, müssen die Daten mit Hilfe komplexer Abfragen ausgewertet werden. Dies wird als OnLine Analytical Processing (OLAP) bezeichnet.

Versucht man nun Daten aus unterschiedlichen Bereichen wie Vertrieb, Buchhaltung, Einkauf, Produktion, aus unterschiedlichen Organisationseinheiten oder aus unterschiedlichen Niederlassungen miteinander zu verknüpfen und auszuwerten, können diverse Probleme auftreten, u. a.:

  • es werden unterschiedliche Systeme mit unterschiedlichen Datenbanken eingesetzt;
  • die Datendeklaration ist in den verwendeten Systemen unterschiedlich (z.B. ist die Kundennummer in System A 6 Ziffern lang, in System B  8 Ziffern lang);
  • OLAP-Abfragen sind sehr komplex und bewirken, dass die Performance im operativen System herabgesetzt wird;
  • historische Daten sind nicht mehr online verfügbar, da sie archiviert wurden.

Diese Probleme umgeht man, wenn man alle benötigten Daten in einem Data Warehouse zentral zusammenführt und die Daten in diesem System so ablegt, dass sie für analytische Anforderungen optimal zugänglich sind. 

Bei der Überführung der Daten aus den operativen Systemen in das Data Warehouse werden die Daten bereinigt und konsolidiert. Dieser Vorgang wird auch als Datentransformation bezeichnet und sorgt dafür, dass die Daten unabhängig von ihrer Herkunft vergleichbar sind.

Da ein Data Warehouse speziell für die Bedürfnisse des OLAPs konzipiert ist (multidimensionales Datenmodell, Daten liegen denormalisiert vor), werden auch bei komplexen Analysen kurze Antwortzeiten realisiert. Die Datenhaltung in einem OLAP-System unterscheidet sich signifikant von dem eines OLTP-Systems und ist ganz auf die Bedürfnisse der Analyse ausgerichtet.

Die SAP AG bietet als Data Warehouse-Lösung das SAP NetWeaver 7.0 BI  an. Als Komponente der Plattform SAP NetWeaver bringt SAP NetWeaver BI eine leistungsfähige Business-Intelligence-Infrastruktur, zahlreiche Werkzeuge und Funktionen für Planung & Simulationen sowie für Data Warehousing zusammen.

Schaubild BI
Quelle: © SAP AG 2006

Die Architektur des SAP BI ist – wie klassische Data Warehouse-Systeme – 3-schichtig:

1. Ebene (Quellsysteme, Datenextraktion)

Die untere Ebene umfasst die Anbindung des SAP BI an die unterschiedlichsten Datenquellen und die Extraktion der Daten aus diesen Quellsystemen in die Eingangsstruktur des SAP BI der sogenannten PSA (Persitent Staging Area).

Um die benötigten Daten aus den Quellsystemen in das SAP BI extrahieren zu können, müssen die jeweiligen Quellsysteme (z.B. SAP ERP oder andere Datenbanken) an das SAP BI angeschlossen werden. Für die Extraktion sind spezielle Übertragungsstrukturen notwendig sowie Extraktionsbausteine, die die gewünschten Daten aus den Quellsystemen zusammenstellen.

Die Datenextraktion erfolgt je nach Kundenanforderung monatlich, wöchentlich oder täglich, wobei darauf geachtet werden muss, dass die Ladeprozesse abends oder nachts laufen, damit die operativen Systeme nicht im Tagesgeschäft belastet werden. Je nach Datenmenge kann ein Ladeprozess zwischen Minuten und mehreren Stunden benötigen.

2. Ebene (Datentransformation, Datenablage)

Die mittlere Ebene ist durch die Datentransformation und Ablage der Daten in den InfoProvidern z.B. InfoCubes und ODS-Objekten gekennzeichnet. Die Überwachung der Datenextraktion und der Datenvorhaltung erfolgt über die Administrator Workbench.

Bevor erstmalig Daten extrahiert und für spätere Analysen bereitgestellt werden können, muss in dieser Ebene der Datenfluss innerhalb des SAP BI und die Datenablage definiert werden.  Dieser Vorgang wird als Datenmodellierung bezeichnet. 

Die Datenmodellierung ist ein aufwendiger Prozess, der jedoch entscheidend für die spätere Systemperformance und für die Nutzbarkeit der Daten ist.  Entwickelt man ein zu kleines Datenmodell, kann man ggf. weitere Kundenanforderungen nicht mehr mit diesem Datenmodell befriedigen. Dann muss remodelliert oder gegebenenfalls ein neues Datenmodell entwickelt werden. Dies ist unter Umständen mit einer neuen kompletten Datenübertragung verbunden.  Entwickelt man jedoch ein zu umfangreiches Datenmodell, so kann es zu Performance-Einbußen bei den Auswertungen und Analysen kommen. Die Datenmodellierung nimmt deshalb innerhalb eines BI-Projektes eine wichtige Stellung ein und veranschlagt einen Großteil der Projektlaufzeit.

Der Datenfluss innerhalb des SAP BI erfolgt über einen komplexen Datentransferprozess, der auf die jeweiligen Anforderungen zugeschnitten ist.  Die Datenablage erfolgt in InfoProvidern (z.B. InfoCubes, ODS-Objekte etc.), die betriebswirtschaftlich zusammenhängende Daten beherbergen. Die Datenablage erfolgt in Form eines Stern-Schemas mit einer zentralen Faktentabelle, die die Kennzahlen enthält und sie umgebenden Dimensionstabellen, die die Merkmale enthalten, nach denen die Kennzahlen ausgewertet werden sollen.

3. Ebene (Präsentation und Analyse)

Die obere Ebene ist die Ebene der Analyse. In dieser Ebene werden die Daten in Form von Queries sichtbar gemacht.  Für die Analyse der Daten werden Queries auf Basis der InfoProvider erstellt, die dann nachfolgend über die Business Explorer Suite in Excel , im Web oder in einem Portal zur Verfügung gestellt werden.

Im Gegensatz zu den bekannten SAP ERP-Systemen ist der Aufbau und Betrieb eines SAP BI-Systems gänzlich anders. Es gibt im SAP BI keine Modullandschaft und auch kein klassisches Customizing wie es von SAP ERP bekannt ist.

Im SAP BI müssen die gewünschten Auswertungs- und Analyseapplikationen kundenspezifisch aufgebaut werden. Wenn Daten aus SAP-Systemen extrahiert und analysiert werden sollen, kann man auf den Business Content zurückgreifen. Hinter diesem Begriff verbergen sich von der SAP AG vordefinierte Strukturen, die jedoch aktiviert und kundenspezifisch angepasst werden müssen.

Der Bereich der Datenextraktion, des Datentransferprozesses und der Datenmodellierung ist den BW-Administratoren vorbehalten (entspricht den beiden unteren Ebenen der BI-Architektur).

Die Endanwender greifen lediglich auf die Queries zu und analysieren den zugrunde liegenden Datenbestand.  Daneben können Key-User ausgeprägt  werden,  die eigenständig Queries definieren können (beide Usergruppen arbeiten auf der oberen Ebene der BI-Architektur).