Links

Tools

Export citation

Search in Google Scholar

Datenmodellierung für Data Mining und OLAP

Journal article published in 2001 by Tobias Kraft
This paper was not found in any repository; the policy of its publisher is unknown or unclear.
This paper was not found in any repository; the policy of its publisher is unknown or unclear.

Full text: Unavailable

Question mark in circle
Preprint: policy unknown
Question mark in circle
Postprint: policy unknown
Question mark in circle
Published version: policy unknown

Abstract

102 pages ; Im Bereich Business Intelligence werden verschiedenste Methoden und Werkzeuge eingesetzt, um unternehmensweite Datenbestände in einem Data Warehouse zu analysieren. Wichtige Vertreter sind hier das Online Analytical Processing (OLAP) und das Data Mining. In der praktischen Anwendung sind meist sowohl Werkzeuge aus dem OLAP-Bereich als auch aus dem Data-Mining-Bereich notwendig, um im Data Warehouse eines Unternehmens alle relevanten Informationen aufzufinden. Diese Arbeit befasst sich daher mit der Frage, wie Daten in einem Data Warehouse strukturiert sein sollten, um den Einsatz von Werkzeugen aus den Bereichen OLAP und Data Mining gleichermaßen zu unterstützen. Hierzu werden zunächst verschiedene Modellierungsalternativen aus dem OLAP-Bereich betrachtet. Anschließend wird untersucht, welche Anforderungen die verschiedenen Data-Mining-Methoden und -Algorithmen an die Datenmodellierung stellen. Zusätzlich werden einige ausgewählte Software-Werkzeuge betrachtet, wobei die Datenimport- und Vorverarbeitungsmöglichkeiten im Vordergrund stehen, da sie letztlich die Anforderungen an die Datenmodellierung festlegen. Danach wird ein Klassifizierungsschema für Data-Mining-Fragestellungen entworfen. Die zu den einzelnen Klassen gehörenden Zahlen von Join-Operationen werden für die verschiedenen OLAP-Datenmodelle ermittelt und zur Bewertung bzw. zum Vergleich der Vorverarbeitungskomplexität der verschiedenen OLAP-Datenmodellen verwendet. In diesem Zusammenhang werden auch einige Optimierungsmöglichkeiten besprochen und das Klassifizierungsschema auf eine Menge von Beispiel-Fragestellungen angewandt. Abschließend wird eine Liste von Empfehlungen zur Datenmodellierung von Data Warehouses für die Anwendung von OLAP- und Data-Mining-Werkzeugen erstellt, die das Ergebnis dieser Arbeit darstellt.