close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Die gesteuerte Zukunft – Wie Sie mit Predictive Analytics sichere

EinbettenHerunterladen
Die gesteuerte Zukunft –
Wie Sie mit Predictive Analytics
sichere Prognosen erstellen und
Massenentscheidungen automatisieren
IBI Symposium 2013
Prof. Dr. Michael Feindt
Karlsruher Institut für Technologie (KIT)
Chief Scientific Advisor, Blue Yonder
Übersicht
1.  Einführung und Überblick
2.  Was steckt hinter Predictive Analytics?
3.  The real Business Intelligence
4.  Q&A
Kahneman-Zitat
D.Kahneman
(Nobelpreisträger für Behavioural Economics)
Der Mensch ist nicht in der Lage, statistisch-quantitative
Entscheidungen permanent gut genug zu treffen und lässt
sich häufig täuschen (meist durch Optimismus)
Lange Liste von typischen Denkfehlern:
http://en.wikipedia.org/wiki/List_of_cognitive_biases
Predictive Analytics: Datengetriebener, objektiver
Erkenntnisgewinn und Entscheidungsoptimierung mit
wissenschaftlichen Methoden
Was steckt hinter
Predictive Analytics?
Die Welt verläuft nicht deterministisch.
Vorhersagekraft prinzipiell begrenzt
durch Quantenphysik und
deterministisches Chaos in komplexen
Systemen.
Aber sie verläuft auch nicht zufällig.
Wo ist Predictive Analytics einzuordnen?
Pendel
(deterministisch)
Predictive Analytics
Lotterie
(purer Zufall)
0%
e
h
r
o
V
e
l
l
e
u
d
i
v
i
Ind
it
e
k
r
a
b
g
a
rs
100%
Für reale Systeme kann man mit Predictive Analytics
individuelle Wahrscheinlichkeitsaussagen machen
z.B. zum Ausgang von Sportereignissen
Pendel
(deterministisch)
Lotterie
(purer Zufall)
0%
e
h
r
o
V
e
l
l
e
u
d
i
v
i
Ind
it
e
k
r
a
b
g
a
rs
100%
Für reale Systeme kann man mit Predictive Analytics
individuelle Wahrscheinlichkeitsaussagen machen
z.B. Zuschauerzahlen z.B. Abverkäufe
Pendel
(deterministisch)
Lotterie
(purer Zufall)
0%
e
h
r
o
V
e
l
l
e
u
d
i
v
i
Ind
it
e
k
r
a
b
g
a
rs
100%
Für reale Systeme kann man mit Predictive Analytics
individuelle Wahrscheinlichkeitsaussagen machen
z.B. Verkehrsunfälle
z.B. Verkehrsstaus
Pendel
(deterministisch)
Lotterie
(purer Zufall)
0%
e
h
r
o
V
e
l
l
e
u
d
i
v
i
Ind
it
e
k
r
a
b
g
a
rs
100%
Vorhersage der kompletten
Wahrscheinlichkeitsdichte- Verteilung
für jeden Einzelfall
à Einzelentscheidungen optimierbar
Erwartungswert
Standardabweichung
(Volatilität)
Abweichung von Normalverteilung
(fat tails)
Modus
Wo steht Predictive Analytics heute?
Modernste Technologie
Optimale Bestellmenge
Wahrscheinlichkeitsdichte P
E(X)
100
120
Umsatz
Entwickelt in verschiedenen
Hochtechnologie-Bereichen,
interdisziplinär.
z.B. an ElementarteilchenBeschleunigern wie dem
CERN
1 PETA – BYTE / SEC
Unsere Wurzeln: 30 Jahre Elementarteilchenphysik,
bis zum LHC am CERN.
Verstehen, wie unser Universum funktioniert.
our universe works.
Schreiben Sie hier Ihren Text
CERN (1960)
CERN (2005)
LHC:
27km Umfang
Photo: CERN
Unser Hintergrund: Hochenergiephysik
an der Speerspitze internationaler fundamentaler Spitzenforschung
Der Large Hadron Collider
– 100m unter der Erde, 27km Umfang
Sehr starker weltweiter Wettbewerb um Erkenntnisse aus Daten
àsehr starke statistische Methoden: schnell , robust, multivariat
Photo: CERN
NeuroBayes®
Ein High-Tech-Algorithmus aus der experimentellen Elementarteilchenphysik
kann komplexe Zusammenhänge aus historischen Datenbanken von Firmen
lernen und zur Prognose für die Zukunft nutzen.
Basiert auf einem künstlichen neuronalen Netzwerk. Ist aber viel mehr.
Äußerst hohe Generalisierungsfähigkeit (d.h. die Vorhersagen treffen
innerhalb ihrer angegebenen Unsicherheiten auch ein.)
NeuroBayes-Beispiel: Der LHCb-Trigger
Fundamental research at the forefront of science
Am LHC (CERN) enstehen pro Experiment:
40 000 000 Ereignisse pro Sekunde, das entspricht
1 PetaByte (1,000,000,000,000,000 Byte)
pro Sekunde.
Aber nur 1 PB interessante Daten pro
Jahr können gespeichert werden.
Online-Datenreduktion
1 : 10,000,000 nötig!
Am LHCb-Experiment laufen
30 000 Instanzen von NeuroBayes und
filtern real-time 24/7 die „interessanten“
Ereignisse.
Photo: CERN
NeuroBayes-Beispiel: Vollständige Rekonstruktion von BMesonen an der japanischen Experiment Belle
Fundamental research at the forefront of science
Ø  Belle-Experiment am KEK/Japan
Ø  400 Physiker aus aller Welt
Ø  10 Jahre Datennahme und
Datenanalyse (>4000 Mannjahre)
Ø  Welt-Rekord-Luminosität
Ø  ≈400 Veröffentlichungen
Ø  Automatisches hierarchisches
Rekonstruktionssystem mit 72
NeuroBayes-Netzwerken rekonstruiert
1100 verschiedene Reaktionen mit
Faktor 2 besserer Effizienz als alle
bisherigen Analysen
Ø  Viel klareres Signal
Photo: CERN
Ø  Arbeit von 3 Doktoranden
Ø  Entspricht ca 500 “normalen”
Doktorarbeiten
Ø  Entspricht weiteren 10 Jahren
Datennahme
NeuroBayes von der Wissenschaft in die Wirtschaft
Predictive Analytics in High Energy Physics
10
Momentum
50
Direction
90
Type
Kaon
Sub-Detector
Calo
Distance
...
200
Use all available and relevant
information as input, e.g.
measurements from the various
sub-detectors, …
E(X)
propabilityP
Energy
Particle Property
NeuroBayes will extract statistically
significant patterns in the data to derive
the prediction.
Prediction will return the best
estimator for a measurement
including a statistically sound
estimation of the expected
spread.
NeuroBayes von der Wissenschaft in die Wirtschaft
Predictive Analytics in industry
Picture size
colour
Previous sales
M
e.g. Retail
21%
red
E(X)
propabilityP
Article size
24
brand
171
price
...
19,9
Use all available and relevant
information as input, e.g. article
properties, previous sales, etc
Prediction sales
NeuroBayes will extract statistically
significant patterns in the data to derive
the prediction.
Prediction will return e.g. the most
probable sales rate including a
statistically sound estimation of
the expected spread.
NeuroBayes allows data-driven analysis and forecasts – both in science and industry
blue yonder NeuroBayes® - Prognosetechnologie
blue yonder weiss
… mit großen Datenmengen umzugehen.
… relevante Informationen aus großen
Datenmengen (big data) zu extrahieren.
… daraus Zukunftsprognosen in Form
von Wahrscheinlichkeitsdichten zu
formen.
… daraufhin optimale Entscheidungen
zu treffen.
… das Ganze in einfach zu bedienende
Software zu verpacken und auf Wunsch
vollständig zu automatisieren.
… das Ganze als SaaService anzubieten.
NeuroBayes®
Big Data Science und Business à Innovation
Blue Yonder baut auf NeuroBayes basierende,
sehr erfolgreiche (die Komplexität versteckende) Lösungen u.a. für seine Kunden:
und wurde dafür schon mit vielen Innovationspreisen ausgezeichnet:
Top Retail
Product
2011/2012
Retail
Winner
bwcon
Technology Data Mining Cup Hightech
Award 2012
2009 & 2010
Award
Special Award
Finalist
Deutsche Börse Entrepreneur of
2012
the Year 2012
and 2013
FOCUS
Digital star
2013
Positionierung
Big Data/Analytics Stack
Positionierung von Blue Yonder im Analytics Space (
)
Source: September 20, 2011, “Understanding The Business Intelligence Growth Opportunity” Forrester report
Integriertes Risikomanagement:
Prognose ist mehr als nur eine Zahl...
Am 3. Juli 2013 werden in der XYZ-Filiale in Hinterzarten 12 Erdbeer-Bio-Jogurt gekauft.
Genau 12?
Nein, statistische (Poisson-artige Statistik) und systematische (nicht vorhandene
Information) Schwankungen führen UNUMGÄNGLICH zu Abweichungen der Zukunft
von der Prognose.
Eine gute Prognose quantifiziert auch die Unsicherheit, mindestens (meistens) in
Form einer Varianz oder Standardabweichung (Volatilität):
12 ± 5 Erdbeer-Bio Jogurt
Risikomanagement in Banken und Versicherungen weiß das.
Aber: z.B. viele professionelle SCM- IT-Systeme kennen keine Prognose-Unsicherheit!
Sales Forecast Fashion
Beispiel: OTTO Group
Prognosen pro Artikel:
»  Mittelwert
»  Zwei Prognosewerte
für die Unsicherheit
(68% und 95%
Kredibilitätsintervalle)
Sales [units]
ROI-Berechnungen für die Otto Group
Artikel-individueller optimierter Einkauf schafft jede Saison Mehrwert im 2 stelligen Millionenbereich
Verderbliche Ware in Supermärkten
Fleisch, Obst & Gemüse, Brot, Milchwaren, ….
Ungefähr 7% aller verderblichen
Lebensmittel in deutschen
Supermärkten müssen
vernichtet werden.
Das sind ca. 89 Millionen
Tonnen pro Jahr.
Langfristig weder wirtschaftlich
noch gesellschaftlich /
moralisch tragbar
Dilemma:
Weniger Abschriften können nur
durch mehr leere Regale
erkauft werden.
Das Dilemma der großen strategischen Entscheidungen
Zwischen Skylla und Charybdis –
oder: muss man wirklich einen Tod sterben?
Skylla:
Preise / Prämien erhöhen:
Profitabilität pro Kunde besser
Kunden wandern ab, kaum Neukunden
Charybdis:
Preise / Prämien erniedrigen:
Kunden zufrieden, Neukunden gewinnbar
Profitabilität gefährdet
Kann man beide Ziele gleichzeitig erreichen?
Ja, durch Individualisierung
mit Hilfe von Predictive Analytics
Scheinbar unvereinbare Ziele vereinbaren
mit Hilfe von individualisierten Prognosen / Tarifen / Entscheidungen
Beispiel aus dem Versandhandel (Otto)
u  Erhöhung der Warenverfügbarkeit bei gleichzeitiger Reduktion von Restbeständen
am Ende der Saison
Ergebnis:
Prognoseverbesserung um 40%
Bestandsverbesserung im
2-stelligen Mio.-€-Bereich pro Jahr.
Beispiel aus der Versicherungswirtschaft (BGV)
u  3,5% mehr Neukunden bei gleichzeitiger Reduktion der Schadenquote um 15%
Prognosen auf Einzel-Personen-Ebene
Aus vergangenen Daten
Lernen & zukünftiges
Verhalten prognostizieren
Individuen erzeugen Daten
Beispiele:
Reaktionen auf Produktvorschläge
Kündigungsverhalten
Leistungsforderungen
Kreditausfälle
Betrugsverhalten
Einordnung von Einzelpersonen
Ø  Was wird passieren?
Ø  In welchem Ausmaß?
Ø  Individuelle Wahrscheinlichkeiten
Beispiel: Churn Management (BGV)
Identifiziere Bestandskunden, die mit einer hohen Wahrscheinlichkeit kündigen
Ø  30% aller Kündiger können identifiziert und
kontaktiert werden, wobei nur 9% der gesamten
Kundenbasis betrachtet werden muss.
Ø  Oder 50% aller Kündiger bei Betrachtung &
Kontaktierung von 19% der Kundenbasis
Die Vorteile auf einen Blick
Ø  Finde die Kunden, die wirklich kündigungsgefährdet sind
Ø  Konzentration der Ressourcen auf die identifizierte Gruppe
Ø  Ressourceneinsparpotential
Ø  Keine schlafenden Hunde wecken
NeuroBayes® kann für jeden Versicherten x
individualisierte Bayes‘sche Wahrscheinlichkeitsverteilungen prognostizieren.
NeuroBayes® bietet die Lösung für schwierige Verteilungen des Typs
x
x f (t | t > 0, x)
x
f (t | xx) = (1 − P(x))⋅
δ (t) + P(x)⋅
Der Versicherte x wird
mit Wahrscheinlichkeit 1-P(x)
gar keine Leistung einfordern
€
Wenn für den Versicherten x
Kosten anfallen, werden diese
entsprechend f(t|t>0,x) verteilt sein
t
δ(t) =
Dirac- Delta,,Funktion‘‘
(Distribution)
Schadenprognose in der Versicherungswirtschaft
Kostenverteilung
Klassifikation
Wahrscheinlichkeit P
Dichteverteilung
Wahrscheinlichkeit P
E(X)=413
Kosten in Höhe X
Einblicke in versteckte Zusammenhänge in Daten
Zusammenhänge in Daten lassen sich mit modernen Methoden aufdecken
auch komplexe, nichtlineare, von vielen Variablen abhängige....
Korrelation zwischen Inputvariablen,
Target farbkodiert (“Ramler II-Plot“)
34
NeuroBayes®- Beispiel: Prognose des
Deckungsbeitrags einer Katalogversendung
optimale Ausstattungstiefe
Kunden-Bonitätsbewertung
NeuroBayes im Vergleich zu einem „klassischen“ Ansatz der Otto Gruppe
u  Ziel: Frühzeitiges Erkennen von Kunden, die im Laufe der Zahlungsfrist zahlungsunfähig werden.
Ø  Verbesserung in der Erkennung von zahlungsunfähigen Kunden um bis zu 25%
Ø  Auswirkung auf EBIT: > 2,5 Mio Euro
Call-Center-Optimierung und Bewertung von
Zahlungswahrscheinlichkeiten bei Schuldnern
Lösung:
►  Unterstützung des Inkassoprozesses
►  Prognose der Zahlungswahrscheinlichkeit
und der Zahlungshöhe
►  Optimierung der Priorisierung der individuellen
Anwahlversuche je Schuldner
„Für uns ist eine realistische Bewertung der Zahlungswahrscheinlichkeit
und -höhe von Schuldnern von ganz entscheidender Bedeutung.
Wir sind überzeugt von der Methode der Software: Die Ergebnisse von Blue
Yonder sind direkt messbar und helfen dabei, unsere Prozesse zu optimieren...“
Dr. Andreas Witzig| Geschäftsführer KG EOS Holding GmbH & Co
Technologie-Überblick
OPERATIONAL SYSTEM
(Environment)
WEB UI & SERVICES
NEUROBAYES SYSTEM
Simulator
(industry-specific)
STREAMBASED INPUT
REAL-TIME
FEED
Expert
High Performance
Data Transformation
R>
BATCH
INPUT
HISTORICAL
TRANSACTION DATA
Trainer
Predictions
R>
Industryspecific Output
OUTPUT
EXPERTISE
(Industry-specific models)
Moderne Datenbanktechnologie:
spaltenweise --- massiv-parallel --- clever caching --- effektiv in memory
WICHTIG: Nicht einmaliges Data Mining, sondern Integration
in die Kundenprozesse, täglich optimale Entscheidungen
Automatisierte Warenbeschaffung – Big Data
Mengengerüst
Volume
• 1000 Filialen, 5000 Artikel im Frischesortiment
à 5 Mio. Entscheidungspunkte pro Tag
• 30 Tage Prognosehoziront
à 150 Mio. Prognosen pro Tag
• 2000 Wetterprognosen pro Tag, 5 Tage Horizont
à 10000 Wetterprognosen pro Tag
Velocity
Variety
+VALUE
Seite 39+
• Datenvolumen einfach: 2-4 GB pro Tag, 0.7-1.4 TB pro Jahr
• Datenvolumen Vollsortiment & Bondaten: ca. 100 TB – 500 TB pro Jahr
► Erste Big Data Predictive
Analytics-Standardlösung
► Präzise Absatzprognosen
für den Handel und die
Konsumgüterindustrie
► Zugang zu fortschrittlichem
Predictive Analytics für
Anwender in Fachbereichen
► Einfache Bedienbarkeit
durch intuitive Web-UI
► Software-as-a-Service
ermöglicht den Einsatz von
Forward Demand ohne
hohe Vorabinvestitionen in
Software oder Infrastruktur
www.blue-yonder.com/forwarddemand
In den Startlöchern:
www.datascienceacademy.de
Zukunft: intelligente Entscheidungen direkt am Sensor
(für Industrie 4.0, Internet der Dinge). Belle II-Pixeldetektor:
Entscheiden, bevor big data irgendeinen Computer erreicht.
Ziel: finde (klassifiziere) alle relevante
Pixelinformation
Big Data Challenge: prozessiere ca. 10G bit pro s
Lösung: NeuroBayes-Expert in Hardware
Seit
e
NeuroBayes @ hardware*:
200 million Entscheidungen pro
Sekunde
à 5ns füreine Entscheidung
*features dedicated hardware board:
BELLE 2 Experiment :
nutzt 40 Boards:
à8 Milliarden Entscheidungen
pro Sekunde
»  NeuroBayes on FPGA
»  Field Programmable Gate Array:
(XILINX Virtex6 VLX75T)
»  Clock frequency: 250 MHz
1 decision per clock cycle
»  Approx.
(fully pipelined architecture)
»  Probability decision output possible
Seit
e
Questions & Answers
à Informieren Sie sich am blue yonder- Stand !
Document
Kategorie
Internet
Seitenansichten
14
Dateigröße
12 712 KB
Tags
1/--Seiten
melden