close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Gedicht für Legida am 23.3.2015

EinbettenHerunterladen
intergator - Intelligente Suche in
archivierten und anderen Daten
Agenda:
• Motivation
• Besonderheiten von
Archiven aus
Suchmaschinensicht
• Typische Szenarien
• Produktvorstellung
Live!
Oktober 2014
Ihr Referent: Marcel Hofmann | Senior Consultant
© Kristian Hermsdorf
intergator :
Produkt (seit 2003)
ENTERPRISE
SEARCH
Weltweit agierende Kunden
intergator :
ENTERPRISE
SEARCH
intergator :
ENTERPRISE
SEARCH
Motivation für Enterprise Search
5
interface projects GmbH © 2014
intergator :
ENTERPRISE
SEARCH
ECM
Big Data
Cloud
BI/DWH
Intranet
Informationsmanagement
NoSQL
E-Discovery
6
interface projects GmbH © 2014
Problem: zu viele Daten und Systeme
violator3@flickr
intergator :
ENTERPRISE
SEARCH
intergator :
ENTERPRISE
SEARCH
Web-Sites
CRM
1. abc
2. def
Dateiserver
3. qrt
ECM
4. xyz
Zentraler Zugriff
Archive
ERP
Microsoft
Sharepoint
8
interface projects GmbH © 2014
Volltextsuche ist nicht ausreichend
intergator :
ENTERPRISE
SEARCH
http://pixdaus.com/single.php?id=100774
intergator :
Suche
Navigation
Dashboard
ENTERPRISE
SEARCH
Search-Based
Application
Systemübergreifender Index
10
interface projects GmbH © 2014
intergator :
ENTERPRISE
SEARCH
Besonderheiten von Archiven
aus Enterprise Search-Sicht
11
interface projects GmbH © 2014
intergator :
Exkurs Indexierungsarten
Vollindexierung
Nachindexierung
Nachindexierung
ENTERPRISE
SEARCH
Nachindexierung
Suche
Zeit
Indexieren erfordert Lesen der Quelldaten,
Suchen benötigt KEIN Lesen
12
interface projects GmbH © 2014
Anforderungen an die Suchmaschine
intergator :
ENTERPRISE
SEARCH
- Versehentliche Einlagerung von Offline-Daten MUSS
verhindert werden
- Indexierung von (und damit Zugriff auf) archivierten
Daten MUSS verhindert werden
- Offline Daten MÜSSEN durchsuchbar bleiben
- Indexierung SOLLTE erfolgen, solange Daten Online
sind
- ...
13
interface projects GmbH © 2014
intergator :
ENTERPRISE
SEARCH
Eine Enterprise Search muss Lifecycle
(Online/Offline/Archiv) von Daten kennen.
State Model von Dateien in einem Strongbox-Share aus Sicht
von inter:gator
Indexierung
Nachindexierung (Großteil)
Read Only (Disk Cache)
Read/Write
Copy
Delay Action Time (1h – 90d, Filter))
nach Anlauf der Delay Action Time
können Files inkl. File Eigentümer und ACLs
nicht mehr verändert werden
Indexierung
Offline (LTFS Tape)
File Retention (0h – 360d, Filter)
Pre-Fetch per API
Read Only (File Cache)
0 bis 4 TB
Indexierung (File Open),
Nachindexierung nur in seltenen Fällen (durch Queuing oder
Änderungen zwischen Crawlperioden)*
FIFO out
Das können nur wenige Suchmaschinen!
intergator :
ENTERPRISE
SEARCH
Häufige Szenarien
15
interface projects GmbH © 2014
1. Szenario: Neue Datei-Archive
intergator :
ENTERPRISE
SEARCH
Vollindexierung: Dateien werden einmalig indexiert,
BEVOR diese archiviert werden.
Sicherung: Indexteil muss gesichert werden, sobald
Dateien archiviert werden.
Nachindexierung: nicht notwendig
(da es keine Änderungen gibt)
16
interface projects GmbH © 2014
2. Szenario: Hierarchisches Filesystem
intergator :
ENTERPRISE
SEARCH
Vollindexierung: Schon bestehende Offline-Dateien
werden sukzessive eingelagert und indexiert, dies
sollte eingeplant werden.
Sicherung: Indexteil sollte, muss aber nicht gesichert
werden.
Nachindexierung: Änderungen sollten indexiert
werden, solange Dateien online sind, transparent im
Betrieb.
17
interface projects GmbH © 2014
intergator :
ENTERPRISE
SEARCH
Live Demo!
intergator Enterprise Search
18
interface projects GmbH © 2014
intergator :
ENTERPRISE
SEARCH
Produktphilosophie &
Alleinstellungsmerkmale
19
interface projects GmbH © 2014
Standard-Suchoberfläche
intergator :
ENTERPRISE
SEARCH
 Flexibel anpassbar (CI, Facetten, Treffertyp-anhängige Templates, …)
 Mobile-Search
 Integration in andere Applikationen
20
interface projects GmbH © 2014
Navigator
intergator :
ENTERPRISE
SEARCH
 Personalisierte Suchperspektive
 Einfache Navigation durch tief hierarchische Datenbestände
 Einheitliche Sicht über die Datenbestände
21
interface projects GmbH © 2014
Dashboard
intergator :
ENTERPRISE
SEARCH
 Persönliche Pinnwand
 Aktuelle Nachrichten
 Lesezeichen
 Gespeicherte Suchen
 Eigene Dokumente
22
interface projects GmbH © 2014
Documentation Reader
23

Recherche in umfangreichen Dokumentationen




Einzelne Seiten als Suchtreffer statt ganzer Dateien
Suchtreffer ohne native Anwendung bewertbar
Automatische Verlinkung zwischen Dokumenten
Kein ActiveX, Flash oder Java
intergator :
ENTERPRISE
SEARCH
interface projects GmbH © 2014
intergator :
OCR
ENTERPRISE
SEARCH
OCR
• Posteingang
• Scanner
• E-Mail
• File-Server
• etc.
• Text- und
Metadatenextraktion
• Texterkennung
• Sonderregelungsausführung
Input
• Volltextindizierung
• PDF-Vorschau
• etc.
Output
• Keine Extra-Lizenz für OCR-Software notwendig
• Einfache Konfiguration
Mehr Intelligenz
Simple & Smart
• automatische Gewinnung von Metadaten
• umfassender Überblick über die OCR-Dateien
• Zeit/-Aufgabenplanung
25
interface projects GmbH © 2014
intergator :
ENTERPRISE
SEARCH
Ausgewählte Funktionen
28
interface projects GmbH © 2014
Facetten: Filtern & Klassifizieren
29
intergator :
ENTERPRISE
SEARCH
interface projects GmbH © 2014
Tagging
intergator :
ENTERPRISE
SEARCH
Treffer als abgearbeitet markieren
30
interface projects GmbH © 2014
Transliteration & Synonyme
32
intergator :
ENTERPRISE
SEARCH
interface projects GmbH © 2014
intergator :
Dubletten-Erkennung
Semantische Dubletten-Erkennung
Dubletten-Report
•
•
•
•
•
33
intergator kann Dubletten anhand beliebig
komplexer Suchanfragen auf beliebige Inhalte
erkennen
Abbildung semantischer Kriterien, wie z.B. die
Gleichheit von Kontakten trotz unterschiedlicher Kontaktdaten
Dubletten können in Suche und Dashboard
ausgeblendet werden
Rollenabhängige Steuerung: Anzeige des
persönlich
relevantesten
oder
verbindlichsten Kontakt einer zentralen
Datenquelle
•
ENTERPRISE
SEARCH
Ein Widget im intergator Reports Center
listet alle Dubletten sortiert nach Duplizität
oder verbrauchtem Speicher auf.
Der Report kann per CSV oder PDF
exportiert werden.
interface projects GmbH © 2014
Foto: Kristian Hermsdorf
Vielen Dank!
interface projects GmbH ©
34
Foto: Kristian Hermsdorf
Document
Kategorie
Technik
Seitenansichten
10
Dateigröße
4 499 KB
Tags
1/--Seiten
melden