close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Einfuehrung zum Proseminar Sprachverarbeitungsmethoden

EinbettenHerunterladen
1/26
2/26
Übersicht
1. Allgemeine Einführung in das Thema
Sprachanalyse
2. Fachbegriffe der Sprachanalyse
3. Sprachbausteine
4. Sprache und KI
5. Aktuelle Entwicklung der
Sprachverarbeitung
Einfuehrung zum Proseminar
Sprachverarbeitungsmethoden
Referent: Dayton Bishop
Datum: 20.04.04
3/26
4/26
1.2 Einführung – Umgang mit
Sprache
1.1 Was ist Sprache
• Vorbild: Mensch
• Wenig Kenntnis der menschlichen
Sprachverarbeitung
• Absenz abstrakter Lösungsansätze
• Intelligenz ÅÆSprache
• Was sagen Leute?(Aufbau der Sprache)
• Was spiegelt die Aussage wieder? (Sinn)
• Was ist die Funktion der Äußerung im
kommunikativen Zusammenhang?
– Turing,1950 Nachweis von Intelligenz
– SpeechÅÆ language
– Sprache als technische Systemlösung
2.1 IC Analyse (Immediate
Constraints)
•
•
•
•
Manning: IC = Part of speech Analysis
Satz = Konstitut
Satzbausteine = Konstituenten
Bedeutung der IC Analyse
– Beziehung der Morpheme untereinander
– Beziehung Morphem ÅÆ Satz
5/26
6/26
2.1.1Was ist ein Wort
• Wort: Durch Muttersprachler intuitiv erkennbare
Basiseinheit des Lexikons
• Wort setzt sich aus Zeichen zusammen
• Wort besteht aus:
– Morphem = Klasse von Morphen einer Bedeutung
• Schiff, Bar, Haus
– Morph = minimale Bedeutungstragende Einheit
• Denk, dach, t, e, haus
– Lexem = Wort aus dem Lexikon
• Ins Grass beißen
• Bank sind mehrere Lexeme da mehrdeutig
• Lexikon: Menge aller Lexeme einer Sprache
1
7/26
2.2 Wortarten
2.1.2 IC Analyse Beispiel
•
•
•
•
•
•
•
–
–
–
–
–
–
–
–
–
–
–
NP = Nominalphrase
VP = Verbalphrase
Pro = Pronomen
Art = Artikel
N = Nomen
V = Verb
Adj = Adjektiv
Substantiv
Verb
Adjektiv
Artikel
Partizip
Adverb
Präposition
Numerale
Pronomen
Konjunktion
Interjektion
: Haus, Garten
: lachen, laufen, lieben
: rot, schön, hoch
: der, die, das, ein, eine
: lachend, weinend
: hier, da, dort, heute, darum, deshalb
: in, auf, unter, über, zwischen, mitten
: eins, zwei, drei; erster, zweiter
: ich, du, er, sie, es; dein, mein
: und, oder
: Oh!
9/26
2.3 Flexion oder Beugung
10/26
3. Woraus setzt sich Sprache
zusammen?
• Haupt- und Eigenschaftswörtern Deklination
• Bestandteile der
Sprache:
– das Haus, des Hauses, dem Haus, das Haus; die Häuser,
der Häuser, den Häusern, die Häuser
• Verben Konjugation
–
–
–
–
– ich gehe, du gehst, er/sie geht, wir gehen, ihr geht, sie
gehen
– ich ging, du gingst, ...
• Adjektiven gibt es die Vergleichsform
(Steigerung, Komparation).
• veränderbare Wörter nennt man flektierbar (=
beugbar)
• Ein Wort besitzt eine syntaktische Kategorie
Syntax
Semantik
Morphologie
Pragmatik
• Syntax:
– Theorie der internen
Struktur der Sprache
• Semantik:
– Theorie der Bedeutung
sprachlicher Ausdrücke
• Morphologie:
– Theorie der
bedeutungstragenden
Elemente der Sprache
• Pragmatik:
– Theorie des Gebrauchs
sprachlicher Ausdrücke
11/26
3.1 Syntax
• Beispiele:
– Wohlgeformter Satz:
• Colourless green ideas sleep furiously
– Nicht wohlgeformter Satz:
• Green sleep ideas colourless furiously
8/26
12/26
3.2 Semantik
• Lexikalische Semantik
– Bedeutung der Lexeme
• Kompositionale Semantik
– Bedeutung der komplexen Ausdrücke
• Semantisches Paradigma
– Der Hund bellt
knurrt
winselt
spricht !?
2
13/26
14/26
3.2 Semantik
3.3 Morphologie
• Ontologie: Theorie welche Arten von von
Entitäten es gibt
• Semantik ÅÆ Ontologie
• LexikonÅÆ Enzyklopädie
• Morphologie unterscheidet Wörter aufgrund
ihrer Beugung
• Morphosyntaktisches Paradigma
– Der Hund bellt
bellte
hat gebellt
bellten !?
15/26
3.4 Pragmatik
3.5 Probleme der vier Teilgebiete
• Syntax
• kommunikative Funktion eines Wortes
• Der X100 hat eine max. Drehzahl von 5000
U/min
– Grammatik Regeln + Ausnahmen
• Semantik
– PolysemieÅÆ Homonymie
• Schule : Institution vs. Gebäude vs. Organisatorischer Ablauf
• Hahn : Wasserhahn als auch männliches Huhn
– Vorausgesetzes Wissen:
•
•
•
•
16/26
• Morphologie
X100 = Auto
Auto besitzt Motor
Motor besitzt Drehbewegung
Kenngröße für Motoren ist max. Drehzahl
– Grosse Anzahl von Morphen => Sehr aufwendig
• Pragmatik
– Metapher : wachsendes Interesse
– Synekdoche : Das Fahrrad aufpumpen
17/26
4. Sprache und KI
• Zunächst:
– Pragmatik – Mittelpunkt der Forschung
– Frage – Antwort – System
• Dann:
– Semantischer Ansatz
– Rechtschreibkorrektur
– Zum Teil mit syntaktischen Aspekten
• Heute: Unterteilung in drei verschiedene Gebiete
– 4.1 Ohne Referenz
– 4.2 Textinterne Referenz
– 4.3 Externe Referenz
18/26
4.1 Informationsreduktion/ selektion
• Sprachproduktion = informationserhaltend
• Hintergrundwissen vorausgesetzt
• Ansätze für die KI:
4.1.1 Induktive Erschließung ( Fehlerbehaftet)
Beispiel:
X100 = Auto
3
19/26
20/26
4.1.2 (partielle) Rekonstruktion
mit Referenzsystem
4.3 Externe Referenz
• Beispiel 1: Die Frau holt ihre
Familienphotos hervor.Sie trägt sie immer
bei sich
• Beispiel 2: Gestern entgleiste in Neustadt
ein Güterzug. Der Lockführer hatte ein
Signal missachtet
• Datenbank/ Bezug zu realen Welt
•
•
•
•
Wissensbasierte Übersetzung
Wissenserwerb aus textuellen Vorlagen
Beschreibungs- und Problemlöseverfahren
Sensorik – Begriffliche Abstraktion
– Probleme:
• dynamische Eigenschaften der Welt
• Deiktischer Konstruktionen
21/26
5. Aktuelle
Entwicklungsrichtungen
22/26
5.1 Hindernisse/ Anforderungen
5.1.1 Natürliche Sprachkommunikation
5.1.2 Erwerb sprachlichen Wissens
5.1.3 Situierte Kommunikation
5.1.4 Anwendung der Sprachtechnologie
• Syntaktisch vs. Semantische orientierte
Analyse
• Probabilistische vs. Klassische Ansätze
• Regelbasierte vs. Beispielbasierte Verfahren
• Akustischer vs. Visueller Eingabekanal
– Zwischenmenschliche Kommunikation
– Werkzeuge der Textproduktion
– Informationsmanagement
– Mensch - Maschine Kommunikation
23/26
5.1.1 Natürliche Sprachkommunikation
– Sprechen, Schreiben, Hören, Lesen
– Lineare Entfaltung in der zeitlichen Dimension
5.1.2 Erwerb sprachlichen Wissens
– Lexika (Brown corpus/balanced)
– Scanning mit stochastischen Modellen
5.1.3 Situierte Kommunikation
– Realisierung sprachverarbeitender Systeme und
deren Einbettung in komplexe
Nutzungsschnittsellen
24/26
5.1.4 Anwendung der
Sprachtechnologie
• Aufgrund der Kommunikationssituation:
– Zwischenmenschliche Kommunikation
• Umfangreiche Wissen- und Datenbestände
• Kein tiefergehendes Sprachverstehen
• Ziele:
– Übersetzer für die großen Sprachen
– Rapid deployment für die kleinen Sprachen
– Werkzeuge der Textproduktion
• Tippfehlersuche, Silbentrennung, Wörterbuchzugriff
• Ziel: formale Repräsentation für multilinguale
Texterstellung
4
25/26
26/26
5.1.4 Anwendung der
Sprachtechnologie
• Informationsmanagement
– Informationsklassifikation und –filterung
– Informationsstrukturierung
– Informationserschließung und -extraktion
• Mensch - Maschine Kommunikation
– Sprachtechnologie: Einsatz vor allem bei sprachlichen
Anfrage
– Tastatur hat sich als Konkurrenz durchgesetzt
Zusammenfassung
• Syntax:
– Theorie der internen
Struktur der Sprache
• Semantik:
– Theorie der Bedeutung
sprachlicher Ausdrücke
• Morphologie:
– Theorie der
bedeutungstragenden
Elemente der Sprache
• Pragmatik:
– Theorie des Gebrauchs
sprachlicher Ausdrücke
• Sprachwissenschaften sind
noch am Anfang
• Viele Tätigkeitsgebiete sind
noch nicht mal erschlossen
• Fast in jedem Gebiet der
Informatik einsetzbar
Beispiel:
• Forschung and der TUM
www.mmk.ei.tum.de/
5
Document
Kategorie
Bildung
Seitenansichten
1
Dateigröße
81 KB
Tags
1/--Seiten
melden