technische universität dortmund fakultät für informatik, ls 8 ls 8 künstliche intelligenz prof....
TRANSCRIPT
technische universität dortmund
Fakultät für Informatik, LS 8www-ai.cs.uni-dortmund.de
LS 8 Künstliche IntelligenzProf. Dr. Katharina MorikChristian Bockermann, Felix Jungermann, Ingo Mierswa
2Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Hauptstudium
Eigentlich ist die Universität immer die Gemeinschaft der Lehrenden und Lernenden. Spätestens aber im Hauptstudium wird gemeinsam geforscht!
Wissen
3Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Künstliche Intelligenz
Natürlichsprachliche Systeme:Beratungssysteme
TextverstehenMasch. Übersetzung
Maschinelles Lernen:Begriffserwerb
Wissensentdeckung
Wissensrepräsentation:Planungssysteme
wissensbasierte ProblemlösungAutomatisches Beweisen
Bildverarbeitung:Bild- und Szenenverstehen
grafische SystemeMustererkennung
Linguistik
Statistik
Logik
Psychologie
Mustererkennung
Lernbarkeit
evolutionäre Strategien
LS6
LS7
LS12
LS8LS2
LS11
4Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Schwerpunkt am LS8
Textsammlungen -- WWW Informationsextraktion -- Automatische Auszeichnung von Textteilen durch
Maschinelles Lernen Folksonomies in Web 2.0 -- Ausnutzen der tags (Auszeichnungen), die Benutzer
angegeben haben
Mediensammlungen Strukturierung nach verschiedenen Aspekten Recommender Systems -- Empfehlung gemäß Ort, Stimmung, Benutzer Merkmalsextraktion aus Audio- und Videodaten
Wissensentdeckung und Ubiquitous Computing Datenströme z.B. aus Sensornetzwerken Verteilte Daten
Sicherheit von Web-Anwendungen durch Maschinelles Lernen
5Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
LS8-Stil
Systeme entwickeln, die weltweit eingesetzt werden MOBAL SVM_light -- erste effiziente SVM-Implementierung (jetzt in libSVM) Yale (jetzt: RapidMiner) ist das weltweit favorisierte Open Source Tool für Data Mining
Internationale Ausrichtung Europäische Zusammenarbeit Qualitätsprüfung durch Konferenzen (ca. 20% Annahme) und Zeitschriften
6Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Lebenszyklus der Forschung
Stützvektormethode zur Textklassifikation: Formales Modell TCat Schranke des erwarteten
FehlersThorsten Joachims 2002
Induktive logische Programmierung: Obere und untere
Lernbarkeitsschranke gemäß LE, LB, LH
Schnellster Beweiser für eingeschränkte Hornlogik
Jörg-Uwe Kietz 1996
Lernen von Merkmalsextraktionen aus Musikdaten (Mierswa 2002) Organisation von Musiksammlungen (Wurst 2005) Automatische Erkennung von
Eigennamen (Rössler 2006) Informationsextraktion aus Texten
PG520, (Jungermann 2008) Verteiltes Data Mining
7Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Musikdaten
Klassifikation von Musikstücken nach Benutzerpräferenzen Automatische Merkmalsextraktion
Clustering von Musiksammlungen nach verschiedenen Gesichtspunkten Verteiltes kollaboratives Strukturieren in P2P-NetzenJetzt das selbe für Videos?
8Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Lehre am LS 8 Vorlesung "Wissensentdeckung und maschinelles Lernen (Data Mining)“ mit Fachbereich
Statistik 4V+2Ü jedes Sommersemester
Vorlesung „Maschinelles Lernen“ rein Informatik 2V + 2Ü WS 2008/9Implementieren der „Herzstücke“ der wichtigsten Algorithmen
PGs: KDD Cup (endete SoSe 2004) Kollaboratives Strukturieren von Multimediadaten in peer2peer-Netzen (endete
SoSe2005) Intelligence Service – Informationsextraktion aus dem Web (endet SoSe2008)
9Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Abgeschlossene Diplomarbeiten...
Christian Bockermann (2007) Anomalie-Erkennung in Web-Anwendungen. Andreas Kaspari (2007) Maschinelle Lernverfahren für kollaboratives Tagging. Stephan Deutsch (2006). Outlier Detection in Usenet Newsgruppen. Benjamin Helbig (2005). Eine Umgebung zur Informationsextraktion aus Geschäftsbriefen. Mierswa, Ingo (2004). Automatisierte Merkmalsextraktion aus Audiodaten. Hüppe, Christian (2003). Benutzergeführtes Lernen von Dokumentstrukturauszeichnungen aus
Formatierungsmerkmalen. Michaelis, Stefan (2000). Techniken des Data Mining zur Analyse von
Telekommunikationsnetzwerken
10Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Erwartungen an Diplomandinnen
Von der Anwendung zur Methode zur Theorie und wieder zurück! Fragestellungen aus der Anwendung in solche des Fachs übertragen Algorithmen entwickeln Vorhandene Systeme erweitern Sorgfältige Evaluation Teilnahme am Oberseminar Maschinelles Lernen und Data Mining Und...
11Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Lesen!
Bücher: Hand, Mannila, Smyth (2001)
„Principles of Data Mining“ Han, Kamber (2006)
„Data Mining -- Concepts and Techniques“
Schölkopf, Smola (2002)„Learning with Kernels“
Zeitschriften: JMLR (im WWW) MLJ (Springer) Knowledge and Information Systems
(Springer) Data Mining and Knowledge Discovery
(Springer)
Proceedings: ICDM KDD ICML ECML/PKDD
12Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Offene Diplomarbeiten -- Beispiele
Verteiltes Klassifizieren mit der SVM
Simulationsumgebung für verteiltes Data Mining Folksonomy für tagging und Empfehlung von Filmen über Mobiltelefone
Merkmalsextraktion aus Datenströmen Sensordaten in Walzwerken CERN-Experimente
Lernen von taggings zur Informationsextraktion mit SVMstruct
Relationen und Ereignisse aus den Bundestagsprotokollen extrahieren Analyse von MicroArray Daten Lernen von Automaten für Sicherheitsprüfung bei Web-Anwendungen
13Katharina Morik | Lehrgebiet LS8
technische universität dortmund
Fakultät für InformatikLS 8
Camps Süd, GB IV, Erdgeschoss links