Vorlesung und Übungen: Donnerstags 16-18 Uhr in der Physik, Raum 217.
In dieser Lehrveranstaltung sollen Lernverfahren der Neuroinformatik
auf Probleme der Spieltheorie angewendet werden.
Methodisch werden Programmierprojekte im Vordergrund stehen, die von
Kleingruppen selbstständig bearbeitet werden sollen. In diesen
Projekten sollen Programme entwickelt werden, die konkrete Spiele mit
Methoden der Neuroinformatik lernen können.
Der Vorlesungsteil wird sich eng an den aktuellen Bedürfnissen
orientieren, die sich aus den Projekten ergeben.
Vorausgesetzt werden grundlegende Programmier- und
Mathematikkenntnisse. Die Veranstaltung richtet sich an Studenten der
Physik, Informatik, Mathematik, Biophysik, und Biologie.
Literatur
Spieltheorie
-
Bewersdorff,
Jörg (1998). Glück,
Logik und Bluff: Mathematik im Spiel - Methoden, Ergebnisse und
Grenzen, Vieweg Verlag, Braunschweig, Wiesbaden, ISBN
3-528-06997-X, 49,80DM.
-
Rieck, Christian (1993). Spieltheorie: Einführung für
Wirtschafts- und Sozialwissenschaftler. Gabler Verlag,
Wiesbaden, ISBN 3-409-16801-X.
Neuronale Netze
-
Bishop, C. M. (1995). Neural Networks for Pattern
Recognition. Oxford University Press. (steht in der
Zweigbilbiothek Physik)
-
Hertz, J., Krogh, A., and Palmer, R. G. (1991). Introduction to
the Theory of Neural Computation. Addison-Wesley, Redwood
City, CA. (steht in der Zweigbilbiothek Physik)
-
Rojas, Raul (1996). Theorie der neuronalen Netze: Eine
systematische Einführung. Springer Verlag, Berlin. 4.,
korregierter Nachdruck. (steht in der Zweigbilbiothek Physik)
-
Rojas, Raul (1996). Neural Networks - A Systematic
Introduction. Springer-Verlag, Berlin, New-York, (Kapitel 7
über Fehlerrückführung/Backpropagation:
http://www.inf.fu-berlin.de/~rojas/neural/chap7.ps (dead link)).
Verstärkungslernen
-
Harmon, Mance E. and Harmon, Stephanie S. (1996). Reinforcement
Learning: A Tutorial. Manuskript,
http://www-anw.cs.umass.edu./~mharmon/rltutorial/docs/RLTutorial.ps
(dead link) oder
http://www-anw.cs.umass.edu/~mharmon/rltutorial/noframes.html (dead
link).
-
Kaelbling, L. P., Littman, M. L., and Moore, A. W. (1996).
Reinforcement Learning: A Survey. Journal of Artificial
Intelligence Research, 4:237-285, http://www.cs.washington.edu/research/jair/abstracts/kaelbling96a.html.
-
Schraudolph, N. N., Dayan, P., and Sejnowski, T. J. (2000).
Learning to Evaluate Go Positions via Temporal Difference
Methods. Technical report IDSIA-05-00, ftp://ftp.idsia.ch/pub/techrep/IDSIA-05-00.ps.gz.
(ein Beispiel wie Verstärkungslernen auf ein komplexes Spiel
angewendet werden kann)
-
ten Hagen, S. H. G. and Kröse, B. J. A. (1997). A Short
Introduction to Reinforcement Learning. Proc. of the 7th
Belgian-Dutch Conf. on Machine Learning; Daelemans, W. and Flach,
P., and van den Bosch, A. (eds.); pp. 7-12, ftp://ftp.wins.uva.nl/pub/computer-systems/aut-sys/reports/HagKro97b.ps.gz.
updated August 18, 2006
Laurenz Wiskott, http://www.neuroinformatik.ruhr-uni-bochum.de/PEOPLE/wiskott/