SS 2000

Spielen lernen
(zwischen Spieltheorie und Neuroinformatik)

Dr. Laurenz Wiskott, Prof. Dr. Andreas V. M. Herz und Prof. Dr. Peter Hammerstein

Vorlesung und Übungen: Donnerstags 16-18 Uhr in der Physik, Raum 217.

In dieser Lehrveranstaltung sollen Lernverfahren der Neuroinformatik auf Probleme der Spieltheorie angewendet werden.

Methodisch werden Programmierprojekte im Vordergrund stehen, die von Kleingruppen selbstständig bearbeitet werden sollen. In diesen Projekten sollen Programme entwickelt werden, die konkrete Spiele mit Methoden der Neuroinformatik lernen können.

Der Vorlesungsteil wird sich eng an den aktuellen Bedürfnissen orientieren, die sich aus den Projekten ergeben.

Vorausgesetzt werden grundlegende Programmier- und Mathematikkenntnisse. Die Veranstaltung richtet sich an Studenten der Physik, Informatik, Mathematik, Biophysik, und Biologie.

Literatur

Spieltheorie

Bewersdorff, Jörg (1998). Glück, Logik und Bluff: Mathematik im Spiel - Methoden, Ergebnisse und Grenzen, Vieweg Verlag, Braunschweig, Wiesbaden, ISBN 3-528-06997-X, 49,80DM.
Rieck, Christian (1993). Spieltheorie: Einführung für Wirtschafts- und Sozialwissenschaftler. Gabler Verlag, Wiesbaden, ISBN 3-409-16801-X.

Neuronale Netze

Bishop, C. M. (1995). Neural Networks for Pattern Recognition. Oxford University Press. (steht in der Zweigbilbiothek Physik)
Hertz, J., Krogh, A., and Palmer, R. G. (1991). Introduction to the Theory of Neural Computation. Addison-Wesley, Redwood City, CA. (steht in der Zweigbilbiothek Physik)
Rojas, Raul (1996). Theorie der neuronalen Netze: Eine systematische Einführung. Springer Verlag, Berlin. 4., korregierter Nachdruck. (steht in der Zweigbilbiothek Physik)
Rojas, Raul (1996). Neural Networks - A Systematic Introduction. Springer-Verlag, Berlin, New-York, (Kapitel 7 über Fehlerrückführung/Backpropagation: http://www.inf.fu-berlin.de/~rojas/neural/chap7.ps (dead link)).

Verstärkungslernen

Harmon, Mance E. and Harmon, Stephanie S. (1996). Reinforcement Learning: A Tutorial. Manuskript, http://www-anw.cs.umass.edu./~mharmon/rltutorial/docs/RLTutorial.ps (dead link) oder http://www-anw.cs.umass.edu/~mharmon/rltutorial/noframes.html (dead link).
Kaelbling, L. P., Littman, M. L., and Moore, A. W. (1996). Reinforcement Learning: A Survey. Journal of Artificial Intelligence Research, 4:237-285, http://www.cs.washington.edu/research/jair/abstracts/kaelbling96a.html.
Schraudolph, N. N., Dayan, P., and Sejnowski, T. J. (2000). Learning to Evaluate Go Positions via Temporal Difference Methods. Technical report IDSIA-05-00, ftp://ftp.idsia.ch/pub/techrep/IDSIA-05-00.ps.gz. (ein Beispiel wie Verstärkungslernen auf ein komplexes Spiel angewendet werden kann)
ten Hagen, S. H. G. and Kröse, B. J. A. (1997). A Short Introduction to Reinforcement Learning. Proc. of the 7th Belgian-Dutch Conf. on Machine Learning; Daelemans, W. and Flach, P., and van den Bosch, A. (eds.); pp. 7-12, ftp://ftp.wins.uva.nl/pub/computer-systems/aut-sys/reports/HagKro97b.ps.gz.

updated August 18, 2006
Laurenz Wiskott, http://www.neuroinformatik.ruhr-uni-bochum.de/PEOPLE/wiskott/

Spielen lernen (zwischen Spieltheorie und Neuroinformatik)

Literatur

Spielen lernen
(zwischen Spieltheorie und Neuroinformatik)