Autor der Publikation

Online Learning in Markov Decision Processes with Adversarially Chosen Transition Probability Distributions

, , , , und . NIPS, Seite 2508--2516. (Dezember 2013)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Learning Changing Concepts by Exploiting the Structure of Change, , und . Proceedings of the Ninth Annual Conference on Computational Learning Theory (COLT 1996), New York: ACM, (1996)Localization and physical properties experiments conducted by Spirit at Gusev crater, , , , , , , , , und 21 andere Autor(en). Science, 305 (5685): 821--824 (2004)POLITEX: Regret Bounds for Policy Iteration using Expert Prediction, , , , , und . ICML, Seite 3692--3702. (Mai 2019)Online Learning in Markov Decision Processes with Adversarially Chosen Transition Probability Distributions, , , , und . NIPS, Seite 2508--2516. (Dezember 2013)Direct Gradient-Based Reinforcement Learning, und . (1999)Colloidal fluids, crystals and glasses, , , , und . Physica A: Statistical and Theoretical Physics, 176 (1): 16--27 (01.08.1991)Wind-related processes detected by the Spirit rover at Gusev Crater, Mars, , , , , , , , , und 17 andere Autor(en). Science, 305 (5685): 810--+ (2004)Freezing of binary mixtures of hard-sphere colloids, und . Physica A: Statistical and Theoretical Physics, 194 (1-4): 415--423 (15.03.1993)Boosting the Margin: A New Explanation for the Effectiveness of Voting Methods., , , und . The Annals of Statistics, 26 (5): 1651--1686 (1998)Controlling solubility of polymeric anions in supramolecular assemblies with poly(aniline) for microsensors and actuators in human tissue, , , und . Sensors And Actuators B-Chemical, (2007)0925-4005.