Établissement
Lycée Notre Dame du Grandchamp (Versailles)
Année
2023-2024
Résumé
Dans un jeu vidéo, plusieurs tâches sont possibles (par exemple, tâche 1=aller battre tel monstre; tâche 2=aller chercher tel objet, etc.). À chaque fois qu’on réalise une tâche, on a une certaine probabilité de recevoir une récompense. Cette probabilité est propre à chaque tâche (par exemple, à chaque fois qu’on réalise la tâche 1, on a une probabilité p_1 d’avoir une récompense, qui sera toujours la même si on recommence la tâche 1, mais qui est différente de la probabilité de récompense de la tâche 2), et le joueur ne la connaît pas. Le fait de recevoir une récompense est indépendant d’une tâche à l’autre (au moment où l’on termine la tâche 1, tout se passe comme si le jeu lançait en l’air une pièce non-équilibrée qui aurait une probabilité p_1 de faire pile, et si elle fait pile il donne une récompense). Quelle stratégie le joueur peut-il adopter pour maximiser son gain sur le long terme ?
Mots clés
Ateliers qui présentent ce sujet
- Se connecter pour publier des commentaires