La science économique au service de la société

Existe-t-il des stratégies optimales lors de prises de décisions séquentielles de joueurs quand les paiements sont discontinus ?

Lien court permanent vers cette page : https://bit.ly/2xqvEho

Philippe Bich, Waël Saker

JPEG - 72 ko

La théorie des jeux vise à modéliser le plus fidèlement possible la façon dont les individus prennent des décisions dans un contexte où les choix des acteurs sont interdépendants. Cette théorie s’applique à de nombreux domaines comme le commerce ou la politique. Les séquences de choix sont ainsi modélisées jusqu’à l’issue finale, comme par exemple l’obtention d’un gain financier, d’une victoire politique ou militaire. Le paiement de chaque joueur est une mesure (par exemple exprimée en euros) qui représente les préférences des individus relatives aux issues finales.

Souvent, le nombre d’actions que peuvent choisir les intervenants n’est pas limité par exemple lors d’un un choix de localisation, ou un choix de stratégie politique. Dans un tel cadre, plusieurs chercheurs (1) ont montré en 1990 qu’il existait une stratégie optimale pour chaque joueur, appelée « équilibre en sous-jeux parfait », où chacun anticipe les stratégies des autres joueurs lui succédant. Un exemple connu a été étudié par Stackelberg (2), celui de deux entreprises en concurrence sur le marché d’un même bien : la première anticipe la réaction optimale de la seconde quand elle doit décider de la quantité ou du prix du bien à fixer sur le marché. L’existence d’un équilibre en sous-jeux parfait signifie que ces deux entreprises peuvent trouver des stratégies optimales.

Pourtant, l’existence de cet équilibre repose sur une hypothèse contraignante et souvent fausse en pratique : la continuité des paiements en fonction des actions choisies. Cela doit être compris ainsi : si chaque séquence d’actions, par exemple la séquence de définition des prix successifs d’un smartphone dans le temps, génère des profits pour les entreprises, ces profits sont-ils relativement stables quand les actions sont légèrement perturbées ?

Dans cet article, Philippe Bich et Waël Saker commencent par démontrer que cette hypothèse de continuité est souvent fausse, il est possible de considérer l’exemple suivant : si une entreprise B commercialise un smartphone à un prix légèrement inférieur au prix fixé par l’entreprise A, elle attirera potentiellement de nombreux consommateurs, alors qu’une très légère augmentation de son prix peut lui faire perdre une grande partie du marché (phénomène de seuil).

Philippe Bich et Waël Saker étendent ce résultat et montrent que malgré l’absence de continuité, un équilibre en sous-jeux parfait existe pour une classe générale de jeux séquentiels. La généralité des modèles considérés ne permet aucun calcul explicite, et l’idée de la preuve est d’utiliser un outil mathématique appelé suite généralisée : on montre par une méthode classique d’induction arrière que pour toute approximation finie des espaces de stratégies, il existe un équilibre en sous-jeux parfait dans le jeu, où les joueurs sont contraints de choisir leur stratégies dans ces ensembles finis. Ceci permet d’obtenir une suite généralisée d’équilibres approximés (généralisée car cette suite n’est pas indexée par des entiers, mais par l’ensemble des stratégies approximantes). On montre alors qu’en considérant une limite de cette suite (ce qui revient à prendre des approximations qui se rapprochent progressivement des ensembles de stratégies initiaux) on peut obtenir des stratégies optimales du jeu initial. Un cas particulier des classes de jeux séquentiels que nous considérons est celle des « jeux d’arrêts », où chaque joueur peut décider à chaque période de quitter le jeu, ce qui est par exemple le cas lors de négociations séquentielles.

(1) « Subgame perfect equilibrium in continuous games of perfect information : an elementary approach to existence and approximation by discrete games », par Hellwig, Leininger, Reny et Robson (Journal of Economic Theory 52). Les auteurs ont montré en particulier que l’approche classique, consistant à considérer en chaque nœud de la dernière période une stratégie optimale et à « remonter » le temps (méthode d’induction arrière) en prenant à chaque fois les stratégies optimales à la période précédente, ne fonctionnait pas quand l’espace des stratégies était infini.

(2) H. von Stackelberg, Market Structure and Equilibrium

Titre original de l’article : On the existence of subgame perfect equilibria in dynamic games with discontinuous payoffs.
Publié dans : working paper.
Téléchargement : https://bichgame.files.wordpress.com/2019/07/article-bich-saker-reny-extensif-18-mars-2019.pdf