Autisme-Economie.org
Chercher
forum Chercher

Le talon d’achille de la théorie des jeux

Tout le monde ferait de nos jours de la théorie des jeux : du journaliste qui parle de " jeu à somme nulle ", au sociologue ou à l’économiste qui évoquent pour un oui et pour un non le " dilemme des prisonniers " ou les " interactions stratégiques " - avec, à titre d’illustration, un vague tableau où sont consignés les gains des joueurs dans les divers cas possibles. Si la théorie des jeux se réduit à cela - une collection, illimitée, de petites histoires -, alors on se demande pourquoi tellement de traités pleins de mathématiques compliquées lui sont consacrés, ou disent utiliser ses " résultats ". En fait, toute théorie digne de ce nom suppose un certain degré de généralité. La théorie des jeux n’échappe pas à cette règle, bien au contraire, puisqu’elle a été d’abord proposée par des mathématiciens - pour certains, elle serait même une branche des mathématiques. D’où son prestige, les mathématiques permettant d’établir " rigoureusement " des résultats, ou des théorèmes, incontestables, du moins dans le cadre des hypothèses retenues. Toute évaluation de la théorie des jeux - de son intérêt, de sa portée - passe donc par celle de ses hypothèses. Or, il se trouve que la principale d’entre elles - les joueurs ne choisissent qu’une seule fois, et simultanément - enlève toute pertinence, autre qu’anecdotique, à cette théorie. Pour comprendre le rôle essentiel de cette hypothèse --- talon d’Achille de la théorie des jeux - il faut revenir à la définition de ce qu’est un " jeu ", selon cette théorie.

Qu’est-ce qu’un jeu ?

La théorie des jeux se propose, d’abord, de mettre sous forme mathématique des situations, appelées jeux, dans lesquelles des individus (les " joueurs ") à la recherche du gain maximum (hypothèse de rationalité) sont en interaction. Tout jeu, selon cette théorie, est donc constitué des trois éléments suivants :

1. Une liste de n joueurs, chacun étant caractérisé par un indice i, i = 1, ..., n.

2. Un ensemble S1, ..., Sn, où Si est l’ensemble des stratégies du joueur i (i = 1,..., n), dont il choisit un élément (en ayant pour but d’obtenir le gain le plus élevé possible), élément noté si.

3. Un ensemble de fonctions de gain f1(.), ... , fn (.), la fonction fi(.) donnant le gain f1(s1, ..., sn) du joueur i lorsque les choix des joueurs sont donnés par la liste - ou le vecteur - de stratégies (s1, ..., sn), avec s1Î S1, ..., snÎSn.

Il y a situation de " jeu " parce que le gain de chaque joueur dépend évidemment de la stratégie qu’il choisit mais aussi de celles qui sont choisies par les autres joueurs.
Une solution d’un jeu est une liste de stratégies (une par joueur) de la forme :
(s1*, ..., sn*),
où si* est l’une des stratégies de du joueur i (si*Î Si), i = 1, ..., n.
Le point essentiel - et évident ici - à propos de toute solution d’un jeu, quelle qu’elle soit, c’est qu’elle résulte d’un choix simultané d’une stratégie par chacun des joueurs - ceux-ci prenant leur (unique) décision en ignorant celles des autres.
Même dans le cas où chaque joueur connaît " tout " sur les autres (on dit alors qu’il y a information complète), il ne peut pas, en règle générale, prévoir avec certitude leurs choix. Ses croyances concernant leur comportement sont donc un élément essentiel pour caractériser toute solution du modèle. Or, les croyances des joueurs sont des paramètres hors modèle (elles ne font pas partie des points 1., 2. et 3. qui caractérisent tout jeu), qui " expliquent " autant la " solution " retenue que les éléments même du modèle.
On pourrait avancer, intuitivement, que les croyances se sont formées, ou se forment, progressivement, " en cours de jeu " - de sorte que, d’exogènes, elles deviennent endogènes. Mais ce serait oublier que tout modèle de jeu suppose un choix unique (et simultané) de la part des joueurs : par hypothèse, il ne peut y avoir de " cours du jeu ".

Un " équilibre " qui n’en est pas un

Après avoir mis sous forme mathématique son modèle, le théoricien des jeux cherche à en déterminer les " solutions " - c’est-à-dire, les listes de stratégies résultant du choix unique et simultané des joueurs - qui lui semblent intéressantes, pour une raison ou une autre. En fait, les cas où une solution s’impose d’elle-même, tellement elle semble " évidente ", sont extrêmement rares (parmi eux, il y a celui où il existe une liste de stratégies telle que tous les joueurs ont un gain supérieur à celui qu’ils obtiendraient avec n’importe quelle autre liste de stratégies). Le théoricien impose alors un certain nombre de conditions, ou de critères, qui permettent de faire le tri parmi les listes de stratégies possibles, pour n’en garder que quelques unes (si possible, une), qui seront les "solutions" de son modèle, selon ces critères (qui forment un "concept de solution").

Au début des années 1950, John Nash a proposé d’imposer comme condition aux listes de stratégies que l’on veut retenir en tant que solutions des modèles de jeu d’être autoréalisatrices : chacun fait son choix en prévoyant correctement celui des autres, provoquant ainsi le résultat attendu par ceux-ci (et par lui-même). Les issues ayant une telle propriété sont appelées, malheureusement, " équilibres " (de Nash). Malheureusement, parce que l’idée d’équilibre suggère celle d’un processus - dont l’équilibre serait l’aboutissement (résultat de " forces " qui se " compensent ") - alors que les modèles de jeu (caractérisés par les conditions 1., 2. et 3.) excluent par construction toute forme de processus, puisqu’ils supposent un choix unique (et simultané) de la part des joueurs. Mieux eut valu parler de " solution de Nash ", ou de " choix autoréalisateurs ".

Pourquoi les théoriciens des jeux privilégient-ils alors la solution de Nash ? D’une part, parce que s’il existe un choix qui " saute aux yeux " pour chaque joueur (celui des autres ne faisant pas de doute, du moins s’il suppose qu’ils sont rationnels), alors l’ensemble de ces choix est forcément une solution de Nash (la réciproque n’est évidemment pas vraie - en règle générale, la solution de Nash n’apparaît pas comme évidente - et c’est là qu’il y a problème). D’autre part, et surtout, parce que les solutions de Nash sont les points fixes d’une fonction obtenue à partir des paramètres du modèle, ce qui est une aubaine pour le mathématicien (qui va chercher à établir les " propriétés " de ces points - existence, unicité, sensibilité aux divers paramètres du modèle, etc.).
Souvent, le rôle décisif des croyances dans la caractérisation de la solution de Nash est occulté en présentant celle-ci comme un profil de stratégies où chacun maximise son gain " compte tenu du choix des autres " (on dit aussi de ces stratégies qu’elles sont de " meilleures réponses " à celles des autres). On a alors l’impression que chaque joueur prend sa décision en ayant connaissance de celles des autres - ce qui semble plus " réaliste ", mais est en fait absurde.

Pourquoi faudrait-il privilégier la solution de Nash ?

La très grande majorité des articles ou des ouvrages sur la théorie des jeux (non coopératifs) concentrent exclusivement leur attention, ou presque, sur les solutions de Nash - dont ils étudient les propriétés. Il n’y a pourtant aucune raison pour que chaque joueur prévoie correctement ce que feront les autres, comme le montre l’exemple classique de l’équilibre dit " de Cournot-Nash " du modèle du duopole de Cournot. Celui-ci peut être considéré comme un jeu, avec les deux entreprises (qui produisent un même bien) comme joueurs, les quantités offertes du bien comme stratégies, le profit des entreprises (qui connaissent la fonction de demande du bien) pour chaque couple d’offres comme fonction de gain. La démarche usuelle consiste alors à supposer que chaque entreprise pense que l’autre ne réagira pas lorsqu’elle modifie son offre (elle fait des " conjectures à la Cournot "), ce qui lui permet de calculer sa fonction de réaction. Après que les courbes représentant les deux fonctions de réaction aient été tracées dans un même système d’axes, l’attention est inévitablement attirée par les points où elles se coupent, points qui représentent les équilibres de Cournot-Nash. Mais pourquoi accorder une attention particulière a de tels points, qui correspondent au cas où chaque entreprise prévoit correctement l’offre de l’autre, alors que - contrairement au modélisateur qui " voit " les deux courbes de réaction, et donc leurs points d’intersection - chaque entreprise ne connaît que sa propre courbe de réaction ? Comme elle ne dispose d’aucun élément lui permettant de prévoir correctement l’offre de l’autre, elle ne peut que faire une offre " au hasard " et donc la seule prédiction qui résulte de ce modèle est : " le couple de stratégies résultant du choix des deux entreprises en duopole n’est pas un équilibre de Cournot-Nash " (ce n’est que par le plus grand des hasards que chaque entreprise anticiperait correctement l’offre de l’autre). Il n’y a donc aucune raison d’accorder une place particulière, dans l’analyse, aux équilibres de Cournot-Nash (aux points où se coupent les courbes de réaction). Pourtant, c’est ce que tout le monde fait ...

Solution de Nash et " dynamique "

L’importance accordée aux équilibres de Cournot-Nash est fréquemment justifiée en évoquant un processus, dans lequel les deux entreprises du duopole font des propositions et des contre propositions, jusqu’à ce que qu’elles " trouvent " l’équilibre. Mais, ce faisant, on change subrepticement de modèle : le choix unique et simultané de stratégies que suppose tout modèle de jeu est remplacé par une succession de choix, où chacun observe ce que l’autre a fait au coup précédent. Or, des individus rationnels prennent en compte l’information propre à ce processus (en observant ce que l’autre fait, à chaque fois) et modifient en conséquent leurs comportements - et donc leurs courbes de réaction. Conclusion : les équilibres - points d’intersection de ces courbes - " bougent " pendant le processus dont ils sont censés être le point d’aboutissement. Il n’est plus possible de les déterminer indépendamment de ce processus (ils " dépendent de la trajectoire suivie ").

Il existe, il est vrai, des modèles de jeu qui ont l’air d’être " dynamiques ", car ils supposent que les joueurs interviennent de façon successive : ce sont les jeux à plusieurs coups (ou jeux séquentiels), généralement représentés par un " arbre " dont les " noeuds " (points de départ des " branches ") correspondent aux " coups " successifs. Ces modèles vérifient toutefois les conditions 1., 2. et 3. qui caractérisent tout jeu. Seules les stratégies y prennent une forme particulière : ce sont des listes d’instructions qui précisent ce que les joueurs font, ou feraient, dans toutes les éventualités possibles (à chaque noeud de l’arbre du jeu où ils sont concernés). En définissant ainsi les stratégies, on se ramène au cas habituel, celui où il y a choix simultané d’une, et d’une seule, stratégie par joueur. Pas l’ombre de dynamique là-dedans : seules les règles du jeu changent. Il est vrai que les instructions données par les stratégies concernent les coups successifs - dont on peut imaginer qu’ils se déroulent dans le temps -, mais tout est décidé " au début ", dès que les stratégies sont annoncées (le " meneur de jeu " lit alors les instructions qui y sont consignées et en déduit le " chemin " sur l’arbre ainsi que le gain de chacun qui en résulte).

Comment chaque joueur choisit-il alors sa stratégie - sa liste d’instructions ? On retombe sur le même problème que plus haut : tout dépend de ce qu’il croit que les autres feront. La solution de Nash est alors, par définition, telle que chacun prévoit correctement les instructions données par les autres, pour toutes les éventualités possibles, dont aucune, sauf une, ne se réalisera - ce qui rend encore plus invraisemblable une telle " solution ", en tant que prédiction du modèle.

Menaces, représailles, coopération, réputation ...

Les traités et articles de théorie des jeux (ou sur elle) parlent souvent de " menaces ", de " coopération ", de " réputation ", de règles qui " émergeraient ", etc., laissant ainsi entendre que leurs modèles prennent en compte ces aspects importants de la vie en société - comblant ainsi une importante lacune de la théorie économique. Pourtant, il n’en est rien, pour toujours la même raison : dans tout modèle de jeu il y a choix unique et simultané. Comment pourrait-il y avoir alors des menaces, des représailles, de la coopération ou de l’établissement de réputations etc., puisque ces notions supposent des interactions répétées, une succession de décisions où menaces et représailles peuvent s’exercer, la coopération se mettre en place, les réputations se faire, etc. ? C’est absurde.

La confusion provient ici encore de la fausse idée selon laquelle les jeux à plusieurs coups relèveraient de la dynamique. Il est vrai que, par exemple, dans le dilemme des prisonniers répété, les stratégies des joueurs peuvent comporter des instructions de la forme : " si tel noeud de l’arbre est atteint, après que l’autre se soit abstenu de me dénoncer auparavant, alors ’je coopère avec lui’ en ne le dénonçant pas ; sinon, à titre de ’représailles’, je le dénonce systématiquement ". Mais " coopération " et " représailles ", n’ont lieu que dans la tête de celui qui établit, seul, dans son coin, sa liste d’instructions, en cherchant à anticiper celles des autres. Les joueurs ne pourront éventuellement que constater - avec joie ou dépit - le comportement des autres, au moment où le " meneur de jeu " lira les listes d’instructions. La situation est la même, en plus compliqué, que dans les jeux à un coup : si, par exemple, la " réputation " des joueurs intervient dans leurs décisions, c’est en tant qu’élément " hors modèle ", ad hoc.

Des subterfuges : " évolution " et " apprentissage "

Le fait d’envisager des jeux à plusieurs coups ne résout en rien - bien au contraire - la question essentielle que pose la solution de Nash : pourquoi faudrait-il lui accorder une place privilégiée ? Bien que la réponse soit claire - il n’y a aucune raison de le faire -, elle est difficile à accepter, tellement les théoriciens des jeux se focalisent sur cette solution. D’où la tendance de plus en plus fréquente consistant à introduire, d’une façon ou d’une autre, un processus dans les modèles de jeu - processus dont l’aboutissement pourrait être présenté comme " la " solution de ces modèles, et dans lesquels les notions de " menaces ", de " réputation ", etc. pourraient être évoquées à bon escient. Les modèles ainsi élargis ont l’avantage de paraître plus intuitifs, plus " réalistes ". Mais ils supposent en fait l’abandon, totalement ou en partie, de l’idée de base de la théorie des jeux : les individus font leur choix de façon rationnelle (c’est-à-dire, en cherchant à maximiser leurs gains, en tenant compte de toute l’information disponible). L’abandon de l’idée de rationalité est total dans ce que certains appellent l’ " approche évolutionniste " de la théorie des jeux, dans laquelle il n’y a même plus de choix à faire, joueurs et stratégies étant confondus ! Cela n’a d’ailleurs pas de sens de parler de " théorie des jeux " à propos de ces joutes répétées de robots - très à la mode - par ordinateurs interposés. Une autre façon de " dynamiser " les modèles de jeu consiste à supposer des individus en partie rationnels, dans le sens où ils cherchent à maximiser leurs gains à chaque étape du processus (donc, en choisissant parmi plusieurs options), mais sur la base de conjectures a priori concernant les choix des autres (conjectures qui peuvent être éventuellement modifiées en cours de processus : on parlera alors d’ " apprentissage "). Un exemple simple de ce genre de modèle est celui de Cournot auquel on ajoute un processus d’offres successives, dans lequel chaque entreprise a pour conjecture (immuable) que l’autre ne réagit pas lorsqu’elle fait varier son offre (et ce bien qu’elle constate le contraire à chaque étape du processus). Ce cocktail de maximisation et de conjectures a priori ouvre la voie à d’innombrables modèles (et publications), dans lesquelles on cherchera, par exemple, à établir les conditions assurant la convergence vers une solution de Nash du processus ainsi mis en oeuvre. Mais la multiplication de modèles ad hoc - avec des comportements très simplistes - n’est pas le signe d’un quelconque " richesse théorique ", mais celui d’un désarroi certain (aucun modèle ne s’imposant, et ne pouvant le faire).

Des " raffinements " de l’équilibre de Nash à l’équilibre bayésien

Les modèles de jeu - surtout s’ils sont à plusieurs coups - comportent souvent de nombreuses solutions de Nash. Les théoriciens tentent alors de lever cette indétermination en imposant des conditions plus fortes que celles de la solution (essentiellement, en cherchant parmi les croyances, s’il n’y en a pas de plus " vraisemblables ", ou de " raisonnables ", que d’autres), de façon à ne retenir que le plus petit nombre possible de solutions de Nash (une seule étant l’idéal pour eux). On dit qu’ils cherchent des " raffinements " de l’équilibre de Nash. Mais, ce faisant, ils n’évitent pas la question : pourquoi privilégier l’équilibre de Nash, ou tel ou tel de ses raffinements, en tant que prédiction du modèle, alors qu’il dépend des croyances a priori des joueurs ?

Au départ, les modèles de jeu supposaient qu’il y a information complète, les joueurs connaissant tout des autres (ensembles de stratégies et fonctions de gains). Cette hypothèse a été un peu relâchée dans les années 1960, où on a admis que des joueurs pouvaient ne connaître certaines des caractéristiques que de façon " probabiliste " (ils savent qu’elles peuvent être de tel ou tel type, chacun étant affecté d’une probabilité - soit " objective ", connue de tous, soit " subjective ", à l’appréciation de chacun). Mais, point fondamental, ces nouvelles hypothèses sont faites de façon à rester dans le cadre des conditions 1., 2. et 3. qui caractérisent tout modèle de jeu : les listes de joueurs et de fonctions de gain sont seulement " rallongées ", en y incluant les divers types possibles. Les calculs deviennent cependant très lourds : aux gains se substituent des espérances de gains, aux croyances sur ce que feront les autres viennent se rajouter les croyances sur leur nature ou sur les fonctions de gains (de quel type sont-ils ?) - ce qui oblige à faire intervenir des distributions de probabilité au niveau même du calcul des gains pouvant être procuré par chaque stratégie. Les probabilités envisagées étant conditionnelles aux types possibles, les équilibres de Nash de ces modèles sont dits, pour cela, bayesiens. Mais comme toute solution d’un jeu, ces " équilibres " résultent d’un choix unique et simultané des joueurs : pourquoi chacun prévoierait-il alors correctement le choix des autres ? Du fait de l’imbrication des divers niveaux de croyances qu’ils supposent, les équilibres bayesiens peuvent être, à la fois, nombreux et difficiles à déterminer. D’où des calculs longs et pénibles pour déterminer ces équilibres, calculs qui peuvent donner à penser qu’on est en présence d’une théorie donnant lieu à des prédictions fines et pertinentes, alors qu’il n’en est rien (on se demande d’ailleurs comment " de vrais joueurs ", avcc une bonne formation d’économiste (par exemple), pourraient se livrer à ces calculs).

Deux points essentiels à retenir

Face à toute présentation invoquant la théorie des jeux, et ses " solutions ", il faut donc toujours avoir en tête les deux points essentiels suivants.

1. Il n’y a aucune raison de privilégier les équilibres de Nash en tant que " solutions " d’un jeu. Par conséquent, chaque fois qu’on est en présence d’un modèle de jeu dont l’auteur veut trouver et caractériser les équilibres de Nash, il faut d’abord se demander : pourquoi accorder une telle importance à ces profils de stratégie particuliers ? Si la réponse à cette question n’est pas évidente, et si l’auteur ne la pose même pas - ce qui est généralement le cas -, alors il est inutile de poursuivre : quel que soit le " résultat " établi, le modèle est sans intérêt (du moins, pour celui qui ne prend pas un plaisir particulier à jongler avec des symboles mathématiques).

2. Pour justifier l’importance donnée à telle ou telle " solution ", les théoriciens des jeux font presque toujours appel soit à des éléments extérieurs à leurs modèles, croyances, normes, " niveau de sécurité ", etc. soit à des " processus " qui font appel à des règles a prioir qui mettent en cause (du moins partiellement) l’hypothèse de rationalité. Celle-ci est donc loin de rendre compte, à elle seule, des problèmes soulevés par les interactions des choix individuels, même dans le cadre très sommaire des modèles de jeu.

 
Autisme-Economie.org > Les Textes > Textes du mouvement > Textes critiques sur la théorie néoclassique
 
 
Autisme-Economie.org - Site réalisé avec SPIP par Siloh.