Choux romanesco, Vache qui rit et intégrales curvilignes

19 octobre 2014

En soulevant le couvercle

D8, fossoyeur assumé de jeux télévisé, vient de déterrer "à prendre ou à laisser", plutôt connu entre 2004 et 2010 sous le nom de "jeu des boîtes d'Arthur". Le jeu est aujourd'hui présenté par Julien Courbet, mais il garde ses principes de base : ouvertures de boîtes, musiques de suspens, téléphone à cadran et candidats recalés de télé réalité.

Le principe du jeu est plutôt simple mais diablement efficace. 24 boîtes, contenant des sommes connues de 0.01 € à 100 000 € (jusqu'à 1 000 000 € dans les précédentes éditions de l'émission), sont confiées à des candidats qui ne connaissent par leur contenu. L'un des candidat est tiré au sort et aura le privilège d'ouvrir une par une les 23 autres boîtes, jusqu'à ce qu'il ne reste plus que la sienne. Le candidat gagne alors le contenu de sa boîte.
Là où le jeu passe du bingo traditionnel à une application de théorie des jeux, c'est que de nombreuses fois durant l'émission, le "banquier" appelle et propose un choix : échanger sa boîte avec un autre candidat, ou bien, accepter de vendre sa boîte au banquier.

La question que se pose n'importe quel candidat est alors la suivante : à quel moment faut-il échanger sa boîte ? à quel moment est-il préférable d'accepter la proposition pécuniaire du banquier ?

Paradoxe de Monty Hall

monty_hall
Le paradoxe de Monty Hall, par xkcd

Le problème de à prendre ou à laisser, à cause de cette possibilité d'échanger sa boîte, fait terriblement penser au paradoxe de Monty Hall (ou, dans son nom plus franchouillard, paradoxe du Bigdil). Pourtant, cela n'a rien à voir !

L'énoncé du problème de Monty Hall est le suivant :
Vous participez à un jeu télé, et vous êtes enfin arrivé en finale. Devant vous, trois portes A, B et C. Deux d'entre elles cachent une chèvre, la troisième cache une voiture. Bien sûr, vous jouez pour remporter la voiture et non la chèvre. Vous devez choisir une porte, et vous gagnerez ce que cache cette porte. Le choix de la porte se fera selon la procédure suivante :
- vous choisissez la porte de votre choix ;
- le présentateur ouvrira une porte que vous n'avez pas choisi et qui cache une chèvre (il connaît le lot attribué à chaque porte);
- vous avez la possibilité de changer de porte, et vous gagnez le contenu de la porte finalement retenue.

La question est la suivante : est-il préférable de changer de porte, ou bien, est-ce que cela ne change en rien les probabilités ?

Un raisonnement erroné consiste à dire que, au stade où il ne reste que deux portes, il y a une chance sur deux d'avoir la bonne porte, et que changer de choix ne change rien. Ce raisonnement est pourtant faux : en changeant de porte, on fait passer la probabilité de gagner la voiture de 33% à 67% !

Pour comprendre pourquoi les probabilités changent, il faut comprendre ce qu'il se passe quand l'animateur retire une chèvre : dans le cas où l'on se trompe dans le choix initial, l'animateur n'a pas le choix dans la chèvre qu'il devra retirer, et laissera nécessairement la voiture. Changer de choix assure alors de remporter la voiture. Cette situation arrive donc dans deux tiers des cas.
Si on choisit la voiture lors de son choix initial, l'animateur pourra retirer n'importe quelle autre porte, qui cachera forcément une chèvre. En changeant de choix, on tombera donc sur l'autre chèvre. Mais cette situation n'arrive que dans un tiers des cas (si la voiture a été choisie dès le début).
Finalement, en changeant de choix après la révélation de la chèvre par l'animateur, on est assuré de gagner la voiture avec une probabilité de 2/3. En fait, le choix de l'animateur apporte une information nouvelle que l'on peut utiliser pour renverser les probabilités de gagner.

Screen Shot 10-15-14 at 11

On peut se convaincre du bienfondé du raisonnement en plaçant dans une situation où 100 portes sont présentes (99 chèvres, une voiture), et où l'animateur retire 98 chèvres lors de l'étape 2. La probabilité de tomber sur la voiture lors du choix initial est particulièrement faible (1/100), le changement de porte sera donc plus que conseillé.

Changer de boîte chez Courbet
Mais dans à prendre ou à laisser, la situation est complètement différente. Contrairement au paradoxe de Monty Hall, la phase d'élimination des boîtes est faite au hasard, et non par un animateur qui connaît le contenu des boîtes et cherche à ménager le suspens. L'ouverture des boîtes n'apporte donc aucune nouvelle information, et il est impossible de l'utiliser pour modifier les probabilités.

La probabilité de détenir la boîte à 100 000 € est donc de 1 / 24, et aucun changement de boîte ne peut modifier cette probabilité !

« Oui, mais pour le candidat d'hier, il ne lui restait au final que deux boîtes possibles, un contenant 100 000 € et une autre contenant une ventouse. Dans ce cas, il a bien une chance sur 2 de gagner le gros lot ! »
Effectivement ! Dans ce cas (que l'on échange ou non sa boîte), la probabilité de gagner les 100 000 € est bien de 1/2 (et donc, échanger sa boîte n'apporte pas un supplément de probabilité)
Mais "ce cas" (où la boîte à 100 000 € n'est pas éliminé pendant les 22 premiers tours) ne se présentera qu'avec une probabilité de une chance sur 12*, ce qui, puisque (1/2) x (1/12) = (1/24), nous ramène bien au fait que l'on a toujours que une chance sur 24 de remporter les 100 000 €.

Bref : la possibilité d'échanger sa boîte dans à prendre ou à laisser est un non-choix total !  Il est presque aussi pertinent que le choix des numéros que l'on coche dans une grille de loto (bien que, pour le loto, le partage des gains au rang 1 implique que certains numéros peuvent rapporter plus que d'autre).

Bon, pour être un peu honnête, la possibilité d'échanger sa boîte est là pour garantir l'équité du jeu. Étant donné que le banquier connaît la répartition des différentes somme entre les boîtes, il pourra systématiquement proposer des sommes inférieures au contenu de la boîte, rendant le jeu injuste. Une meilleure solution serait que le banquier ne connaisse pas le contenu des boîtes, comme dans les versions étrangères du jeu.

Une proposition que l'on ne peut pas refuser
Mais il reste un choix qui garde un sens : les propositions du banquier !

Après que l'on a éliminé six premières boîtes, le banquier appelle et offre la possibilité de racheter la boîte. D'autres propositions seront faite après 11 boîtes, 15, 18, 20, 21 et 22 boîtes éliminées.

La somme qu'il propose est systématiquement inférieure à la moyenne des sommes restantes en jeu (sauf lorsque ces montants sont dérisoires, le banquier a tendance à proposer un geste commercial), et plus le nombre de boîtes diminue, plus la somme proposée par le banquier se rapproche de la moyenne des boîtes restantes en jeu.

Une stratégie optimale consiste à jouer tant que le banquier ne propose pas de somme supérieure à 10 000 (ce qui correspond au gain moyen des 24 boîtes). Mais comme le banquier ne propose jamais des sommes supérieure au gain moyen, appliquer cette stratégie revient à refuser systématiquement les propositions, rendant forcément le jeu moins intéressant.
Pour être un peu précis, l'élimination initiale de 6 boîtes fait varier le gain moyen de 1250 € à 13500 €, mais la stratégie optimale n'a pas plus de chance de porter ses fruits.

La question est donc de savoir à quel moment il faut savoir vendre sa boîte, et c'est à ce moment que la théorie des probabilité laisse sa place aux théories économiques.
Grossièrement, les dilemmes de à prendre ou à laisser peuvent être résumées par « préférez vous gagner 40 000 € ou avoir une chance sur 2 de gagner 100 000 € ?». Dans le deuxième cas, l'espérance de gain est de 50 000 €, et c'est donc ce choix qu'il serait logique de prendre. Mais dans la pratique, une personne sensée choisira les 40 000 € garantis, puisque 60 000 € supplémentaires ne nous rendront pas plus heureux, il n'est pas raisonnable de risquer de les perdre. C'est donc cette notion de satisfaction qu'il faut prendre en compte ("l'utilité"), et non les valeurs absolues des sommes engagées. C'est finalement cette utilité que l'on cherche à maximiser quand on joue à un tel jeu. 
Évidemment, la risquophilie est bénéfique pour le suspens de l'émission, et est donc encouragée ! Il a d'ailleurs été montré que les mécaniques mises en oeuvre par l'émission diminuent l'aversion au risque des candidats. C'est d'ailleurs pour cette raison que l'émission s'est pour la première fois arrêtée en 2010 : avec la crise, les candidats étaient devenus moins tolérant au risque...

Finalement, la meilleure stratégie consiste à se fixer une somme idéale satisfaisante, et à ne rien risquer pour la dépasser. D8, si vous me lisez, sachez que je suis prêt à venir dans l'émission pour y appliquer cette stratégie désespérément pragmatique !

Il existe cependant une véritable stratégie permettant à tous les candidats de gagner avec une bonne probabilité une somme autour de 10 000 € : il suffit que chaque jour, le candidat désigné n'accepte à aucun moment les offres du banquier, et garde sa boîte jusqu'au bout. En suivant cette stratégie, chaque candidat gagnera donc en moyenne 10 000 €,  mais c'est après plusieurs semaines de jeu que la stratégie se met en place : il suffit que l'ensemble des candidats se partagent leur gains. Le risque associé à cette stratégie est bien plus faible, puisqu'il invoque la loi des grands nombres ! Le seul hic, c'est qu'il peut être compliqué de convaincre Crystal, la gogo-danseuse recalée des Ch'tis à Mykonos qui vient de gagner 50 000 € de partager ses gains avec Marie-Joe, prof de lettres à la retraite, qui a seulement gagné 0.42 €.

Bon, de toutes façons, il y Question pour un champion à la même heure sur France 3. A choisir, je préfère regarder ma maman qui y participe bientôt répondre à des questions sur le cyclisme, plutôt qu'un pourfendeur d'huissier s'accoquiner avec une candidate qui n'en a que faire des théories économiques de la gestion du risque. C'est finalement dommage qu'un laboratoire de théorie des jeux appliqués se soit transformé en réunion tupperware de toutes les superstitions les plus délirantes...


 * D'un côté, on  1 chance sur 24 d'avoir la boîte à 100 000 €. On a donc une proba de 23/24 de ne pas l'avoir. Dans ce second cas, la probabilité de ne pas révéler la boîte à 100 000 € lors de la première ouverture est de 22/23. Si elle n'a pas été ouverte lors de la première révélation, la probabilité qu'elle ne le soit pas lors de la deuxième est de 21/22. etc. Au final, dans le cas où l'on ne possède pas soi-même la boîte à 100 000 €, la probabilité ne pas pas l'ouvrir avant qu'il n'en reste plus que deux est 23/24 × 22/23 × 21/22 × ... × 2/3 × 1/2 = 1/24. En ajoutant la probabilité de soi même détenir cette boîte, on retrouve bien cette probabilité de 1/12.


Sources :
Deal or No Deal? Decision Making under Risk in a Large-Payoff Game Show
T. Post, M. Van den Assem , G. Baltussen, R. Thaler

Images : une chèvre, une autre chèvre, une voiture 

Posté par El Jj à 10:00 - Commentaires [0] - Permalien [#]
Tags : , , ,

12 octobre 2014

Deux minutes pour les boeufs d'Hélios

Nouvel épisode de "deux minutes pour", avec cette fois-ci l'étonnant problème des boeufs d'Hélios. 

Sources :
Problème des bœufs d'Hélios - Gérard Villemin - pour le détail de la résolution par le calcul du système
Archimedes' cattle problem - Ilan Vardi - pour le détail de la résolution de l'équation de Pell-Fermat
The cattle problem - pour les précisions historiques et pour les 206 545 chiffres de la solution

Posté par El Jj à 10:00 - Commentaires [3] - Permalien [#]
Tags : , , , ,
28 septembre 2014

Deux minutes pour le théorème de Pythagore

Peut-on démontrer le théorème de Pythagore en moins de deux minutes ? Bien sûr, ce n'est pas difficile.

Mais peut-on le faire de 8 façons différentes ? C'est justement le sujet de la première vidéo de ma nouvelle chaîne Youtube !

Bonus
Il y a une autre démonstration du théorème de Pythagore que j'aurais voulu placer dans la vidéo, mais elle aurait gravement dépassé les 2 minutes... La démonstration de Arioni, basée sur la convergence de la série géométrique.

Pour cela, la première chose à remarquer, c'est que, dans un triangle rectangle, la hauteur issue de l'angle droit donne deux triangles semblables au premier (car ils ont forcément un angle en commun en plus de l'angle droit).

Du coup, sur la figure suivante, tous les triangles représentés sont semblables :

Arioni
ABC est un triangle rectangle en A, de côtés a, b et c.
Pour tout k, Ck+1 est le pied de la hauteur issue de Adu triangle CkAkB, 
et Ak+1 est le pied de la hauteur issue de Ck+1 du triangle Ck+1AkB

Tous les triangles bleus sont similaires, si bien que

Arioni_1

On a alors, pour tout k, 

Arioni_2

On regarde ensuite les triangles de part et d'autres des segments hk :

Arioni_3

On a alors, pour tout k,

Arioni_4

En remplaçant dans l'égalité des triangles bleus, on a :

Arioni_5

De plus, tous les triangles rouges sont similaires à ABC, donc

Arioni_6

Donc 

Arioni_7

Autrement dit, la suite c est géométrique, de raison c²/a²

La longueur c est égale à la série géométrique c0+c1+c2+...
Donc

Arioni_8

De plus, la similarité de ABC avec ABH0 implique que h0 = cb/a
La similarité de A1H0A avec ABC implique que c0 = h0.b/a
Donc c0 = c b²/a².

On remplace dans la série géométrique :

Arioni_9

Ce qui se simplifie en :

Arioni_10

Autrement dit :

a² = b² + c²

CQFD !


Sources :
Vous pouvez retrouver 103 (103 !) démonstrations du théorème de Pythagore sur cut the knot

Posté par El Jj à 10:00 - Commentaires [2] - Permalien [#]
Tags : , , ,
14 septembre 2014

Artur Avila, celui qui mélange

Dans le dernier épisode, j'avais entrepris d'écrire de petits articles pour décrire les travaux de la dernière fournée des médaillés Fields. Dès le premier article sur Manjul Bhargava, j'ai échoué, puisque l'article était trop long. Je vais tenter de me rattraper, en parlant aujourd'hui du plus brésilien de tous les médaillés Fields français (puisque c'est le seul qui soit franco-brésilien) : Artur Avila !

RTEmagicC_Artur_Avila
Artur Ávila Cordeiro de Melo

Artur Ávila est né le 29 juin 1979 à Rio de Janeiro, si bien qu'il a été médaillé Fields à moins de 36 ans (ce qui est plutôt rare). En même temps, vu qu'il a démarré sa thèse à 19 ans, il est normal qu'il obtienne la médaille Fields plus tôt que les autres. Cette médaille, il l'a remporté grâce à 

"ses profondes contributions à la théorie des systèmes dynamiques qui ont bouleversé le domaine, en utilisant la puissante idée de renormalisation comme principe unificateur"

Suite logistique
Ce qui intéresse Artur Avila, c'est de comprendre le comportement des systèmes dynamiques : le mouvement des planètes, la dynamique des populations, le mouvement des électrons... Ce qui caractérise un système dynamique, c'est que leur évolution est parfaitement déterministe : la connaissance exacte des conditions initiales permet toujours de savoir leur avenir. Mais si on ne connaît que vaguement les conditions initiales, la prédiction du futur du système est souvent compromise. Mais ce n'est pas une fatalité ! Commençons déjà par étudier le plus célèbre des systèmes dynamiques, issu d'une modélisation de la croissance de populations : la suite logistique.

Pour un nombre réel r∈ ]0,4], on définit la fonction logistique f:x ↦ r.x.(1-x). 
Puis, étant donné un nombre u0  ]0,1[, on va observer le comportement de la suite (un) définie par un+1 = f(un).

Malgré son apparence très simple, cette suite peut avoir des comportements très bizarres pour certaines valeurs de r et de u0.

Prenons un premier exemple, avec r = 2.8 et u0 = 0.2. Dans ce cas, la suite logistique est la suivante :
u0 = 0.2, u1 = f(u0) = 0.448, u2 = f(u1) = 0.692..., u3 = 0.596..., u4 = 0.674..., u5 = 0.615..., u6 = 0.662...
En itérant davantage, on constate que la suite finit par se stabiliser autour de 0.6428 (9/14). La suite converge !

On peut observer le comportement de ces suites à l'aide de ce que l'on appelle les diagrammes en "toile d'araignée" (ou diagrammes de Vershult). Pour cela, on dessine la fonction que l'on va itérer (ici, f), ainsi que la droite d'équation y=x, et on place le terme initial u0 sur l'axe horizontal. On va ensuite placer le point u1 en reliant verticalement u0 à la courbe de f, puis horizontalement la courbe f à la droite y=x. En répétant l'opération, on fabriquera la "toile d'araignée" qui représentera les différents termes de la suite.
La convergence d'une suite se traduit sur ce diagramme par la convergence des zig-zag.

Logistic_28 (2)
Diagramme en toile d'araignée de la suite logistique, pour r = 2.8 et u0 = 0.2
Les 500 premiers termes de (un) sont représentés (même si 99% d'entre eux sont concentrés autour de 9/14)

En fait, le choix du terme initial u0 n'a aucune incidence sur le devenir de cette suite de paramètre r=2.8 : elle finira toujours par converger vers 9/14.

Mais pour les autres valeurs de r ? Eh bien, ça dépend...

Déjà, il y a les valeurs r comprises entre 0 et 3 : c'est toujours la même chose qui se passe, la suite converge :

logistique_13logistique_2logistique_23
logistique_26logistique_295logistique_3
Pour r ∈ ]0,3], la suite converge, quelle que soit la valeur initiale u0.
Pour r=3, la convergence vers 2/3 est cependant particulièrement lente.

Mais pour les valeurs plus grandes que r=3, les choses se corsent. D'abord, gentiment, lorsque r est compris entre 3 et 3.449 : la suite ne se stabilise pas autour de une seule valeur, mais autour de 2 :

logistique_310logistique_320logistique_330logistique_342
Diagramme pour r=3.1, r=3.2, r=3.3 et r=3.42
Pour r ∈ ]3,1+√6], la suite se stabilise autour de 2 valeurs, quelle que soit (sauf exception) la valeur initiale u0.

Pour des valeurs encore plus grande de r, ça se complique davantage : la suite se stabilisera autour de 4 valeurs (r ∈]3.449, 3.544]), puis autour de 8 valeurs (r∈]3.544;3.564]), puis autour de 16 valeurs, etc., et ce, tant que r ≤ 3.57.

logistique_350logistique_356logistique_3565
Diagramme pour r=3.5, r=3.56, r=3.565
Pour ces valeurs r ≤ 3.57, la suite finira par se stabiliser autour de 2n valeurs

Mais pour les valeurs plus grandes que 3.57, le chaos arrive ! Il n'y a plus aucune valeur autour desquelles la suite va se stabiliser. De plus, si on change même très légèrement la valeur initiale u0, la trajectoire sera complètement différente. On peut alors dire que la suite a un comportement chaotique. Encore une fois, ce chaos est indépendant de la valeur initiale (sauf exceptions)

logistique_370logistique_380logistique_390logistique_400
Diagramme pour r=3.7, r=3.8, r=3.9 et r=4
Pour ces valeurs r ∈ [3.57;4], la suite est chaotique : elle ne se stabilisera autour d'aucune valeur

En fait, ceci n'est pas totalement vrai. A partir de r=3.57, on peut trouver parfois des valeurs r pour lesquelles la suite se stabilisera autour de 3 valeurs, autour de 6 valeurs, ou autour de n'importe quel nombre de valeurs choisies à l'avance. Par exemple, pour r=3.83, la suite se stabilise autour de 3 valeurs :

logistique_383
Diagramme pour r=3.83 : la suite se stabilise autour de 3 valeurs.

On peut résumer le comportement de la suite logistique par son diagramme de bifurcation : en abscisse, le paramètre r, et en ordonnée, ses valeurs d'adhérence :

800px-LogisticMap_BifurcationDiagram

Finalement, la suite peut présenter deux comportements, suivant la valeur r :
- ou bien elle est régulière : elle finit par se stabiliser autour d'une ou de plusieurs valeurs
- ou bien elle est chaotique

Dans le cas où la suite est chaotique, elle n'est cependant pas si imprévisible qu'on voudrait bien le croire. Même si on ne peut pas connaître la valeur de la suite après un grand nombre de valeurs, on peut tout de même prédire avec une certaine probabilité dans quel intervalle elle se trouvera. Par exemple, on peut vérifier que dans le cas r = 0.9, la suite passera plus de 20% de son temps dans l'intervalle [0.9;1], ou qu'elle sera deux fois plus souvent autour de 0.35 qu'autour de 0.7. Et ça, indépendemment du choix de u0 (sauf, comme toujours, cas particuliers). 
Autrement dit, quand on connaît la valeur r, on peut connaître la répartition des valeurs prises par la suite. Le système dynamique se comporte alors comme un objet aléatoire : on dit alors que la suite stochastiquement stable.

Existe-t-il des valeurs r pour laquelle la suite serait ni régulière, ni stochastiquement stable ? ... Eh bien, oui, mais ces exemples sont négligeables (les cycles attracteurs peuvent par exemple être des ensembles de Cantor...). C'est l'objet du théorème de Lyubich (2002), qui indique que presque toutes les suites logistiques sont régulières ou stochastiquement stable.

Mais ça, c'était juste pour le cas très particulier des suites logistiques. Qu'en est-il de tous les autres systèmes dynamiques ? Eh bien, c'est ça l'objet du travail de Artur Avila : il a démontré, avec Lyubich et Melo, que la plupart des systèmes dynamiques observent cette dualité régulier/stochastiquement stable !

Les échanges d'intervalles
Un autre problème qui a longtemps empêché Avila de dormir est celui du mélange des jeux de cartes (bon, avec un nombre infini et continu de cartes, mais l'idée est là).

Par exemple, pour mélanger un jeu de 32 cartes, on peut répéter plusieurs fois l'opération suivante : faire 4 tas de cartes A, B, C, D, puis les réassembler en mélangeant l'ordre des tas (par exemple, D, A, C, B). Quand on parle de système dynamique, il est nécessaire que l'opération soit toujours identique.

Disons que les tas A, B, C et D contiennent respectivement 7, 7, 7, et 11 cartes. En numérotant les cartes de 1 à 32, on a le découpage suivant :

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

En permutant ces 4 tas selon le motif DACB, on obtient :

22 23 24 25 26 27 28 29 30 31 32 1 2 3 4 5 6 7 15 16 17 18 19 20 21 8 9 10 11 12 13 14

Et si on répète encore la même opération :

18 19 20 21 8 9 10 11 12 13 14 22 23 24 25 26 27 28 4 5 6 7 15 16 17 29 30 31 32 1 2 3
7 15 16 17 29 30 31 32 1 2 3 18 19 20 21 8 9 10 25 26 27 28 4 5 6 11 12 13 14 22 23 24
28 4 5 6 11 12 13 14 22 23 24 7 15 16 17 29 30 31 21 8 9 10 25 26 27 32 1 2 3 18 19 20
10 25 26 27 32 1 2 3 18 19 20 28 4 5 6 11 12 13 17 29 30 31 21 8 9 14 22 23 24 7 15 16
31 21 8 9 14 22 23 24 7 15 16 10 25 26 27 32 1 2 6 11 12 13 17 29 30 3 18 19 20 28 4 5
13 17 29 30 3 18 19 20 28 4 5 31 21 8 9 14 22 23 27 32 1 2 6 11 12 24 7 15 16 10 25 26
2 6 11 12 24 7 15 16 10 25 26 13 17 29 30 3 18 19 9 14 22 23 27 32 1 20 28 4 5 31 21 8
23 27 32 1 20 28 4 5 31 21 8 2 6 11 12 24 7 15 30 3 18 19 9 14 22 16 10 25 26 13 17 29

Après 10 répétitions, le jeu est plutôt mélangé, et c'est parfait pour une bataille ! 
Après un grand nombre n d'opérations, on dira que le jeu est mélangé si, dans n'importe quel petit groupe de carte, la proportion de carte d'un groupe donné est la même que dans le jeu complet.
Autrement dit, un jeu de carte est bien mélangé si, dans une main, on a toujours environ 50% de cartes rouges, 25 % de piques, 12.5% de carte as ou roi...

Il y a quand même un problème avec le mélange d'un jeu de 32 cartes, c'est qu'après un certain nombre de répétitions, on reviendra forcément à un jeu parfaitement trié. En effet, puisque chaque répétition donne une nouvelle permutation des 32 cartes, et qu'il n'existe *que* 32! (=32×31×30×...×1 = 3.2×1035) permutations différentes, on retombera tôt ou tard sur le jeu trié.
Cela signifie qu'il existe des grands nombres d'itérations n pour lesquelles le jeu n'est pas mélangé...

Cependant, un tel mélange par permutation peut facilement se généraliser à des intervalles :

MelangeIntervalles
Permutation DACB, itérée deux fois

On peut se poser la même question : est-ce que cette permutation est mélangeante ?
Si oui, cela signifierait que, après plusieurs itérations, la première moitié (ou n'importe quel sous-ensemble) de l'intervalle contiendrait exactement la même proportion de rouge (et des autres couleurs) que dans l'intervalle initial. Une telle perfection de mélange est impossible à obtenir, mais on peut l'exprimer en terme de limite : la limite de la proportion de rouge dans la première moitié de l'intervalle doit tendre vers la proportion initiale de rouge.
Malheureusement, une permutation mélangeante, ça n'existe pas, et c'est à Anatole Katok que l'on doit se résultat. Mais ce que Avila a montré, avec Giovanni Forni, c'est que la plupart des permutations d'intervalles sont faiblement mélangeantes : elles sont mélangentes à condition d'exclure un "petit" nombre de valeurs de n.

Ce résultat sur les intervalles peut s'appliquer sur les billards de forme quelconque, ce qui fournit de précieux résultats dans l'étude des mouvements des particules en physique statistique.

Le problème des 10 Martinis
Il existe des problèmes mathématiques côtés à un million de dollars (les fameux problèmes du prix du millénaire, comme l'hypothèse de Riemann ou le problème P=NP). Et il y en existe pour qui la récompense est à première vue moindre, comme le problème des dix martinis. Comme son nom l'indique, dix martinis seraient offerts en échange de la résolution du problème ; une proposition du mathématicien Mark Kac (proposer une ou plusieurs boissons alcoolisées en échange de la résolution d'un problème étant l'une des coutumes des mathématiciens de l'école de Lwów, en Pologne). A noter qu'il existe une variante plus "sèche" de ce problème, appelé problème des dix dry martini... Le problème des 10 martinis est donc le suivant :

Montrer que, pour tout λ ≠ 0, et pour tout α irrationnel, le spectre de l'opérateur presque-Mathieu OperateurMathieu
est un ensemble de Cantor

J'ai retranscrit l'énoncé pour la forme, je ne vais pas le détailler davantage. La seule chose qu'il faut dire, c'est que l'opérateur presque-Mathieu décrit l'évolution d'un électron dans un champ magnétique particulier. Il ne fait nul doute que les physiciens apprécient de connaître le spectre d'un tel opérateur. 

Artur Avila, ainsi que Raphaël Krikorian, Svetlana Jitomirskaya et David Damanik ont résolu ce problème des 10 martinis, ainsi que d'autres problèmes issus de la liste des problèmes de Simon, 15 problèmes issus de la théorie des opérateurs de Schrödinger à destination des mathématiciens du XXIe sicèle. L'histoire ne dit pas si ils ont gagné leur dix verres de vermouth.

L'opérateur presque-Mathieu est lié au papillon de Hofstadter, qui, avant d'écrire des livres (Godel, Escher, Bach), s'intéressait à la physique. Cette fractale issue de la physique représente la conductance de Hall (?) en fonction de l'énergie (??) et du flux magnétique (???). Autant dire que je n'ai pas compris exactement ce qu'est le papillon de Hofstadter, mais comme c'est joli, je ne vais pas me priver de le mettre ici pour conclure cet article...

Hofstadter's_butterfly
Le papillon de Hofstadter
Je devrais un jour faire un top 10 des utilisations du papillon en mathématiques...


Sources
The work of Artur Avila
La suite logistique et le chaos, Daniel Perrin
Weak mixing for interval exchange transformations and translation flows, Artur Avila et Giovanni Forni


Et si vous êtes quelqu'un de bien, votez pour moi aux Golden Blog Awards

Posté par El Jj à 10:00 - Commentaires [1] - Permalien [#]
Tags : , , , ,
31 août 2014

Manjul Bhargava, celui qui compte

Quand on part en vacances, on se coupe des informations. Parfois par choix, parfois simplement parce que le wifi du camping n'est pas tout à fait fonctionnel. Et quand on rentre de vacances, on découvre que l'on est passé à côté du décès de Robin Williams et de la révélation des nouveaux médaillés Fields. Du coup, je ne sais pas comment les médias ont traité l'hommage au professeur John Keating, à Sean Maguire ou à Alan Parish, ni comment ils sont parvenus à saboter l'événement de l'année de la communauté mathématique.

Rappellons-le : la médaille Fields, c'est comme le prix Nobel, mais pour les mathématiques. Mais elles ne sont remies que tous les quatre ans, contrairement au prix Nobel. C'est donc plutôt les JO des mathématiques. Mais ça n'a rien à voir, d'autant que les Olympiades de mathématiques existentt, et qu'elles ont lieu tous les ans. Mais chaque année, 4 mathématiciens sont récompensés par la médaille Fields, ce qui fait une moyenne de une médaille Fields par an, ce qui est équivalent au prix Nobel. Mais la médaille Fields limite ses récipiendaires à 40 ans, ce qui n'a rien à voir avec le Nobel. Du coup, on n'a qu'à dire que le Nobel des mathématiques est le prix Abel, et que la médaille Fields est la médailles Fields des mathématiques, puisqu'ils ne font jamais rien comme tout le monde.

En cette année 2014, les quatre mathématiciens qui ont reçu la fameuse médaille sont :
- Artur Ávila, franco-brésilien
- Manjul Bhargava, américano-canadien, d'origine indienne
- Maryam Mirzakhani, iranienne, professeur aux USA
- Martin Hairer, autrichien, professeur au Royaume-Uni

Trois choses sont alors à remarquer :
- il faut arrêter de donner la nationalité des mathématiciens, puisqu'ils font vraiment tout pour compliquer les choses
- je n'ai pas encore parlé des lauréats du prix Nevanlinna, du prix Gauss, du prix Leelavati ni de la médaille Chern, remis en même temps que les médailles Fields, mais j'en parlerai (peut-être) dans un futur article
- heureusement qu'une femme et qu'un français ont été médaillés, sinon, on aurait vraiment rien eu à dire

Mais qu'on fait ces 4 mathématiciens pour mériter une médaille ? Commençons aujourd'hui en nous penchant sur les travaux de Manjul Bhargava.

RTEmagicC_ManjulBhargava_FieldsMedal
मंजुल भार्गव

Pour situer, Manjul Bhargava est né le 8 août 1974 à Hamilton, au Canada, si bien qu'il avait plus de 40 ans lorsqu'il a reçu la médaille Fields (mais le règlement stipule(rait) qu'il faut être âgé de moins de 40 ans au 1er janvier de l'année du congrès). Il obtient son doctorat en 2001 à Princeton (USA), sous la direction de Andrew Wiles, célèbre pour avoir démontré le grand théorème de Fermat (mais comme il a finalisé sa démonstration à 41 ans, il est passé à côté de la médailles Fields...). Il a donc été récompensé :

"pour avoir développé des nouvelles méthodes en géométrie des nombres, lesquelles ont été utilisées pour compter les anneaux de petits rangs, ainsi que pour avoir borné le rang moyen des courbes elliptiques"

... en géométrie des nombres...
La géométrie des nombres consiste à résoudre de façon géométrique des problèmes issus de théorie des nombres (la théorie des nombres est le domaine où l'on cherche les solutions entières ou rationnelles (les fractions) d'équations).
Par exemple, on peut chercher quels sont les entiers x et y qui vérifient x² + y² = 13. La façon la plus simple de le faire est de dessiner dans un repère le cercle de centre (0,0) et de rayon √13 (autrement dit, le cercle d'équation x²+y²=13), et de regarder où il coupe le quadrillage. Un coup d'oeil rapide permet de vérifier que l'équation possède 8 solutions entières.

EquationCercle
Géométriquement, on voit que l'équation x²+y² = 13 possède 8 solutions entières.

On peut également poser la question du nombre de solutions (entières) de l'inéquation x² + y² ≤ 13. Cette fois-ci, il faut compter le nombre de points à l'intérieur du disque de centre (0,0) et de rayon √13.

InequationCercle
Géométriquement, on voit que l'équation x²+y² ≤ 13 possède 45 solutions.

En généralisant la construction, on peut voir que si le nombre C est assez grand, l'équation x² + y² ≤ C aura environ π.C solutions entières. En effet, l'équation x² + y² ≤ C correspond à un disque de rayon √C, donc d'aire π.C. Chaque noeud du quadrillage correspond à un carré d'aire 1, qui recouvre à peu près le disque, ce qui nous donne une approximation pas trop mauvaise.

InequationCercleGeneralise
Le cercle d'équation x² + y² ≤ C est d'aire π.C, il contient donc environ π.C noeuds du quadrillages

Autrement dit, une considération géométrique sur l'aire d'un disque nous apporte une réponse à une question de thoérie des nombres. C'est ça, la géométrie des nombres, et c'est pour ça que c'est cool.

... de nouvelles méthodes...
Le principal fait d'arme de Bhargava, c'est d'avoir découvert de nouvelles lois de compositions pour des polynômes. Cette découverte s'est faite en trois étapes :
- il a lu attentivement Disquisitiones arithmeticae, de Carl Friedrich Gauss, où il est entre autre question de composition de formes quadratiques
- il a joué avec un Rubik's Cube 2x2x2, ce qui lui a fait penser que le cube serait parfait pour illustrer le problème de la composition de formes quadratiques (sérendipité !)
- il a réfléchi longuement, et a abouti à la découverte de 13 nouvelles lois de compositions (là où Gauss en a péniblement décrit une).

Gauss s'est donc intéressé aux formes quadratiques binaires, autrement dit, aux polynômes à deux variables où tous les monômes sont de degré total 2. Bref, aux polynômes de la forme :

Q(x,y) = a x² + b xy + c y²
avec a, b, c entiers

On apprend au lycée qu'il existe trois types de trinômes du second degré : ceux qui possèdent deux racines, ceux qui n'en possèdent qu'une seule, et ceux qui n'en ont aucune. Pour savoir à quel type de trinôme on a affaire, on calcule son discriminant :

Δ = b² − 4ac

Lorsque Δ est négatif, le trinôme n'a pas de racine, et c'est là que c'est intéressant. Pour les formes quadratiques binaires, c'est pareil, elles ne sont intéressantes que lorsque Δ est négatif. Et si, en plus, les coefficients a et c sont positifs, on leur donne un nom : les formes quadratiques définies positives.

Une question qui taraude Gauss est de savoir combien il existe de formes quadratiques binaires définies positives (que je vais abrégéer en écrivant simplement "forme", parce que c'est pénible à écrire) différentes ayant un discriminant -Δ donné. Par exemple, quels sont les formes de discriminant -4 ?
Déjà, il y a Q(x,y) = x² + y².
Mais il y a aussi Q'(x,y) = x² + 2xy + 2y²
Ou alors il y a Q''(x,y) = 65 x² + 94 xy + 34 y²
En fait, n'importe quelle forme Q(rx+sy,tx+uy) (avec r,s,t,u entiers tel que ru-st=1) a le même discriminant que Q, ce qui donne une infinité d'exemples possibles 
Du coup, tous ces exemples de formes ne sont pas réellement différents. Ils constituent alors une même classe d'équivalence, à un changement de variable près. Mais y en a-t-il d'autres ? Pour Δ=-4, non, mais ce n'est pas le cas pour d'autres valeurs de Δ.

La question qu'il faut donc se poser est donc plutôt : combien existe-t-il de classes différentes de formes quadratiques, pour un discriminant -Δ donné ? C'est avec des outils de la géométrie des nombres que l'on peut répondre, au moins de manière approximative, à cette question.

Une autre question qui taraudait Gauss était celle de la structure de ces formes quadratiques : y a t-il un opération (une composition) que l'on peut faire entre deux formes qui donnerait une autre forme ? Il y a des façons naïves de le faire (en additionnant deux formes, on trouve une autre forme), mais celles-ci ne préservent pas le coeur de la forme quadratique : son déterminant. Et c'est là que le génie de Gauss, et plus tard, celui de Bhargava, opèrent !

Pour cela, Gauss s'appuie sur un fait bien connu : quand on multiplie deux sommes de deux carrés (x²+y²), on obtient une somme de deux carrés. Par exemple, le produit de 13 (=2²+3²) et de 25 (=3²+4²) est 325 (=6²+17²), tous trois sommes de deux carrés.
Ceci vient du fait que, pour tout nombres x, y, x', y', on a l'identité (x²+y²)(x'²+y'²) = (xx'-yy')² + (xy'+yx')² (on peut l'illustrer en remarquant que le module d'un produit de deux nombres complexes est égal au produit des modules).
Ainsi, en combinant la forme Q(x,y)=x²+y² avec elle-même, on trouve à nouveau cette forme : d'une certaine façon, on peut dire que Q×Q=Q.

On peut voir sur un autre exemple. Il existe seulement deux formes (à équivalence près) de déterminant -12 :
Q1 = x² + 3y² et Q2 = 2x² + 2xy + 2y²

On peut alors vérifier que l'on a les identités suivantes :
Q1(x,y)×Q1(x',y') = Q1(xx'-3yy',xy'+x'y) 
Q1(x,y)×Q2(x',y') = Q2(xx'-x'y-2yy',xy'+2x'y+yy') 
Q2(x,y)×Q2(x',y') = Q2(xx'-xy'+2yx'+yy',xx'+xy'+yy') 

Autrement dit : Q1×Q1 = Q1, Q1×Q2 = Q2 et Q2×Q2 = Q1 ! C'est ce que l'on appelle la composition des formes quadratiques, et on peut trouver des formules similaires liant entre eux toutes les différentes forme d'un même déterminant donné. Ces identités sont plutôt obscures, et il fallait au moins le génie de Gauss pour découvrir leur existence. 

Mais là où Bhargava intervient, c'est qu'en reprenant et en améliorant les méthodes de Gauss, il est parvenu à généraliser la composition des formes quadratiques à des polynômes de degré supérieur. Du coup, il a fait passer de 1 à 14 le nombre de lois de compositions connues pour les polynômes, cassant au passage l'idée que de telles identités ne pouvait exister que dans le cas des formes quadratiques.

Outre la satisfaction d'avoir plein de nouvelles identités pour les polynômes de degré 2 ou plus, toutes ces constructions sont utiles pour étudier les corps de nombres, objet central en algèbre.
Un corps, c'est un ensemble dans lequel on peut faire sans problèmes les quatre opérations de base : addition, soustraction, multiplication et division. On peut citer, par exemple, le corps des nombres rationnels ℚ, ou celui des nombres réels ℝ.

Ce que l'on aime bien faire avec les corps, c'est y ajouter des nombres pour voir ce que cela donne (on parle d'extensions de corps). Par exemple, on peut prendre le corps des nombres réels ℝ, et y ajouter un nombre qui serait la racine du polynôme X²+1. Si on appelle cette racine i, on obtient des nombres de la forme a+ib, où i²=-1, autrement dit, le corps des nombres complexes. C'est un corps quadratique de discriminant -4, puisqu'il a été construit à partir du polynôme X²+1.
Ce qui serait génial de savoir, c'est le nombre d'extensions de corps qui existent pour un déterminant donné (plus le déterminant est grand, plus le corps sera complexe). Grâce à Bhargava et à ses lois de compositions des polynômes, c'est chose faite !

(Mine de rien, la théorie des corps est centrale en algèbre, et c'est quand elle a été mise au point que l'on a pu résoudre sans difficulté les 3 grands problèmes de l'antiquité)

...avoir borné le rang moyen des courbes elliptiques...
Deuxième prouesse de Manjul Bhargava (avec Arul Shankar) : avoir borné le rang moyen des courbes elliptiques. Evidemment, rien n'aurait été possible sans tous les outils qu'il venait de mettre au point. Par ce théorème qui a fait sa renommé, Bhargava et Shankar ont fait un pas de plus vers la résolution de la conjecture de Birch et Swinnerton-Dyer, l'un des 7 problèmes du millénaire.

Une équation elliptique, c'est une équation de la forme :

y² + a1 xy + a2y = x3 +a3 x² +a4 x + a5
où a1a2a3a4a5 sont des nombres rationnels

Par exemple, les deux equations suivantes sont elliptiques :

y² = x3 +1

y² + y = x3 - x

Encore une fois, le but est de trouver des solutions rationnelles pour ces équations, et surtout, dire combien il y en a : un nombre infini ou pas ?
Dans le cas de l'équation y² = x3 +1, il n'y a que 5 solutions : (-1,0), (0,1), (0,-1), (2,3) et (-2,3)
Dans le cas de l'équation y² + y = x3 - x, il y a une infinité de solutions : (0,0), (1,-1), (1,0), (-1,0), (-1,-1), (2,2), (2,-3), (6,-15), (0.25, -0.375), ...

Mais pourquoi certaines équations elliptiques ont un nombre fini de solutions, et d'autres un nombre infini ? C'est injuste ! Pour cela, on va voir comment déterminer ces solutions, et on va le faire de façon graphique, puisque à chaque équation elliptique correspond sa courbe elliptique :

EquationCourbesElliptiques
Deux courbes elliptiques

Sur ces courbes, on va définir deux opérations : étant donné deux point P et Q de la courbe, on note :

  • P*Q : le troisième point d'intersection entre la courbe et la droite (PQ). Si P=Q, la droite (PQ) est la tangente à la courbe au point P.
  • P+Q : le symétrique de P*Q par rapport à l'axe de symétrie de la courbe.
    On peut démontrer que le point P+Q existe toujours, sans aucune ambiguité (le point P+Q peut éventuellement être un point à l'infini)

CompositionCourbesElliptiques4

Pour deux points P et Q de la courbe (distincts ou non), on fait correspondre un point P*Q et un point P+Q.

Ce qui est intéressant avec cette opération, c'est que si P et Q sont des points à coordonnées rationnelles (des solutions de l'équation de départ), alors P*Q et P+Q aussi. On peut donc, si l'on connaît une solution de l'équation, en déterminer d'autres.

Reprenons la première équation : y² = x3 +1. Une solution particulière de cette équation est le point A (2,3).
Pour déterminer le point A+A, on trace la tangente à la courbe au point A. Cette tangente coupe la courbe en A*A = D(0,-1), donc A+A est le symétrique de D par rapport à l'axe Ox, c'est B (0,1).

SolutionsEquationsElliptiques
Les 5 solutions rationnelles de l'équation y² = x3 +1

On a donc A*A = D, donc 2A = A+A = B
De même :
A*B = C, donc 3A = A + 2A = A+B = C
A*C = B, donc 4A = A + 3A = A+C = D
A*D = A, donc 5A = A + 4A = A + D = E
Et enfin, A*E = O (le point à l'infini), donc 6A = A + E = O
O est élément neutre, puisque A+O = A.
Les 5 solutions de l'équation y² = x3 +1 sont donc tous les multiples du point A !

Si on part sur la deuxième équation y² + y = x3 - x, les choses se passent légèrement différement. Une solution évidente est la solution A(0,0).
En suivant la même méthode, on trace la tangente à la courbe au point A, ce qui nous donne le point A*A = B'(1,-1), et donc, 2A = B(1,0).

SolutionsEquationsElliptiques2

On peut poursuivre : 3A = C (-1,1)
4A = D (2,-3)
5A = E (-0.25, -0.625)
6A = (6,14)
7A = (-5/9 , 8/27)
etc.
En continuant ainsi, on passera par tous les points à coordonnées rationnelles de la courbe, qui sont en nombre infini. Puisque le point A(0,0) permet de trouver l'ensemble infini des solutions de l'équation, on dira que A est un point générateur.

Mais parfois, il arrive qu'un point générateur ne suffise pas pour obtenir l'ensemble des points rationnels de la courbe. C'est par exemple ce qui arrive avec la courbe d'équation y² + y = x3 + x² - 2x, où il est nécéssaire d'avoir deux points générateurs.
Le nombre minimum de points générateurs nécéssaires pour engendrer l'ensemble des points rationnels de la courbe est appellé son rang, et c'est ce nombre qui mesure la complexité de la courbe elliptique que l'on étudie.
Ainsi, la courbe y² + y = x3 - x est de rang 1, la courbe y² + y = x3 + x² - 2x est de rang 2 et la courbe y² = x3 +1 est de rang 0 (puisqu'elle n'a qu'un nombre fini de solution).
Le rang d'une courbe elliptique est toujours un nombre fini, mais n'est a priori pas borné. On ne connaît cependant que très peu de courbes elliptique de très haut rang, le record étant une courbe de rang (au moins) 28, et date de 2006 :

y² + xy + y = x3 - x² - 20067762415575526585033208209338542750930230312178956502x + 34481611795030556467032985690390720374855944359319180361266008296291939448732243429

Les courbes de haut rang sont en fait particulièrement rares, tandis que les courbes de rang 0 ou 1 semblent légions. Mais est-ce toujours le cas ? Si je prend au hasard une courbe elliptique, quelle est la probabilité de tomber sur une courbe de rang 0 ou 1 ? L'expérience montre que environ la moitié sont de rang 0, l'autre moitié de rang 1, et que les rang supérieurs sont négligeables. 
En moyenne (dans un sens que je n'expliquerai pas), on doit donc s'attendre à ce que le rang d'une courbe elliptique soit autour de 0.5. 

Mais la démonstration que le rang moyen est bien 0.5 n'est pas aisée... Ce n'est d'ailleurs aujourd'hui toujours pas démontré, mais on s'approche doucement de cette valeur.
Avant que Bhargava et Shankar ne s'intéressent au sujet en 2010, on s'était arrêté à un rang moyen inférieur à 1.79. Mais la démonstration de cette valeur sous-optimale utilise comme acquis la démonstration de l'hypothèse de Riemann et de la conjecture de Birch et Swinnerton-Dyer (deux conjectures à un millions de dollars que l'on est très loin d'avoir percé).
Aujourd'hui, on sait que le rang moyen des courbes elliptique est inférieur à 1.17, et pas besoin de théorèmes non démontrés pour le prouver. C'est en particulier ce théorème qui a permis à Bhargava d'obtenir la médaille Fields.

Le théorème 290.
Un dernier théorème de Bhargava que j'apprécie tout particulièrement : le théorème 290 ! Il dit la chose suivante :

On considère une forme quadratique définie positive à coefficients entiers.
Si elle peut représenter les 29 nombres suivants :
1, 2, 3, 5, 6, 7, 10, 13, 14, 15, 17, 19, 21, 22, 23, 26, 29, 30, 31, 34, 35, 37, 42, 58, 93, 110, 145, 203, and 290
alors, elle peut représenter n'importe quel nombre entier (on dit qu'elle est universelle).

Par exemple, le polynôme Q(x,y,z,t) = x²+y²+z²+t² est une forme quadratique définie positive à coefficients entiers.
On peut vérifier qu'il existe un moyen d'écrire 
tous les nombres de la liste avec ce polynôme : 1 = Q(1,0,0,0), 2 = Q(1,1,0,0), 31 = Q(5,2,1,1), etc. D'après le théorème 290, tous les nombres entiers 
Autrement dit, n'importe quel nombre peut être écrit comme somme de (au plus) 4 carrés. Cette propriété porte un nom, c'est le théorème des quatre carrés de Lagrange. Le théorème 290, lui, permet de généraliser le théorème de Lagrange en fournissant un critère d'universalité des formes quadratiques. (à noter tout de même que le théorème de Lagrange intervient dans la démo du théorème 290)
Par contre, le polynôme Q(x,y,z) = x² + y² + z² échoue au test, puisqu'il est impossible d'écrire 7 comme somme de trois carrés : ce polynôme n'est pas universel.

Les 29 nombres de l'énoncé sont optimaux : pour chacun de ces entiers, il existe une forme quadratique représentant l'ensemble des entiers sauf lui. Par exemple, la forme quadratique x² + 2y² + 2z² + 5t² représente tous les nombres, sauf 15 !

Ce critère a permis à Bhargava de compléter la liste des forme quadratiques quaternaires (à 4 inconnues) universelles. Alors que Ramanujan pensait qu'il n'y en avait que 54, Bhargava a montré qu'il y en avait en fait 6436 !


Sources
The Work of Manjul Bhargava

Composition and Bhargava's cube, Florian Bouyer

Answers on a donut – the Fields medal lecture of Manjul Bhargava, Rachel Thomas

Universal quadratic forms and the 290-Theorem, Manjul Bhargava and Jonathan Hanke

Manjul Bhargava, médaille Fields 2014, Étienne Ghys
Le rang des courbes elliptiques, François Brunault

Posté par El Jj à 10:00 - Commentaires [3] - Permalien [#]
Tags : , , , , ,
07 août 2014

Aquitaine-Poitou-Charente-Limousin

En juillet dernier, Antoine Planchot, sur Twitter, proposait aux matheux le défi suivant :

Quand on me pose, directement ou indirectement, ce genre de question, je réagis toujours plus ou moins de la même façon 
- je lis l'énoncé en me disant que cela n'a pas l'air si difficile, et je retourne vaquer à mes occupation, 
- je libère 10 minutes de mon planning pour y réfléchir un peu plus précisément, 
- deux heures plus tard, j'enrage de ne pas encore avoir trouvé, 
- trois jours plus tard, je résous enfin le problème, maugréant qu'en fait, c'était trivial !

Pour ce problème de #RéformeTerritoriale, je suis toujours bloqué dans la phase 3, mais je suis persuadé qu'un lecteur bien plus malin que moi trouvera l'idée qui m'a échappé. Je ne suis donc pour l'instant pas encore en mesure d'aider François Hollande et son gouvernement, mais on va quand même essayer pour aujourd'hui de trouver une borne supérieure satisfaisante du nombre de cartes à envisager !

Si je compte bien, la France compte 26 régions (métropolitaine ou d'outre-mer), ainsi qu'une collectivité métropolitaine (la Corse) et 5 d'outre-mer.
Je ne crois pas qu'il ait été à un moment donné question de fusionner la Martinique avec la Franche-Compté, donc on ne prendra pas en compte les régions et collectivités d'outre-mer dans le problème. Puisque l'idée que la Corse puisse fusionner avec la région PACA a été étudiée, on prendra en compte dans le calcul 22 régions françaises.

CarteDeFrance
La France de la #RéformeTerritoriale : 22 régions, 44 frontières, 23 points triples

Les nombres de Bell
Première idée naïve : combien existe-t-il de façon de partionner un tel ensemble de 22 éléments ? De toutes ces partitions, on aura par exemple l'actuel projet de réforme territoriale :

ReformeTerritoriale
Une carte de France à 13 régions, dont la future Aquitaine-Poitou-Charente-Limousin, qu'il faudra renommer au plus vite.

Ou bien, la partition correspondant aux différents indicatifs téléphoniques locaux :

Projet06
Une carte de France à 5 régions

Mais il y aura également cette partition des régions Françaises en 3, en fonction du nombre de voyelles et consonnes dans leur nom. Cette dernière ne répond pas au problème initial, puisque les régions formées ne sont pas d'un seul tenant ("connexe"). Pas grave, on cherche pour l'instant une estimation haute du nombre de carte que l'on pourrait faire.

MauvaiseReforme4
Un redécoupage à exclure
(En bleu, les régions comptant plus de consonnes que de voyelles, en rouge les régions comptant plus de voyelles que de consonnes, et en blanc les régions égalitaires)

Le nombre de façons de partionner un ensemble à n éléments porte un nom, ce sont les nombres de Bell (du nom de Eric Temple Bell, mathématicien célèbre autant pour ses travaux en combinatoire que pour ses livres d'histoire des mathématiques ou de science-fiction). Le n-ième nombre de Bell, noté Bn, représente donc le nombre de partitions différentes d'un ensemble à n éléments.

B0 = 1 : il n'y a qu'une seule (non) façon de découper un ensemble vide.
B1 = 1 : il n'y a qu'une seule façon de découper un ensemble à 1 élément.
B2 = 2 : dans un ensemble à 2 éléments, on peut soit regrouper les deux éléments (première partition), soit ne pas les regrouper (seconde partition).
B3 = 5 : 1 partition en une seule région, 3 partitions en deux régions et 1 partition en trois régions.

GrandOuestRedecoupé
5 façons de redécouper le grand Ouest

B4 = 15. Pour trouver cette valeur, procédons méthodiquement, en rajoutant la haute-Normandie dans le grand Ouest. Après un redécoupage, 4 cas différents peuvent se produire, suivant le nombre de régions pouvant être annexées à la Haute-Normandie.
- zéroième cas : toutes les régions sont liées à la HN → 1 découpage
- unième cas : une région (parmi les 3 du grand Ouest) n'est pas annexée à la HN → 3 découpages
- deuxième cas : deux régions ne sont pas fusionnées à la HN, soit 3 paires possibles. Chacune de ces paires admet 2 découpages. Au total, on a donc 3 × 2 = 6 découpages
- troisième cas : aucune région n'est accolée à la HN. On ne compte donc que les découpages à 3 régions, soit B3 → 5 découpages.
On a bien B4 = 1 + 3 + 6 + 5 = 15.

On peut déterminer les valeurs plus grande de Bn en suivant la même trame, en fonction du nombre de région k qui ne seront pas annexées à une n+1-ième région. Parmi les n premières régions, il y a k parmi n façons de choisir ces k régions. Ces k régions admettant Bk découpages, on a donc, pour chaque k,  k parmi n×Bk découpages.

NombreDeBell

Les valeurs suivantes de Bn se calculent par récurrence


Au final, les valeurs plus grandes des Bn sont donc données par la formule de récurrence :

Formule Aitkin

Ainsi,  B5  = 1×B0 + 4×B1 + 6×B2  +4×B3 + 1×B4 = 52

Cette formule nous permet alors de savoir que, pour 22 régions, on peut compter
B22 = 4 506 715 738 447 323 (=4,5×1015) (=4,5 billiards de) partitions !

Les nombres de Bell ont des tas de propriétés fascinantes (par exemple, le n-ième nombre de Bell est la valeur en 0 de la n-ième dérivée de la fonction f(x) = exp(exp(x)-1)), mais il est inutile d'en parler davantage ici, puisque n'est de toutes évidence pas une bonne modélisation ; le nombre de partitions est bien supérieur au nombre de redécoupages.

Passage au dual
Plutôt que de chercher à fusionner les régions, cherchons donc plutôt à retirer les frontières entre régions. Ainsi, il n'y a plus aucun risque de fabriquer des régions non connexes.

La France (métropolitaine) compte 43 frontières, auquel on peut ajouter une 44e frontière P.A.C.A./Corse. Un redécoupage territorial consiste alors à choisir, pour chacune des 44 frontières, si il faut la garder ou non.
Avec cette approche, on peut donc donner une nouvelle estimation (haute) du nombre de partitions. Il y a donc (au plus) 244 = 17 592 186 044 416 (=1,8 ×1013) (=18 billions de) redécoupages !

Le problème de cette approche, c'est que plusieurs choix différents de frontières à retirer donnent un même redécoupage.

Tripoint_Problem
Autour du tripoint Haute-Normandie/Picardie/Île-de-Frane, 4 choix différents des frontières à retirer aboutissent à la fusion des mêmes régions

Ce problème apparaît pour chacun des tripoints (point où trois frontières se rejoignent), lorsque sur les trois frontières, une seule est gardée (la région formée est alors mal délimitée). Et des tripoints régionaux, il y en a 23 en France (sur les 44 frontières, 42 sont ratachées à au moins un tripoint).

Autour d'un tripoint, 3 frontières se rejoignent, ce qui devrait donner 23=8 redécoupages. Mais sur ces 8 redécoupages, 5 sont vraiment différents.
Pour dénombrer les découpages, on va partir d'un premier tripoint (par exemple, le tripoint Bretagne/Pays-de-la-Loire/Basse-Normandie), qui donne naissance à 5 découpages. On choisit ensuite un deuxième tripoint tel qu'il existe une frontière la reliant au premier tripoint (par exemple, le tripoint Pays-de-la-Loire/Basse-Normandie/Centre). On a alors deux nouvelles frontières que l'on peut garder ou non, ce qui multiplie par 2²=4 le nombre de découpages possibles. En regardant d'un peu plus près, on peut remarquer que multiplier par 3 à chaque nouveau tripoint suffit :

  • Si la frontière liant les deux tripoints est gardée, alors il faut qu'au moins une des deux nouvelles frontières soit gardée. On exclut donc un des 4 découpages, celui où les deux nouvelles frontières ne sont pas gardées.

  • Si la frontière liant les deux tripoints n'est pas gardée, il n'y a que deux possibilités pour créer des régions bien délimitées : soit on garde les deux nouvelles frontières, soit on en garde aucune.
    Dans certains cas, on multiplie par 3, dans d'autres, on multiplie par 2. Pour avoir une estimation haute, on multipliera toujours par 3.

A chacun des 22 tripoints suivant, on mutlipliera donc par 3 le nombre de découpages. Le résultat sera à multiplier par 2², pour prendre en compte les frontières sans tripoints (PACA/Corse et Nords-Pas-de-Calais/Picardie). On a donc au total :

5 × 322 × 4 = 627 621 192 180 (=6,3 × 1011) (=627 milliards de) découpages

Encore une fois, cette estimation est trop haute, pour plusieurs raisons. La première, c'est qu'on a supposé que chaque tripoint apporte deux nouvelles frontières, ce qui n'est pas toujours le cas. Suivant la façon dont on choisit le tripoint suivant, on peut avoir qu'une seule nouvelle frontière, voire aucune. Si seule une nouvelle frontière se présente, on ne multipliera le nombre de découpage que par 2 ; si un tripoint n'apporte pas de nouvelle frontière, on multipliera par 1.

La deuxième, c'est que la multiplication par 3 n'est pas optimale (on multiplie par 3 si la frontière est gardée (62% des découpages), et par 2 sinon. Un meilleur coefficient multiplicateur serait de 2,61). Les multiplicateurs 2 et 1 du paragraphe précédent ne sont eux non plus pas optimaux.

En prenant ceci en compte, cela donne * (environ) 2 000 000 000 (=2 milliards de) découpages. Cette dernière estimation a elle aussi été faite à la hache, d'autant qu'il y a encore d'autres points à prendre en compte pour parfaire le calcul. En effet, il est possible que les régions formées ne sont pas simplement connexes (si une région est enclavée à l'intérieur d'un autre), ce qui diminue encore une fois le nombre de redécoupages possibles.

En fait, la seule façon de connaître le nombre exact de redécoupages possibles serait d'écrire un programme informatique qui les énumère tous... Mais en attendant, j'estime le nombre de découpages à un milliard, et c'est mon dernier mot.


Pour les besoins des illustrations de l'article, j'ai fabriqué un petit script pour fabriquer de *jolies* cartes pour tester des réformes territoriales, disponibles sur eljjdt. En fouillant le script, vous y trouverez les données utiles pour faire un programme compteur.



Fin »