Pour choisir une chaussette plutôt que l'autre pour chaque paire d'une collection infinie, on a besoin de l'axiome du choix. Mais pour les chaussures, ce n'est pas la peine. [Bertrand Russel]

Jadis (avant le 20eme siècle), les mathématiques reposaient sur la théorie ensembles suivante :  un ensemble, c'est une collection de trucs, et on peut faire à peu près tout ce qu'on veut avec ces trucs. Cette vision, c'est la "théorie naïve des ensembles"...

Forcément, avec une base claire et rigoureuse comme celle-ci, on ne peut pas éviter tout un tas de paradoxes logique (du genre du paradoxe du barbier). Bref, la théorie naïve des ensembles est à jeter, il faut quelque chose de plus rigoureux.

Maintenant, l'ensemble des mathématiques (si je peux me permettre d'appeler ça "ensemble") repose sur 8 axiomes, choisis judicieusement et faisant consensus, donnant ce que l'on a le droit de faire avec des ensembles. Cet ensemble d'axiomes est appelé théorie ZF (de Zermelo et Fraenkel) et tout le monde est d'accord là-dessus. A priori, cette théorie n'amène à aucun paradoxes, et cela suffit pour bâtir l'Algèbre, l'Analyse et la plupart des domaines des mathématiques (même si le huitième ne sert pas forcément)

Mais il reste un axiome, à priori anodin, mais amenant son lot de paradoxes. Non pas des paradoxes logique mais plutôt des uppercuts à l'intuition. Cet axiome, c'est...


L'axiome du choix
L'axiome du choix, c'est le 9eme axiome, qui forme la théorie ZFC (Comme Zermelo-Fraenkel-Choix), le petit dernier, et, forcément, celui qui est rejeté.

Il énonce ceci (1)
Étant donnée une famille F non vide d'ensembles Ei non vides, il existe une fonction f, appelée fonction de choix qui à chacun d'entre eux associe un de ses éléments.

On peut voir les choses d'une façon équivalente (2)
Étant donnée une famille F non vide d'ensembles Ei non vides disjoints, on peut fabriquer l'ensemble des représentants des ensembles Ei.

Par exemple, le matin, vous avez besoin d'une fonction de choix pour vous habiller. Si F est votre armoire, on peut la définir comme ça :
F = {E1=l'ensemble des T-shirt/chemises, E2=l'ensemble des pantalons, E3=l'ensemble des sous-vêtements, E4=l'ensemble des paires de chaussettes, ...}
Une fonction de choix que l'on peut associer est celle dite du "dessus de la pile", ce qui donnera dans la pratique :
f(E1)=Le joli T-shirt qu'on aime porter chez soi, mais un peu honteux
f(E2)=Le pantalon noir un peu troué par le temps
etc. Certes, la tenue obtenue n'est peut-être pas la plus assortie, mais ce n'est qu'un exemple.

Ici, on a pu définir notre fonction de choix sans aide d'axiome, puisque que faire mon choix, j'ai simplement pris le premier qui venait (un procédé de choix). Le fait que l'on ait qu'un nombre fini de vêtements aide aussi dans le processus de choix.

Deuxième exemple, celui de la famille infinie de chaussures.
On dispose d'une famille infinie F de paires de chaussures. Il faut trouver un moyen de choisir un représentant pour chaque paire. Pour se faire, il suffit de dire que l'on prendra à chaque fois la chaussure droite. (On a pu le définir, donc pas encore besoin de l'axiome du choix)

Troisième exemple, celui de la famille infinie de chaussettes
Dans une paire de chaussette, on ne peut pas distinguer à priori la droite de la gauche. Il faut faire un choix pour en choisir une plutôt que l'autre. Pour trouver l'ensemble des représentants d'une famille infinie de paire de chaussettes, il faut choisir pour chaque paire un représentant. Si la famille est infinie, cela risque de prendre un temps infini. On ne peut pas dire une bonne fois pour toute quelle chaussette il faut prendre pour chaque paire, et l'axiome du choix permet de le remplacer : il existe un moyen de le faire (même si on ne le connaît pas)

Bref, l'axiome du choix permet de dire une bonne fois pour toute qu'il existe un choix, au lieu de passer un temps infini à construire ceux qui ne peuvent se faire sans formule.

Le paradoxe de Banach-Tarski
Une troisième forme de l'axiome du choix est la suivante :
Soit E un ensemble muni d'une relation d'équivalence. Alors, il existe un ensemble des représentants des classes d'équivalence.

Par exemple, en prenant un ensemble de crayons de couleurs, on peut trier les crayons par groupe de couleurs (les bleus, les verts...) (les classes d'équivalences) puis choisir dans chaque groupe l'un des crayons qui représentera ce groupe.

En munissant ℤ de la relation a~b ssi "a-b appartient à l'ensemble 3ℤ (l'ensemble des nombres divisibles par 3)", on obtient trois classe d'équivalence, notée ℤ/3ℤ={{0,3,6,...},{1,4,7,...},{2,5,8,...}}. Un ensemble des représentants est E={0,1,2}.

Maintenant, que se passe-t-il en prenant la relation suivante sur ℝ : a~b ssi "a-b appartient à l'ensemble ℚ" (l'ensemble des nombres que l'on peut écrire comme une fraction). Par exemple, les nombres 0 et √2 ne seront pas dans la même classe d'équivalence, car √2-0 n'est pas dans ℚ. On écrit √2+ℚ l'ensemble des nombres que l'on écrit sous la forme √2+q, où q∈ℚ. En prenant deux nombres a et b dans cet ensemble, on vérifie facilement que l'on a a~b.

De même, les nombres √2,  √3, π ou √π ne sont pas dans les mêmes classes d'équivalence. L'ensemble des classes d'équivalence, ressemble donc à quelque chose comme : ℝ/ℚ = {{0+ℚ},{√2+ℚ},{√3+ℚ},{π+ℚ},...}. Les points de suspensions représentent toutes les autres classes d'équivalences.

Mais que doit on mettre exactement dans ces points de suspension ?

On peut les compléter aussi loin que l'on veut, en choisissant à chaque fois de nouveaux représentants, mais on ne pourra jamais trouver une formule qui les donne toutes. Heureusement, l'axiome du choix est là, et nous dit que l'on peut le faire, et choisir ainsi dans chaque classe un élément qui représentera cette classe. L'ensemble des représentant ressemble à quelque chose comme F={0, √2, √3, π, √π, ...}, même si on ne sait pas bien ce qu'il y a dans les points de suspensions.

Et alors ? Eh bien, le hic arrive !
Un ensemble de nombre, on peut généralement le mesurer : si on un nombre tout seul, c'est un point isolé, il est de longueur nulle. Un segment [0,1] sera lui de longueur 1, l'ensemble [0,2] contient deux fois la longueur unité, il est donc de longueur 2. Cela donne une règle permettant de mesurer des ensembles.
Et l'ensemble F, que l'on vient de construire, quelle est sa longueur ?... voici notre problème : il n'a pas de longueur ! Cet ensemble n'est pas de longueur nulle, mais suivant la manière dont on le mesure, on ne trouve jamais le même résultat !

Un objet non mesurable et contraire à toute l'intuition physique que l'on a des choses, voilà un aspect fort dérangeant de l'axiome du choix !

Et les problème ne s'arrêtent pas là ! Le paradoxe de Banach Tarski en est l'exemple le plus flagrant :

L'énoncé du théorème de Banach-Tarski est le suivant :

Tarski

Il est possible de découper comme un puzzle une boule (de ℝ3) en 5 morceaux qui, une fois réassemblés, forment deux boules de même volume que la boule initiale.

Autrement dit, en faisant fondre une boule d'or, il est mathématiquement possible de reformer deux boules ayant le même volume que le premier ! Heureusement, aucun mathématicien n'a eu le vice de mettre en oeuvre ce théorème dans la réalité !

Le volume, c'est l'équivalent de la longueur en dimension 3. Si on a pu fabriquer un ensemble de points sans longueur grâce à l'axiome du choix, on peut faire de même avec une dimension en plus. L'astuce utilisée dans le théorème de Banach-Tarski, c'est qu'en découpant la boule en morceaux sans volume, on peut les réassembler différemment de manière à retrouver un volume double du premier !

Accepter l'axiome du choix, c'est accepter le paradoxe de Banach-Traski. Bienvenue dans les mathématiques contre-intuitive !

Le théorème de Zermelo
La première implication contre intuitive, c'est le lemme de Zorn («Tout ensemble inductif non vide admet un élément maximal »), mais surtout, le théorème de Zermelo : «Tout ensemble peut-être muni d'un bon ordre»

Un ensemble ordonné est un ensemble sur lequel on a définit une relation du type "plus petit que", c'est à dire, une relation permettant de comparer les éléments deux à deux. (Une relation d'ordre doit être réflexive, transitive et antisymétrique)

Par exemple, les ensembles de nombres comme ℕ peuvent être ordonnée par la relation ≤, un ensemble de mots (un dictionnaire, par exemple) peut-être ordonné par l'ordre alphabétique, un arbre généalogique peut-être ordonné par la relation "est descendant de".

Un ordre est dit "total" si tous les éléments de l'ensemble peuvent être comparés deux à deux. Parmi les exemples, l'arbre généalogique n'est pas un ordre total (Mon oncle paternel n'est pas descendant de ma mère, et vice-versa). Les ensembles ordonnés (ℕ,≤) ou (ℝ,≤) sont totaux (quand on prend deux nombres, il y en a toujours un plus petit que l'ordre), tout comme l'ordre donné par le dictionnaire

Si un ordre est total, il peut être "bon". Un ensemble est bien ordonné si tout sous-ensemble admet un plus petit élément. Par exemple, (ℕ,≤) est un bon ordre, puisque dans n'importe quel ensemble d'entier, il y en a un plus petit que tous les autres. Par contre, (ℝ,≤) n'est pas un bon ordre, puisque le sous-ensemble ]0,1]  ne possède pas d'élément plus petit que tous les autres, pour la relation ≤ classique. De même, l'ordre alphabétique n'est pas un bon ordre pour un dictionnaire ayant une infinité de mots, puisque l'ensemble des mots de la forme a...az ne possède pas de plus petit élément (on a ...≤aaaz≤aaz≤az≤z)

Quand un ensemble n'est pas bien ordonné, on peut parfois s'arranger pour bien l'ordonner. C'est le cas de (ℤ,≤), qui n'est pas bien ordonné. On peut créer un nouvel ordre ≤' de la façon suivante : on dit que a≤'b ssi 0≤a≤b ou b≤a≤0 ou a≤0≤b (cela revient à dire -1 ≤' -2 ≤' -3 ≤' -4 ≤' ... ≤' 0 ≤' 1 ≤' 2 ≤' 3 ≤' ...). On a ainsi "bien ordonné" l'ensemble ℤ.

Ce que nous dit le théorème de Zermelo (équivalent à l'axiome du choix) c'est que n'importe quel ensemble peut être ainsi bien ordonné. Notamment, l'ensemble ℝ peut être bien ordonné, d'après l'axiome du choix. Le hic, c'est que l'on a beau chercher depuis plus de 100 ans, on a jamais pu trouver de bon ordre sur cet ensemble !

Malgré ces deux paradoxes, l'axiome du choix est quand même largement utilisé, puisqu'il est finalement bien pratique ! De nombreux théorèmes d'algèbre ("tout espace vectoriel admet une base") , de topologie (théorème de Tychonoff) ou d'analyse (théorème de Hahn-Banach) l'utilisent, avec des résultats intuitifs ! Enfin, un résultat mathématique restera toujours bien plus satisfaisant s'il n'utilise pas cet axiome !

Accepter ou non l'axiome du choix, c'est de l'ordre du philosophique. A vous de choisir !