Publié le 15 mars 2026 · 8 min de lecture

Résoudre le Taquin en un minimum de coups : l’algorithme A* expliqué simplement

Vous venez de résoudre un Taquin 3×3 en 47 coups. Pas mal. Mais saviez-vous que la solution optimale en nécessitait peut-être seulement 22 ? L’écart entre votre résolution et la résolution parfaite s’explique par la différence entre l’intuition humaine et la précision algorithmique. L’algorithme qui trouve la solution la plus courte à tout coup s’appelle A* (prononcé « A étoile »), et il est étonnamment élégant. Voici comment il fonctionne, expliqué sans jargon.

🎮 Jouer au Taquin

Le problème : un labyrinthe invisible

Résoudre un Taquin, c’est naviguer dans un espace de possibilités gigantesque. Pour un Taquin 3×3 (8 pièces + 1 case vide), il existe 181 440 configurations possibles (la moitié des 9! permutations, l’autre moitié étant insolubles). Chaque déplacement de pièce vous amène à une nouvelle configuration. L’ensemble de ces configurations et des transitions entre elles forme un graphe - un réseau immense de nœuds connectés.

Comme l’explique notre article sur le Taquin et les mathématiques, ce graphe a des propriétés fascinantes. Trouver la solution optimale, c’est trouver le plus court chemin dans ce graphe, de la configuration initiale à la configuration résolue. C’est exactement ce que fait A*.

L’intuition derrière A*

Imaginez que vous cherchez le chemin le plus court entre votre maison et un restaurant dans une ville que vous ne connaissez pas. Vous avez deux informations :

Le chemin déjà parcouru : vous savez exactement combien de kilomètres vous avez marché depuis votre maison.
La distance à vol d’oiseau : vous pouvez estimer à quelle distance se trouve le restaurant en ligne droite.

À chaque croisement, vous choisissez la direction qui minimise la somme de ces deux valeurs : distance parcourue + distance estimée restante. C’est exactement le principe de A*. L’algorithme explore en priorité les chemins qui semblent les plus prometteurs, en combinant ce qu’il sait (les coups déjà joués) et ce qu’il estime (les coups restants).

Formellement, A* utilise une fonction d’évaluation : f(n) = g(n) + h(n), où g(n) est le coût du chemin parcouru et h(n) est l’estimation du coût restant (l’heuristique).

La Manhattan Distance : l’heuristique du Taquin

La clé de l’efficacité de A* réside dans le choix de l’heuristique - cette estimation de la distance restante. Pour le Taquin, l’heuristique la plus utilisée est la Manhattan Distance (aussi appelée « distance de Manhattan » ou « distance taxi »).

Le principe est simple : pour chaque pièce du Taquin, on calcule le nombre de déplacements horizontaux et verticaux nécessaires pour l’amener à sa position finale, en ignorant toutes les autres pièces. La Manhattan Distance totale est la somme de ces distances individuelles.

Prenons un exemple concret. Sur un Taquin 3×3, la pièce « 5 » se trouve en haut à gauche (position 0,0) mais devrait être au centre (position 1,1). Sa Manhattan Distance est |0-1| + |0-1| = 2. On répète ce calcul pour chaque pièce et on additionne. Si la somme totale est 14, cela signifie qu’il faudra au moins 14 coups pour résoudre le Taquin (en réalité probablement plus, car les pièces se gênent mutuellement).

Cette heuristique est dite admissible : elle ne surestime jamais le nombre de coups nécessaires. C’est cette propriété qui garantit que A* trouve toujours la solution optimale.

Comment A* explore les possibilités

Voici le fonctionnement de A* appliqué au Taquin, étape par étape :

1. Départ. L’algorithme commence avec la configuration initiale. Il calcule sa Manhattan Distance (disons 18). Le coût total estimé est f = 0 + 18 = 18 (zéro coup joué, 18 estimés).

2. Expansion. L’algorithme génère toutes les configurations accessibles en un coup (2 à 4 configurations selon la position de la case vide). Pour chacune, il calcule g (1 coup joué) + h (nouvelle Manhattan Distance). Disons que les voisins ont des scores f de 19, 17 et 20.

3. Choix du meilleur. A* choisit la configuration avec le score f le plus bas : celle à 17. C’est la plus prometteuse. Il l’explore en générant ses voisins à son tour.

4. Répétition. L’algorithme répète ce processus, choisissant toujours la configuration la plus prometteuse parmi toutes celles en attente. Les configurations non prometteuses restent en réserve - elles ne sont pas éliminées, au cas où le chemin le plus prometteur s’avérerait être une impasse.

5. Solution. Quand A* atteint la configuration résolue (Manhattan Distance = 0), il a trouvé le chemin optimal. Il remonte le chemin pour reconstituer la séquence complète de coups.

🎮 Jouer au Taquin

Pourquoi A* est optimal

La beauté de A* tient dans sa garantie d’optimalité. Tant que l’heuristique ne surestime jamais le coût restant (propriété d’admissibilité), la première solution trouvée par A* est forcément la meilleure. C’est un résultat mathématique démontré par Peter Hart, Nils Nilsson et Bertram Raphael en 1968.

Pourquoi ? Parce que A* n’atteint la configuration résolue que lorsque son score f est le plus bas de toutes les configurations en attente. Si une solution plus courte existait, elle aurait forcément un score f inférieur et aurait été explorée en premier.

Sans heuristique (h = 0), A* se réduit à l’algorithme de Dijkstra, qui explore uniformément dans toutes les directions. C’est correct mais lent. L’heuristique agit comme une boussole qui oriente l’exploration vers la solution, réduisant considérablement le nombre de configurations à examiner.

Humain vs algorithme : deux approches opposées

La résolution humaine et la résolution algorithmique du Taquin fonctionnent de manière radicalement différente. Comme le détaillent nos stratégies de résolution, les humains procèdent généralement par étapes : d’abord la première rangée, puis la deuxième, puis le carré restant. Cette approche est fiable mais sous-optimale : en fixant des pièces définitivement, on s’interdit des mouvements intermédiaires qui pourraient raccourcir la solution globale.

A*, lui, considère le puzzle dans sa globalité. Il n’hésite pas à « défaire » temporairement une pièce bien placée si cela permet de réduire le nombre total de coups. C’est contre-intuitif pour un humain, mais mathématiquement optimal.

Résultat concret : là où un bon joueur humain résout un Taquin 3×3 en 40 à 80 coups, A* trouve des solutions de 20 à 31 coups (31 étant le maximum pour n’importe quelle configuration 3×3 soluble).

La complexité explose avec la taille

Pour un Taquin 3×3, A* avec Manhattan Distance résout n’importe quelle configuration en quelques millisecondes. L’espace de recherche (181 440 configurations) est gérable.

Pour un Taquin 4×4 (15 pièces), la situation change drastiquement. L’espace de recherche explose à plus de 10 000 milliards de configurations. La Manhattan Distance seule ne suffit plus à guider efficacement l’exploration : il faut des heuristiques plus sophistiquées comme les Pattern Databases, qui précalculent les distances optimales pour des sous-ensembles de pièces.

Pour un Taquin 5×5 (24 pièces), le problème devient NP-difficile. Trouver la solution optimale dépasse les capacités des ordinateurs actuels pour la plupart des configurations. On se rabat alors sur des algorithmes approchés : IDA* (Iterative Deepening A*), qui utilise moins de mémoire, ou des algorithmes de recherche locale qui trouvent de bonnes solutions sans garantie d’optimalité.

Visualiser mentalement la résolution

Même si vous ne pouvez pas calculer A* de tête, comprendre son fonctionnement peut améliorer votre jeu. Voici comment intégrer l’intuition de A* dans votre résolution humaine :

Pensez en Manhattan Distance. Avant de déplacer une pièce, évaluez mentalement si le mouvement rapproche globalement le puzzle de sa solution. Si vous déplacez la pièce « 7 » d’une case vers sa position cible mais éloignez la pièce « 3 » de deux cases, le mouvement est probablement mauvais.

Acceptez les reculs temporaires. Comme A*, n’hésitez pas à déplacer temporairement une pièce déjà bien placée si cela facilite le placement d’autres pièces. Les meilleurs joueurs de Taquin savent que le chemin le plus court passe parfois par un détour.

Regardez le puzzle globalement. Au lieu de vous focaliser sur une seule pièce, essayez de percevoir l’état général du puzzle. Plusieurs pièces proches de leur cible ? Vous êtes sur la bonne voie. Une pièce très éloignée ? Priorisez-la.

Un algorithme qui dépasse le Taquin

A* n’est pas spécifique au Taquin. C’est l’un des algorithmes les plus utilisés en informatique : navigation GPS, planification de trajectoire pour les robots, intelligence artificielle dans les jeux vidéo, routage réseau. Partout où il faut trouver le chemin le plus court dans un espace de possibilités, A* est la référence.

En jouant au Taquin, vous manipulez - sans le savoir - les mêmes structures mathématiques que celles qui permettent à votre GPS de trouver le trajet le plus rapide ou à un drone de naviguer entre les obstacles. La différence, c’est que votre cerveau remplace l’algorithme par l’intuition. Une intuition imparfaite, certes, mais capable de choses qu’aucun algorithme ne sait faire : apprécier la beauté d’une solution élégante, ressentir la satisfaction d’un puzzle résolu, et décider de recommencer pour le plaisir.