# Sudoku

Marc Lorenzi - 10 mars 2018

In [None]:
import random

count = 0

## 1. Représentation des données

On représente un problème de Sudoku par une matrice 9x9. Les cases inconnues sont remplies par des zéros. Ci-dessous deux problèmes faciles.

In [None]:
pb01 = [
 [0,3,0,0,6,0,1,0,5],
 [0,2,0,4,0,0,3,9,0],
 [0,0,7,0,3,0,4,0,0],
 [0,6,1,0,5,0,9,0,0],
 [8,0,2,7,0,6,5,0,1],
 [0,0,5,0,4,0,7,6,0],
 [0,0,4,0,8,0,2,0,0],
 [0,7,8,0,0,1,0,4,0],
 [2,0,3,0,7,0,0,5,0]]

In [None]:
pb02 = [
[0,6,9,2,0,7,4,0,0],
[0,0,1,9,0,0,0,0,0],
[2,0,0,0,0,0,0,6,0],
[0,1,0,6,0,0,9,0,0],
[7,0,0,1,0,2,0,0,4],
[0,0,5,0,0,3,0,7,0],
[0,2,0,0,0,0,0,0,6],
[0,0,0,0,0,4,3,0,0],
[0,0,4,5,0,1,7,9,0]
]

Les problèmes `harder` et `ai_escargot` ci-dessous sont réputés très difficiles. Voir [ce site](http://aisudoku.com/index_en.html). Nous allons voir que leur réputation est surfaite.

In [None]:
harder = [
[8,0,0,0,0,0,0,0,0],
[0,0,3,6,0,0,0,0,0],
[0,7,0,0,9,0,2,0,0],
[0,5,0,0,0,7,0,0,0],
[0,0,0,0,4,5,7,0,0],
[0,0,0,1,0,0,0,3,0],
[0,0,1,0,0,0,0,6,8],
[0,0,8,5,0,0,0,1,0],
[0,9,0,0,0,0,4,0,0]
]

In [None]:
ai_escargot = [
[1,0,0,0,0,7,0,9,0],
[0,3,0,0,2,0,0,0,8],
[0,0,9,6,0,0,5,0,0],
[0,0,5,3,0,0,9,0,0],
[0,1,0,0,8,0,0,0,2],
[6,0,0,0,0,4,0,0,0],
[3,0,0,0,0,0,0,1,0],
[0,4,0,0,0,0,0,0,7],
[0,0,7,0,0,0,3,0,0]
]

Rajoutons à cela le problème vide, qui n'est pas un vrai problème pouisqu'il ne possède pas vraiment une unique solution :-).

In [None]:
vide = [
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0]
]

## 2. Conversions entre problèmes et grilles

Lors de la résolution du problème on a besoin, pour chaque case, de mémoriser les possibilités pour remplir cette case. Nous appellerons dans la suite "grille" une matrice 9x9 contenant à la ligne $i$, colonne $j$ la liste des possibilités pour remplir la case $(i,j)$.

Voici une fonction qui permet de transformer un problème en grille. Tout d'abord, on remplit les cases de la grille par la liste des entiers de 1 à 9. Puis, pour chaque case connue du problème, on impose sa valeur dans la grille.

La fonction `imposer`, qui reste à écrire, force la case $(i, j)$ de la grille à une valeur $c$. Puis elle élimine de la ligne $i$, de la colonne $j$, et du carré 3x3 contenant la case $(i,j)$, la possibilité $c$. 

In [None]:
def probleme_vers_grille(probleme):
    g = 9 * [None]
    for k in range(9): g[k] = 9 * [None]
    for i in range(9):
        for j in range(9):
            g[i][j] = list(range(1, 10))
    for i in range(9):
        for j in range(9):
            c = probleme[i][j]
            if c != 0:
                imposer(g, i, j, c)
    return g

La fonction réciproque prend en paramètre une grille censée être résolue : toutes les cases de la grille contiennent des listes à 1 élément. Elle renvoie le problème correspondant. Elle lève une exception en cas de case de la grille qui n'est pas un singleton.

In [None]:
def grille_vers_probleme(g):
    pb = [[0 for i in range(9)] for j in range(9)]
    for i in range(9):
        for j in range(9):
            if len(g[i][j]) != 1: raise Exception
            else: pb[i][j] = g[i][j][0]
    return pb

## 3. Affichage

La fonction `afficher_probleme` ... affiche joliment notre problème de Sudoku.

In [None]:
def afficher_probleme(pb):
    s = '' 
    for i in range(9):
        for j in range(9): s += ('%2d' % pb[i][j])
        if i != 8: s += '\n'
    print(s)

In [None]:
afficher_probleme(ai_escargot)

## 4. Résolution

### 4.1 La fonction de résolution

Nous y voilà. La fonction `resoudre` prend une grille $g$ en paramètre. 

- On commence par faire un peu de ménage en regardant les cases de la grille qui sont des singletons (ménage sur ligne, colonne, carré).
- Puis on choisit une case de la grille qui contient le moins possible d'éléments (le cas des singletons étant retenu en dernière extrémité).
- Si la case retenue est un singleton c'est que le problème est résolu.
- Si la case retenue est vide c'est que le problème est impossible.
- Sinon, on fait une copie toute neuve, $g_1$, de la grille $g$. On sélectionne une valeur $c$ au hasard parmi toutes les possibilités pour $g[i][j]$ et on l'impose dans $g_1$. On appelle ensuite récursivement `resoudre` sur $g_1$. Si cela réussit, tant mieux, on a fini. Sinon, on retire la possibilité $c$ pour la case $(i,j)$ de $g$ et on appelle résoudre sur le $g$ ainsi légèrement modifié.

In [None]:
def resoudre(g):
    global count
    count = count + 1
    for (i,j) in random_walk():
        if len(g[i][j]) == 1:
            c = g[i][j][0]
            imposer(g, i, j, c)
    i, j = choisir_case(g)
    if (i, j) == (-1, -1): return (g, True) # Grille résolue
    elif len(g[i][j]) == 0: return (g, False) # Grille impossible
    else:
        g1 = copie(g)
        c = choisir_hasard(g1[i][j])
        imposer(g1, i, j, c)
        (g2, b) = resoudre(g1)
        if not b: # échec ! 
            g[i][j].remove(c) # car c ne convient pas
            return resoudre(g)
        else:
            return (g2, True)

### 4.2 Copie d'une grille

Sans commentaire, voici la fonction de copie.

In [None]:
def copie(g):
    g1 = [[None for i in range(9)] for j in range(9)]
    for i in range(9):
        for j in range(9):
            g1[i][j] = g[i][j][:]
    return g1

### 4.3 Choix d'une case de la grille

La fonction `choisir_case` choisit une case de la grille ayant un nombre minimal d'éléments, mais si possible pas un seul. Elle renvoie les coordonnées de la case, sauf ti toutes les cases ont un seul élément (problème résolu !). Dans ce cas, la fonction renvoie le couple $(-1,-1)$. La grille est parcourue au hasard pour donner un peu plus de chance à la chance.

In [None]:
def random_list(n):
    s = list(range(n))
    for i in range(n):
        j = random.randint(0, i)
        s[i], s[j] = s[j], s[i]
    return s

In [None]:
print(random_list(81))

Voici une fonction qui renvoie un parcours au hasard des cases d'un tableau 9x9.

In [None]:
def random_walk():
    s = random_list(81)
    return [(x // 9, x % 9) for x in s]

In [None]:
print(random_walk())

In [None]:
def note(g, i, j):
    l = len(g[i][j])
    if l == 1: return 1000000
    else : return l

In [None]:
def choisir_case(g):
    u, v = 0, 0
    for (i, j) in random_walk():
        nij = note(g, i, j)
        nuv = note(g, u, v)
        if nij <= nuv: u, v = i, j
    if note(g, u, v) == 1000000: u, v = -1, -1
    return (u, v)

Fonction ci-dessous : RAS :-)

In [None]:
def choisir_hasard(s):
    k = random.randint(0, len(s) - 1)
    return s[k]

In [None]:
choisir_hasard([1,7,2,8,5,3])

### 4.4 Imposer une valeur à une case

Dernière ligne droite : imposer une valeur à une case. Facile ...

In [None]:
def imposer(g, i, j, c):
    g[i][j] = [c]
    ajuster_ligne(g, i, j, c)
    ajuster_colonne(g, i, j, c)
    ajuster_carre(g, i, j, c)

... euh oui, facile lorsqu'on aura écrit les fonctions d'ajustement !

In [None]:
def ajuster_ligne(g, i, j, c):
    for k in range(9):
        if k != j and c in g[i][k]:
            g[i][k].remove(c)

In [None]:
def ajuster_colonne(g, i, j, c):
    for k in range(9):
        if k != i and c in g[k][j]:
            g[k][j].remove(c)

In [None]:
def ajuster_carre(g, i, j, c):
    for (k, l) in carre(i, j):
        if (k != i or l != j) and c in g[k][l]:
            g[k][l].remove(c)

In [None]:
def carre(i, j):
    coin_x = 3 * (i // 3)
    coin_y = 3 * (j // 3)
    return [(coin_x + k, coin_y + l) for k in range(3) for l in range(3)] 

## 5. Tests

Nous sommes maintenant en mesure de tester notre fonction de résolution. Tant qu'à faire, on encapsule toutes les étapes dans une unique fonction que nous appellerons `solution`.

In [None]:
def solution(probleme):
    g = probleme_vers_grille(probleme)
    count = 0
    g1, b = resoudre(g)
    if not b:
        print("Pas de solution")
    else:
        afficher_probleme(grille_vers_probleme(g1))

On tente un problème facile ?

In [None]:
solution(pb01)

Réponse donnée en 0 seconde. On essaie plus difficile ?

In [None]:
solution(pb02)

Le problème ci-dessous est réputé difficile.

In [None]:
solution(harder)

La solution est donnée en moins de 10 secondes, au pire. 

Selon [ce site](http://aisudoku.com/index_en.html), voici un problème vraiment très très difficile. Bof.

In [None]:
solution(ai_escargot)

Difficile pour un humain ... mais pas pour un python :-).

## 6. Derniers doutes levés

Après quelques grilles vérifiées à l'oeil, je me décide. La fonction `verifier` prend un problème en paramètre et sa solution (?) et teste si le problème est vraiment résolu.

In [None]:
def verifier(pb, sol):
    b = True
    comparer(pb, sol)
    for i in range(9): b = b and verifier_ligne(sol, i)
    for j in range(9): b = b and verifier_colonne(sol, j)
    for x in range(3):
        for y in range(3):
            b = b and verifier_carre(sol, x, y)
    return b

In [None]:
def comparer(pb, sol):
    b = True
    for i in range(9):
        for j in range(9):
            if pb[i][j] != 0:
                b = b and pb[i][j] == sol[i][j]
    return b            

In [None]:
def verifier_ligne(pb, i):
    s = 0
    for j in range(9):
        s = s + pb[i][j]
    return s == 45

In [None]:
def verifier_colonne(pb, j):
    s = 0
    for i in range(9):
        s = s + pb[i][j]
    return s == 45

In [None]:
def verifier_carre(pb, x, y):
    s = 0
    for i in range(3):
        for j in range(3):
            s = s + pb[3 * x + i][3 * y + j]
    return s == 45

In [None]:
def solution_verifiee(probleme):
    g = probleme_vers_grille(probleme)
    g1, b = resoudre(g)
    if not b:
        print("Pas de solution")
    else:
        sol = grille_vers_probleme(g1)
        afficher_probleme(sol)
        print('')
        if verifier(probleme, sol): print('Grille résolue !!!')
        else: print('Aie aie aie, l''impossible s''est produit.')
        

In [None]:
%%time
solution_verifiee(ai_escargot)

In [None]:
%%time
count = 0
solution_verifiee(harder)
print("Nombre d'appels à resoudre : ", count)

## 7. Des milliers de grilles ...

Le fichier joint `sudoku17.txt` contient 49151 problèmes de Sudoku avec 17 cases connues au départ. 17 est à ce jour le nombre minimum connu de cases nécessaires pour qu'un problème de Sudoku ait une solution unique. Il se peut qu'on trouve mieux un jour ...

Certains de ces problèmes donnent du fil à retordre à l'algorithme, le numéro 39949 par exemple (plus d'une minute de recherche pour obtenir la solution).

La fonction `get_sudoku` prend un entier $k$ en paramètre et renvoie le $k$ième problème du fichier.

In [None]:
def get_sudoku(k):
    lines = open('sudoku17.txt', 'r').readlines() 
    s = lines[k]
    pb = [[0 for i in range(9)] for j in range(9)]
    for i in range(9):
        for j in range(9):
            pb[i][j] = int(s[9*i+j])
    return pb

In [None]:
%%time
pb = get_sudoku(2018)
afficher_probleme(pb)
print()
solution_verifiee(pb)

La fonction `random_sudoku` renvoie un problème pris au hasard dans le fichier, ainsi que le numéro de ce problème.

In [None]:
def random_sudoku():
    k = random.randint(0, 49150)
    return (get_sudoku(k), k)

In [None]:
%%time
pb, k = random_sudoku()
print('Problème numéro ', k)
afficher_probleme(pb)
print()
solution_verifiee(pb)