$\newcommand\N{\mathbb N}
\newcommand\Z{\mathbb Z}
\newcommand\Q{\mathbb Q}
\newcommand\R{\mathbb R}
\newcommand\C{\mathbb C}
\newcommand\too\longrightarrow
\renewcommand\phi\varphi
\renewcommand\epsilon\varepsilon
\renewcommand\hat\widehat
\renewcommand\tilde\widetilde
\renewcommand\vec\overrightarrow
\renewcommand\bar\overline
\newcommand\fl[1]{\left\lfloor #1\right\rfloor}
\newcommand\llbracket{[\![}
\newcommand\rrbracket{]\!]}
\newcommand\bbr[2]{\llbracket #1,#2\rrbracket}
\newcommand\todo{{\bf TODO }}
\newcommand\prob{\mathbb P}
\newcommand\esp{\mathbb E}
\newcommand\var{\mathbb V}
\newcommand\tribu{\mathfrak T}
\newcommand\stirling[2]{\begin{bmatrix}#1\\#2\end{bmatrix}}$

# Nombres de Stirling de premi√®re esp√®ce

Marc Lorenzi

13 mai 2025

In [None]:
import time

## Introduction

Pour tous $n,k\in\N$, $\mathfrak S_{n,k}$ est l'ensemble des permutations de $\mathfrak S_n$ poss√©dant $k$ orbites. On note 

$$\stirling n k=|\mathfrak S_{n,k}|$$

Les entiers $\stirling n k$ sont les *nombres de Stirling de premi√®re esp√®ce*.

La fonction `stirling` renvoie la matrice des $\stirling n k$ pour $n,k\in\bbr0N$.

In [None]:
def stirling(N):
    cs = [[0 for k in range(N + 1)] for n in range(N + 1)]
    cs[0][0] = 1
    for n in range(1, N + 1):
        for k in range(1, n + 1):
            cs[n][k] = cs[n - 1][k - 1] + (n - 1) * cs[n - 1][k]
    return cs

In [None]:
N = 10
S = stirling(N)
for n in range(N + 1):
    for k in range(N + 1):
        print('%8d' % S[n][k], end='')
    print()

La complexit√© temporelle et la complexit√© spatiale de `stirling` sont en $O(N^2)$. 

Pour de grandes valeurs de $N$, la complexit√© spatiale peut poser probl√®me. La fonction `stirling2` renvoie la ligne $N$ du tableau ci-dessus avec une complexit√© spatiale seulement en $O(N)$.

In [None]:
def stirling2(N):
    cs = (N + 1) * [0]
    cs[0] = 1
    for n in range(1, N + 1):
        cs1 = (N + 1) * [0]
        for k in range(1, n + 1):
            cs1[k] = cs[k - 1] + (n - 1) * cs[k]
        cs = cs1
    return cs

In [None]:
stirling2(10)

On peut maintenant calculer $\stirling{1000}{500}$ en temps et espace raisonnables.

In [None]:
stirling2(1000)[500]

## V√©rifications

On a l'union disjointe

$$\mathfrak S_n=\bigcup_{k=0}^n\mathfrak S_{n,k}$$

et donc

$$\sum_{k=0}^n\stirling n k=n!$$

In [None]:
def factorielle(n):
    p = 1
    for k in range(1, n + 1):
        p = p * k
    return p

In [None]:
print(sum(stirling2(1000)) == factorielle(1000))

## M√©mo√èsation

En utilisant directement la relation de r√©currence sur les nombres de Stirling, on obtient la fonction r√©cursive `stirling3` suivante.

In [None]:
def stirling3(n, k):
    if n == 0:
        if k == 0: return 1
        else: return 0
    elif k == 0: return 0
    else:
        return stirling3(n - 1, k - 1) + (n - 1) * stirling3(n - 1, k)        

In [None]:
[stirling3(10, k) for k in range(12)]

Cette fonction renvoie le bon r√©sultat mais sa complexit√© temporelle est ex√©crable. Calculons $\stirling{26}{13}$.

In [None]:
t1 = time.time()
a = stirling3(26, 13)
t2 = time.time()
print(a)
print(stirling2(26)[13])
print(t2 - t1)

Le lecteur pourra √©valuer `stirling3(30, 15)`, revenir 3 jours plus tard ... puis red√©marrer sa machine plant√©eüòÄ.

La raison de la mauvaise complexit√© de cette fonction est qu'elle recalcule ind√©finiment les m√™mes nombres de Stirling. Pour √©viter cela, on peut utiliser une technique de m√©mo√Øsation. 

Pour *m√©mo√Øser* une fonction $f$, on cr√©e un **cache**. Pour calculer $f(x)$ :

- Cas 1 : $f(x)$ est dans le cache. On renvoie la valeur en z√©ro seconde.
- Cas 2 : $f(x)$ n'est pas dans le cache. On appelle la fonction $f$, on met le r√©sultat dans le cache, et on est ramen√©s au premier cas.

Python permet d'automatiser cette technique. Ci-dessous, on cr√©e un dictionnaire `memo` (le cache) dont les cl√©s sont des couples $(n,k)$. On cr√©e ensuite une fonction `memoize` (on peut l'appeler comme on veut) prenant en param√®tre une fonction $f$ de 2 variables (ce sera plus tard une fonction `stirling4`). La fonction `memoize` renvoie une fonction `aux` qui fait ce que l'on vient de dire.

In [None]:
memo = {}
def memoize(f):
    
    def aux(n, k):
        if (n, k) not in memo: 
            memo[(n, k)] = f(n, k)
        return memo[(n, k)]
    
    return aux

Maintenant, faisons un copier-coller de `stirling3` et rajoutons simplement le **d√©corateur** `@memoize` avant la d√©finition de la fonction.

In [None]:
@memoize
def stirling4(n, k):
    if n == 0:
        if k == 0: return 1
        else: return 0
    elif k == 0: return 0
    else:
        return stirling4(n - 1, k - 1) + (n - 1) * stirling4(n - 1, k)        

In [None]:
t1 = time.time()
a = stirling4(26, 13)
t2 = time.time()
print(a)
print(stirling2(26)[13])
print(t2 - t1)

La fonction `stirling4` renvoie le r√©sultat en z√©ro seconde. Histoire d'√™tre vraiment certains, tentons le calcul de $\stirling{1000}{500}$.

In [None]:
t1 = time.time()
a = stirling4(1000, 500)
t2 = time.time()
print(a)
#print(stirling2(1000)[500])
print(t2 - t1)

Il faut seulement quelques dixi√®mes de seconde pour obtenir le r√©sultat. 

Trop beau pour √™tre vrai ! Y aurait-il un pi√®ge ? √âvidemment. Recalculons le m√™me nombre de Stirling.

In [None]:
t1 = time.time()
a = stirling4(1000, 500)
t2 = time.time()
print(a)
#print(stirling2(1000)[500])
print(t2 - t1)

Mince, maintenant il faut z√©ro seconde. Eh bien oui, c'est la m√©mo√Øsation. Alors, o√π est le souci ? Il est dans la m√©moire de l'ordinateur ...

In [None]:
len(memo)

Notre dictionnaire `memo` contient 376251 entr√©es. Et il va grossir, grossir, grossir ... imaginez un instant un programme qui utiliserait des milliers de fonctions m√©mo√Øs√©es ! Et si quelqu'un me demande quelle est la complexit√© de `stirling4`, je lui r√©ponds quoi ? Ma r√©ponse serait : ¬´ cela d√©pend de ce que tu as fait les trois derniers jours ¬ª.