# Inversion d'une matrice triangulaire

Marc Lorenzi

31 janvier 2021

In [None]:
import matplotlib.pyplot as plt
from fractions import Fraction
import random
import time

## 1. Pr√©liminaires 

### 1.1 Qu'allons-nous faire ?

On note $\mathcal T_n(\mathbb R)$ l'ensemble des matrices $n\times n$ triangulaires **sup√©rieures**.

Nous allons dans ce notebook nous int√©resser aux deux probl√®mes suivants. Soit $A\in\mathcal T_n(\mathbb R)$ une matrice inversible (l'inversibilit√© de $A$ est √©quivalente √† la non nullit√© de ses coefficients diagonaux).

- Probl√®me 1 : √âtant donn√© $Y\in\mathcal M_{n1}(\mathbb R)$, r√©soudre le syst√®me $AX=Y$, d'inconnue $X\in\mathcal M_{n1}(\mathbb R)$.
- Probl√®me 2 : Inverser la matrice $A$.

Nous allons en fait voir que si l'on sait r√©soudre le premier probl√®me on sait aussi r√©soudre le second, *√† condition d'anticiper un peu les choses*.

### 1.2 Op√©rations sur les listes

La fonction `sub` prend en param√®tres deux listes de nombres $X$ et $Y$ et renvoie $X-Y$.

In [None]:
def sub(X, Y):
    n = len(X)
    Z = n * [None]
    for i in range(n):
        Z[i] = X[i] - Y[i]
    return Z

In [None]:
sub([1, 2, 3, 4], [5, 4, 3, 2])

La fonction `mult` prend en param√®tres un nombre $t$ et une liste $X$ et renvoie la liste $tX$.

In [None]:
def mult(t, X):
    n = len(X)
    Y = n * [None]
    for i in range(n):
        Y[i] = t * X[i]
    return Y

In [None]:
mult(3, [1, 2, 3, 4])

### 1.3 Matrices triangulaires al√©atoires

La fonction `random_triang` prend un entier $n$ en param√®tre. Elle renvoie une matrice triangulaire sup√©rieure inversible ¬´ al√©atoire ¬ª de taille $n$.

In [None]:
def random_triang(n, M=1000):
    A = n * [None]
    for i in range(n):
        A[i] = n * [0]
        A[i][i] = random.randint(1, M)
        r = random.randint(0, 1)
        if r == 0: A[i][i] = - A[i][i]
        for j in range(i + 1, n):
            A[i][j] = random.randint(-M, M)
    return A

In [None]:
print(random_triang(10))

Clairement, nous allons avoir du mal √† lire des matrices affich√©es de la sorte. √âcrivons donc une fonction qui affiche joliment une matrice.

In [None]:
def print_joli(A):
    m = len(A)
    n = len(A[0])
    w = n * [0]
    for i in range(m):
        for j in range(n):
            w[j] = max(w[j], len(str(A[i][j])))
    fmt = ''
    for j in range(n):
        fmt += '%' + str(w[j] + 2) + 's'
    for i in range(m):
        print(fmt % tuple(A[i]))

In [None]:
print_joli(random_triang(10))

C'est beaucoup mieux.

## 2. R√©solution d'un syst√®me triangulaire

### 2.1 Un peu de th√©orie

Soit $A\in\mathcal T_n(\mathbb R)$ une matrice triangulaire sup√©rieure de taille $n$. Supposons que $A$ est inversible.

Soit $Y=(y_1\ y_2\ \ldots\ y_n)^T\in\mathcal M_{n1}(\mathbb R)$. Quelle est l'unique solution du syst√®me $AX=Y$, d'inconnue $X=(x_1\ x_2\ \ldots\ x_n)^T\in\mathcal M_{n1}(\mathbb R)$ ? Ce syst√®me est, si l'on d√©veloppe le tout,

$$\left\lbrace\begin{array}{llllllll}
A_{11}x_1&+&A_{12}x_2&\ldots&+&A_{1n}x_n&=&y_1\\
&&A_{22}x_2&\ldots&+&A_{2n}x_n&=&y_2\\
&&&\ldots\\
&&&&&A_{nn}x_n&=&y_n\\
\end{array}\right.$$

On a $A_{nn}x_n=y_n$ d'o√π, imm√©diatement,

$$x_n=\frac 1 {A_{nn}}y_n$$

Soit $i\in[|1,n|]$. Supposons trouv√©s $x_{i+1},\ldots,x_n$. La $i$√®me ligne du syst√®me $AX=Y$ est

$$\sum_{j=i}^nA_{ij}x_j=y_i$$

On en tire imm√©diatement

$$x_i=\frac 1 {A_{ii}}\left(y_i-\sum_{j=i+1}^nA_{ij}x_j\right)$$

### 2.2 La fonction Python

√âcrire une fonction r√©solvant le syst√®me $AX=Y$ est donc plus ou moins imm√©diat. Une simple boucle `for` suffit, en faisant simplement attention √† deux choses :

- Comme nous manipulons des listes Python, les indices vont de $0$ √† $n-1$ et pas de $1$ √† $n$.
- La boucle est parcourue ¬´ √† l'envers ¬ª, pour $i=n-1,n-2,\ldots, 0$.

On se contente dans la fonction `resoudre_triang` ci-dessous d'appliquer la formule trouv√©e dans le paragraphe pr√©c√©dent.

**Remarque.** Lorsque le param√®tre optionnel `exact` vaut `True`, les calculs sont fait de fa√ßon exacte (lorsque la matrice $A$ est √† coefficients entiers ou rationnels). Lorsque ce param√®tre vaut `False`,  les calculs sont fait en utilisant des `float`. Les calculs exacts sont tr√®s co√ªteux car les d√©nominateurs des fractions ont tendance √† devenir √©normes lorsque la taille de la matrice augmente.

In [None]:
def resoudre_triang(A, Y, exact=True):
    n = len(A)
    X = n * [None]
    for i in range(n - 1, -1, -1):
        X[i] = Y[i]
        for j in range(i + 1, n):
            X[i] = sub(X[i], mult(A[i][j], X[j]))
        if exact: X[i] = mult(Fraction(1, A[i][i]), X[i])
        else: X[i] = mult(1 / A[i][i], X[i])
    return X        

Testons avec une matrice $4\times 4$ et un second membre $Y$ tel que la solution du syst√®me soit $(1\ 2\ 3\ 4)^T$. Il suffit √©videmment de prendre $Y=A(1\ 2\ 3\ 4)^T$.

In [None]:
A = [[1, 2, 3, 4],
    [0, 1, 5, 6],
    [0, 0, 1, 7],
    [0, 0, 0, 1]]

Y = [[30], [41], [31], [4]]
X = resoudre_triang(A, Y)
print_joli(X)

### 2.3 Complexit√©

Quel est le nombre d'op√©rations n√©cessaire √† la r√©solution d'un syst√®me triangulaire ? Notons $C(n)$ cette quantit√©, qui d√©pend seulement de la taille du syst√®me √† r√©soudre.

La fonction `resoudre_triang` effectue une boucle `for` sur l'entier $i$. Cette boucle est ex√©cut√©e $n$ fois. √Ä la $i$√®me it√©ration, la boucle sur $j$ est effectu√©e $n-i-1$ fois. √Ä chaque it√©ration de la boucle sur $j$, on effectue 2 op√©rations (une soustraction et une multiplication). Enfin, √† chaque it√©ration de la boucle sur $i$, on effectue une division. Ainsi, chaque it√©ration de la boucle sur $i$ n√©cessite $2(n-i-1)+1=2n-2i-1$ op√©rations. Finalement,

$$C(n)=\sum_{i=0}^{n-1}(2n-2i-1)=-n+2\sum_{i=0}^{n-1} (n-i)$$

La somme $\sum_{i=0}^{n-1} (n-i)$ vaut $\frac 1 2 n (n+1)$. On en d√©duit

$$C(n)=-n+n(n+1)= n^2$$

**La r√©solution d'un syst√®me triangulaire de taille $n$ n√©cessite $n^2$ op√©rations.**

## 3. Inverser une matrice triangulaire

### 3.1 Se ramener √† ce qui pr√©c√®de

Trouver l'inverse de la matrice $A$ c'est aussi r√©soudre un syst√®me, le syst√®me $AX=Y$ o√π $Y=I_n$ est la matrice identit√© d'ordre $n$ et l'inconnue $X$ est une matrice $n\times n$. Il s'av√®re que les formules que nous avons obtenues au paragraphe 2.2 sont toujours valides, en interpr√©tant $x_i$ et $y_i$ non plus comme des nombres mais comme comme la $i$√®me ligne de la matrice $X$ et de la matrice $Y$, c'est √† dire des listes.

Mais alors, se pourrait-il que notre fonction `resoudre_triang` puisse aussi inverser les matrices ? On peut toujours r√™ver ... et pour une fois le r√™ve devient r√©alit√© üòÄ. En fait il n'y a rien √† √©crire, √ßa marche tout seul ou presque.

### 3.2 La fonction Python

√âcrivons juste une fonction `eye` qui renvoie la matrice identit√© d'ordre $n$.

In [None]:
def eye(n):
    E = n * [None]
    for i in range(n):
        E[i] = n * [0]
        E[i][i] = 1
    return E

In [None]:
print_joli(eye(5))

La fonction `inverse_triang` renvoie l'inverse de la matrice triangulaire $A$. Cett fonction appelle `resoudre_triang`  avec un second membre du syst√®me √©gal √† $I_n$.

In [None]:
def inverse_triang(A, exact=True):
    n = len(A)
    return resoudre_triang(A, eye(n), exact)

In [None]:
A = [[1, 2, 3, 4],
    [0, 1, 5, 6],
    [0, 0, 1, 7],
    [0, 0, 0, 1]]

print_joli(inverse_triang(A))

Tests sur une matrice al√©atoire ...

In [None]:
A = random_triang(5, M=100)
print_joli(A)
print_joli(inverse_triang(A))

**Exercice.** Ex√©cutez plusieurs fois la cellule ci-dessus. Que remarquez-vous √† propos des coefficients diagonaux de l'inverse de $A$ ? Pouvez-vous le prouver ?

### 3.3 V√©rifications

Nous sommes confiants dans notre fonction d'inversion de matrices, mais deux pr√©cautions valent mieux qu'une. La fonction `prodmat` renvoie le produit $AB$ de deux matrices $A$ et $B$. Elle prend en param√®tres une matrice $A\in\mathcal M_{pq}(\mathbb R)$ et une matrice $B\in\mathcal M_{qr}(\mathbb R)$. Elle renvoie la matrice $C\in\mathcal M_{pr}(\mathbb R)$ d√©finie pour $i\in[|0,p-1|]$ et $j\in[|0,r-1|]$ par

$$C_{ij}=\sum_{k=0}^{q-1}A_{ik}B_{kj}$$

In [None]:
def prodmat(A, B):
    p = len(A)
    q = len(B)
    r = len(B[0])
    C = p * [None]
    for i in range(p): C[i] = r * [0]
    for i in range(p):
        for k in range(q):
            for j in range(r):
                C[i][j] = C[i][j] + A[i][k] * B[k][j]
    return C

Prenons une matrice $A$, calculons son inverse $A'$, puis affichons le produit $AA'$. La cellule ci-dessous devrait tout le temps afficher la matrice identit√©.

In [None]:
A = random_triang(10, 1000)
#print_joli(A)
A1 = inverse_triang(A)
print_joli(prodmat(A, A1))

### 3.4 Temps de calcul

La r√©solution d'un syst√®me triangulaire n√©cessite $n^2$ op√©rations. Inverser une matrice triangulaire n√©cessite toujours $n^2$ op√©rations, mais ces op√©rations se font sur des listes de taille $n$. Chacune de ces op√©rations n√©cessite ainsi $n$ op√©rations sur des nombres, ce qui donne au total $n^3$ op√©rations pour l'obtention de l'inverse. Illustrons cela par un dessin.

La fonction `temps_calcul` renvoie le temps mis pour inverser une matrice de taille $n$. Le calcul est fait en virgule flottante, sinon les temps deviennent tr√®s vite prohibitifs.

In [None]:
def temps_calcul(n):
    A = random_triang(n)
    t1 = time.time()
    A1 = inverse_triang(A, False)
    t2 = time.time()
    return t2 - t1

Combien de temps faut-il pour inverser une matrice de taille 100 ? 

In [None]:
t100 = temps_calcul(100)
print(t100)

Si nous appelons $T_n$ le temps n√©cessaire √† l'inversion d'une matrice de taille $n$, nous devrions avoir

$$T_n\simeq Cn^3$$

o√π $C$ est une constante. Pourquoi ¬´ √† peu pr√®s √©gal ¬ª ? Tout simplement parce que le temps de calcul ne d√©pend pas **que** des op√©rations arithm√©tiques effectu√©es. Il y a aussi dans nos fonctions des cr√©ations de listes, des acc√®s √† des √©l√©ments de listes, des modifications d'√©l√©ments de listes, etc.

Que vaut $C$ ? Cette constante d√©pend √©videmment de la machine utilis√©e, et nous pouvons facilement en obtenir la valeur :

In [None]:
C = t100 / 100 ** 3
print(C)

La fonction `plot_temps` affiche :

- En noir, les temps de calcul pour des matrices de taille $n=$ 10, 20, 30, ..., $N$.
- En rouge, les temps ¬´ th√©oriques ¬ª $Cn^3$.

In [None]:
def plot_temps(N):
    temps = []
    ns = range(10, N + 1, 10)
    for n in ns:
        temps.append(temps_calcul(n))
    plt.plot(ns, temps, 'k')
    cs = [C * n ** 3 for n in ns]
    plt.plot(ns, cs, 'r')
    plt.xlim(10, N)
    plt.grid()

In [None]:
plt.rcParams['figure.figsize'] = (10, 6)

In [None]:
plot_temps(150)

La concordance entre les deux courbes n'est pas trop mauvaise ...

**Remarque finale.** On trouve par ci par l√† des gens affirmant pouvoir inverser une matrice triangulaire de taille $n$ en  $O(n^2)$ op√©rations. Supposons que ce soit le cas. Soient $A$ et $B$ deux matrices $n\times n$. On a le produit pas blocs suivant (matrices de taille $3n\times 3n$) :

$$\begin{pmatrix}I_n&A&0\\0&I_n&B\\0&0&I_n\end{pmatrix}\begin{pmatrix}I_n&-A&AB\\0&I_n&-B\\0&0&I_n\end{pmatrix}=I_{3n}$$

Ces deux matrices sont triangulaires. L'inverse de la premi√®re matrice est la seconde matrice, et on peut lire en haut √† droite de la seconde matrice le produit $AB$. Ainsi, si on savait inverser une matrice triangulaire  de taille $n$ en $O(n^2)$ op√©rations, on saurait multiplier deux matrices $n\times n$ quelconques en $O(n^2)$ op√©rations. Remarquons que $n^2$ est le nombre de coefficients de ces matrices !

Il existe une r√©ciproque √† ce que nous venons de dire : si on sait multiplier deux matrices $n\times n$ en temps $O(n^\omega)$ (o√π $\omega\ge 2$), alors on sait aussi inverser une matrice $n\times n$ quelconque en temps $O(n^\omega)$. Ne cherchez pas pourquoi, ce n'est pas trivial du tout.

Le ¬´ record actuel ¬ª (√† ma connaissance) pour la complexit√© du produit de deux matrices $n\times n$ (et donc pour l'inversion des matrices) est $O(n^{2.3728639})$ (Le Gall, 2014).

## 4. Mini projet

Vous pensez avoir tout compris ? Faites une copie de ce notebook. Modifiez la copie pour r√©soudre les deux probl√®mes (r√©solution de syst√®mes, inversion) pour les matrices triangulaires **inf√©rieures**.