Diagonalisoinnin ideana on saattaa matriisi similariteettimuunnoksella \(\mathbf{A}=\mathbf{V}\mathbf{B}\mathbf{V}^{-1}\) mahdollisimman yksinkertaiseen muotoon eli diagonaalimatriisiksi.
Menettely ei kuitenkaan ole aina ongelmatonta:
- Diagonalisointi ei ole aina mahdollista, koska hajotelmassa esiintyvä matriisi \(\mathbf{B}\) ei ole aina diagonaalimatriisi.
- Lopuksi joudutaan laskemaan käänteismatriisi \(\mathbf{V}^{-1}\).
- Hajotelman laskeminen on kuitenkin helppoa, jos matriisi \(\mathbf{U}\in \mathbb{C}^{n\times n}\) on unitaarinen eli \(\mathbf{U}^* = \mathbf{U}^{-1}\).
Koska
\[
\mathbf{I}=\mathbf{U} \mathbf{U}^*
= \begin{pmatrix}
\mathbf{u}_1 & \cdots & \mathbf{u}_n \end{pmatrix} \begin{pmatrix}
\mathbf{u}_1^* \\ \vdots \\ \mathbf{u}_n^* \end{pmatrix}
= \begin{pmatrix}
\langle \mathbf{u}_1,\mathbf{u}_1 \rangle & \cdots & \langle \mathbf{u}_1,\mathbf{u}_n \rangle \\ \vdots & \ddots & \vdots\\
\langle \mathbf{u}_n,\mathbf{u}_1 \rangle & \cdots & \langle \mathbf{u}_n,\mathbf{u}_n \rangle \end{pmatrix},
\]
matriisi on unitaarinen täsmälleen silloin, kun sen sarakevektorit ovat ortonormaaleja.
Yleisessä tapauksessa voidana etsiä hajotelma, jossa on esiintyy diagonaalimatriisin sijasta yläkolmiomatriisi.
Lause (Schurin hajotelma)
Jokaiselle \(\mathbf{A}\in \mathbb{C}^{n\times n}\) on olemassa yläkolmiomatriisi \(\mathbf{T}\in \mathbb{C}^{n\times n}\) ja unitaarinen matriisi \(\mathbf{U}\in \mathbb{C}^{n\times n}\) siten, että
\[
\mathbf{A} = \mathbf{U}\mathbf{T}\mathbf{U}^*.
\]
Todistus:
Olk. \(\lambda\) jokin matriisin \(\mathbf{A}\in \mathbb{C}^{n\times n}\) ominaisarvo. Valitaan ortonormaalit kannat \(\{\mathbf{q}_1,\ldots,\mathbf{q}_k\}\) ja \(\{\mathbf{q}_{k+1},\ldots,\mathbf{q}_n\}\) avaruuksille \(E_\lambda(\mathbf{A})\) ja \(E_\lambda(\mathbf{A})^\bot\).
Saadaan
\[
\mathbf{A}\begin{pmatrix}
\mathbf{q}_1&\cdots & \mathbf{q}_n \end{pmatrix}
= \begin{pmatrix}
\lambda \mathbf{q}_1 & \cdots & \lambda \mathbf{q}_k & \mathbf{A}\mathbf{q}_{k+1} & \cdots & \mathbf{A}\mathbf{q}_n \end{pmatrix}
\]
\[
= \begin{pmatrix}
\mathbf{q}_1&\cdots & \mathbf{q}_n \end{pmatrix}
\begin{pmatrix}
\lambda & \cdots & 0 & \langle \mathbf{q}_1,\mathbf{A}\mathbf{q}_{k+1} \rangle & \cdots & \langle \mathbf{q}_1,\mathbf{A}\mathbf{q}_{n} \rangle \\
\vdots & \ddots & \vdots & \vdots & \ddots & \vdots \\
0 & \cdots & \lambda & \langle \mathbf{q}_k,\mathbf{A}\mathbf{q}_{k+1} \rangle & \cdots & \langle \mathbf{q}_k,\mathbf{A}\mathbf{q}_{n} \rangle \\
\vdots & & & \vdots & & \vdots\\
0 & \cdots & 0 & \langle \mathbf{q}_n,\mathbf{A}\mathbf{q}_{k+1} \rangle & \cdots & \langle \mathbf{q}_n,\mathbf{A}\mathbf{q}_{n} \rangle \end{pmatrix}.
\]
Toisin sanoen
\[
\mathbf{A} = \mathbf{Q}_1 \begin{pmatrix}
\lambda \mathbf{I} & \mathbf{B}_1 \\ 0 & \mathbf{A}_1 \end{pmatrix} \mathbf{Q}_1^*,
\]
missä \(\mathbf{I}\in \mathbb{C}^{k\times k}\), \(\mathbf{B}_1\in \mathbb{C}^{k\times (n-k)}\) ja \(\mathbf{A}_1\in \mathbb{C}^{(n-k)\times(n-k)}\).
Toistetaan samat operaatiot matriisille \(\mathbf{A}_1\), jolloin saadaan
\[
\mathbf{A}_1= \mathbf{Q}_2\begin{pmatrix}
\mu \mathbf{I} & \mathbf{B}_2 \\ 0 & \mathbf{A}_2 \end{pmatrix} \mathbf{Q}_2^*, \qquad \mu\in \sigma(\mathbf{A}).
\]
Nyt
\[
\mathbf{A}= \mathbf{Q}_1 \begin{pmatrix}
\lambda \mathbf{I} & \mathbf{B}_1 \\ 0 & \mathbf{Q}_2 \begin{pmatrix}
\mu \mathbf{I} & \mathbf{B}_2 \\ 0 & \mathbf{A}_2 \end{pmatrix} \mathbf{Q}_2^* \end{pmatrix} \mathbf{Q}_1^*
\]
\[
= \mathbf{Q}_1 \mathbf{Q}_2 \begin{pmatrix} \lambda \mathbf{I} & &\mathbf{Q}_2^* \mathbf{B}_1 \mathbf{Q}_2 \\ 0 & \mu \mathbf{I} & \mathbf{B}_2 \\ 0 & 0 & \mathbf{A}_2 \end{pmatrix} \mathbf{Q}_2^* \mathbf{Q}_1^*.
\]
Samaan tapaan voidaan jatkaa matriisin alanurkkaan saakka, jolloin päädytään hajotelmaan
\[
\mathbf{A} = \mathbf{Q}_1\cdots\mathbf{Q}_l \mathbf{T} \mathbf{Q}_l^* \cdots \mathbf{Q}_1^* = \mathbf{Q}\mathbf{T}\mathbf{Q}^*,
\]
missä \(\mathbf{T}\) on yläkolmiomatriisi ja \(\mathbf{Q}\) on unitaarinen.