Aalto MOOC Matriisilaskenta 2019: Schurin hajotelma*

Diagonalisoinnin ideana on saattaa matriisi similariteettimuunnoksella \(\mathbf{A}=\mathbf{V}\mathbf{B}\mathbf{V}^{-1}\) mahdollisimman yksinkertaiseen muotoon eli diagonaalimatriisiksi.

Menettely ei kuitenkaan ole aina ongelmatonta:

Diagonalisointi ei ole aina mahdollista, koska hajotelmassa esiintyvä matriisi \(\mathbf{B}\) ei ole aina diagonaalimatriisi.
Lopuksi joudutaan laskemaan käänteismatriisi \(\mathbf{V}^{-1}\).
Hajotelman laskeminen on kuitenkin helppoa, jos matriisi \(\mathbf{U}\in \mathbb{C}^{n\times n}\) on unitaarinen eli \(\mathbf{U}^* = \mathbf{U}^{-1}\).

Koska

\[ \mathbf{I}=\mathbf{U} \mathbf{U}^* = \begin{pmatrix} \mathbf{u}_1 & \cdots & \mathbf{u}_n \end{pmatrix} \begin{pmatrix} \mathbf{u}_1^* \\ \vdots \\ \mathbf{u}_n^* \end{pmatrix} = \begin{pmatrix} \langle \mathbf{u}_1,\mathbf{u}_1 \rangle & \cdots & \langle \mathbf{u}_1,\mathbf{u}_n \rangle \\ \vdots & \ddots & \vdots\\ \langle \mathbf{u}_n,\mathbf{u}_1 \rangle & \cdots & \langle \mathbf{u}_n,\mathbf{u}_n \rangle \end{pmatrix}, \]

matriisi on unitaarinen täsmälleen silloin, kun sen sarakevektorit ovat ortonormaaleja.

Yleisessä tapauksessa voidana etsiä hajotelma, jossa on esiintyy diagonaalimatriisin sijasta yläkolmiomatriisi.

Lause (Schurin hajotelma) Jokaiselle \(\mathbf{A}\in \mathbb{C}^{n\times n}\) on olemassa yläkolmiomatriisi \(\mathbf{T}\in \mathbb{C}^{n\times n}\) ja unitaarinen matriisi \(\mathbf{U}\in \mathbb{C}^{n\times n}\) siten, että

\[ \mathbf{A} = \mathbf{U}\mathbf{T}\mathbf{U}^*. \]

Todistus:

Olk. \(\lambda\) jokin matriisin \(\mathbf{A}\in \mathbb{C}^{n\times n}\) ominaisarvo. Valitaan ortonormaalit kannat \(\{\mathbf{q}_1,\ldots,\mathbf{q}_k\}\) ja \(\{\mathbf{q}_{k+1},\ldots,\mathbf{q}_n\}\) avaruuksille \(E_\lambda(\mathbf{A})\) ja \(E_\lambda(\mathbf{A})^\bot\).

Saadaan

\[ \mathbf{A}\begin{pmatrix} \mathbf{q}_1&\cdots & \mathbf{q}_n \end{pmatrix} = \begin{pmatrix} \lambda \mathbf{q}_1 & \cdots & \lambda \mathbf{q}_k & \mathbf{A}\mathbf{q}_{k+1} & \cdots & \mathbf{A}\mathbf{q}_n \end{pmatrix} \] \[ = \begin{pmatrix} \mathbf{q}_1&\cdots & \mathbf{q}_n \end{pmatrix} \begin{pmatrix} \lambda & \cdots & 0 & \langle \mathbf{q}_1,\mathbf{A}\mathbf{q}_{k+1} \rangle & \cdots & \langle \mathbf{q}_1,\mathbf{A}\mathbf{q}_{n} \rangle \\ \vdots & \ddots & \vdots & \vdots & \ddots & \vdots \\ 0 & \cdots & \lambda & \langle \mathbf{q}_k,\mathbf{A}\mathbf{q}_{k+1} \rangle & \cdots & \langle \mathbf{q}_k,\mathbf{A}\mathbf{q}_{n} \rangle \\ \vdots & & & \vdots & & \vdots\\ 0 & \cdots & 0 & \langle \mathbf{q}_n,\mathbf{A}\mathbf{q}_{k+1} \rangle & \cdots & \langle \mathbf{q}_n,\mathbf{A}\mathbf{q}_{n} \rangle \end{pmatrix}. \]

Toisin sanoen

\[ \mathbf{A} = \mathbf{Q}_1 \begin{pmatrix} \lambda \mathbf{I} & \mathbf{B}_1 \\ 0 & \mathbf{A}_1 \end{pmatrix} \mathbf{Q}_1^*, \]

missä \(\mathbf{I}\in \mathbb{C}^{k\times k}\), \(\mathbf{B}_1\in \mathbb{C}^{k\times (n-k)}\) ja \(\mathbf{A}_1\in \mathbb{C}^{(n-k)\times(n-k)}\).

Toistetaan samat operaatiot matriisille \(\mathbf{A}_1\), jolloin saadaan

\[ \mathbf{A}_1= \mathbf{Q}_2\begin{pmatrix} \mu \mathbf{I} & \mathbf{B}_2 \\ 0 & \mathbf{A}_2 \end{pmatrix} \mathbf{Q}_2^*, \qquad \mu\in \sigma(\mathbf{A}). \]

Nyt

\[ \mathbf{A}= \mathbf{Q}_1 \begin{pmatrix} \lambda \mathbf{I} & \mathbf{B}_1 \\ 0 & \mathbf{Q}_2 \begin{pmatrix} \mu \mathbf{I} & \mathbf{B}_2 \\ 0 & \mathbf{A}_2 \end{pmatrix} \mathbf{Q}_2^* \end{pmatrix} \mathbf{Q}_1^* \] \[ = \mathbf{Q}_1 \mathbf{Q}_2 \begin{pmatrix} \lambda \mathbf{I} & &\mathbf{Q}_2^* \mathbf{B}_1 \mathbf{Q}_2 \\ 0 & \mu \mathbf{I} & \mathbf{B}_2 \\ 0 & 0 & \mathbf{A}_2 \end{pmatrix} \mathbf{Q}_2^* \mathbf{Q}_1^*. \]

Samaan tapaan voidaan jatkaa matriisin alanurkkaan saakka, jolloin päädytään hajotelmaan

\[ \mathbf{A} = \mathbf{Q}_1\cdots\mathbf{Q}_l \mathbf{T} \mathbf{Q}_l^* \cdots \mathbf{Q}_1^* = \mathbf{Q}\mathbf{T}\mathbf{Q}^*, \]

missä \(\mathbf{T}\) on yläkolmiomatriisi ja \(\mathbf{Q}\) on unitaarinen.

Last modified: Monday, 23 November 2015, 9:14 AM