Matriz ortogonal
En álxebra linear, unha matriz ortogonal, ou matriz ortonormal, é unha matriz cadrada de coeficientes reais cuxas columnas e filas son vectores ortonormais.
Unha forma de expresalo é
onde Modelo:Math é a transposta de Modelo:Mvar e Modelo:Mvar é a matriz identidade.
Isto leva á caracterización equivalente: unha matriz Modelo:Mvar é ortogonal se a súa transposición é igual á súa inversa:
onde Modelo:Math é a inversa de Modelo:Mvar.
Unha matriz ortogonal Modelo:Mvar é necesariamente invertíbel (con inverso Modelo:Math), unitaria (Modelo:Math), onde Modelo:Math é a adxunta hermitiana (conxugada transposta) de Modelo:Mvar e, polo tanto, normal (Modelo:Math) nos números reais. O determinante de calquera matriz ortogonal é +1 ou −1. Como transformación linear, unha matriz ortogonal conserva o produto interno dos vectores e, polo tanto, actúa como unha isometría do espazo euclidiano, como unha rotación ou unha reflexión Noutras palabras, é unha transformación unitaria.
O conxunto das matrices ortogonais Modelo:Math, baixo multiplicación, forma o grupo Modelo:Math, coñecido como grupo ortogonal. O subgrupo Modelo:Math que consta das matrices ortogonais co determinante +1 chámase grupo ortogonal especial. Como transformación linear, cada matriz ortogonal especial actúa como unha rotación.
Descrición xeral

Aínda que aquí só consideramos matrices de reais, a definición pódese usar para matrices con entradas de calquera corpo. No entanto, as matrices ortogonais xorden naturalmente a partir do produto escalar, mais para as matrices de números complexos hai que remitirse ao requisito de unitario.
As matrices ortogonais preservan o produto escalar,[1] polo tanto, para os vectores Modelo:Math e Modelo:Math nun espazo euclidiano real Modelo:Mvar-dimensional
onde Modelo:Mvar é unha matriz ortogonal.
Así as isometrías lineares de dimensión finita (rotacións, reflexións e as súas combinacións) producen matrices ortogonais. E viceversa: as matrices ortogonais implican transformacións ortogonais. No entanto, a álxebra linear inclúe transformacións ortogonais entre espazos que poden non ser nin de dimensión finita nin da mesma dimensión, e estes non teñen un equivalente en matriz ortogonal.
As matrices ortogonais son importantes por varias razóns, tanto teóricas como prácticas. As matrices ortogonais Modelo:Math forman un grupo baixo a multiplicación matricial, o grupo ortogonal denotado por Modelo:Math, que xunto aos seus subgrupos, é moi utilizado en matemáticas e ciencias físicas.
Exemplos
Abaixo amósanse algúns exemplos de pequenas matrices ortogonais e posíbeis interpretacións.
- (Transformación identidade)
- (rotación sobre a orixe)
- (reflexión a través do eixo "x")
- (permutación de eixos de coordenadas)
Construcións elementais
Dimensións máis baixas
As matrices ortogonais máis simples son as matrices [1] e [−1] de dimensións Modelo:Nowrap, que podemos interpretar como a identidade e o como a reflexión da liña real a través da orixe.
As matrices de dimensións Modelo:Nowrap teñen a forma
nas que a ortogonalidade esixe satisfacer as tres ecuacións
Tendo en conta a primeira ecuación, sen perda de xeneralidade sexa Modelo:Math, Modelo:Math; entón Modelo:Math, Modelo:Math ou Modelo:Math, Modelo:Math. Podemos interpretar o primeiro caso como unha rotación de Modelo:Mvar (onde Modelo:Math é a identidade), e o segundo como unha reflexión a través dunha liña nun ángulo de Modelo:Math.
O caso especial da matriz de reflexión con Modelo:Math xera unha reflexión sobre a recta a 45° dada por Modelo:Math e polo tanto troca Modelo:Mvar e Modelo:Mvar; é unha matriz de permutación, cun único 1 en cada columna e fila (e doutro xeito 0):
A identidade tamén é unha matriz de permutación.
Unha reflexión é a súa propia inversa, o que implica que unha matriz de reflexión é simétrica (igual á súa transposta) así como ortogonal. O produto de dúas matrices de rotación é unha matriz de rotación, e o produto de dúas matrices de reflexión tamén é unha matriz de rotación.
Dimensións máis altas
Independentemente da dimensión, sempre é posíbel clasificar as matrices ortogonais como puramente rotacionais ou non, mais para matrices Modelo:Nowrap e maiores, as matrices non de rotación poden ser máis complicadas que as reflexións. Por exemplo,
representan unha simetría central a través da orixe e unha rotación impropia, respectivamente, sobre o eixo Modelo:Math.
As rotacións complícanse en dimensións máis altas; xa non poden caracterizarse completamente por un ángulo e poden afectar a máis dun subespazo plano. É común describir unha matriz de rotación Modelo:Nowrap en termos dun eixo e un ángulo, mais isto só funciona en tres dimensións. Por riba das tres dimensións son necesarios dous ou máis ángulos, cada un asociado a un plano de rotación.
No entanto, temos bloques de construción elementais para permutacións, reflexións e rotacións que se aplican en xeral.
Primitivas
A permutación máis elemental é unha transposición obtida a partir da matriz identidade trocando dúas filas. Calquera matriz de permutación Modelo:Math pode construírse como un produto de non máis de Modelo:Math transposicións.
Unha reflexión de Householder constrúese a partir dun vector non nulo Modelo:Math como
Aquí o numerador é unha matriz simétrica mentres que o denominador é un número, a magnitude ao cadrado de Modelo:Math.
Unha rotación de Givens actúa nun subespazo bidimensional (planar) abranguido por dous eixos de coordenadas, xirando nun ángulo elixido.
Unha rotación de Jacobi ten a mesma forma que unha rotación de Givens, mais úsase para poñer a cero as dúas entradas fóra da diagonal dunha submatriz simétrica Modelo:Nowrap.
Propiedades
Propiedades da matriz
Unha matriz cadrada real é ortogonal se e só se as súas columnas forman unha base ortonormal do espazo euclidiano Modelo:Math co produto escalar euclidiano, que tamén e o caso se e só se as súas filas forman unha base ortonormal de Modelo:Math.
O determinante de calquera matriz ortogonal é +1 ou −1. Isto despréndese dos feitos básicos sobre os determinantes, como segue:
A inversa non é verdade; ter un determinante de ±1 non é garantía de ortogonalidade, mesmo con columnas ortogonais, como mostra o seguinte contraexemplo.
Nas matrices de permutación o determinante coincide coa sinatura, sendo +1 ou −1 xa que a paridade da permutación é par ou impar, pois o determinante é unha función alterna das filas.
Máis forte que a restrición do determinante é o feito de que unha matriz ortogonal sempre pode ser diagonalizada sobre os números complexos para mostrar un conxunto completo de valores propios onde todos eles deben ter módulo (complexo) 1.
Propiedades do grupo
O inverso de toda matriz ortogonal é de novo ortogonal, así como o produto matricial de dúas matrices ortogonais. De feito, o conxunto de todas as matrices ortogonais Modelo:Math satisfai todos os axiomas dun grupo. É un grupo de Lie compacto de dimensión Modelo:Math, chamado grupo ortogonal e denotado por Modelo:Math.
As matrices ortogonais cuxo determinante é +1 forman un subgrupo normal conexo de Modelo:Math de índice 2, o grupo ortogonal especial Modelo:Math de rotacións. O grupo cociente Modelo:Math é isomorfo a Modelo:Math, co mapa de proxección escollendo [+1] ou [−1] segundo o determinante.
As matrices ortogonais co determinante −1 non inclúen a identidade, polo que non forman un subgrupo senón só un coset; tamén é (separadamente) conexo.
Considere agora as matrices Modelo:Math ortogonais coa entrada inferior dereita igual a 1. O resto da última columna (e da última fila) deben ser ceros e o produto de dúas matrices calquera ten a mesma forma. O resto da matriz é unha matriz ortogonal Modelo:Math; así Modelo:Math é un subgrupo de Modelo:Math (e de todos os grupos superiores).
Dado que unha reflexión elemental en forma de Matriz de Householder pode reducir calquera matriz ortogonal a esta forma restrinxida, unha serie desas reflexións pode levar calquera matriz ortogonal á identidade; polo tanto, un grupo ortogonal é un grupo de reflexión. A última columna pódese fixar a calquera vector unitario, e cada opción dá unha copia diferente de Modelo:Math en Modelo:Math; deste xeito Modelo:Math é un fibrado sobre a esfera unitaria Modelo:Math con fibra Modelo:Math.
Do mesmo xeito, Modelo:Math é un subgrupo de Modelo:Math; e calquera matriz ortogonal especial pode xerarse cunha Rotación de Givens usando un procedemento análogo. A estrutura do fibrado persiste: Modelo:Math. Unha soa rotación pode producir un cero na primeira fila da última columna, e a series de rotacións Modelo:Math poñerán a cero todas menos a última fila da última columna dunha matriz de rotación Modelo:Math. Dado que os planos son fixos, cada xiro só ten un grao de liberdade, o seu ángulo. Por indución, Modelo:Math ten, polo tanto
graos de liberdade, e tamén o fai Modelo:Math.
As matrices de permutación son aínda máis sinxelas; non forman un grupo de Lie, senón só un grupo finito, de orde [[factorial|Modelo:Math]] que é a do grupo simétrico Modelo:Math. Polo mesmo tipo de argumento, Modelo:Math é un subgrupo de Modelo:Math. As permutacións pares producen o subgrupo de matrices de permutación do determinante +1, de orde Modelo:Math que é o grupo alternante.
Forma canónica
De forma máis ampla, o efecto de calquera matriz ortogonal sepárase en accións independentes en subespazos bidimensionais ortogonais. É dicir, se Modelo:Mvar é ortogonal especial, sempre se pode atopar unha matriz ortogonal Modelo:Mvar, unha mudanza de base (rotacional), que leva a Modelo:Mvar en forma diagonal de bloque:
onde as matrices Modelo:Math son matrices Modelo:Nowrap de rotación, e coas entradas restantes a cero.
Excepcionalmente, un bloque de rotación pode ser diagonal, Modelo:Math. Así, negando unha columna se é necesario, e observando que unha reflexión Modelo:Nowrap diagonaliza a +1 e −1, calquera matriz ortogonal pódese levar á forma
As matrices Modelo:Math dan pares conxugados de valores propios situados na circunferencia unitaria no plano complexo; polo que esta descomposición confirma que todos os valores propios teñen valor absoluto 1. Se Modelo:Mvar é impar, hai polo menos un autovalor real, +1 ou −1; para unha rotación Modelo:Nowrap, o vector propio asociado a +1 é o eixo de rotación.
Álxebra de Lie
Supoña que as entradas de Modelo:Mvar son funcións diferenciábeis de Modelo:Mvar e que Modelo:Math dá Modelo:Math. Diferenciar a condición de ortogonalidade
produce
A avaliación en Modelo:Math (Modelo:Math) implica entón
En termos de grupos de Lie, isto significa que a álxebra de Lie dun grupo de matrices ortogonais consta de matrices antisimétricas. Indo na outra dirección, a exponencial dunha matriz de calquera matriz antisimétrica é unha matriz ortogonal (de feito, ortogonal especial).
Por exemplo, a física de obxectos tridimensionais que se chama velocidade angular é unha rotación diferencial e por tanto un vector da álxebra de Lie tanxente a Modelo:Math.
Dado Modelo:Math, sendo Modelo:Math un vector unitario, a forma correcta de matriz antisimétrica de ω é
A exponencial desta é a matriz ortogonal para a rotación arredor do eixo Modelo:Math polo ángulo Modelo:Mvar; facendo Modelo:Math, Modelo:Math, temos
Álxebra linear numérica
Beneficios
A análise numérica aproveita moitas das propiedades das matrices ortogonais para a álxebra linear numérica, e xorden de forma natural. Por exemplo, moitas veces é desexábel calcular unha base ortonormal para un espazo, ou unha mudanza ortogonal de bases; ambos transformacións adoptan a forma de matrices ortogonais.
Ter determinante ±1 e todos os eigenvalores de magnitude 1 é de gran beneficio para a estabilidade numérica. Unha implicación é que o número de condicionamento é 1 (que é o mínimo), polo que os erros non se amplían ao multiplicar cunha matriz ortogonal. Moitos algoritmos, por este motivo, usan matrices ortogonais como as reflexións de Householder e as rotacións de Givens.
As permutacións son esenciais para o éxito de moitos algoritmos, incluíndo o cabalo de batalla da eliminación de Gauss con pivote parcial (onde as permutacións fan o pivote). Porén, raramente aparecen explicitamente como matrices; a súa forma especial permite unha representación máis eficiente, como unha lista de índices Modelo:Mvar.
Así mesmo, os algoritmos que usan matrices de Householder e Givens normalmente usan métodos especializados de multiplicación e almacenamento. Por exemplo, unha rotación de Givens afecta só a dúas filas dunha matriz que multiplica, mudando unha multiplicación matricial completa de orde Modelo:Math a unha orde moito máis eficiente Modelo:Mvar. Cando os usos destas reflexións e rotacións introducen ceros nunha matriz, o espazo libre é suficiente para almacenar datos suficientes para reproducir a transformada e facelo de forma robusta. (Seguindo a Modelo:Harvtxt, "non" almacenamos un ángulo de rotación, que non é efectivo computacionalmente.)
Descomposicións
Unha serie de descomposicións matriciais importantes Modelo:Harv implican matrices ortogonais, incluíndo especialmente:
- [[Descomposición QR|Descomposición Modelo:Mvar]]
- Modelo:Math, Modelo:Mvar ortogonal, Modelo:Mvar triangular superior.
- Descomposición de valores singulares
- Modelo:Math, Modelo:Mvar e Modelo:Mvar matriz ortogonal, Modelo:Math diagonal.
- Desomposición propia dunha matriz simétrica (descomposición segundo o teorema espectral)
- Modelo:Math, Modelo:Mvar simétrica, Modelo:Mvar ortogonal, Modelo:Math diagonal.
- Descomposición polar
- Modelo:Math, Modelo:Mvar ortogonal, Modelo:Mvar positiva-semidefinida simétrica.
Exemplos
Considere un sistema sobredeterminado de ecuacións lineares, como pode ocorrer con medicións repetidas dun fenómeno físico para compensar os erros experimentais.
Escribimos , onde é de dimensións Modelo:Math, Modelo:Math. Unha descomposición Modelo:Mvar reduce a Modelo:Mvar triangular superior. Por exemplo, se é de dimensións Modelo:Nowrap entón Modelo:Mvar ten a forma
O problema de mínimos cadrados lineares consiste en atopar o Modelo:Math que minimiza , o que equivale a proxectar Modelo:Math no subespazo abranguido polas columnas de . Asumindo que as columnas de Modelo:Mvar (e, polo tanto, Modelo:Mvar) son independentes, a solución de proxección atópase a partir de Modelo:Math.
Agora Modelo:Math é cadrada (Modelo:Math) e invertíbel, e tamén é igual a Modelo:Math. Pero as filas inferiores de ceros en Modelo:Mvar son superfluas no produto, que xa está en forma factorizada triangular superior triangular inferior, como na eliminación gaussiana (descomposición de Cholesky). Aquí a ortogonalidade é importante non só para reducir Modelo:Math a Modelo:Math, senón tamén para permitir a solución sen aumentar os problemas numéricos.
No caso dun sistema linear que está indeterminado, que se corresponde con unha matriz non invertíbel, a descomposición de valores singulares (SVD) é igualmente útil. Con Modelo:Mvar factorizado como Modelo:Math, unha solución satisfactoria usa a pseudoinversa de Moore-Penrose, Modelo:Math, onde Modelo:Math só substitúe cada entrada diagonal distinta de cero polo seu recíproco. Estabelece Modelo:Math como Modelo:Math.
O caso dunha matriz invertíbel cadrada tamén ten interese. Supoña, por exemplo, que Modelo:Mvar é unha matriz de rotación Modelo:Nowrap que foi calculada como a composición de numerosas voltas e voltas. A coma flotante non coincide co ideal matemático dos números reais, polo que Modelo:Mvar perdeu gradualmente a súa verdadeira ortogonalidade. Un proceso de Gram-Schmidt podería ortogonalizar as columnas, mais non é o método máis fiábel, nin o máis eficiente nin o máis invariante.
A descomposición polar factoriza unha matriz nunha parella de matrices, onde unha delas é a única matriz ortogonal máis próxima á matriz dada, ou unha das máis próximas se a matriz dada é singular. (A proximidade pódese medir mediante calquera norma matricial invariante baixo unha mudanza de base ortogonal).
Para unha matriz case ortogonal, pódese conseguir unha converxencia rápida cara ao factor ortogonal mediante unha variante do "Método de Newton" debido a Modelo:Harvtxt, promediando repetidamente a matriz coa súa transposta inversa. Modelo:Harvtxt publicou un método acelerado cun test de converxencia adecuado.
Por exemplo, considere unha matriz non ortogonal para a cal o algoritmo de media simple leva sete pasos
e no que a aceleración recórtao a dous pasos (con Modelo:Mvar = 0,353553, 0,565685).
Gram-Schmidt produce unha solución inferior, mostrada por unha distancia de Frobenius de 8,28659 en lugar do mínimo 8,12404.
Matriz ortogonal máis próxima
O problema de atopar a matriz ortogonal Modelo:Mvar máis próxima a unha matriz dada Modelo:Mvar está relacionado co problema de Procusto ortogonal. Hai varias formas diferentes de obter a solución única, a máis sinxela é tomar a descomposición en valores singulares de Modelo:Mvar e substituír os valores singulares por uns.
Outro método expresa o Modelo:Mvar explicitamente pero require o uso dunha raíz cadrada dunha matriz:[2]
Isto pódese combinar co método babilónico para extraer a raíz cadrada dunha matriz para dar unha recorrencia que converxe a unha matriz ortogonal cadráticamente:
onde Modelo:Math.
Estas iteracións son estábeis sempre que o número de condicionamento de Modelo:Mvar sexa inferior a tres.[3]
Usando unha aproximación de primeira orde do inverso e a mesma inicialización resulta na iteración modificada:
- .
- .
- .
Spin e pin
Un problema técnico sutil afecta algúns usos das matrices ortogonais. Non só os compoñentes do grupo co determinante +1 e −1 non son conexos entre si, mesmo a compoñente +1, Modelo:Math, non é simplemente conexo (agás SO(1), que é trivial). Así, ás veces é vantaxoso, ou mesmo necesario, traballar cun recubrimento de SO(n),o grupo spin, Modelo:Math.
Así mesmo, Modelo:Math ten grupos de recubrimento, os grupos de pin, Pin(n). Para Modelo:Math, Modelo:Math é simplemente conexo e, polo tanto, o grupo de recubrimento universal para Modelo:Math. De lonxe, o exemplo máis famoso dun grupo de spin é Modelo:Math, que non é máis que Modelo:Math, ou o grupo de cuaternións unitarios.
Os grupos Pin e Spin atópanse dentro das álxebras de Clifford, que se poden construír a partir de matrices ortogonais.
Matrices rectangulares
Se Modelo:Mvar non é unha matriz cadrada, as condicións Modelo:Math e Modelo:Math non son equivalentes. A condición Modelo:Math di que as columnas de Q son ortonormais. Isto só pode ocorrer se Modelo:Mvar é unha matriz Modelo:Math con Modelo:Math (debido á dependencia linear). Do mesmo xeito, Modelo:Math di que as filas de Modelo:Mvar son ortonormais, o que require Modelo:Math.
Non existe unha terminoloxía estándar para estas matrices. Chámanse de varias maneiras "matrices semi-ortogonais", "matrices ortonormais", "matrices ortogonais" e ás veces simplemente "matrices con filas/columnas ortonormais".
Para o caso Modelo:Math, as matrices con columnas ortonormais poden denominarse k-marcos ortogonais e son elementos da variedade de Stiefel.
Notas
Véxase tamén
Bibliografía
- Modelo:Cita revista
- Modelo:Cita libro
- Modelo:Cita libro
- Modelo:Cita revista
- Modelo:Cita vevista [1]
- Modelo:Cita revista
- Modelo:Cita revista
- Modelo:Cita revista
Outros artigos
- Sistema biortogonal
- Ortogonal
- Ortonormal
- Matriz nilpotente
- Valor propio, vector propio e espazo propio
Ligazóns externas
- ↑ "Apuntes de matemáticas en liña de Paul", The Paulmar University]8. 3(c)
- ↑ "Buscando a matriz ortonormal máis próxima", Berthold K.P. Corno, MIT.
- ↑ "Método de Newton para a raíz cadrada da matriz" Modelo:Webarchive, Nicholas J. Higham, Mathematics of Computation, Number 191846, Volume 19.