4 votos

Demostrar que esta matriz es invertible para $n < m-1$

Pruébalo $(n+1)\times (n+1)$ matriz $\bf{A}$ es invertible para $n < m-1$ y el $x_k$ distinto,

\begin{bmatrix} m &\sum_{k=1}^mx_k &\sum_{k=1}^mx_k^2 &\cdots &\sum_{k=1}^mx_k^n \\\\ \sum_{k=1}^mx_k &\sum_{k=1}^mx_k^2 & \cdots &\cdots&\sum_{k=1}^mx_k^{n+1} \\\\ \vdots &\vdots &\ddots &&\vdots \\ & & & &&\\\\ \sum_{k=1}^mx_k^n&\sum_{k=1}^mx_k^{n+1}&\cdots&\cdots&\sum_{k=1}^mx_k^{2n} \end{bmatrix}

Seguro que muchos de ustedes la reconocen como la matriz normal de mínimos cuadrados polinómicos.

La pista del libro es la siguiente:

Supongamos que $\bf{A}$ es singular y que $\bf{c}\neq\bf{0}$ i $\bf{c}$$ ^\text{T} $$\bf{Ac}$$ \;=0 $. Show that the $ n $th-degree polynomial whose coefficients are the coordinates of $ \bf{c} $ has more than $ n$ raíces, y utilizar esto para establecer una contradicción.

Trabajé en esto durante bastante tiempo sin éxito. En primer lugar no puedo entender por qué la matriz se multiplica a la izquierda por la transposición de $\bf{c}$ Supongo $\bf{c}$ se elige porque es un elemento no trivial en el núcleo, pero que no requiere su transposición a la izquierda.

En segundo lugar, las cosas se complican bastante cuando empiezas a jugar con las series, así que esperaba algo que evitara los cálculos complicados. Es el producto de la matriz de Vandermonde y su transpuesta, pero no son cuadradas, así que parecía inútil.

Lo más cerca que pude llegar a relacionar esto con el polinomio $c_0+c_1t+...+c_nt^n$ era considerar las filas del vector $\bf{A\cdot c}$ . Me refiero a considerar la primera fila (igual a cero) y dividirla por $m$ obtenemos: $$c_0 + c_1\frac{\sum_{k=1}^mx_k}{m}+...+c_n\frac{\sum_{k=1}^mx_k^n}{m}=0.$$

Si los distintos $\frac{\sum_{k=1}^mx_k^r}{m}$ eran poderes de $\frac{\sum_{k=1}^mx_k}{m}$ entonces sería una raíz, pero está claro que no lo son. O en lugar de dividir por $m$ se podría dividir en $m>n+1$ expresiones de la forma $$c_0 + c_1x_k + ... + c_nx_k^n\; ,$$ tal que su suma sea igual a cero, pero eso no implica que todas tengan que ser cero individualmente.

De todas formas como puedes ver estoy perplejo.

**También tenga en cuenta que mientras $n=m-1$ la mayoría de las veces será invertible, si uno de los puntos de datos es cero, entonces no lo será.

4voto

Lyra Puntos 30

Es importante recordar de dónde procede tu matriz. La matriz normal viene dada por $A=X^\mathrm{T}X$ donde $$X = \begin{pmatrix} 1 & x_1 & x_1^2 & \cdots & x_1^n \\ 1 & x_2 & x_2^2 & \cdots & x_2^n \\ \vdots &\vdots &\vdots& \ddots & \vdots \\ 1 & x_m & x_m^2 & \cdots & x_m^n \\\end{pmatrix}$$ donde $X$ se supone que es $m\times (n+1)$ y donde al menos $n+1$ de la $m$ $x_i$ son distintos. Entonces tienes $$\mathbf{c}^\mathrm{T}A\mathbf{c} = \mathbf{c}^\mathrm{T}X^\mathrm{T}X\mathbf{c}=(X\mathbf{c})\cdot (X\mathbf{c})=\|X\mathbf{c}\|^2$$ De lo anterior se deduce que $A\mathbf{c} = \mathbf{0}$ sólo si $X\mathbf{c} = \mathbf{0}$ . Por lo tanto, la afirmación equivale a demostrar que $X$ tiene un núcleo trivial. Supongamos lo contrario, entonces $$X\mathbf{c} = c_0\begin{pmatrix}1 \\ 1 \\ \vdots \\ 1\end{pmatrix} + c_1\begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_m\end{pmatrix} + \cdots + c_n\begin{pmatrix}x_1^n \\ x_2^n \\ \vdots \\ x_m^n\end{pmatrix} = \begin{pmatrix}0 \\ 0 \\ \vdots \\ 0\end{pmatrix}$$ Aquí es donde entra en juego tu pista. Lo anterior implica que el polinomio $$p(t) = c_0 + c_1t + \cdots + c_nt^n$$ tiene raíces $\{x_1,\ \cdots,\ x_m\}$ . Dado que al menos $n+1$ de estos números son distinto Esto significa que $p(t)$ es un $n$ polinomio de grado mayor que $n$ raíces. Esto contradice el teorema fundamental del álgebra. Por lo tanto su polinomio es idénticamente cero y por lo tanto $\mathbf{c} = \mathbf{0}$ .

En cuanto a la motivación de la solución, se me ocurren dos razones por las que podríamos multiplicar por $\mathbf{c}$ tanto a la izquierda como a la derecha. La primera es poder volver a relacionar la ecuación con $X$ . Presentación de la $\mathbf{c}^\mathrm{T}$ a la izquierda introduce simetría. El mismo truco es precisamente el que se utiliza para demostrar que el rango de $A$ es igual al rango de $A^\mathrm{T}A$ para cualquier matriz $A$ . Si se sabe a priori que los rangos son iguales, se puede prescindir de gran parte de este proceso.

Una segunda razón es que tu matriz es simétrica y (al menos) semidefinida positiva. Esto se debe al hecho de que $A$ es la matriz de gramos de $X$ . Naturalmente, una forma de demostrar que la matriz es invertible es demostrar que no sólo es semidefinida positiva, sino también definida positiva. De nuevo, esto nos lleva a considerar la forma cuadrática $\mathbf{c}^\mathrm{T}A\mathbf{c}$ .

La motivación aquí proviene únicamente del hecho de que conoces la factorización de la matriz. La moraleja aquí es simplificar el problema. Usted tiene una factorización de la matriz, que es una herramienta muy útil, así que trate de usar eso para su ventaja.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X