Equivalenza delle definizioni di rango

Prima di postare leggi le regole del Forum. Puoi anche leggere le ultime discussioni.

Equivalenza delle definizioni di rango #1506

avt
xavier310
Sfera
Potreste dimostrare l'equivalenza tra queste definizioni di rango di una matrice?

Sia A una matrice con m righe e n colonne a coefficienti in un campo K. Il rango di A si definisce in uno dei seguenti modi, equivalenti tra loro:

1) è il numero di righe linearmente indipendenti di A;

2) è il numero di colonne linearmente indipendenti di A;

3) è la dimensione dell'immagine dell'applicazione lineare L_A: K^n → K^m che a ogni vettore colonna x ∈ K^n associa Ax ∈ K^m;

4) è l'ordine massimo dei minori non nulli estraibili da A;

5) è il numero di pivot di una riduzione a scala di A attraverso un'eliminazione gaussiana;

6) è la dimensione del sottospazio generato dalle righe o dalle colonne di A.

Potreste dimostrare l'equivalenza tra queste definizioni?
 
 

Equivalenza delle definizioni di rango #1531

avt
Omega
Amministratore
Prima di entrare nel vivo della questione e dimostrare l'equivalenza tra le definizioni di rango è utile fare una piccola premessa sul modo più pratico e veloce di procedere.

In generale, per provare l'equivalenza di più asserti conviene procedere con una dimostrazione a catena, cioè per dimostrare l'equivalenza di n enunciati

(1), (2), ..., (n)

invece di dimostrare le 2(n-1) implicazioni logiche

(1) ⇔ (2) ⇔ ... ⇔ (n)

si possono provare le seguenti n

(1) ⇒ (2) ⇒ ... ⇒ (n) ⇒ (1)

Così facendo si risparmiano le dimostrazioni di (n-2) implicazioni, e non è cosa da poco.

Cominciamo: sia A ∈ Mat(m,n,K). Dobbiamo dimostrare che le seguenti definizioni di rango di una matrice sono tra loro equivalenti:

(1) è il numero di righe linearmente indipendenti di A;

(2) è il numero di colonne linearmente indipendenti di A;

(3) è la dimensione dell'immagine dell'applicazione lineare L_A: K^n → K^m che a ogni vettore colonna x ∈ K^n associa Ax ∈ K^m;

(4) è l'ordine massimo dei minori non nulli estraibili da A;

(5) è il numero di pivot di una riduzione a scala di A attraverso un'eliminazione gaussiana;

(6) è la dimensione del sottospazio generato dalle righe o dalle colonne di A.

Per quanto detto poc'anzi, se dimostriamo la seguente catena di implicazioni

(1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (5) ⇒ (6) ⇒ (1)

possiamo concludere che le 6 definizioni sono equivalenti tra loro. Procediamo!

(1) ⇒ (2)

Indichiamo con k il rango della matrice A ∈ Mat(m,n,K) e assumiamo come ipotesi che k sia il massimo numero di righe linearmente indipendenti di A.

Dobbiamo dimostrare che k è anche il massimo numero di colonne linearmente indipendenti di A.

Siano R_1, R_2, ..., R_m le righe di A e sia

mathcalB = D_1, D_2, ..., D_k

una base del sottospazio generato dalle righe di A.

Ogni riga di A può essere allora scritta come combinazione lineare degli elementi della base mathcalB, cioè per ogni i ∈ 1,2,...,m esistono gli scalari c_(ij) ∈ K tali che

R_i = Σ_(j = 1)^(k)c_(ij)D_j

Denotiamo con D ∈ Mat(k,n,K) la matrice che ha per righe i vettori della base mathcalB e con C ∈ Mat(m,k,K) la matrice i cui elementi sono gli scalari c_(ij).

L'uso di queste notazioni permette di scrivere la precedente uguaglianza in forma matriciale

A = CD

Da una proprietà della trasposizione applicata al prodotto tra matrici segue che

A^T = (CD)^T = D^TC^T

Di conseguenza, le righe di A^T, e dunque le colonne di A, sono combinazione lineare delle righe di C^T, che sono k.

Il sottospazio generato dalle colonne di A ha quindi k generatori, per cui il numero di colonne linearmente indipendenti di A è minore o uguale di k.

Abbiamo così dimostrato che per ogni matrice A ∈ Mat(m,n,K) il numero di colonne linearmente indipendenti è minore o uguale del massimo numero di righe linearmente indipendenti.

Applicando questa disuguaglianza alla matrice A^T∈ Mat(n,m,K) si ottiene che il numero di colonne linearmente indipendenti di A^T è minore o uguale del massimo numero di righe linearmente indipendenti di A^T.

Dalla definizione di matrice trasposta segue che il numero di righe linearmente indipendenti di A è minore o uguale del massimo numero di colonne linearmente indipendenti di A, e quindi, necessariamente, il massimo numero di colonne linearmente indipendenti di A è k.

(2) ⇒ (3)

Sapendo che k: = rk(A) è il massimo numero di colonne linearmente indipendenti di A dobbiamo dimostrare che k è la dimensione dell'immagine dell'applicazione lineare

 L_A:K^n → K^m ; x ∈ K^n ↦ Ax ∈ K^m

Sia e_1, e_2, ..., e_n la base canonica di K^n. Allora

Im(L_A) = Span(L(e_1), L(e_2), ..., L(e_n)) ⊆ K^m

Inoltre, per ogni i ∈ 1,2,...,n risulta che L(e_i) = Ae_i e dunque il prodotto riga per colonna Ae_i restituisce la i-esima colonna di A.

Dunque l'immagine dell'applicazione lineare L_A coincide col sottospazio generato dalle colonne C_1, C_2, ..., C_n di A, ossia

Im(L_A) = Span(C_1, C_2, ..., C_n)

Per ipotesi sappiamo che il massimo numero di colonne linearmente indipendenti di A è k, dunque

dim(Im(L_A)) = dim(Span(C_1, C_2, ..., C_n)) = k

(3) ⇒ (4)

Sapendo che k: = rk(A) è la dimensione dell'immagine dell'applicazione lineare L_A, dobbiamo provare che k è l'ordine massimo dei minori non nulli estraibili da A.

Ricordando la definizione di minore associato a una matrice, ciò equivale a provare che k è l'ordine massimo delle sottomatrici estraibili da A con determinante diverso da zero.

Sia A la matrice associata all'applicazione lineare L_A rispetto alle basi canoniche di K^n e di K^m.

Le colonne di A sono i vettori dell'immagine di L_A, che ha dimensione k. Di conseguenza k è il massimo numero di colonne linearmente indipendenti di A, quindi esiste una sottomatrice quadrata A'di A di ordine k con determinante diverso da zero, e non può esistere una di ordine superiore.

Se esistesse, infatti, una sottomatrice quadrata di A di ordine k+1 con determinante diverso da zero, allora le colonne linearmente indipendenti di A sarebbero k+1, contro l'ipotesi assunta.

(4) ⇒ (5)

Supponiamo ora che k: = rk(A) è l'ordine massimo dei minori non nulli estraibili da A.

Da ciò segue che k è il numero massimo di righe linearmente indipendenti di A, quindi le restanti m-k righe di A si possono scrivere come combinazione lineare delle altre, ossia per ogni t ∈ k+1, k+2, ..., m esistono gli scalari α_(1), α_2, ..., α_(k) tali che

R_t = Σ_(i = 1)^(k)α_i R_i

Di conseguenza

R_t-Σ_(i = 1)^(k)α_i R_i = 0

Se applichiamo il metodo di eliminazione gaussiana alla matrice A si ottiene una matrice a gradini con le prime k righe non identicamente nulle e con le rimanenti m-k righe con tutti termini nulli.

Il numero di pivot di una matrice a gradini è, per definizione, il numero di righe non identicamente nulle, e da ciò segue la tesi.

(5) ⇒ (6)

Assumiamo per ipotesi che k sia il numero di pivot della matrice ridotta a gradini associata ad A. Allora k è il numero di righe non identicamente nulle della matrice a gradini e quindi è il numero massimo di righe linearmente indipendenti di A.

Dalla definizione di dimensione di uno spazio vettoriale abbiamo la tesi, infatti se

Span(R_1, R_2, ..., R_m)

è il sottospazio generato dalle righe di A, essendo k il massimo numero di righe linearmente indipendenti si ha che

dim(Span(R_1, R_2, ..., R_m)) = k

(6) ⇒ (1)

Assumiamo, infine, che

dim(Span(R_1, R_2, ..., R_m)) = k

Per definizione di dimensione, k è il massimo numero di vettori linearmente indipendenti del sottospazio generato, quindi k è proprio il massimo numero di righe di A linearmente indipendenti, e la dimostrazione può dirsi conclusa.
Ringraziano: frank094, Ifrit, xavier310, CarFaby, rc4955
  • Pagina:
  • 1
Os