Il mistero dell'Hessiano

Analisi, algebra lineare, topologia, gruppi, anelli, campi, ...
Rispondi
Avatar utente
Franchifis
Messaggi: 149
Iscritto il: 01 gen 1970, 01:00
Località: Pisa

Il mistero dell'Hessiano

Messaggio da Franchifis »

Ciao! Vi chiedo disperatamente aiuto a proposito dell'Hessiano, e del suo utilizzo per trovare massimi, minimi, punti di sella per le funzioni a due variabili. Il fatto è che ho consultato tre fonti, e tutte sono in disaccordo! Il mio libro di testo dice che se H>0 e f''(xx)>0 allora è un minmo, se f''(xx)<0 è un massimo, se H<0 è un punto di sella (tralasciamo il fatto che il libro non considera neanche il caso H>0 e f"(xx)=0). Mi sono chiesto se fosse lo stesso controllare la derivata f''(yy) ma la mia prof di mate ha detto di no (il che non ha senso, non dovrebbe esserci una variabile "privilegiata"). Però ho consultato un altro testo che invece mi dice il contrario. Allora in preda alla confusione ho chiesto al dio Mathworld che mi ha detto che serve anche la condizione f''(xx) + f''(yy)>0 per i minimi e viceversa per i massimi, il che ha contribuito a confondermi ancora di più. Naturalmente nessun testo si degna di fornire uno straccio di dimostrazione. :x

Un altro dubbio: ma ha che serve l'hessiano? Non basta controllare il segno delle due derivate seconde f''(xx) e f''(yy)? Se sono tutte e due positive è un minimo, entrambe negative è un massimo, di segno diverso è un punto di sella. Dov'è che sbaglio?

Vi sarei molto grato se poteste aiutarmi! Così quando l'ho capito lo spiego anche a quella caprona della prof, ogni tanto se ne esce con degli errori matematici che fanno accapponare la pelle...
Avatar utente
Marco
Site Admin
Messaggi: 1331
Iscritto il: 01 gen 1970, 01:00
Località: IMO '93

Re: Il mistero dell'Hessiano

Messaggio da Marco »

Franchifis ha scritto:Un altro dubbio: ma ha che serve l'hessiano? Non basta controllare il segno delle due derivate seconde f''(xx) e f''(yy)? Se sono tutte e due positive è un minimo, entrambe negative è un massimo, di segno diverso è un punto di sella. Dov'è che sbaglio?
Lo sbaglio è che non consideri che le derivate miste possono dominare le derivate pure. Ad esempio:
$ $f(x,y) = x^2 + y^2 + 999.999.999 xy $
Chiaramente, il termine che domina è il termine rettangolare. E non è difficile vedere (cambia le variabili se non ci credi) che l'origine è una sella.

Inoltre, dal tuo messaggio non è chiaro se per Hessiano intendi la matrice o il suo determinante. L'importante è capire che, mentre in una dimensione la derivata seconda è una sola, in più variabili il concetto si espande e il modo giusto di rappresentare le derivate seconde è con una matrice (l'Hessiano, appunto...)
Franchifis ha scritto:Allora in preda alla confusione ho chiesto al dio Mathworld che mi ha detto che serve anche la condizione f''(xx) + f''(yy)>0 per i minimi e viceversa per i massimi
Se lo dice Mathworld, allora deve essere vero...

Funziona solo in dimensione due: l'Hessiano è simmetrico e per ipotesi ha determinante positivo. Se aggiungi la condizione f''(xx) + f''(yy)>0, dici che ha anche traccia positiva. Una matrice 2x2 simmetrica, con traccia e determinante positivi è senz'altro definita positiva, quindi f() ha un minimo.
[i:2epswnx1]già ambasciatore ufficiale di RM in Londra[/i:2epswnx1]
- - - - -
"Well, master, we're in a fix and no mistake."
Avatar utente
Franchifis
Messaggi: 149
Iscritto il: 01 gen 1970, 01:00
Località: Pisa

Messaggio da Franchifis »

Grazie mille per la risposta! Ho capito finalmente perché usiamo l'Hessiano, in quella funzione per esempio il punto di sella è "orientato" lungo la diagonale degli assi e non lungo gli assi (e io non ci avevo pensato :oops: ).
Però mi sfugge il resto della risposta: non capisco il significato di "traccia", e non ho capito se la condizione f''(xx) + f''(yy)>0 è necessaria, come dice Mathworld, oppure no, come dice il mio libro, per avere un minimo, fermo restando H>0 e f''(xx)>0, e perché. Stesso discorso per un massimo.
Con "Hessiano (H)" intendo il determinante. Mi riferisco inoltre alle sole funzioni a due variabili.
Avatar utente
Marco
Site Admin
Messaggi: 1331
Iscritto il: 01 gen 1970, 01:00
Località: IMO '93

Messaggio da Marco »

Franchifis ha scritto:Però mi sfugge il resto della risposta: non capisco il significato di "traccia", e non ho capito se la condizione f''(xx) + f''(yy)>0 è necessaria, come dice Mathworld, oppure no, come dice il mio libro, per avere un minimo, fermo restando H>0 e f''(xx)>0, e perché. Stesso discorso per un massimo.
Beh, la traccia di una matrice quadrata, ossia la somma degli elementi sulla diagonale.

Intanto sono equivalenti:
$ H>0; f_{xx} > 0 $
e
$ H>0; f_{xx} + f_{yy} > 0 $.

Infatti:
$ H = f_{xx} f_{yy} - f_{xy}^2 $,
quindi $ f_{xx} f_{yy} \geqslant H > 0 $ per ipotesi. Quindi $ f_{xx} $ e $ f_{yy} $ sono concordi in segno. []

Per quanto riguarda necessità e sufficienza, devo pescare dai miei ricordi di Analisi II, ormai mill'anni fa, ma dovrebbe essere che condizione sufficiente perché f() abbia un minimo è che abbia gradiente nullo e hessiano definito positivo nel punto. Se gradiente è nullo e hessiano definito negativo, allora è un max, se invece gradiente è nullo e hessiano ha segnatura (1,1) allora è una sella.

Il problema è che non si può dire nulla se l'hessiano ha determinante zero. (è il caso analogo in una variabile in cui la derivata seconda è nulla: occorre guardare ordine e segno della prima derivata superiore non nulla, ma la derivata seconda non ti basta più).

Per quel che riguarda il claim di Mathworld: una matrice simmetrica è definita positiva sse i suoi autovalori (che sappiamo essere reali) sono entrambi positivi. La traccia è la somma degli autovalori e il determinante è il loro prodotto. Se studi i segni degli autovalori e come cambiano i segni di traccia e determinante, vedi che torna.
[i:2epswnx1]già ambasciatore ufficiale di RM in Londra[/i:2epswnx1]
- - - - -
"Well, master, we're in a fix and no mistake."
Avatar utente
Franchifis
Messaggi: 149
Iscritto il: 01 gen 1970, 01:00
Località: Pisa

Messaggio da Franchifis »

Credo di aver capito tutto ora, grazie mille! Certo che Mathworld poteva evitare di imporre entrambe le condizioni f''(xx)>0 e f''(xx) + f''(yy)>0 dal momento che sono equivalenti, mi avrebbe evitato un po' di confusione...
Rispondi