La ricerca dei massimi e dei minimi di una funzione all’interno del suo dominio è un problema tipico dell’Analisi Matematica, sia per funzioni di una variabile (che si affronta studiando il segno della derivata prima) che per funzioni di più variabili (cosa che di solito richiede lo studio della matrice Hessiana). La situazione però si complica, in generale, quando vogliamo trovare massimi e minimi vincolati ad appartenere a un certo sottoinsieme del dominio della funzione analizzata.
Introduciamo questo discorso considerando la funzione $$f(x,y) = x^2y^2-4x^2y-\frac{1}{4}x^4$$Vogliamo trovare i suoi punti stazionari e gli eventuali massimi e minimi. Scriviamo quindi le sue derivate parziali: ##KATEX##\begin{aligned} \frac{\partial f}{\partial x} & = 2xy^2-8xy-x^3 = x(2y^2-8y-2y^2) \\ \frac{\partial f}{\partial y} & = 2x^2y-4x^2 = 2x^2(y-2) \end{aligned}##KATEX##Quando $x=0$ entrambe le derivate parziali sono nulle, e $f(0,y)=0$; quindi tutti i punti dell’asse $y$ sono stazionari per $f$ (e sono anche gli unici, come si può verificare facilmente). Ecco la matrice Hessiana di $f$: $$\text{H}f = \left ( \begin{matrix} 2y^2-8y-3x^2 & 4xy-8x \\ 4xy-8x & 2x^2 \end{matrix} \right )$$Quando $x=0$, la matrice diventa: $$\text{H}f(0,y) = \left ( \begin{matrix} 2y^2-8y & 0 \\ 0 & 0 \end{matrix} \right )$$Qualunque sia $y$, l’Hessiano (cioè il determinante di questa matrice) sarà nullo, e quindi non potremo utilizzare il teorema che fa uso dell’Hessiana per scoprire di che tipo sono questi punti stazionari.
Per aggirare questo inconveniente riscriviamo $f$ come $$f(x,y) = x^2 \left ( y^2 - 4y - \frac{1}{4}x^2 \right )$$e renderci conto che:
- come notato in precedenza $f(0,y)=0$;
- se $x \neq 0$, il segno di $f(x, y)$ dipende solo dal segno del termine $a(x,y):= y^2 - 4y - \frac{1}{4}x^2$, dato che $x^2$ è non negativo.
Nel piano $Oxy$ l’equazione $y^2 - 4y - \frac{1}{4}x^2=0$ può essere riscritta come $$\frac{(y-2)^2}{4} - \frac{x^2}{16} = 1$$che è l’equazione di un’iperbole traslata con assi paralleli agli assi cartesiani e vertici in $(0,0)$ e $(0,4)$. Otteniamo quindi il seguente schema dei segni per $f(x,y)$:
Da questo schema si vede che tutti i punti $(0,y)$ con $y<0 \vee y>4$ (segnati in rosso) sono punti di minimo locale, dato che la funzione nelle vicinanze di ciascuno di questi punti è positiva o nulla; con un ragionamento analogo si mostra che i punti $(0,y)$ con $0 < y < 4$ (segnati in blu) sono punti di massimo locale. Intorno ai punti $(0,0)$ e $(0,4)$, invece, la funzione potrà assumere valori maggiori o minori di $0$, a seconda di dove ci si trovi nel piano $Oxy$: per questo motivo $(0,0)$ e $(0,4)$ sono punti di sella.
Ora che conosciamo (a grandi linee) il grafico della funzione $f(x,y)$ e abbiamo studiato i suoi punti stazionari, proviamo a considerare la funzione limitatamente ai punti del piano $Oxy$ che soddisfano l’equazione $$g(x,y): = 4x^2+y^2-4y = 0$$Solitamente, l’espressione $g(x,y)$ è detta vincolo (nel senso che i punti del piano sono vincolati a soddisfare $g(x,y)=0$). L’equazione $4x^2+y^2-4y = 0$ può essere riscritta come $x^2 + \frac{(y-2)^2}{4} = 1$: questa è l’equazione di un’ellisse traslata con vertici in $(0,4)$, $(0,0)$ e $(\pm 1, 2)$. Per quanto visto prima, la funzione $f$ assumerà valori negativi per tutti i punti dell’ellisse, a eccezione dei vertici $(0,4)$ e $(0,0)$, dove la funzione invece si annulla:
Siamo quindi in questa situazione:
- i punti di sella $(0,4)$ e $(0,0)$ diventano punti di massimo per $f$, quando ci restringiamo al vincolo $g(x,y)$;
- tutti i punti di minimo o di massimo per $f$ trovati prima non ci interessano più, dato che non soddisfano il vincolo imposto;
- è ragionevole immaginare che restringendoci ai punti che rispettano $g(x,y)=0$ ci siano dei “nuovi” punti di minimo per $f$, che - per il momento - non sappiamo come individuare.
Questa analisi è, come si vede, non molto rigorosa e soprattutto difficilmente riproducibile nel caso generale (anche cambiando leggermente il vincolo potremmo tranquillamente ritrovarci in alto mare). Fortunatamente esiste uno strumento che, in molte situazioni, ci permetterà di ricavare i punti di massimo e minimo vincolati.
TEOREMA (dei moltiplicatori di Lagrange). Prendiamo una funzione $f(x,y)$ che vogliamo massimizzare rispetto a un vincolo $g(x,y)$, dove $f,g: \mathbb{R}^2 \rightarrow \mathbb{R}$ sono funzioni differenziabili. Consideriamo la Lagrangiana associata al problema, che è la seguente funzione: ##KATEX##\begin{aligned}L: \mathbb{R}^3 & \rightarrow \mathbb{R} \\ (x, y, \lambda) & \mapsto L(x,y,\lambda) := f(x,y) + \lambda \cdot g(x,y)\end{aligned}##KATEX##Se $(x_0, y_0)$ è un punto di massimo o di minimo per $f$ ristretta al vincolo $g$, allora esiste un $\lambda_0$ tale per cui il punto $(x_0, y_0, \lambda_0)$ è stazionario per $L$; cioè, tutte le derivate parziali di $L$ si annullano in $(x_0, y_0, \lambda_0)$. La variabile $\lambda$ è detta moltiplicatore di Lagrange.
Questo teorema ci fornisce una condizione necessaria che un punto di massimo o di minimo per $f$ ristretta al vincolo $g$ deve soddisfare: in poche parole, la ricerca di questi punti può essere ristretta solo a quelli per cui $L$ ha derivate parziali nulle.
È interessante notare che in generale $$\frac{\partial L}{\partial \lambda} = g(x,y)$$Quindi imporre $\frac{\partial L}{\partial \lambda} =0$ equivale sostanzialmente a imporre che il punto che stiamo cercando soddisfi il vincolo imposto.
Per capire come funziona questo metodo nella pratica, torniamo all’esempio guida da cui siamo partiti: ##KATEX##\begin{aligned} f(x,y) & = x^2y^2-4x^2y-\frac{1}{4}x^4 \\ g(x,y) & = 4x^2+y^2-4y \end{aligned}##KATEX##In questo caso la Lagrangiana è $$L(x,y,\lambda) = x^2y^2-4x^2y-\frac{1}{4}x^4 + \lambda \cdot ( 4x^2+y^2-4y )$$Di conseguenza abbiamo: ##KATEX##\begin{aligned} \frac{\partial L}{\partial x} = 0 \quad & \Leftrightarrow \quad 2xy^2-8xy-x^3+8\lambda x = 0 \\ \frac{\partial L}{\partial y} = 0 \quad & \Leftrightarrow \quad 2x^2y-4x^2+2\lambda y-4\lambda = 0 \\ \frac{\partial L}{\partial \lambda} = 0 \quad & \Leftrightarrow \quad 4x^2+y^2-4y = 0 \end{aligned}##KATEX##Effettuando i dovuti raccoglimenti, queste condizioni possono essere riscritte così:##KATEX##\begin{aligned} \frac{\partial L}{\partial x} = 0 \quad & \Leftrightarrow \quad x(2y^2-8y-x^2+8\lambda) = 0 \\ \frac{\partial L}{\partial y} = 0 \quad & \Leftrightarrow \quad 2(x^2+\lambda)(y-2)=0 \\ \frac{\partial L}{\partial \lambda} = 0 \quad & \Leftrightarrow \quad 4x^2+y^2-4y = 0 \end{aligned}##KATEX##Dividiamo il ragionamento in più casi.
- Quando $y=2$, la terza condizione diventa $4x^2 -4=0$, che è equivalente ad affermare $x=\pm 1$. Inserendo questi valori nella prima condizione si troveranno due valori di $\lambda$ che la soddisfano (che non esplicitiamo, dato che non ci servono, ma che sono fondamentali per capire se esiste o meno il punto stazionario per $L$). Pertanto, i punti $(1,2)$, $(-1, 2)$ sono candidati a essere punti di minimo o di massimo per $f$ ristretta al vincolo $g$.
- Quando $x=0$, la prima condizione è soddisfatta e la terza ci dice che $y^2-4y=0$; da questo otteniamo che altri due candidati sono i punti $(0,0)$ e $(0,4)$ (anche in questo caso siamo in grado di trovare dei valori di $\lambda$ che soddisfano la condizione rimanente).
- Quando $\lambda = -x^2$ la seconda condizione è soddisfatta; escludendo il caso in cui $x = 0$ (già analizzato prima) la seconda condizione ci dice che $2y^2-8y-9x^2=0$. Si può verificare che questa è l’equazione di un’ellisse traslata nel piano $Oxy$ che non ha punti in comune con l’iperbole definita da $4x^2+y^2-4y = 0$ (la terza condizione) a parte i punti $(0,0)$ e $(0,4)$ già trovati prima. Non ci sono quindi altri punti candidati a essere di massimo o minimo per $f$.
A questo punto dobbiamo sostituire i punti trovati nella funzione per capire se sono massimi o minimi: $$f(\pm 1,2)=-\frac{17}{4}; \qquad f(0,0) = f(0,4) = 0$$Quindi $(0,0)$ e $(0,4)$ sono punti di massimo per $f$ ristretta al vincolo $g$, e $(\pm 1, 2)$ sono punti di minimo.
Come ci si poteva aspettare, il metodo dei moltiplicatori di Lagrange ha individuato anche i massimi che eravamo stati in grado di determinare con metodi “artigianali” all’inizio della lezione. Grazie a questo procedimento, però, abbiamo anche potuto determinare quei punti di minimo di cui, in precedenza, potevamo solamente intuire l’esistenza (e che si rivelano essere proprio due dei vertici dell’ellisse).
Ribadiamo che il teorema dei moltiplicatori di Lagrange fornisce una condizione necessaria, ma non sufficiente, per determinare massimi e minimi vincolati. Per capire cosa può “andare storto”, prendiamo una nuova funzione: $$h(x,y)=-4xy+xy^2-\frac{1}{3}x^3$$Consideriamo sempre lo stesso vincolo $g(x,y)$ utilizzato prima. In questo caso la Lagrangiana è $$L(x,y,\lambda) = -4xy+xy^2-\frac{1}{3}x^3 + \lambda \cdot ( 4x^2+y^2-4y )$$Le condizioni da imporre sono: ##KATEX##\begin{aligned} \frac{\partial L}{\partial x} = 0 \quad & \Leftrightarrow \quad -4y+y^2-x^2-8\lambda x = 0 \\ \frac{\partial L}{\partial y} = 0 \quad & \Leftrightarrow \quad 2(x+\lambda)(y-2) = 0 \\ \frac{\partial L}{\partial \lambda} = 0 \quad & \Leftrightarrow \quad 4x^2+y^2-4y = 0 \end{aligned}##KATEX##Analizziamo i diversi casi.
- Quando $y=2$ la seconda condizione è soddisfatta e la terza condizione ci dice che $x= \pm 1$. Tralasciando il calcolo dei corrispondenti valori di $\lambda$ (che comunque esistono) abbiamo quindi due punti candidati: $(1, 2)$ e $(-1, 2)$.
- Quando $x = -\lambda$ la seconda condizione è verificata, e le altre due possono essere riscritte così: $$\begin{cases}y^2-4y = \lambda^2+8\lambda^2 \\y^2-4y=-4\lambda^2 \end{cases}$$Quindi $\lambda^2+8\lambda^2 = -4\lambda^2$, da cui otteniamo necessariamente $\lambda=0$ e quindi $x=0$; dalla terza condizione otteniamo allora $y=0 \vee y=4$. Abbiamo cioè trovato due nuovi punti candidati: $(0,0)$ e $(0,4)$.
Come abbiamo fatto prima, calcoliamo il valore di $h$ nei punti trovati: $$h(1,2)=-\frac{13}{3} \quad h(-1, 2)=\frac{13}{3} \quad h(0,0)=h(0,4)=0$$Da questo si vede che $(1,2)$ è punto di minimo, $(-1,2)$ è punto di massimo, mentre invece $(0,0)$ e $(0,4)$ non sono né una né l’altra cosa.
Ecco quindi un esempio in cui il metodo dei moltiplicatori di Lagrange ci fornisce punti “di troppo”, anche se i massimi e minimi vincolati vengono trovati in ogni caso.