Теория по ФНП (определения, доказательства, формулы) (FMP7)

Посмотреть архив целиком

67



2.12. Локальный экстремум числовой функции нескольких вещественных переменных


В этом параграфе содержится элементарное изложение вопроса о точках локального экстремума числовой функции векторного аргумента. Слово «локальный» (как и в одномерном анализе) означает, что экстремальные свойства имеют место лишь в некоторой окрестности рассматриваемой точки. Если на векторный аргумент в пределах соответствующей окрестности не накладывается никаких дополнительных ограничений, то говорят о безусловном локальном экстремуме. В противном случае, т.е., когда ставится задача об отыскании точки локального экстремума при условии, что аргумент должен удовлетворять определенным ограничениям, заданным в виде системы уравнений, говорят об условном локальном экстремуме.


Безусловный локальный экстремум

Определение 2.24. Точка из области определения функции называется точкой безусловного локального экстремума, если существует такая окрестность точки , что приращение функции при любом не меняет знака.

Соответственно, если это приращение неотрицательно, то точка называется точкой безусловного локального минимума, если же неположительно, то - точкой безусловного локального максимума.

Если указанное приращение строго положительно (отрицательно), то точка называется точкой строгого безусловного локального минимума (максимума).

Впредь, рассматривая безусловный экстремум, будем, как правило, прилагательное «безусловный» опускать.

Докажем сначала простое необходимое условие локального экстремума.

Теорема 2.8. Если функция дифференцируема в точке , и эта точка есть точка локального экстремума функции , то первый дифференциал функции в этой точке обращается в нуль: .

Доказательство. Для дифференцируемой функции ее приращение в точке представимо в виде:

.

По условию найдется такое , что это приращение не меняет знака. Предположим тогда, что при этом . Вектор всегда можно выбрать так, что как точка , так и точка принадлежат той окрестности точки , в которой приращение функции не меняет знака (см рис. 2.15). Но если , то , а так как слагаемое не влияет на знак всего приращения, то приращение функции в рассматриваемой окрестности точки меняет знак. Полученное противоречие и доказывает теорему.



Рис. 2.15


Определение 2.25. Точка называется стационарной точкой функции ( дифференцируемой в ), если .

Из теоремы 2.8 следует, что точка локального экстремума функции является ее стационарной точкой. Обратное, конечно, неверно, что показывает простой пример: точка является стационарной точкой функции , но не является точкой ее локального экстремума (почему?).

Достаточное условие локального экстремума мы докажем в предположении, что исследуемая функция является достаточно гладкой в некоторой окрестности стационарной точки.

Теорема 2.9. Если - стационарная точка функции , для некоторой окрестности точки , и , то - точка строгого локального минимума (максимума) функции .

Доказательство. По теореме 2.7 можно написать:

.

Так как - стационарная точка функции , то , и, следовательно, знак приращения функции в точке определяется знаком ее второго дифференциала в этой точке.

Теорема доказана.

Практически для определения знака второго дифференциала достаточно применить критерий Сильвестра (п. 1.17, теорема 1.18) к матрице Гессе функции в исследуемой точке.

Таким образом, может быть предложена следующая схема исследования функции на локальный экстремум.

  1. Найти все стационарные точки функции из условия (или, что равносильно, ).

  2. Для каждой стационарной точки выяснить знакоопределенность квадратичной формы второго дифференциала .

  3. В тех точках, в которых указанная форма положительно (отрицательно) определена, имеет место строгий локальный минимум (максимум).

  4. В тех точках, где квадратичная форма второго дифференциала является формой общего вида, экстремума нет.

  5. В тех точках, где форма полуопределена, требуется дополнительное исследование.

Это дополнительное исследование нуждается в комментарии. Рассмотрим пример. Зададим функцию двух переменных

Вычисляя частные производные, получим:

Из условия равенства их нулю будем иметь:

откуда .

Вычислим вторые производные:

Поэтому второй дифференциал в произвольной точке будет равен

Матрица Гессе в точке равна , и

Сразу видно, что второй дифференциал в данной точке положительно полуопределен, причем при он обращается в нуль (это соответствует вектору приращения аргумента ). Следовательно, по направлению, задаваемому этим вектором, приращение функции не может быть вычислено, если ограничиться только вторым дифференциалом. Попробуем тогда найти третий дифференциал нашей функции в этой точке. Имеем:

(вычисляем частные производные от выражения второго дифференциала, считая приращения переменных константами!).

Итак, третий дифференциал не зависит от точки и равен

.

При получаем , что, очевидно, меняет знак (при изменении знака приращения первой переменной).

Следовательно, в точке исследуемая функция экстремума не имеет.

Точка рассматривается аналогично.

Таким образом, если по некоторым направлениям второй дифференциал функции в исследуемой стационарной точке обращается в нуль, а сама функция имеет дифференциалы третьего и более высоких порядков, то можно предложить такой метод дополнительного исследования.

Вычисляем третий дифференциал - если он (при равенстве нулю второго дифференциала) отличен от нуля, то экстремума нет (так как третий и любой дифференциал нечетного порядка есть нечетная функция приращений независимых переменных); иначе вычисляем четвертый дифференциал. Если он строго положителен (отрицателен), то имеем в точке локальный минимум (максимум). Если же он по некоторым направлениям обращается в нуль, то вычисляем пятый дифференциал и т. д. Другими словами, если наименьшее такое, что , нечетно, то экстремума в точке у функции нет; если же четно, то (при строгой положительности или отрицательности дифференциала порядка ), то имеет место локальный экстремум.


Условный локальный экстремум


Поставим задачу об отыскании точек локального экстремума функции

(1)

при дополнительном ограничении, состоящем в том, что искомая точка должна удовлетворять системе уравнений вида:

(2)


Уравнения (2) называются уравнениями связи.

В векторной форме задача (1) - (2) может быть переписана так: найти точки локального экстремума функции (1) при выполнении векторного уравнения , где . Уравнения связи (2) (или одно векторное уравнение связи) определяют подмножество точек в пространстве , в котором производится поиск точек экстремума.

Более подробно, следует, конечно, определить понятие точки условного локального экстремума.

Определение 2.26. Точка из области определения функции (1) называется точкой условного локального экстремума при выполнении уравнений связи (2), если существует такая окрестность точки , что приращение функции для любого такого , что и не меняет знака.

Совершенно аналогично безусловному случаю вводятся понятия условного локального минимума и максимума, а также понятие строгого условного локального экстремума.

Решение задачи об условном экстремуме может резко отличаться от решения задачи о безусловном экстремуме для одной и той же функции. Например, линейная функция вовсе не имеет точек локального безусловного экстремума, но если мы поставим задачу об условном экстремуме для этой функции при уравнении связи , то даже чисто геометрический анализ показывает, что эта задача имеет решение, так как здесь уже рассматриваются не все точки плоскости, которая является графиком нашей функции, а точки линии пересечения плоскости с цилиндром, уравнение которого есть уравнение связи. Плоскость наклонена под углом 45° к координатной плоскости и проходит через начало координат; следовательно, эллипс, являющийся линией пересечения этой плоскости с цилиндром, ось которого перпендикулярна плоскости , имеет «наивысшую» точку и «наинизшую» точку - это и будут искомые точки условного локального экстремума. На рис. 2.16 изображено сечение описанной «конструкции» плоскостью . Точно такая же «картинка» будет и в сечении плоскостью .


Рис. 2.16



Теория условного экстремума неизмеримо сложнее теории «обычного» безусловного экстремума. Мы здесь ограничимся рассмотрением на «физическом» уровне строгости решения задачи для функции трех переменных при двух уравнениях связи, т.е. при .

Итак, рассмотрим, прежде всего, вопрос о необходимых условиях экстремума функции при

Продифференцируем уравнения связи:

(3)

Если бы уравнения связи отсутствовали, то для достижения локального экстремума функцией было бы необходимо, чтобы ее первый дифференциал в исследуемой точке обращался в нуль:

(4)

Уравнения связи и вытекающие из них уравнения (3) накладывают ограничения на дифференциалы (приращения) независимых переменных - они перестают быть независимыми: в предположении, что ранг матрицы

равен двум, любые два из этих трех дифференциалов могут быть выражены через третий.

Иначе говоря, если все условия теоремы 2.6 (о неявной функции) выполняются, то любые две переменные можно выразить через третью, и тем самым вопрос об условном экстремуме функции трех переменных может быть сведен к вопросу о безусловном экстремуме функции одного переменного.

Именно, из системы (3) выразим дифференциалы и через дифференциал :


(5)


Обозначая главный определитель системы (3) через , а определители и через и соответственно, преобразуем (5) к виду:


(6)


Подставляя (6) в (4), получим

(7)

откуда

(8)

Нетрудно видеть, что левая часть (8) есть определитель третьего порядка


Это не что иное, как якобиан . Равенство нулю определителя означает, что его строки линейно зависимы, а так как мы предположили, что ранг матрицы Якоби равен двум, то вторая и третья строки указанного определителя линейно независимы, и тогда первая строка есть их линейная комбинация, т.е. существуют такие одновременно не равные нулю числа , что

(9)


Систему равенств (9) можно переписать в векторной форме:

(10)

Итак, мы можем утверждать, что при сформулированных перед проведенными выкладками предположениях в точке условного локального экстремума функции градиент функции есть линейная комбинация градиентов функций, задающих уравнения связи.

В общем случае может быть доказан следующий результат.

Теорема 2.10 (о необходимых условиях условного локального экстремума). Если точка есть точка условного локального экстремума функции (1) при уравнениях связи (2), причем существует открытое множество , содержащее точку , такое, что функции суть функции класса , и ранг матрицы Якоби равен , то существуют такие не равные нулю одновременно числа , что

(11)


Подробное доказательство теоремы не приводится, хотя написанные выше выкладки могут рассматриваться как набросок такого доказательства в частном случае (при ).

Точка , удовлетворяющая условию (11), называется условной стационарной точкой функции (1) при уравнениях связи (2) (или, короче, условной стационарной точкой задачи (1) - (2)).

Исследование условного экстремума удобно проводить в терминах так называемых функций Лагранжа.

Определение 2.27. Функцией Лагранжа задачи (1)-(2) называется любая функция вида

, (12)

где числа не равны нулю одновременно.

Тем самым функция Лагранжа есть числовая функция векторного аргумента с параметрами , число которых равно числу уравнений связи (2). В общем случае для задачи (1)-(2) определено некоторое -параметрическое семейство функций Лагранжа (12).

Утверждение 2.12. Точка есть условная стационарная точка задачи (1) - (2) тогда и только тогда, когда она является (безусловной ) стационарной точкой некоторой функции Лагранжа этой задачи.

Доказательство. Из (11) следует, что в точке обращается в нуль градиент функции , совпадающей с функцией Лагранжа при (для всех ).

Наоборот, если в семействе функций Лагранжа нашлась такая функция (12), что , то из очевидных свойств градиента следует равенство

,

что эквивалентно (11) при (для всех ).

С учетом изложенного можно предложить такой алгоритм поиска условных стационарных точек задачи (1) - (2).

  1. Записать функцию Лагранжа (12) при неизвестных пока значениях параметров .

  2. Приравнять нулю все частные производные функции (12), получив из этого систему уравнений:

(13)

  1. Дополнив систему (13) (систему уравнений с неизвестными) уравнениями связи (2), определить значения вектора и параметров , при которых удовлетворяется одновременно (13) и (2).

  2. Все полученные в п. (3) точки (при соответствующих значениях функции Лагранжа и являются условными стационарными точками задачи (1) - (2)).

Разберем пример: исследуем аналитически ту задачу, геометрическое обсуждение которой было дано выше: найти точки условного экстремума функции

при

.

В данном случае .

Запишем функцию Лагранжа для этой задачи

(14)

(по традиции параметры функции Лагранжа обозначаются буквой с возможными индексами). Для данной задачи мы, естественно, получаем однопараметрическое семейство функций Лагранжа.

Находим частные производные функции (14) и приравниваем их к нулю:

(15)

откуда .

С учетом уравнения связи имеем:

,

и, следовательно,

.

Таким образом, в данной задаче возникает семейство функций Лагранжа, удовлетворяющее одновременно уравнению связи и условию (15) равенства нулю градиента, которое состоит из двух функций.

При получим условную стационарную точку ; при условная стационарная точка есть .

Чисто геометрические соображения подсказывают нам, что первая точка есть точка условного минимума, а вторая - точка условного максимума.

Теория достаточных условий условного экстремума в сколько-нибудь обстоятельном изложении выходит за пределы нашего курса. Можно доказать, что это исследование тоже сводится к исследованию достаточных условий обычного (безусловного) экстремума для функций Лагранжа. В простейших случаях достаточно вычислить второй дифференциал функции Лагранжа (одной из тех, что была найдена при вычислении условных стационарных точек) с учетом соотношений между дифференциалами, вытекающих из уравнений связи. Положительность (отрицательность) этого дифференциала есть достаточное условие строгого условного минимума (максимума) в рассматриваемой точке.

Например, для рассмотренной выше задачи исследования функции трех переменных при двух уравнениях связи будем, с учетом равенств (6) иметь:

Таким образом, в этом случае знак второго дифференциала функции Лагранжа определяется записанным выше выражением в квадратных скобках (при подстановке тех значений параметров , которые были получены при вычислении условных стационарных точек данной задачи).

Рассмотрим в качестве примера такую задачу: найти точки экстремума функции

при

Составляем функцию Лагранжа:


Приравниваем нулю ее частные производные:

Умножая первое уравнение на , а второе - на , и вычитая из первого второе, получим:

,

откуда

(16)

или

(17)

Аналогично из второго и третьего уравнений получаем:


(18)

или

(19)

Ясно, что (16) и (19) не могут выполняться одновременно, так как если , то из первого уравнения связи следует , но из второго уравнения связи тогда следует .

Пусть имеет место (16) и (19). Тогда и . Из уравнений связи получаем:

Проанализируем точку . Из (19) имеем:

, с другой стороны, из равенства следует, что , но так как , то .

Итак, мы получили условную стационарную точку и соответствующие ей параметры функции Лагранжа.

Разберемся теперь с достаточными условиями. Второй дифференциал функции Лагранжа в произвольной точке и при произвольных значениях параметров имеет вид:

(20)

(можно заметить, что второй дифференциал не зависит от параметра ).

В (20) два из трех дифференциалов независимых переменных следует выразить через третий. Дифференцируя уравнения связи, получим:

Так как в рассматриваемой точке , то выразим и через (одновременно подставляя координаты точки):

Наконец, подставляя это в (20) (с учетом значений параметров), получим:

Следовательно, данная условная стационарная точка является точкой локального условного минимума. Минимальное значение функции в этой точке равно . Вычисление остальных условных стационарных точек и исследование их по достаточным условиям предоставляется читателю.

Мы видим, таким образом, что исследование функции на условный экстремум сводится к исследованию на обычный безусловный экстремум некоторого многопараметрического (в общем случае) семейства функций (каковым является семейство функций Лагранжа). Мы не только определяем координаты стационарной точки, но и выбираем из данного семейства функций некоторые функции, проходящие через эти точки. Нельзя поэтому говорить, что решение задачи об условном экстремуме сводится к решению задачи о безусловном экстремуме для какой-то одной функции Лагранжа. Принципиальное усложнение задачи при переходе от безусловного к условному экстремуму в том и состоит, что ищется не только точка, но и сама функция. Разные условные стационарные точки отвечают, вообще говоря, и разным функциям Лагранжа, которые проходят через них.

В случае функции двух переменных при одном уравнении связи задача об условном экстремуме имеет прозрачную геометрическую интерпретацию. Условие (11) тогда принимает совсем простой вид:

,

т.е. градиенты самой исследуемой функции и функции, задающей уравнение связи, в условной стационарной точке должны быть коллинеарны.

Другими словами, кривая и некоторая линия уровня функции - кривая для некоторого - имеют в условной стационарной точке общую касательную.












а) б) в)


Рис. 2.17


На рис. 2.17 представлены различные ситуации, которые могут иметь место при существовании общей касательной к линии уровня исследуемой функции (красный цвет) и кривой, соответствующей уравнению связи (синий цвет). Стрелка изображает вектор градиента функции . На рис. 2.17 (а) изображена точка условного максимума: двигаясь все время по синей линии (уравнение связи!) и приближаясь к точке касания с красной линией, мы двигаемся по направлению возрастания функции. Миновав точку касания, мы начинаем двигаться уже против направления возрастания и по направлению убывания. На рис. 2.17 (б) изображена точка условного минимума, а на рис. 2.17 (в) - условная стационарная точка, не являющаяся точкой условного экстремума (синяя и красная линии «переплетаются» - некий аналог точки перегиба).


Рис. 2.18


На рис. 2.18 представлена геометрия разбиравшейся выше задачи «плоскость -цилиндр». Очевидно из ранее изложенного, что «верхняя» точка есть точка максимума, а «нижняя» - минимума.

Аналитическое же исследование условных стационарных точек в этой задаче даст такие результаты:

.

Таким образом, даже независимо от того, какое соотношение между дифференциалами и имеет место (а из уравнений связи следует, что ), знак второго дифференциала функции Лагранжа определяется только знаком параметра . Следовательно, в той условной стационарной точке, которая отвечает отрицательному , имеет место максимум, а в точке с положительным - минимум.




Случайные файлы

Файл
108974.rtf
131408.rtf
21775.doc
59676.rtf
11264-1.rtf