Теория по ФНП (определения, доказательства, формулы) (FMP3)

Посмотреть архив целиком

31



2.5. Градиент


В этом параграфе мы обсудим специально производную числовой функции векторного аргумента, т.е. функции вида (1) (введение к гл. 2) при .

Из предыдущих рассмотрений ясно, что матрица Якоби такой функции является матрицей-строкой, в каждой точке , в которой функция дифференцируема, имеющую вид:


Введем вектор, имеющий в соответствующем ортонорме пространства вид

Этот вектор называется градиентом функции в точке и обозначается (или ).

Тогда равенство (1) из п. 2.4 (с учетом условия (2) того же параграфа) перепишется в виде:

, (1)

где . Мы можем теперь написать вместо вектора просто бесконечно малую по сравнению с нормой вектора , так как сама функция и ее приращение являются скалярами.

Стоящая в равенстве (1) линейная форма называется первым дифференциалом функции в точке и обозначается .

Итак,

(2)

и

(3)

С использованием вектора градиента мы можем переписать (3) в виде:


(4)

Таким образом, первый дифференциал функции в точке равен скалярному произведению вектора градиента в этой точке на вектор приращения аргумента.

Необходимо подчеркнуть следующее. Как только в точке определены все частные производные функции, так мы можем формально вычислить вектор, компоненты которого равны соответственно частным производным в точке, а затем вычислить и скалярное произведение этого вектора на вектор приращения аргумента. Эти вычисления, однако, будут иметь смысл и дадут градиент функции в точке и первый дифференциал функции в точке, только если функция в этой точке будет дифференцируема, т.е. если разность между приращением функции в точке и значением произведения будет бесконечно малой высшего порядка по сравнению с нормой приращения аргумента.

Так для функции

обе частные производные в точке существуют и равны нулю, но функция в точке не будет даже непрерывна (как мы убедились в п. 2.3). Следовательно, в этой точке данная функция не будет иметь ни градиента, ни первого дифференциала.

Подобное же замечание справедливо и в общем случае векторной функции векторного аргумента: формальная возможность вычислить матрицу частных производных в точке еще не означает, что это будет матрица оператора производной в данной точке.

Обратим внимание на то, что первый дифференциал есть функция точки, т.е. для переменной точки (в которой функция дифференцируема, функция первого дифференциала есть

.

Обсудим теперь связь между понятиями градиента и производной по направлению.

Как известно, в общем случае производная по направлению функции в точке равна результату действия линейного оператора производной в точке на единичный вектор направления :

(5)

(см. формулу (4) п. 2.4).

Для числовой функции выражение (5) примет вид:

(6)

Итак, производная по направлению в точке равна скалярному произведению градиента в данной точке на единичный вектор направления.

Следовательно, если вектор направления коллинеарен вектору градиента, то производная по направлению имеет максимальное значение, равное норме градиента:



Содержательно это означает, что направление градиента есть направление наибыстрейшего возрастания функции.

Точно также направление, задаваемое вектором, противоположным вектору градиента (и называемому вектором антиградиента), есть направление наибыстрейшего убывания функции (в рассматриваемой точке).

В трехмерном пространстве единичный вектор направления задается своими проекциями на оси координат, которые равны косинусам углов, образуемых вектором направления с ортами осей (так называемые направляющие косинусы). В этом случае производная по направлению, задаваемому косинусами , в некоторой точке с координатами будет равна:

В двумерном случае эта формула принимает совсем простой вид:


Опять-таки подчеркнем, что существование частных производных в точке не есть достаточное условие существования в этой точке производной по заданному направлению (отличному от базисного), хотя формально указанное выше скалярное произведение можно вычислить.

Так функция двух переменных, равная нулю на осях координат и единице во всех остальных точках плоскости, не дифференцируема в начале координат ни по одному направлению, кроме базисных, хотя и имеет в этой точке обе частные производные, равные нулю.

Замечание. Читатель, проработавший п. 1.12, поймет, что оператор производной числовой функции в точке , является линейным функционалом (или ковектором). Но, как следует из теоремы 1.8, для любого линейного функционала , определенного на евклидовом пространстве, однозначно определен вектор , такой, что для любого . Понятно тогда, что вектор градиента функции в точке и есть этот самый вектор для функционала производной в точке. Производная функция числовой функции векторного аргумента есть, очевидно, отображение пространства в сопряженное пространство .

Читатель без труда докажет, что градиент имеет следующие свойства:

1)

  1. (для любого вещественного )

  2. (градиент константы равен нулю).


Аналогичные свойства имеет и первый дифференциал.


2.6. Достаточное условие дифференцируемости


В этом параграфе мы докажем одно важное достаточное условие дифференцируемости функции в точке (необходимыми условиями дифференцируемости являются, как мы показали выше, непрерывность функции в точке, существование всех частных производных в точке, дифференцируемость по любому направлению в точке). Мы докажем это условие во всех подробностях для частного случая - числовой функции двух переменных. Однако доказательство для числовой функции произвольного числа переменных принципиально не отличается от случая двух переменных. Тем самым это доказательство можно расценивать как доказательство условия дифференцируемости любой числовой функции. А так как в силу утверждения 2.10 вопрос о дифференцируемости произвольной векторной функции сводится к вопросу о дифференцируемости ее координатных функций, то излагаемое ниже доказательство есть, по существу, доказательство достаточного условия дифференцируемости в общем случае.

Теорема 2.3. Если функция имеет в точке обе частные производные, которые также непрерывны в этой точке и определены в некоторой ее окрестности, то функция дифференцируема в точке .

(Таким образом, помимо необходимого условия существования частных производных в точке вводятся еще два условия: 1) непрерывность частных производных в точке и 2) существование этих производных в некоторой окрестности данной точки).

Доказательство. Рассмотрим на плоскости (в декартовых координатах) некоторую точку вместе с какой-то ее - окрестностью так, что выполнены условия теоремы 2.3. Придадим приращения переменным: (переменная ) и (переменная ) так, что (см. рис. 2.9).

Рис. 2.9


Вычислим приращение функции:


Частные приращения, записанные в квадратных скобках, преобразуем, используя теорему Лагранжа (мат. анализ, первый семестр!), согласно которой приращение , где при условии, что функция непрерывна на отрезке и дифференцируема на интервале . Применимость теоремы Лагранжа в данном случае обоснована тем, что по каждой из переменных функция (по условию теоремы и выбору величин и ) дифференцируема и, следовательно, непрерывна во всем прямоугольнике .

Тогда, применяя теорему Лагранжа, получим:

, (1)

где .

При этом

(2)

Подставляя (2) в (1) , получим:


(3)

Так как частные производные непрерывны в точке EMBED Equation.2 , то EMBED Equation.2 при EMBED Equation.2 (т.е. при EMBED Equation.2 ).

Тогда , и, следовательно, стоящая в правой части (3) линейная форма есть дифференциал функции в точке .

Теорема доказана.

Замечание. Можно несколько более подробно проанализировать предел из последнего абзаца доказательства теоремы 2.3. Без ограничения общности можно рассматривать приращения и как величины одного порядка. Тогда можно написать: , где - ограниченная величина. Следовательно,

(Величина ограничена, а при ).

Определение 2.17. Функция называется непрерывно дифференцируемой в точке , если все ее частные производные определены и непрерывны в этой точке и, кроме того, определены в некоторой окрестности этой точки.

Определение 2.18. Функция называется функцией класса , если она непрерывно дифференцируема в каждой точке открытого множества .

При этом используют обозначение .

Итак, из теоремы 2.3 следует, что всякая непрерывно дифференцируемая функция дифференцируема.

Обратное, однако, неверно. Это показывает, что условие теоремы 2.3 не является необходимым условием дифференцируемости.

Мы проанализируем сейчас весьма интересный пример, показывающий это.

Рассмотрим функцию


Докажем, что в точке эта функция дифференцируема, но условие теоремы 2.3 не выполняются.

Прежде всего, вычислим частные производные в данной точке. Вычисляем их непосредственно по определению:

(предел произведения бесконечно малой величины на ограниченную равен нулю - мат. анализ, первый семестр). Точно так же

Таким образом, обе частные производные в рассматриваемой точке существуют и равны нулю. Заметим, что и по каждому направлению, задаваемому направляющим вектором произвольной прямой наша функция в начале координат дифференцируема (почему?).

С другой стороны, приращение функции в точке составит

Иначе, это приращение можно представить в виде:

что означает дифференцируемость функции в данной точке.

Теперь вычислим частные производные в произвольной точке, отличной от начала координат.

Первое слагаемое в написанном выше выражении стремится к нулю при стремлении к нулю обеих переменных, но второе слагаемое при этом не имеет ни конечного, ни определенного знака бесконечного предела в начале координат. Следовательно, частная производная по разрывна в точке . Совершенно аналогично анализируется и частная производная по , равная


Итак, функция дифференцируема в точке , но не является в этой точке непрерывно дифференцируемой.