125



  1. Оптимальное управление.

    1. Определение оптимального программирования.

В общем виде задачи оптимального управления могут быть сформулированы следующим образом:

определить вектор-функции при , доставляющие минимум функционалу

( 12.1.0)

при описании движения

( 12.1.0 )

при ограничениях вдоль траектории

( 12.1.0)

и краевых условиях

, ( 12.1.0)

где – непрерывные и дифференцируемые функции по совокупности ,

,

- некоторые многообразия в .


Напоминание.

Будем говорить, что на множестве задан функционал , если известно правило, которое каждому элементу ставит в соответствие определенное число . Можно сказать, что функция осуществляет отображение множества (имеющего произвольную природу) на множество действительных чисел.


Пример 1:

Рассмотрим множество областей, представляющих собой фигуры, ограниченные замкнутыми кривыми. Каждой области соответствует действительное число, равное ее площади.


Пример 2:

Рассмотрим множество функций, заданных и непрерывных на отрезке . Элемент множества - это сама функция и ему соответствует число, равное значению функции .

- функционал.

В зависимости от конкретного вида выражений задачи оптимального управления можно разбить на три группы. В каждой из групп определяющей характеристикой являются способы, с помощью которых задаются:

  1. функционал;

  2. ограничения вдоль траектории;

  3. краевые условия.

      1. Способы задания функционала.

  1. Интегральный функционал.


Задача Лагранжа.

( 12.1.0)

где – дифференцируемая функция по своим переменным.

В случае отсутствия ( 12.1 .0) , то есть задача [( 12.1 .0), ( 12.1 .0 ),( 12.1 .0)] называется задачей Лагранжа.


  1. Задача Майера.

( 12.1.0)

при ограничениях ( 12.1 .0 ), ( 12.1 .0),( 12.1 .0)


Формально задача Майера является более общей, чем задача Лагранжа. Любая задача Лагранжа может быть сведена к задаче Майера.


  1. Задача Больца.


Функционал смешанного типа:

( 12.1.0)

То есть нужно определить векторы , доставляющие минимум функционалу ( 12.1 .0) при ограничениях

( 12.1 .0 ), ( 12.1 .0),( 12.1 .0).


  1. Задача на быстродействие.


Этим термином объединяются задачи, в которых функционалом является время

( 12.1.0)

      1. Способы задания ограничения .

  1. Ограничение на управление.

,

где - некоторое замкнутое множество из .

В частном случае может быть, к примеру, .


  1. Ограничения на фазовые переменные.

.

Ограничения могут быть в виде равенств:

,

и в виде неравенств:

.


  1. Совместные ограничения на управление и фазовые переменные.


Когда ограничения на не могут быть разделены.


Подобные задачи часто встречаются в экономике:


в виде равенств:

,

и неравенств:

.


  1. Изопериметрическая задача (задача с интегральными ограничениями).


Определить минимум функционала ( 12.1 .0) при следующих ограничениях:

,

где - некоторые скалярные функции, а - заданные числа.


Формулировка этой задачи:

определить кривую данной длины, которая ограничивает максимальную площадь.


Класс изопериметрических задач играет большую роль как в технике, так и в экономике, когда задан суммарный объем некоторого ресурса, которым мы вправе распоряжаться (например, в технике: запас горючего для самолета).


Изопериметрическая задача может быть сведена к задаче Лагранжа увеличением размерности вектора на (то есть станет ).

Например:

,

должны удовлетворять условиям.


Пример.


Уравнение Эйлера:

Отсюда

- является ,

,

определяются из граничных условий:


, .

      1. Способы задания краевых условий.

В общем случае многообразия в ( 12.1 .0) – это некоторые гиперповерхности в пространстве , задаваемые уравнениями

( 12.1.0)

( 12.1.0)

  1. Задача с фиксированными концами.


То есть - заданы.

Среди них различают задачи

с фиксированным временем

и не фиксированным временем: либо , либо – не заданы.


  1. Задача со свободным концом.


Если (или) не задано, то задача называется со свободным левым или правым концом.

Здесь также различают задачи с фиксированным и не фиксированным временем.


  1. Задача с подвижными концами.


Если - фиксированы, а векторы лежат на гиперповерхностях, определяемых уравнениями ( 12.1 .0) и ( 12.1 .0) , то говорят о задаче с подвижными концами и фиксированным временем.


Если либо , либо не фиксировано в ( 12.1 .0),( 12.1 .0), то получают задачу с перемещающимся многообразием на соответствующем конце.

    1. Методы вариационного исчисления.

Начнем с методов вариационного исчисления.

Задача управления в классе вариационных исчислений состоит в следующем:

среди множества функций времени фазовых траекторий, соединяющих фиксированные точки , выбрать функцию максимизации

( 12.2.0)

( 12.2.0)

где

- фиксированная, непрерывно дифференцируемая функция,

- фиксированные параметры.


Уравнения движения в этом случае имеют вид: .

Управление

может принимать любое значение и должно отвечать единственному условию – быть конечно-непрерывной функцией времени.


Рисунок 12.2.1

Классическую задачу вариационного исчисления можно рассматривать как динамический аналог задачи математического программирования.

      1. Уравнение Эйлера.

Определение.

Решением задачи вариационного исчисления ( 12.2 .0) называется допустимая траектория , на которой достигается максимальное значение функционала .

Если такое решение существует, то оно должно удовлетворять необходимым условиям, которые являются динамическими аналогами необходимых условий в классической задаче математического программирования.


Примечание: В классических задачах оптимизации необходимым условием первого порядка является обращение в нуль первой производной. В задаче вариационного необходимым условием является выполнение уравнения Эйлера.


Необходимые условия в классических задачах математического программирования были получены при рассмотрении небольших изменений решения, которым в этом случае являлась точка евклидова пространства.

Необходимые условия для решения классических задач вариационного исчисления можно получить сходным методом, варьируя в малых пределах траекторию, являющуюся решением.


Пусть траектория является решением. Проварьируем траекторию решения, то есть рассмотрим траекторию , близкую к :

( 12.2.0)

где - произвольная функция с кусочно-непрерывной производной, у которой

( 12.2.0)

удовлетворяет как граничным условиям, так и условиям непрерывности , и является допустимой траекторией.

( 12.2.0)

Рисунок 12.2.2

( 12.2.0)

Так как - решение , то достигает максимума при . Следовательно

( 12.2.0)

( 12.2.0)

применяя ко второму члену интегрирование по частям, получаем:

( 12.2.0)

Так как выполняются граничные условия ( 12.2 .0), то

( 12.2.0)

Для того чтобы этот интеграл обращался в нуль при , удовлетворяющих условию непрерывности и граничным условиям, необходимо:

. ( 12.2.0)

Уравнение ( 12.2 .0) называют уравнением Эйлера.

Любая траектория , удовлетворяющая уравнению Эйлера при и граничным условиям

,

называется экстремалью.


В общем случае подынтегральная функция зависит от трех переменных.


  1. если не зависит от , то уравнение Эйлера принимает вид:



Это условие совпадает по форме с необходимым условием экстремума в классической задаче математического программирования при отсутствии ограничений.


  1. не зависит явно от , то уравнение Эйлера

называется непосредственным, то есть


  1. если подынтегральная функция не зависит явно от , то уравнение Эйлера можно представить в виде


Отсюда следует

      1. Необходимые условия.

  1. Уравнение Эйлера – это необходимое условие первого порядка.

  2. Необходимые условия второго порядка:

  • необходимое условие второго порядка – условие Лежандра. Оно заключается в том, что:



Этот вывод следует из необходимости условия второго порядка


для существования максимума функции

при


  • условие Вейерштрасса.

Если траектория решения и - любая другая допустимая траектория, то функция

Функция называется функцией Вейерштрасса.


Условие Вейерштрасса аналогично условию вогнутости целевой функции в статическом случае.


Если функция является вогнутой относительно управляющего параметра , то условие Вейерштрасса выполнено.


  • условия Вейерштрасса – Эрдмана для точки излома допустимой траектории

Эти условия не имеют прямой аналогии в статических задачах, поскольку они существенным образом зависят от времени.

Хотя фазовая траектория является непрерывной, управление должно быть только кусочно - непрерывной функцией.


может состоять из кусков непрерывных кривых, соединенных точками излома, в которых