1. Умови оптимальності у неавтономних системах керування
У
загальному
випадку неавтономної
системи права
частина закону
руху й підінтегральна
функція цільового
функціонала
залежать явно
від часу
,
тобто закон
руху має вигляд:
,
(1)
а цільовий функціонал дорівнює
.
(2)
Тут
функції
і
– неперервні
по сукупності
змінних і неперервно
диференційовані
по змінних
,
,
.
Також
вважатимемо,
що момент часу
,
який відповідає
початковому
стану
,
відомий, а момент
часу
проходження
через кінцеву
точку
не заданий і
повинен бути
знайдений,
тобто сформульована
задача – це
задача з вільним
часом.
Поставлена
задача може
бути зведена
до автономної
задачі введенням
додаткової
змінної
.
До закону руху
при цьому додається
рівняння
,
а
до початкових
умов – співвідношення
.
Тепер систему (2) можна переписати у вигляді:
(3)
а
функціонал
дорівнюватиме
,
(4)
де
(відповідно
до доданого
у початкову
систему рівняння).
Отже,
неавтономну
-вимірну
задачу було
зведено до
автономної
задачі з розширеним
фазовим простором.
У новій задачі
потрібно знайти
оптимальну
траєкторію,
що поєднує
точку
розширеного
фазового простору
з деякою точкою
на прямій, яка
проходить через
точку
паралельно
осі
.
Оскільки кінцеве
значення
змінної
невідоме, то
нова задача
– це задача з
фіксованим
лівим і рухомим
правим кінцями.
Якщо
в задачі оптимального
керування (3) –
(4) відомі і початковий
момент часу
й кінцевий
момент часу
,
то задача називається
задачею з фіксованим
часом. Перетворення
цієї задачі
введенням
додаткового
змінного приводить
до задачі з
фіксованими
кінцями в такому
формулюванні.
Потрібно знайти
керування
,
що переводить
фазову точку
системи (2) зі
стану
в момент часу
у стан
в момент часу
,
причому функціонал
(4) набуває найменшого
значення. Зауважимо,
що момент часу
попадання в
точку
можна не вважати
фіксованим,
оскільки в силу
тотожності
попадання в
точку
може відбутися
тільки в цей
момент часу.
Таким чином,
до даної задачі
можна застосувати
теорему, відповідно
до якої для
одержання
необхідних
умов екстремуму
функціонала
необхідно
максимізувати
функцію Понтрягіна
,
(5)
де
– загальний
вигляд функції
Понтрягіна
з теореми 1, у
якій не врахована
додаткова,
(
)-ша
змінна. Спряжена
система для
цієї задачі
за умов
набуває вигляду:
(6)
Має місце така теорема.
Припустимо,
,
– оптимальний
процес для
задачі з фіксованим
часом. Тоді
існує ненульова
вектор-функція
,
що відповідає
цьому процесу,
така що:
1.
Для будь-якого
функція
змінної
набуває максимального
значення в
точці
,
тобто:
:
.
2.
,
.
Оскільки,
як і раніше,
,
то умову 2 цієї
теореми достатньо
перевірити
в якій-небудь
одній точці
відрізка
.
Розглянемо
випадок, коли
при фіксованому
правий кінець
вільний. Ця
задача полягає
в тому, щоб із
заданого стану
за заданий час
пройти по траєкторії
з довільним
кінцевим станом
за умови мінімізації
цільового
функціонала.
Умови трансверсальності
для цієї задачі
набувають
вигляду:
,
.
(7)
Для
цього випадку
необхідна умова
оптимальності
полягає в тому,
щоб функція
досягала
максимального
значення для
кожного
на оптимальному
керуванні
і мала місце
умова (7).
2 Поняття особливого керування
На
практиці часто
зустрічаються
задачі оптимального
керування, у
яких функція
Понтрягіна
лінійно залежить
від всіх керувань
або від частини
з них (наприклад,
в лінійних
задачах оптимальної
швидкодії).
Однак у нелінійних
задачах оптимального
керування (якщо
функція Понтрягіна
є нелінійною
по одній або
декількох
фазових змінних)
можлива ситуація,
коли на оптимальній
траєкторії
коефіцієнт
при одній з
компонент
вектора керування
обертається
на нуль всюди
на деякому
інтервалі часу,
і тоді умова
максимуму
функції
за
не дозволяє
однозначно
визначити
оптимальне
керування. Ця
ситуація називається
особливим
режимом керування.
Дослідимо її
детальніше.
Розглянемо автономну задачу оптимального керування
,
Де
;
,
,
,
,
– довільна
множина з
;
– лінійний
простір кусково-неперервних
на
функцій.
Крайові умови задачі мають вигляд:
,
.
Потрібно
знайти таке
припустиме
керування
,
що переводить
систему зі
стану
у стан
,
причому відповідний
припустимий
процес
доставляє
мінімальне
значення функціоналу
,
де
функції
,
неперервні
по сукупності
всіх змінних
і неперервно-диференційовані
по змінних
.
Вважатимемо,
що функція
Понтрягіна
для цієї задачі
є лінійною за
частиною компонент
вектора
.
Виділимо із
цих компонент
групу з
керувань (з
тих, за якими
функція
лінійна) і позначимо
їх через
,
а інші
керувань зберемо
у вектор
(він також може
включати компоненти,
за якими функція
лінійна). За
таких умов
закон руху
набуває вигляду:
,
де
.
Складемо функцію Понтрягіна для даної задачі:
.
Очевидно, що
,
.
(8)
Припустимо,
що процес
разом з розв’язком
спряженої
системи
,
,
(9)
задовольняє
принципу максимуму
і, крім того,
припустимо,
що у всіх точках
деякого інтервалу
має місце рівність
,
(10)
або, враховуючи (10),
,
,
.
(11)
Ця
ситуація означає,
що коефіцієнти
при
на деякому
часовому відрізку
дорівнюють
0, і оптимальне
керування
визначити
неможливо. У
цьому випадку
вектор керувань
називається
особливим
керуванням
на відрізку
,
процес
– особливим
режимом, траєкторія
– траєкторією
особливого
режиму, а відрізок
часу
– ділянкою
особливого
керування.
З
формули (11) випливає,
що на ділянці
особливого
режиму функція
Понтрягіна
не залежить
від
.
Дійсно,
:
.
Тому
в даній ситуації
умова максимуму
по
не дає жодної
інформації
про конкретні
значення керувань
.
Оскільки на ділянці особливого режиму має місце співвідношення (11), то очевидно, що
,
і т.д. Останні співвідношення разом з умовою (10) дозволяють визначити всі особливі режими.
3. Лінійна задача оптимальної швидкодії
Розглянемо лінійну задачу оптимальної швидкодії:
,
,
(12)
де
,
,
,
– числові матриці
розмірності
та
відповідно.
Область
керування
задачі
– замкнутий
обмежений
багатогранник
в
:
,
,
(13)
Якщо
для будь-якого
вектора
,
паралельного
будь-якому
ребру багатогранника
,
система векторів
,
,
…,
(14) є лінійно
незалежною,
то багатогранник
задовольняє
умові спільності
положення
відносно системи
(14).
Для перевірки лінійної незалежності векторів (13) достатньо перевірити, чи матриця, стовпцями якої є стовпці (12), є невиродженою, тобто
.
Перепишемо формулу (10):
,
,
де
,
–
-і
рядки матриць
і
.
Функція Понтрягіна лінійної задачі оптимальної швидкодії має вигляд:
(15)
Оскільки
перший доданок
у формулі (15) не
залежить від
,
то функція
досягає максимуму
за змінною
одночасно з
функцією
.
Спряжена система у цьому випадку може бути записана у вигляді:
,
,
або у векторній формі
.
(16)
Позначимо
через
.
З теореми 2 випливає,
що якщо
– оптимальне
керування, то
існує такий
ненульовий
розв’язок
системи (16), для
якого в кожний
момент часу
функція
набуватиме
максимального
значення за
змінною
:
.
(17)
Оскільки
система (17) з
постійними
коефіцієнтами
не містить
невідомих
функцій
і
,
то всі її розв’язки
можна легко
знайти, після
чого, використовуючи
їх для розв’язання
задачі максимізації
функції
на множині
,
знаходимо
оптимальні
керування
.
Для
будь-якого
нетривіального
розв’язання
системи (11) співвідношення
(14) однозначно
визначає керування
,
причому це
керування
кусково стале,
а значеннями
керування в
точках неперервності
є вершини
багатогранника
.
Точки
розриву оптимальної
функції керування
відповідають
зміні значення
керування і
називаються
точками перемикання.
Якщо
– точка перемикання,
то ліворуч від
неї керування
має одне значення,
наприклад,
,
а праворуч інше
–
.
Позначимо
через
підмножину
у
виду
.
(18)
Якщо
всі корені
характеристичного
рівняння матриці
з (14) є дійсними,
то для будь-якого
розв’язання
рівняння (18) кожна
з функцій
є кусково сталою
і має не більше
ніж
перемикань
(
– порядок системи
(16)).
Керування
називається
екстремальним
керуванням,
якщо воно задовольняє
принципу максимуму.
Для лінійної
задачі оптимальної
швидкодії з
областю керування
– багатогранником
керування
є екстремальним,
якщо існує таке
нетривіальне
розв’язання
системи (17), для
якого матиме
місце співвідношення
(18).
Зрозуміло, що
будь-яке оптимальне
керування є
екстремальним.
Тому, щоб знайти
оптимальне
керування, що
переводить
фазову точку
зі стану
у стан
,
треба відшукати
всі екстремальні
керування з
цими крайовими
умовами, а потім
серед них вибрати
те, що здійснює
перехід за
найменший час.
У загальному
випадку можуть
існувати кілька
оптимальних
керувань, що
переводять
фазову точку
зі стану
у стан
,
але якщо початок
координат у
просторі керувань
є внутрішньою
точкою багатогранника
,
то екстремальне
керування
єдине. Отже, у
лінійних задачах
оптимальної
швидкодії
принцип максимуму
дозволяє не
тільки визначити
вид оптимальних
керувань, але
й одержати
умови єдиності
оптимального
керування.
Припустимо,
що початок
координат є
внутрішньою
точкою багатогранника
припустимих
керувань. Якщо
і
– два екстремальних
керування, що
переводять
фазову точку
зі стану
у стан
за час
і
відповідно,
то
і
,
.
У теоремі має
місце умова
.
Теорема. Якщо
існує хоча б
одне керування,
що переводить
систему (17) зі
стану
у стан
,
то існує й оптимальне
по швидкодії
керування, що
також переводить
систему з
у
.
4. Умови оптимальності у задачі з рухомими кінцями
У
задачі з рухомими
кінцями або
початковий
стан
,
або кінцевий
стан
,
або обидва ці
стани невідомі.
Задані тільки
множини
і
,
що містять
точки
та
.
Гіперповерхня
– це множина
всіх точок
,
які задовольняють
співвідношенню
,
де
– скалярна
диференційована
функція. Якщо
– лінійна функція,
то гіперповерхня
називається
гіперплощиною
і описується
рівнянням
.
(19)
Якщо
,
то гіперплощина
(19) є (
)-вимірним
лінійним підпростором
в
.
Будь-який
()-вимірний
підпростір
може бути заданий
як множина
розв’язань
лінійної однорідної
системи з
рівнянь із
невідомими,
матриця якої
має ранг
:
.
Такий
лінійний підпростір
називається
-вимірною
площиною. Множина
розв’язань
системи нелінійних
рівнянь
де
функції
,
…,
диференційовані
і ранг матриці
Якобі цієї
системи функцій
дорівнює
,
є
-вимірним
гладким різноманіттям.
Задача
оптимального
керування з
рухомими кінцями
полягає в тому,
щоб знайти таке
припустиме
керування
для системи
із законом руху
,
,
,
яке
переводить
фазову точку
з деякого,
заздалегідь
невідомого,
стану
на
-вимірному
різноманітті
(
)
у деякий стан
на
-вимірному
різноманітті
(
)
і надає найменшого
значення функціоналу
.
Задача
оптимального
керування з
фіксованими
кінцями є окремим
випадком цієї
задачі при
,
тобто коли
різноманіття
і
вироджуються
в точку.
Відсутність рівнянь, що задають початковий і кінцевий стани, приводить до того, що система необхідних умов перестає бути повною. У цьому разі для одержання відсутніх рівнянь використовують умови, що називаються умовами трансверсальності.
Умови
трансверсальності.
Вектор спряжених
змінних
із принципу
максимуму
задовольняє
умові трансверсальності
на лівому кінці
траєкторії
,
якщо вектор
ортогональний
дотичній площини
до різноманіття
в точці
,
тобто
,
(20)
де
– довільний
вектор, що лежить
у дотичній
площини. Аналогічно
формулюється
умова на правому
кінці.
Якщо
,
– оптимальний
процес у задачі
з рухомими
кінцями
,
,
то ненульова
вектор-функція
,
що існує відповідно
до теореми 3,
задовольняє
на кожному з
кінців траєкторії
умовам трансверсальності.
Розглянемо
окремий випадок
задачі з рухомими
кінцями, коли,
наприклад,
правий кінець
траєкторії
вільний (тобто
).
Тоді умови
трансверсальності
зводяться до
співвідношення
.
Повний вектор
спряжених
змінних
визначається
з точністю до
довільної
сталої, зокрема,
вважають, що
(відповідно
до принципу
максимуму
,
)
і тоді
.