![]() |
РУБРИКИ |
Оптимальність у системах керування |
РЕКЛАМА |
|
Оптимальність у системах керуванняОптимальність у системах керуванняоптимальність у системах керування 1. Умови оптимальності у неавтономних системах керування У загальному випадку неавтономної системи права частина закону руху й підінтегральна функція цільового функціонала залежать явно від часу , тобто закон руху має вигляд: , (1) а цільовий функціонал дорівнює . (2) Тут функції і - неперервні по сукупності змінних і неперервно диференційовані по змінних , , . Також вважатимемо, що момент часу , який відповідає початковому стану , відомий, а момент часу проходження через кінцеву точку не заданий і повинен бути знайдений, тобто сформульована задача - це задача з вільним часом. Поставлена задача може бути зведена до автономної задачі введенням додаткової змінної . До закону руху при цьому додається рівняння , а до початкових умов - співвідношення . Тепер систему (2) можна переписати у вигляді: (3) а функціонал дорівнюватиме , (4) де (відповідно до доданого у початкову систему рівняння). Отже, неавтономну -вимірну задачу було зведено до автономної задачі з розширеним фазовим простором. У новій задачі потрібно знайти оптимальну траєкторію, що поєднує точку розширеного фазового простору з деякою точкою на прямій, яка проходить через точку паралельно осі . Оскільки кінцеве значення змінної невідоме, то нова задача - це задача з фіксованим лівим і рухомим правим кінцями. Якщо в задачі оптимального керування (3) - (4) відомі і початковий момент часу й кінцевий момент часу , то задача називається задачею з фіксованим часом. Перетворення цієї задачі введенням додаткового змінного приводить до задачі з фіксованими кінцями в такому формулюванні. Потрібно знайти керування , що переводить фазову точку системи (2) зі стану в момент часу у стан в момент часу , причому функціонал (4) набуває найменшого значення. Зауважимо, що момент часу попадання в точку можна не вважати фіксованим, оскільки в силу тотожності попадання в точку може відбутися тільки в цей момент часу. Таким чином, до даної задачі можна застосувати теорему, відповідно до якої для одержання необхідних умов екстремуму функціонала необхідно максимізувати функцію Понтрягіна , (5) де - загальний вигляд функції Понтрягіна з теореми 1, у якій не врахована додаткова, ()-ша змінна. Спряжена система для цієї задачі за умов набуває вигляду: (6) Має місце така теорема. Припустимо, , - оптимальний процес для задачі з фіксованим часом. Тоді існує ненульова вектор-функція , що відповідає цьому процесу, така що: 1. Для будь-якого функція змінної набуває максимального значення в точці , тобто: : . 2. , . Оскільки, як і раніше, , то умову 2 цієї теореми достатньо перевірити в якій-небудь одній точці відрізка . Розглянемо випадок, коли при фіксованому правий кінець вільний. Ця задача полягає в тому, щоб із заданого стану за заданий час пройти по траєкторії з довільним кінцевим станом за умови мінімізації цільового функціонала. Умови трансверсальності для цієї задачі набувають вигляду: , . (7) Для цього випадку необхідна умова оптимальності полягає в тому, щоб функція досягала максимального значення для кожного на оптимальному керуванні і мала місце умова (7). 2 Поняття особливого керування На практиці часто зустрічаються задачі оптимального керування, у яких функція Понтрягіна лінійно залежить від всіх керувань або від частини з них (наприклад, в лінійних задачах оптимальної швидкодії). Однак у нелінійних задачах оптимального керування (якщо функція Понтрягіна є нелінійною по одній або декількох фазових змінних) можлива ситуація, коли на оптимальній траєкторії коефіцієнт при одній з компонент вектора керування обертається на нуль всюди на деякому інтервалі часу, і тоді умова максимуму функції за не дозволяє однозначно визначити оптимальне керування. Ця ситуація називається особливим режимом керування. Дослідимо її детальніше. Розглянемо автономну задачу оптимального керування , Де ; , , , , - довільна множина з ; - лінійний простір кусково-неперервних на функцій. Крайові умови задачі мають вигляд: , . Потрібно знайти таке припустиме керування , що переводить систему зі стану у стан , причому відповідний припустимий процес доставляє мінімальне значення функціоналу , де функції , неперервні по сукупності всіх змінних і неперервно-диференційовані по змінних . Вважатимемо, що функція Понтрягіна для цієї задачі є лінійною за частиною компонент вектора . Виділимо із цих компонент групу з керувань (з тих, за якими функція лінійна) і позначимо їх через , а інші керувань зберемо у вектор (він також може включати компоненти, за якими функція лінійна). За таких умов закон руху набуває вигляду: , де . Складемо функцію Понтрягіна для даної задачі: . Очевидно, що , . (8) Припустимо, що процес разом з розв'язком спряженої системи , , (9) задовольняє принципу максимуму і, крім того, припустимо, що у всіх точках деякого інтервалу має місце рівність , (10) або, враховуючи (10), , , . (11) Ця ситуація означає, що коефіцієнти при на деякому часовому відрізку дорівнюють 0, і оптимальне керування визначити неможливо. У цьому випадку вектор керувань називається особливим керуванням на відрізку , процес - особливим режимом, траєкторія - траєкторією особливого режиму, а відрізок часу - ділянкою особливого керування. З формули (11) випливає, що на ділянці особливого режиму функція Понтрягіна не залежить від . Дійсно, : . Тому в даній ситуації умова максимуму по не дає жодної інформації про конкретні значення керувань . Оскільки на ділянці особливого режиму має місце співвідношення (11), то очевидно, що , і т.д. Останні співвідношення разом з умовою (10) дозволяють визначити всі особливі режими. 3. Лінійна задача оптимальної швидкодії Розглянемо лінійну задачу оптимальної швидкодії: , , (12) де , , , - числові матриці розмірності та відповідно. Область керування задачі - замкнутий обмежений багатогранник в : , , (13) Якщо для будь-якого вектора , паралельного будь-якому ребру багатогранника , система векторів , , …, (14) є лінійно незалежною, то багатогранник задовольняє умові спільності положення відносно системи (14). Для перевірки лінійної незалежності векторів (13) достатньо перевірити, чи матриця, стовпцями якої є стовпці (12), є невиродженою, тобто . Перепишемо формулу (10): , , де , - -і рядки матриць і . Функція Понтрягіна лінійної задачі оптимальної швидкодії має вигляд: (15) Оскільки перший доданок у формулі (15) не залежить від , то функція досягає максимуму за змінною одночасно з функцією . Спряжена система у цьому випадку може бути записана у вигляді: , , або у векторній формі . (16) Позначимо через . З теореми 2 випливає, що якщо - оптимальне керування, то існує такий ненульовий розв'язок системи (16), для якого в кожний момент часу функція набуватиме максимального значення за змінною : . (17) Оскільки система (17) з постійними коефіцієнтами не містить невідомих функцій і , то всі її розв'язки можна легко знайти, після чого, використовуючи їх для розв'язання задачі максимізації функції на множині , знаходимо оптимальні керування . Для будь-якого нетривіального розв'язання системи (11) співвідношення (14) однозначно визначає керування , причому це керування кусково стале, а значеннями керування в точках неперервності є вершини багатогранника . Точки розриву оптимальної функції керування відповідають зміні значення керування і називаються точками перемикання. Якщо - точка перемикання, то ліворуч від неї керування має одне значення, наприклад, , а праворуч інше - . Позначимо через підмножину у виду . (18) Якщо всі корені характеристичного рівняння матриці з (14) є дійсними, то для будь-якого розв'язання рівняння (18) кожна з функцій є кусково сталою і має не більше ніж перемикань ( - порядок системи (16)). Керування називається екстремальним керуванням, якщо воно задовольняє принципу максимуму. Для лінійної задачі оптимальної швидкодії з областю керування - багатогранником керування є екстремальним, якщо існує таке нетривіальне розв'язання системи (17), для якого матиме місце співвідношення (18). Зрозуміло, що будь-яке оптимальне керування є екстремальним. Тому, щоб знайти оптимальне керування, що переводить фазову точку зі стану у стан , треба відшукати всі екстремальні керування з цими крайовими умовами, а потім серед них вибрати те, що здійснює перехід за найменший час. У загальному випадку можуть існувати кілька оптимальних керувань, що переводять фазову точку зі стану у стан , але якщо початок координат у просторі керувань є внутрішньою точкою багатогранника , то екстремальне керування єдине. Отже, у лінійних задачах оптимальної швидкодії принцип максимуму дозволяє не тільки визначити вид оптимальних керувань, але й одержати умови єдиності оптимального керування. Припустимо, що початок координат є внутрішньою точкою багатогранника припустимих керувань. Якщо і - два екстремальних керування, що переводять фазову точку зі стану у стан за час і відповідно, то і , . У теоремі має місце умова . Теорема. Якщо існує хоча б одне керування, що переводить систему (17) зі стану у стан , то існує й оптимальне по швидкодії керування, що також переводить систему з у . 4. Умови оптимальності у задачі з рухомими кінцями У задачі з рухомими кінцями або початковий стан , або кінцевий стан , або обидва ці стани невідомі. Задані тільки множини і , що містять точки та . Гіперповерхня - це множина всіх точок , які задовольняють співвідношенню , де - скалярна диференційована функція. Якщо - лінійна функція, то гіперповерхня називається гіперплощиною і описується рівнянням . (19) Якщо , то гіперплощина (19) є ()-вимірним лінійним підпростором в . Будь-який ()-вимірний підпростір може бути заданий як множина розв'язань лінійної однорідної системи з рівнянь із невідомими, матриця якої має ранг : . Такий лінійний підпростір називається -вимірною площиною. Множина розв'язань системи нелінійних рівнянь де функції , …, диференційовані і ранг матриці Якобі цієї системи функцій дорівнює , є -вимірним гладким різноманіттям. Задача оптимального керування з рухомими кінцями полягає в тому, щоб знайти таке припустиме керування для системи із законом руху , , , яке переводить фазову точку з деякого, заздалегідь невідомого, стану на -вимірному різноманітті () у деякий стан на -вимірному різноманітті () і надає найменшого значення функціоналу . Задача оптимального керування з фіксованими кінцями є окремим випадком цієї задачі при , тобто коли різноманіття і вироджуються в точку. Відсутність рівнянь, що задають початковий і кінцевий стани, приводить до того, що система необхідних умов перестає бути повною. У цьому разі для одержання відсутніх рівнянь використовують умови, що називаються умовами трансверсальності. Умови трансверсальності. Вектор спряжених змінних із принципу максимуму задовольняє умові трансверсальності на лівому кінці траєкторії , якщо вектор ортогональний дотичній площини до різноманіття в точці , тобто , (20) де - довільний вектор, що лежить у дотичній площини. Аналогічно формулюється умова на правому кінці. Якщо , - оптимальний процес у задачі з рухомими кінцями , , то ненульова вектор-функція , що існує відповідно до теореми 3, задовольняє на кожному з кінців траєкторії умовам трансверсальності. Розглянемо окремий випадок задачі з рухомими кінцями, коли, наприклад, правий кінець траєкторії вільний (тобто ). Тоді умови трансверсальності зводяться до співвідношення . Повний вектор спряжених змінних визначається з точністю до довільної сталої, зокрема, вважають, що (відповідно до принципу максимуму , ) і тоді . |
|
© 2007 |
|