Сближение однотипных объектов, эволюция которых описывается системами Вольтерра Текст научной статьи по специальности «Математика»
Актуальность и цели. Рассматриваются некоторые вопросы оптимального управления, а именно теория динамических игр для случая, когда динамика игры описывается линейными интегральными и интегродифференциальными векторными уравнениями Вольтерра. Целью работы является решение задач оптимизации функционалов типа расстояния. Материалы и методы. Для решения этих задач автором построена некоторая модификация известной экстремальной конструкции академика Н. Н. Красовского, разработанная для обыкновенных дифференциальных систем. Центральным элементом этой модификации является новое определение позиции игры , для вычисления которой требуется полная память по управляющим воздействиям , что существенно усложняет все исследование по сравнению со случаем обыкновенных линейных дифференциальных систем. Результаты и выводы. В работе получены существенно новые результаты, которые дополняют и расширяют общую теорию динамических игр. Они заключаются в распространении классических методов академика Н. Н. Красовского на более сложные объекты – динамические системы Вольтерра. Таким образом, доказывается возможность расширения области приложения этих методов.
Похожие темы научных работ по математике , автор научной работы — Пасиков Владимир Леонидович
APPROACH OF SINGLE-TYPE OBJECTS, EVOLUTION OF WHICH IS DESCRIBED BY VOLTERRA SYSTEMS
Background. The paper discusses some problems of optimal control, namely, the theory of dynamic games when the game dynamics is described by linear integral and integrodifferential vector Volterra equations. The aim of the article is to solve problems of optimization of distance-type functionals. Materials and methods. To solve these problems, the author built a modification of the famous extreme construction of academician N. N. Krasovskiy developed for ordinary differential systems. The centerpiece of this modification is a new definition of the game position for which it is necessary to calculate the total memory to manage stress that greatly complicates the entire study compared with the case of ordinary differential systems. Results and conclusions. The paper presents significant new results that complement and extend the general theory of dynamic games. They consist in the spread of classical methods of academician N. N. Krasovskiy on more complex objects – Volterra dynamic systems. Thus, the author has proved the possibility of extending the field of application of these methods.
Текст научной работы на тему «Сближение однотипных объектов, эволюция которых описывается системами Вольтерра»
Известия высших учебных заведений. Поволжский регион
СБЛИЖЕНИЕ ОДНОТИПНЫХ ОБЪЕКТОВ, ЭВОЛЮЦИЯ КОТОРЫХ ОПИСЫВАЕТСЯ СИСТЕМАМИ ВОЛЬТЕРРА
Актуальность и цели. Рассматриваются некоторые вопросы оптимального управления, а именно теория динамических игр для случая, когда динамика игры описывается линейными интегральными и интегродифференциальными векторными уравнениями Вольтерра. Целью работы является решение задач оптимизации функционалов типа расстояния.
Материалы и методы. Для решения этих задач автором построена некоторая модификация известной экстремальной конструкции академика Н. Н. Красовского, разработанная для обыкновенных дифференциальных систем. Центральным элементом этой модификации является новое определение позиции игры, для вычисления которой требуется полная память по управляющим воздействиям, что существенно усложняет все исследование по сравнению со случаем обыкновенных линейных дифференциальных систем.
Результаты и выводы. В работе получены существенно новые результаты, которые дополняют и расширяют общую теорию динамических игр. Они заключаются в распространении классических методов академика Н. Н. Красовского на более сложные объекты - динамические системы Вольтерра. Таким образом, доказывается возможность расширения области приложения этих методов.
Ключевые слова: интегральное уравнение Вольтерра, интегродифферен-циальное уравнение Вольтерра, управляющее воздействие, оптимальная стратегия, измеримая функция, позиция игры.
APPROACH OF SINGLE-TYPE OBJECTS, EVOLUTION OF WHICH IS DESCRIBED BY VOLTERRA SYSTEMS
Background. The paper discusses some problems of optimal control, namely, the theory of dynamic games when the game dynamics is described by linear integral and integrodifferential vector Volterra equations. The aim of the article is to solve problems of optimization of distance-type functionals.
Materials and methods. To solve these problems, the author built a modification of the famous extreme construction of academician N. N. Krasovskiy developed for ordinary differential systems. The centerpiece of this modification is a new definition of the game position for which it is necessary to calculate the total memory to manage stress that greatly complicates the entire study compared with the case of ordinary differential systems.
Results and conclusions. The paper presents significant new results that complement and extend the general theory of dynamic games. They consist in the spread of classical methods of academician N. N. Krasovskiy on more complex objects -Volterra dynamic systems. Thus, the author has proved the possibility of extending the field of application of these methods.
Key words: Volterra integral equation, Volterra integrodifferential equation, control action, optimal strategy, measurable function, game position.
University proceedings. Volga region
Физико-математические науки. Математика
1. Пусть эволюция двух управляемых объектов описывается системами интегральных уравнений Вольтерра:
у(t) = Л(t)+ Ja (t. 5) у (s )ds + Js (t. s )u (s )ds. (1.1)
z(t) = Л (t) + Ja (t. s )z (s )ds + Js (t. s )v (s )ds. (1.2)
здесь y(t). z(t) - «-мерные фазовые векторы; f1(t). f2(t) - «-мерные абсолютно непрерывные на [0.0] вектор-функции внешних воздействий; A(t,s) - непрерывная при 0 < s < t <0 матрица «X«; B(t,s) - непрерывная при 0 < s < t <0 матрица « X r с интегрируемыми по Лебегу производными по первому аргументу на [0.0]. Управляющее воздействие u(t) формирует по ходу игры первый игрок - преследователь. управляющее воздействие v(t) формирует по ходу игры второй игрок - преследуемый. их реализации — измеримые по Лебегу функции и [t]. v [t] стесненные вложениями
Vt[0. 0]^ и(t)е P с Rr. v(t)е Q с Rr. (1.3)
P и Q - выпуклые. замкнутые и ограниченные множества; 0> 0 - фиксированный момент окончания игры. Интегралы понимаются в смысле Лебега. Согласно [1-3] каждая из систем (1.1) и (1.2) имеет единственное абсолютно непрерывное решение на [0.0] .
Как и в [4]. здесь и далее принимаем. что отношение размеров множества Р к соответствующим размерам множества Q равно числу в > 1. которое называется коэффициентом подобия. Отметим. что при рассмотрении процесса преследования одного объекта другим в динамической игре используется понятие прицеливания с использованием некоторого направляющего вектора l. если такой вектор определяется единственным образом. то такой случай называется регулярным.
Теорема 1. Если в условиях (1.3) в> 1. то в игре на сближение-уклонение однотипных объектов (1.1) и (1.2) имеет место регулярный случай.
Доказательство. Воспользуемся планом доказательства соответствующего утверждения из [4]; согласно [5] имеем
J max [l 'Z (t. s)]v( s)ds
J max\l'Y (0. s)] u( s)ds +1 [z(0. fy) — у (0. fy)]
если правая часть этого равенства положительная. иначе 80 ((. у (0. t0). z (0. t0)) = 0. Штрих означает транспонирование.
Physical and mathematical sciences. Mathematics
Известия высших учебных заведений. Поволжский регион
Приведем в связи с (1.4) обозначения из [5]:
Y (6, t) = Ф(6, t) B(t, t) + ]Ф(Г, s)
Ф (t, s ) = E + (t, T)d t,
где E — единичная матрица; R(t,s) - резольвента матрицы A(t,s);
y(6,to) = Ф(6,0Щ0) + |ф(6,s)dfi (s) + jY(6,s)u[s]ds,
z(6, t0) = Ф(6,0)f (0) + |Ф (6,s)df2 (s) + jZ (6,s)v[s]ds,
где y (6, t0), z (6, t0) — состояния объектов (1.1) и (1.2) в момент t0 е [0,6]; (, у (6, t0), z (6, t0)) - позиции игры; решения систем определяются формулами [5]
у(t) = у(6,t0) + jY(6,s)u[s]ds, z(t) = z(6,t0) + jZ(6,s)v[s]ds.
В рассматриваемом случае Y (6, s) = Z (6, s) = X (6, s); u[s], v[s] - реализации управляющих воздействий u(s), v(s) на соответствующих промежутках. Тогда получаем
80 ((, у (6, t0), z (6, t0)) = max [ max [/'Z(6, s)] v(s)ds —
где x(6, t0) = у (6, t0) — z(6, t0).
Отметим, что (1.5) получено в результате вычитания (1.1) из (1.2), при
x(t) = f (t) + jA(t- s )x (s )ds + jB (t, s )w (s )ds, (1.6)
University proceedings. Volga region
Физико-математические науки. Математика
где f (t) = f2(t) — fi(t), w eW - ограниченное, выпуклое, замкнутое множество.
Таким образом, задача сближения для объектов (1.1) и (1.2) трансформируется в задачу наведения на начало координат, в задачу минимизации функционала ||х(0)|| на траекториях (1.6). Требуется рассмотреть два случая: в = 1, в > 1. Пусть сначала в = 1, тогда в (1.5) в силу условия So (,((0,t0),z(0,to))>0 вектор x(0,t0) не может быть нулевым. В этом случае [4, с. 170] выражение /х(0,t), te [0, 0), достигает максимума на единственном векторе:
Пусть теперь в > 1. Проведем аналогично [4] доказательство от противного. Предположим, что максимум в правой части (1.5) достигается на двух различных векторах /1 и /2 . Обозначим
Из (1.5), (1.7) ясно, что не может быть /1 =-/2, так как из [4, с. 381] имеем р(0,0,/1) + р(0,0,/2)- р(0,0,/1 + /2), а тогда из (1.5) вытекает равенство
2е0 = (1 -в)[р(0/1)+ р(0/2 )] -- (1 -в)р(t0,0,/1 + /2 ) =(1 -в)р(t0,0,0) = 0 ,
которое противоречит условию £0 > 0.
Если теперь /1 Ф —/2 , то составляем новый единичный вектор
Вычисляем правую часть (1.5) при / = /3, получаем
(1 - Р )р (t0,0, /3 ) + /3 х О0, t0 )
- J + / [р(t0,0,/1 ) + р(t0,0,/2 )] + /3хI0, t0 ) = II, +0 II Так как Ц + /21| < ||/Ц +1/21|, то из (1.8) следует неравенство
(1 -в)р tto, 0, /з)-/ х I0, t0 )>£0 (to, (I0, t0 ) z l0, t0)),
которое противоречит (1.5).
Physical and mathematical sciences. Mathematics
Известия высших учебных заведений. Поволжский регион
2. Пусть эволюция двух управляемых объектов описывается системами интегродифференциальных уравнений типа Вольтерра с управляющими воздействиями вне интеграла
y (t)= f (t) + A (t) y (t) + JK (t, s) y (s )ds + u (t), y (0) = y0, (2.1)
z(t)= f2 (t) + A(t)z(t) + Jk(t,s)z(s)ds + v(t), z(0) = z0, (2.2)
где y (t), z(t) - «-мерные фазовые векторы; f (t), f (t) - n-мерные векторы-функции внешних воздействий, измеримые по Лебегу на [0,0]; A(t) -непрерывная на [0,0] матрица « X« ; K (t, s) - непрерывная при 0< s < t <0 матрица « X«; управление u (t) формирует первый игрок - преследователь, управление v (t) формирует второй игрок - преследуемый; их реализации -измеримые функции u[t], v[t] - стеснены вложениями
Vta [0,0] ^ u(t)a P с R«, v(t)a Q c R«, (2.3)
P и Q - выпуклые, ограниченные, замкнутые множества; интегралы понимаются в смысле Лебега.
Согласно [2, 6] каждая из систем (2.1), (2.2) имеет единственное абсолютно непрерывное решение, удовлетворяющее заданному начальному условию. Объект (1.1) преследует объект (1.2).
Теорема 2. Если в условиях (2.3) в > 1, то в игре на сближение-уклонение однотипных объектов (2.1) и (2.2) имеет место регулярный случай.
Доказательство. Воспользуемся планами доказательства соответствующего утверждения из [4, с. 169] и теоремы 1. Программный максимин
80 (, y (0, t0), z (0, t0)) при условии 80 > 0 определяется в произвольный момент t0, 0 < t0 <0, формулой [4, 7]
80 (, у У0, t0), z l0, t0 )) =
J max[/'z1 (0, s)]v( s)ds - J max[/y1 (s)]u( s)ds+1' [ z (0, t)) - y(0, t0
В связи с (2.4) приведем обозначения из [7]: Y (t, s) - матрица Коши системы
Z (t, s) = Y (t, s) = X (t, s); R (t, s) - резольвента матрицы
L (t, s) = J K (t, t)Y (t, s )d t,
y1 (t, s )= Y (t, s) + J Y (t, t) R (t, s )d t = zj(t, s),
University proceedings. Volga region
Физико-математические науки. Математика
Mi( s) = L (s,0 )j0 + fi( s), M2( s) = L (s,0)z0 + f2( s).
Тогда решения систем (2.1) и (2.2) записываются по формулам [7] при Л ( s ) = ^i (t, s ) = xi (t, s):
У (t ) = Y (0,0) y0 + J xi(t ,s)Mi (s )ds + J xi(0,s $v[s]ds,
:(t) = Y (0,0) ^0 + J xi(t ,s )M2 (s )ds + J xi(0,s )v[s ]ds.
Далее обозначаем реализации в момент t0 (совместно с t0 -позицией
у (0, t0 ) = Y (0,0 )У0 + J xi(t, s) Mi (s )ds + J xi(0, s)^v[ s]ds,
z (0, t0) = Y (0,0 )z0 + J xi(t, s)M2 (s )ds + J xi(0, s )v[ s]ds, 0 0
отсюда получаем реализации в момент t е [t0,0]:
у (0, t) = у (0, t0) + J xi(0, s)Pv(s)ds , z (0, t) = z (0, t0) + J xi(0, s)v(s)ds .
Тогда для рассматриваемого случая получаем программный максимин
80 (t0,У (0,s),Z(0,s)) = max Jmax[i'Z(0,s)]v(s)ds -
max [l'yi (0, s)] Pv(s)ds +1'[z(0, t0) - у(0, fy)] =
(i-P) Jmax[xi (0,s)v(s)]ds-1x(0,t0)
где x (0, t0 ) = у (0, t0)-z (0, t0).
Как и в предыдущем параграфе, рассматриваются два случая: в = i, в > i. Соотношение (2.5) полностью аналогично (i.5). Поэтому далее доказательство проводится дословным повторением доказательства теоремы i.
Physical and mathematical sciences. Mathematics
Известия высших учебных заведений. Поволжский регион
3. Рассматриваем теперь интегродифференциальные системы Вольтер-ра с управляющими воздействиями под знаком интеграла:
У (t) = fi (t) + A(t)y (t) + Jk(t,s)y (s)ds + Jg(t,s)u (s)ds,y (0) = y0, (3.1)
z(t) = f2 (t) + A(t)z(t) + jK (t, s) z (s )ds + Jb (t, s )v (s )ds, z (0) = z0, (3.2)
здесь fi (t) и f2 (t) - функции, измеримые по Лебегу на [0, 0]; реализации управляющих воздействий — измеримые по Лебегу функции u(t), v(t), стесненные вложениями
Vt[0, 0] ^ u(t)е P с Rr, v(t)е Q с Rr, (3.3)
В(t,s) - непрерывная при 0 < s < t <0 матрица n Xn с интегрируемой по Лебегу производной по первому аргументу. Согласно [2, 6, 8] каждая из систем имеет единственное абсолютно непрерывное решение, удовлетворяющее заданному начальному условию.
Решения систем (3.1), (3.2) имеют следующий вид [4] при условиях (3.3) [8]: