§ 1. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ОПТИМИЗАЦИИ И ОСНОВНЫЕ ПОЛОЖЕНИЯ
- целевую функцию /(*), где х = (х!,..., хп)Т, определенную на л-мерном
евклидовом пространстве Яп. Ее значения характеризуют степень достижения цели, во имя которой поставлена или решается задача;
- множество допустимых решений X pound; Я*, среди элементов которого осуществляется поиск.
Требуется найти такой вектор х* из множества допустимых решений, которому соответствует минимальное значение целевой функции на этом множестве:
/(**) = ^тц^/(*)- (1.1)
Замечания 1.1.
1. Задача поиска максимума функции /(х) сводится к задаче поиска минимума путем замены знака перед функцией на противоположный (рис. 1.1): /(**)= таpound; /(*)=- тpound; [- /(*)] •
![]() |
2. Задача поиска минимума и максимума целевой функции /(х) называется задачей поиска экстремума:
3. Если множество допустимых решений X задается ограничениями (условиями), накладываемыми на вектор х , то решается задача поиска условного
экстремума. Если X = Яп, т.е. ограничения (условия) на вектор х отсутствуют, решается задача поиска безусловного экстремума.
4. Решением задачи поиска экстремума является пара |х*,/(х*)|, включающая точку х* и значение целевой функции в ней.
5. Множество точек минимума (максимума) целевой функции /(х) на
множестве X обозначим X*. Оно может содержать конечное число точек (в том числе одну), бесконечное число точек или быть пустым.
Определение 1.1. Точка х* еХ называется точкой глобального (абсолютного) минимума функции /(х) на множестве X, если функция достигает в этой точке своего наименьшего значения, т.е.
/(*•)*/(*) V* е ЛГ .
Определение 1.2. Точка х* еХ называется точкой локального (относительного) минимума функции /(х) на множестве X, если существует е gt; 0, такое, что
если х е X и ||х- х*|| lt; е, то /(**) lt; /(х).
Здесь ||х|| = ^х2 + х\ +...+ х\ - евклидова норма вектора х.Замечания 1.2.
1. В определении 1.1 точка х* сравнивается по величине функции со всеми точками из множества допустимых решений X, а в определении 1.2 - только с принадлежащими ее е - окрестности (рис. 1.2).
![]() Рис. 1.2 2. Если в определениях 1.1 и 1.2 знак неравенства lt; заменить на 2, то получатся определения глобального (абсолютного) и локального (относительного) максимумов. 3. Глобальный экстремум всегда является одновременно локальным, но не наоборот. Определение 1.3. Поверхностью уровня функции /(х) называется множество точек, в которых функция принимает постоянное значение, т.е. /(х) = const. Если л = 2, поверхность уровня изображается линией уровня на плоскости R2. |
Пример 1.1. Построить линии уровня функций: a) f{x) = xl + xl\ б) f(x) = 2L+xj;
в) f(x) = дс| - х\; г) /(х,, х2) = .
? Уравнения линий уровня имеют следующий вид:
а) f(x) = х2 + х\ = const -г2 - уравнение окружностей с центром в точке (О, Of и радиусом, равным г (рис. 1.3, а)\
х2
б) /(*) = — + х2 = const - уравнение эллипса. Если const = 1, то а = 2, 6 = 1- большая и малая полуоси (рис. 1.3, б);
в) /(*) = х2 - х2 = const - уравнение гиперболы (рис. 1.3, в);
г) f(x\gt;х2) = Х2 = const - уравнение двух параллельных оси Охх прямых
/(х) = х2 + |
![]() |
![]() |
(рис. 1.3, г). #9632;
*2 |
*2
Рис. 1.3 |
![]() в |
![]() |
/М-1 *1 /М = 1 |
Рис. 1.3 (Окончание) |
/(*1gt;*2) = *2 |
![]() |
Пример 1.2. На рис. 1.4 изображены линии уровня функции. Цифры указывают значение функции /(х) на соответствующей линии. Точкам А и В соответствуют значения функции /(А) = 10 и /(В) = 5. Требуется классифицировать точки экстремума.
? Функция рассматривается на множестве В2, т.е. решается задача поиска безусловного экстремума. В точке А с координатами (1,3)г достигается локальный
минимум; в точке В с координатами (3,1)гдостигается локальный и глобальный
минимум одновременно; в точке С нет ни минимума, ни максимума, так как по одним направлениям функция убывает, а по другим возрастает. Заметим, что изображенная структура линий уровня типична для так называемых многоэкстремальных задач.«
![]() Рис. 1.4 |
Пример 1.3. На рис. 1.5 изображен ірафик функции /(х), определенной на
множестве X ш Я. Требуется классифицировать точки экстремума.
? Решается задача поиска безусловного экстремума. На рис. 1.5 выделим є-окрестности точек А,В,...,Г и проверим выполнение определений 1.1 и 1.2 с учетом пп. 1, 2 замечаний 1.1, 1.2. В результате получаем: точка А - точка локального минимума; точки Д Е - точки локального максимума; бесконечное множество точек из отрезка СВ - точки локального минимума; точка - точка локального и одновременно глобального минимума; глобальный максимум отсутствует.
#9632;![]() |
ю
Пример 1.4. Найти точки экстремума функций /(х) = х2 + х2 и
х2
/(*) = + Х2 на множестве Л2.
? Обе целевые функции имеют в точке х* « (0,0)т локальный и одновременно глобальный минимум, а локальных и глобальных максимумов не имеют (см. рис. 1.3 а,б), ш
Пример 1.5. Найти точки экстремума функции /(х) = х2 + х2 на множестве X = {х | х\ - х{ + 3 = 0 }.
? Решается задача поиска условного экстремума. Линии уровня функции /(х) представляются окружностями (см. рис. 1.3, а), а множество допустимых
решений X - параболой с уравнением хі = х\ + 3. В точке х* = (3,0)г, /|х*| = 9
достигается глобальный минимум (рис. 1.6). Заметим, что эта точка является точкой касания линии уровня и кривой, описывающей множество X. Глобальный максимум на данном множестве не достигается. Если поменять знак перед функцией на противоположный, то в точке х* функция /(х) = -х2 - х\ будет достигать глобального максимума на множестве X, что соответствует п. 1 замечаний 1.1. #9632;
![]() |
Пример 1.6. Найти точки экстремума функции /(х) = х2 +х2 на множестве Аг = {х|х1 +Х2“2 = 0}.
? Решается задача поиска условного экстремума. Линии уровня функции /(х) представляются окружностями (см. рис. 1.3, а), а множество допустимых
решений X - графиком прямой. В точке х* *(1,1)г, /|х*| = 2 достигается гло
бальный минимум (рис. 1.7). Глобальный максимум на данном множестве не существует. Заметим, что, как и в, примере 1.5, в точке х* линии уровня касаются кривой, описывающей ограничения. #9632;
![]() |
Пример 1.7.
Найти точки экстремума функции f(x) = xf + х\ на множествеЛГ = {х|х,2-х|-1=о}.
? Решается задача поиска условного экстремума. Линии уровня функции f(x) представляются окружностями (см. рис. 1.3, а), а множество X - гиперболой (рис. 1.8). Имеются две точки глобального минимума:
х* = (l.of, х* = (-1,0 f, /(х’)= /Гх*1 = 1.
![]() |
X х2 v }
В них выполняется свойство касания линий уровня и кривых, описывающих множество X, отмеченное при решении примеров 1.5, 1.6. Точки глобального и локального максимума отсутствуют. #9632;
Пример 1.8. Найти точки экстремума функции f(x) - х{ на множестве допустимых решений
X = {* I х\ + х2 ^ 1» *1 ^ 0, х2 pound; 0}.
? Решается задача поиска условного экстремума. Линии уровня функции имеют уравнение f(x) = хх = const и представляются прямыми, па- Рис. 1.8 раллельными оси Ох2. Множество допустимых ре
шений, где все ограничения выполняются одновременно, заштриховано на рис. 1.9. В точке С = (1,0)г, /(С) = 1 достигается глобальный максимум, на множестве точек отрезка АВ достигается глобальный минимум с значением целевой функции /(gt;4) = f(B) = 0. #9632;
![]() |
С
![]() Рис. 1.9 |
Пример 1.9. Найти точки экстремума функции /(х) = -х2 на множестве X = {х\-2lt;gt;хй\}.
? Решается задача поиска условного экстремума. Глобальный максимум достигается в точке В при х = 0, /(В) = 0. Локальный минимум достигается в точке С при х = 1, /(С) = -1, а глобальный минимум - в точке А при х = -2, /(gt;4) = -4 (рис. 1.10). #9632;
Пример 1.10. Найти точки экстремума функции /(х) = 1пх на множестве ДГ = {х | 0 lt; х lt; 3 }.
? Решается задача поиска условного экстремума. Функция не имеет точек локального и глобального экстремума, так как не выполняются определения 1.1 и 1.2 (рис 1.11). При приближении к левой границе значение функции стремится к /* = -оо (функция является неограниченной снизу), а при приближении к правой границе функция возрастает, но не имеет максимума, так как точка х = 3 не принадлежит множеству X. #9632;
/
![]() |
Рис. 1.10 |
Рис. 1.11 |
/
Определение 1.4. Градиентам У/(х) непрерывно дифференцируемой функции /(х) в точке х называется вектор-столбец, элементами которого являются частные производные первого порядка, вычисленные в данной точке:
ГМг!)
дхх
ёМ
'УМ-
дх2
ёМ
дхп
Градиент функции направлен по нормали к поверхности уровня (см. определение 1.3), т.е. перпендикулярно к касательной плоскости, проведенной в точке х , в сторону наибольшего возрастания функции в данной точке.
Гэ2/(ж) | *2/м |
дхх | дх\дх2 |
д2/{х) | |
дх2дхг | дх2 |
*2/М | |
^дхпдхі | дхпдх2 |
} = 1...... | п. |
Я(х) = |
Определение 1.5. Матрицей Гессе Н{х) дважды непрерывно дифференцируемой в точке х функции /(х) называется матрица частных производных второго порядка, вычисленных в данной точке:
*12 ’ | |||
= | *21 | *22 • | •• Кп |
Кг #9632; | •• Кп, |
*№)
дхідхп
pound;М
дх2дхп г2/(х)
дхі
, д2/(х)
гдеА*=^
Замечания 1.3.
1. Матрица Гессе является симметрической размера (пхп).
2. Вместе с градиентом можно определить вектор антиградиента, равный по модулю вектору градиента, но противоположный по направлению. Он указывает в сторону наибольшего убывания функции в данной точке.
3. С помощью градиента и матрицы Гессе, используя разложение в ряд Тейлора, приращение функции /(х) в точке х может быть записано в форме
4/*(х) = /(х + Ах)- /(х) = У/(х)Г Ах + - А хТН(х) Ах + о||Дх||2|, (1.2)
где о|||Ах||2| - сумма всех членов разложения, имеющих порядок выше второго; АхгЯ(х) Ах - квадратичная форма.
Пример 1.11. Для функции /(х) = х2 + х\ необходимо:
а) вычислить и построить градиент в точках х° = (0,1)г, х1 =
х2 = (1,0)Т, хъ = (0, - 1)г; б) найти матрицу Гессе.
? По определениям 1.4, 1.5 имеем:
Щх) = {гхь2х2?, У/-(х°) = (0,2)7\ У/(х1) = (л/2,ЦТ, У/(х2) = (2,0)Г,
У/(х3) = (0,-2)Г, Я(х) = ^ °).
Заметим, что матрица Гессе квадратичной функции не зависит от х. На рис. 1.12 изображены найденные градиенты. #9632;
![]() |
Пример 1.12. Для функции /(х) = х2 + х\ вычислить градиент и найти матрицу Гессе в точках х° = (О,О)7, х1 = (1,1)^ *
? Согласно определениям 1.4 и 1.5 имеем:
![]() |
Определение 1.6. Квадратичная форма Дхг#(х)Дх (а также соответствующая матрица Гессе #(х)) называется:
положительно определенной (Я(х) gt; 0), если для любого ненулевого Дх выполняется неравенство Дх7#(х)Дх gt; 0;
отрицательно определенной (Я(х) lt; 0), если для любого ненулевого Дх выполняется неравенство ДхгЯ(х) Дх lt; 0;
положительно полуопределенной (Я(х) gt; 0), если для любого Ах выполняется неравенство ДхгЯ(х) Дх pound; 0 и имеется отличный от нуля вектор Ах, для которого ДхгЯ(х)Дх = 0;
отрицательно полуопределенной (Я(х) й 0), если для любого Ах выполняется неравенство ДхгЯ(х) Дх й 0 и имеется отличный от нуля вектор Ах, для которого ДхгЯ(х)Дх = 0;
неопределенной (Я(х) ^0 ) , если существуют такие векторы Ах, Дх, что выполняются неравенства ДхгЯ(х)Дх gt; 0, АхТН(х)Дх lt;0;
тождественно равной нулю (Я(х) amp; 0), если для любого Дх выполняется ДхгЯ(х)Дх = 0.
Пример 1.13. Классифицировать квадратичную форму и матрицу Гессе Я-(; ^] » полученную в примере 1.11.
? Выпишем квадратичную форму:
АхТ НАх = (Д*1 Ддс2)[ц °)(^)=2А^+2Дх|.
Очевидно, ДхгЯДхgt;0 для любого ненулевого Дх. Согласно определению 1.6 квадратичная форма (матрица Гессе) положительно определенная. #9632;
Пример 1.14. Классифицировать квадратичную форму и матрицу Гессе
гг (2 0gt;1
Я = I о д! gt; полученную в примере 1.12.
? Выпишем квадратичную форму:
АХТНАХ = (АХ1 Д*2)(2 о) (дх2) = 2 Д^'2'
Очевидно, ДхгЯ(х)Дх pound; 0 для любого вектора Ах и ДхгЯ(х) Ах = 0 для Ах! = 0 и любых Дх2 * 0. Согласно определению 1.6 квадратичная форма (матрица Гессе) положительно полуопределенная. #9632;
Пример 1.15. Найти матрицу Гессе функции /(х) = х* - х2 и классифицировать ее.
? Следуя определению 1.5, получаем Я(х) = ^ • Выпишем соответ
ствующую квадратичную форму:
При А*! = 0 и любых Дх2 * О квадратичная форма отрицательна, а при АХ} * О и Ах2 = 0 положительна. Согласно определению 1.6 квадратичная форма (матрица Гессе) неопределенная. #9632;
Определение 1.7. Множество X pound; В* называется выпуклым, если оно содержит всякий отрезок, концы которого принадлежат X , т.е. если для любых х1,х2 єX и 0lt;И1 справедливо А.Х1 + (1 -Х)х2 еX.
![]() |
г |
е |
д |
![]() |
ж |
3 |
и |
Рис. 1.13 |
Пример 1.16. Требуется выбрать выпуклые множества среди изображенных нарис. 1.13.
![]() а б в |
? На рис. 1.13, а-г множества выпуклые, так как удовлетворяют определению 1.7, а остальные не являются выпуклыми. #9632;
Образно говоря, выпуклыми являются множества, которые не содержат quot;вмятин”, quot;дырокquot; и состоят из одного quot;кускаquot;. Примерами выпуклых множеств служат также само пространство Rn, отрезок, прямая, шар.
Определение 1.8'. Функция /(х), определенная на выпуклом множестве X, называется выпуклой, если f{% х1 + (1 - А.) х2 J pound; A. f[xl ) + (1 - A.) f[x2 J Vx1, x2 e X, 0 lt; A. lt; 1.
Определение 1.9. Функция /(x), определенная на выпуклом множестве X, называется строго выпуклой, если f{% х1 + (1 - А.) х2 ) lt; A. f(xl j + (1 - A.) /(*2) Vx1,x2 eX9 x1 ф x2, 0 lt; X lt; 1.
Определение 1.10. Функция /(х), определенная на выпуклом множестве X, называется сильно выпуклой с константой / gt; 0 , если
f{%xl + (1 - А,)х2) pound; Xf[xx) + (1 - А,)/(х2) - ^ Х(1 - X) Цх1 - х2||2 Vx!,x2 еХу х19tx2, 0lt; А, ^ 1.
Замечания 1.4.
1. Функцию /(х) называют выпуклой, если она целиком лежит не выше
отрезка, соединяющего две ее произвольные точки. Функцию называют строго выпуклой, если она целиком лежит ниже отрезка, соединяющего две ее произвольные, но не совпадающие точки.
2. Если функция сильно выпуклая, то она одновременно строго выпуклая и выпуклая. Если функция строго выпуклая, то она одновременно выпуклая.
3. Выпуклость функции можно определить по матрице Гессе: если #(х) pound; 0 Vx е Rn, то функция выпуклая;
если Н(х) gt;0 Vx е Rn, то функция строго выпуклая;
если Я(х) gt; IE Vx g Rn, где E - единичная матрица, то функция сильно выпуклая.
Пример 1.17. Дана функция /(х) = х2, определенная на множестве X = {х | -1 lt; х lt; 1} (рис. 1.14). Требуется исследовать ее на выпуклость.
? Функция является строго выпуклой согласно п. 1 замечаний 1.4, так как она целиком лежит ниже отрезка, соединяющего две ее произвольные, но не совпадающие точки (рис. 1.14). Более того, функция одновременно является сильно выпуклой, так как согласно п. 3 замечаний 1.4 выполняется условие Я(х) = /quot;(х) = 2pound;/ при 0lt;/^2. Очевидно, условия выпуклости и строгой выпуклости также выполняются (см. п.З замечаний 1.4), что иллюстрирует справедливость п. 2 замечаний 1.4. #9632;
/
![]() Рис. 1.14 |
Пример 1.18. Дана функция /(х) = х, определенная на множестве
X = {х | 0 lt; х pound; 1} (рис. 1.15). Требуется исследовать ее на выпуклость.
? Согласно п. 1 замечаний 1.4 функция является выпуклой, так как она целиком лежит не выше отрезка, соединяющего две ее произвольные точки, но не является строго выпуклой и тем более сильно выпуклой. #9632;
![]() |
Пример 1.19. Исследовать выпуклость функции /(х) = х2 + х\ на множестве Л2.
? Согласно результату примера 1.11 матрица Гессе удовлетворяет условию
-м-е 3 ^/(о 1) ПРИ 0lt; ^ 2. Следуя п. 3 замечаний 1.4, можно сделать
вывод о сильной выпуклости функции. Одновременно она является строго выпуклой и выпуклой (см. п. 2 замечаний 1.4). #9632;
2* |
19
Далее при решении примеров используются следующие свойства выпуклых функций.
Утверждение 1.1.
1. Если /(х) выпуклая функция на выпуклом множестве X, то всякая точка
локального минимума является точкой ее глобального минимума на X (см. пример 1.6).
2. Если выпуклая функция достигает своего минимума в двух различных точках, то она достигает минимума во всех точках отрезка, соединяющего эти две точки (см. пример 1.8).
3. Если /(х) строго выпуклая функция на выпуклом множестве X, то она
может достигать своего глобального минимума на X не более чем в одной точке (см. пример 1.6).
Определение 1.11. Функция /(х) удовлетворяет условию Липшица на отрезке [а,Ь], если существует такое число Ь gt; 0 (константа Липшица), что
\Пх')-/{хquot;)\и\х'-хquot;\ (1.3)
для всех х' и хquot;, принадлежащих [а,Ь] .
Замечания 1.5.
1. Если неравенство (1.3) выполняется с константой Ь, то оно справедливо для бесконечного множества констант, больших Ь. Как правило, представляет интерес минимальная из констант Липшица.
2. Из условия (1.3) следует непрерывность функции /(х) на отрезке [а,Ь]. Если кроме того функция имеет на [а,Ь] непрерывную производную, то кон-
станта Липшица L = ^ |/’(*) | •
3. Условие (1.3) означает, что модуль углового коэффициента любой хорды графика функции /(х) не превосходит L.
Пример 1.20. Проверить, удовлетворяют ли условию Липшица следующие функции: а) /(х) = 2х на отрезке [0,1]; б) /(x) = sinx на отрезке [0,тс];
в )/(x) = Vx на отрезке [0,1].
? Воспользуемся определением 1.11 и п.2 замечаний 1.5:
а) функция /(х) = 2х удовлетворяет условию Липшица на отрезке [0,1] с константой L = 2;
б) функция /(х) = sinx удовлетворяет условию Липшица на отрезке [0, тс]
с константой L = ^ rrj^c ^ | cos х | = 1;
в) функция /(х) = 4х не удовлетворяет условию Липшица на отрезке [0,1], так как при х -#9658; +0 угловой коэффициент касательной к 1рафику неадраничен- но возрастает, а переходя в (1.3) к пределу при | х - хquot; | -gt;• 0, можно заключить, что если в некоторой точке существует касательная к 1рафику функции /(х) , то модуль ее углового коэффициента не может превышать L. #9632;
Задачи для самостоятельного решения
1. Найти точки экстремума функции /(х) = + .(*2,+ ^ на множе-
4 9
ствеЛ2.
Ответ: в точке х* = (3,- 2)г- одновременно локальный и глобальный безусловный минимум.
2. Найти точки экстремума функции/(х) = -(хх +1)2 - -*2 + ^ на множе-
16
ствеЛ2.
Ответ: в точке х*=(-1,-4)г- одновременно локальный и глобальный безусловный максимум.
3. Найти точки экстремума функции /(х) = — на множестве
X
X = {х| 0 lt; х lt; 2}.
Ответ: функция не имеет точек локального и глобального экстремума.
4. Найти точки экстремума функции /(х) = (Х| -1)2 + (х2 -1)2 на множестве X = {х| X} + х2 * 0}.
Ответ: в точке х* = (0,0)г - одновременно локальный и глобальный условный минимум.
5. Найти точки экстремума функции /(х) = X!2 - 4х^2 + 4х22 на множестве Я2.
Ответ: так как /(х) = (х! - 2х2)2, то во всех точках прямой с уравнением х{ = 2х2 достигается одновременно локальный и глобальный минимум.
6. Проверить знакоопределенность матрицы Гессе целевой функции
/(х) = X!3 + х23 - ЗХ|Х2 в точке (0,0)Т.
Ответ: матрица Гессе и соответствующая квадратичная форма неопределенные.
7. Проверить знакоопределенность матрицы Гессе целевой функции
х 2
/(х) = —1— + х22 . Исследовать ее на выпуклость.
4
Ответ: матрица Гессе положительно определенная. Функция является сильно выпуклой, так как Н(х) pound; / Е при 0 lt; / й - .
8. Проверить знакоопределенность матрицы Гессе целевой функции
/(х) = X!2 - 4х^2 + 4х22 . Исследовать ее на выпуклость.
Ответ: матрица Гессе положительно полуопределенная, функция выпуклая.
Еще по теме § 1. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ОПТИМИЗАЦИИ И ОСНОВНЫЕ ПОЛОЖЕНИЯ:
- 1.1. Управление: основные понятия, система управления, ее признаки, принципы организации деятельности
- Глава 1. Сущность, цели и задачи краткосрочной финансовой политики организации
- § 1. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ОПТИМИЗАЦИИ И ОСНОВНЫЕ ПОЛОЖЕНИЯ
- § 14. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ И ОСНОВНЫЕ ПОЛОЖЕНИЯ
- Приемы решения задач
- § 1. Понятие и задачи криминалистики, ее место в системе других наук
- § 1. Сущность и задачи криминалистики, ее место в системе других наук
- 6.3. ОБЩИЕ (ОБЩЕНАУЧНЫЕ) МЕТОДЫ КРИМИНАЛИСТИКИ
- §1. Общие положения подготовки и производства допроса
- § 6. Основные центры международного коммерческого арбитража. Международный коммерческий арбитраж в Российской Федерации
- 21.2. Основные положения правового статуса личности в России и в других странах
- §1. Общие положения подготовки и производства допроса
- 1.1. Основные положения и цели разработки финансовой политики организации
- 4.9.1. Понятие оптимизации портфеля ценных бумаг предприятия
- 14.3. Оптимизация и рационализация работы в многоуровневом канале
- 8.4. Некоторые основные формы экономического поведения