Правило множників Лагранжа в курсі математичного аналізу
-
Кирило Медведєв 2 роки тому Переглядів:
2 Доказ цієї теореми, що наводиться зазвичай у підручниках та лекційних курсах, істотно спирається на теорему про неявну функцію. Логічним стає опустити і підтвердження теореми Лагранжа про умовний екстремум, т.к. з-під фундаменту її докази вже вийнятий головний камінь. Виявляється, однак, що для багатьох тверджень багатовимірного аналізу існують докази, які використовують мінімальну кількість фактів попереднього матеріалу. У цьому замітці наводиться елементарний доказ теореми про правило множників Лагранжа, що спирається лише теорему Вейерштрасса. Нехай на відкритій множині U простору R n визначені два кінцеві сімейства функцій f i : U R (i I) і fi : U R (i I 0 ) (I, I 0 - кінцеві множини, що не перетинаються). Нехай безліч E = не пусто. Розглядається задача f 0 (x) min, (1) f i (x) 0 (i I), f i (x) = 0 (i I 0 ), x U. () Тут f 0 : U R дійсна функція на множині U. Елемент ˆx із E називають локальним розв'язанням задачі (1), (), якщо знайдеться таке δ > 0, що f 0 (x) f 0 (x) x E B (x, δ). Тут і далі B(x, R) = . Введемо на розгляд функцію < t g(t) =, t 0, 0, t 3 I 0 безперервно диференційовані, то функція Φ(x) також безперервно диференційована. Теорема 1 Нехай ˆx - локальне розв'язання задачі (1), () та функції f i (i I 1 ) безперервно диференційовані в околиці точки ˆx. Тоді знайдуться такі числа ˆλ i, не всі рівні нулю, що ˆλ 0 f 0(ˆx) + i I1 ˆλ i f i(ˆx) = 0, (3) ˆλ i f i(ˆx) = 0 (i I 1 ), (4) ˆλ 0 0, ˆλ i 0 (i I). (5) Числа ˆλ i називають множниками Лагранжа, а саму теорему 1 правилом множників Лагранжа. Зрозуміло, що разом із набором ˆλ i співвідношенням (3)-(5) задовольняє набір tˆλ i (t > 0) набір множників Лагранжа визначаєтьсянеоднозначно. Найбільш важливою необхідною умовою оптимальності є рівність (3), яка називається умовою стаціонарності. Співвідношення (4) називають умовою додаткової нежорсткості. Якщо f i (x) 0 вважаємо настільки малим, що B (x, R) U, f 0 (x) f 0 (x) x E B (x, R), функції f i безперервно диференційовані на кулі B (x, R). Існування розв'язання x N задачі (6) випливає з теореми Вейєрштраса. Справедлива нерівність Φ N (x N ) Φ N (ˆx) або, докладніше, f 0 (x N ) + NΦ(x N ) + xn ˆx f 0 (ˆx). (7) Зокрема, з (7) випливає оцінка NΦ(x N ) f 0 (xx) f 0 (x N ). Послідовність x N B(xx, R). Якщо x - гранична точка цієї послідовності, то Φ(x) = 0. З (7) випливає нерівність f 0 (x) + x ˆx f 0 (ˆx). 3
4 З іншого боку, x E B(xx, R), отже f 0 (x) f 0 (xx), тому x = xx. Будь-яка гранична точка послідовності x N збігається з x. Це означає, що x N ˆx. За великих N елемент x N є внутрішня точка кулі B(xx, R). Оскільки x N внутрішня точка кулі B(x, R) і x N мінімізує функцію Φ N на цій кулі, то x N стаціонарна точка функції Φ N : (Φ N ) (x N ) = 0 тобто. f 0(x N ) + N i I 0 fi (x N )fi (x N ) + N i I g (fi (x N ))f i(x N ) + (x N ˆx) T = 0 Розділимо цю рівність на позитивне число K N, так щоб вийшло співвідношення λ N 0 f 0(x N ) + i I 1 λ N i f i (x N ) + (xn ˆx) T K N = 0, (8) у якому (λ N 0 ) + i I 1 (λ N i ) = 1, N. (9) Таким чином, N 0 = 1 K N, N i = N K N f i (x N ) (i I 0 ), N i = N K N g (f i (x N )) (i I), K N = ( 1 + N i I 0 fi (x N ) + N i I g (f i (x N )) ) 1 1. (10) Кожна з послідовностей λ N i (N = 1. ) обмежена, тому, не зменшуючи спільності, можна вважати, що λ N i ˆλ i, i I 1. Переходячи в (9) до межі, отримуємо рівність ˆλ 0 + i I1 ˆλ i = 1. З цієї рівності випливає, щохоча б одне із чисел ˆλ i відмінно від нуля. Отриманий набір ˆλ i шуканий. Справді, спрямовуючи в (8) N до, отримуємо умову стаціонарності (3) (використовуються співвідношення x N x x, N i x i ). Якщо f i (xx) = 0, то f i (xx) = 0 і умова додаткової нежорсткості виконано. Якщо f i (xx) > 1, отже, λ N i = N K N g (f(x N )) = 0, 4
5 тому ˆλ i = 0, тобто. (4) справедливо й у разі. З огляду на (10) λ N 0 0, λ N i 0 (i I), тому ˆλ 0 0, ˆλ i 0 i I. Теорема доведена. Варіанти теореми 1 зберігаються, якщо одна з множин I 0 I порожньо. Теорема Нехай ˆx - локальне розв'язання задачі f 0 (x) min, f i (x) 0 (i I), x U. та функції f i безперервно диференційовані в околиці точки ˆx. Тоді знайдуться такі числа ˆλ i 0, не всі рівні 0, що виконані умови (3), (4) з I 1 = I. Теорема 3 Нехай ˆx - локальне рішення задачі f 0 (x) min, f i (x) = 0 (i I 0 ), x U. та функції f i безперервно диференційовані в околиці точки ˆx. Тоді знайдуться такі числа i i 0, не всі рівні 0 одночасно, що виконано умову (3) з I 1 = I 0. Теореми 1 3 виражають правило множників Лагранжа. У всіх теоремах ˆλ 0 0. Якщо ˆλ 0 > 0, розділивши на ˆλ 0, отримуємо знову набір множників Лагранжа, для якого ˆλ 0 = 1. Лагранж вважав, що завжди можна взяти ˆλ 0 = 1. Однак це законно, лише якщо ˆλ 0 > 0. Будь-яке припущення, що гарантує нерівність ˆλ 0 > 0 називають умовою регулярності. В екстремальному завданні f 0 (x) = x min, f 1 (x 1, x ) = x 3 x 1 = 0 розв'язання x = (0, 0) T, умова регулярності не виконано. Дійсно, f 0(xx) = (0, 1), f 1(xx) = (0, 0) і рівність 0 0 f 0 (x) + 1 f 1 (x) = 0 можлива лише при 0 0 = 0. Основу доказу теореми 1 становить широко використовуваний оптимізації метод штрафних функцій ([1], гл. 8). тамж наведені досить доступні для огляду умови регулярності завдання (1), (). Список литературы [1] Поляк Б.Т. Введення у оптимізацію. М: Наука,