Введение
Во многих областях науки и в практической деятельности часто приходится сталкиваться с задачами поиска экстремума функции. Дело в том, что многие технические, экономические и т.д. процессы моделируются функцией или несколькими функциями, зависящими от переменных – факторов, влияющих на состояние моделируемого явления. Требуется найти экстремумы таких функций для того, чтобы определить оптимальное (рациональное) состояние, управление процессом. Так в экономике, часто решаются задачи минимизации издержек или максимизации прибыли – микроэкономическая задача фирмы. В этой работе мы не рассматриваем вопросы моделирования, а рассматриваем только алгоритмы поиска экстремумов функций в простейшем варианте, когда на переменные не накладываются ограничения (безусловная оптимизация), и экстремум ищется только для одной целевой функции.
ЭКСТРЕМУМЫ ФУНКЦИИ
Рассмотрим график непрерывной функции y=f(x) , изображенной на рисунке. Значение функции в точке x 1 будет больше значений функции во всех соседних точках как слева, так и справа от x 1 . В этом случае говорят, что функция имеет в точке x 1 максимум. В точке x 3 функция, очевидно, также имеет максимум. Если рассмотреть точку x 2 , то в ней значение функции меньше всех соседних значений. В этом случае говорят, что функция имеет в точке x 2 минимум. Аналогично для точки x 4 .
Функция y=f(x) в точке x 0 имеет максимум , если значение функции в этой точке больше, чем ее значения во всех точках некоторого интервала, содержащего точку x 0 , т.е. если существует такая окрестность точки x 0 , что для всех x ≠x 0 , принадлежащих этой окрестности, имеет место неравенство f(x) <f(x 0 ) .
Функция y=f(x) имеет минимум в точке x 0 , если существует такая окрестность точки x 0 , что для всех x ≠x 0 , принадлежащих этой окрестности, имеет место неравенство f(x) >f(x 0 .
Точки, в которых функция достигает максимума и минимума, называются точками экстремума, а значения функции в этих точках экстремумами функции.
Обратим внимание на то, что функция, определенная на отрезке, может достигать максимума и минимума только в точках, заключенных внутри рассматриваемого отрезка.
Отмети, что если функция имеет в точке максимум, то это не означает, что в этой точке функция имеет наибольшее значение во всей области определения. На рисунке, рассмотренном выше, функция в точке x 1 имеет максимум, хотя есть точки, в которых значения функции больше, чем в точке x 1 . В частности, f (x 1) < f (x 4) т.е. минимум функции больше максимума. Из определения максимума следует только, что это самое большое значение функции в точках, достаточно близких к точке максимума.
Теорема 1. (Необходимое условие существования экстремума.) Если дифференцируемая функция y=f(x) имеет в точке x= x 0 экстремум, то ее производная в этой точке обращается в нуль.
Доказательство
. Пусть для определенности в точке x
0
функция имеет максимум. Тогда при достаточно малых приращениях Δx
имеем f(x
0
+ Δx)
Переходя в этих неравенствах к пределу при Δx → 0 и учитывая, что производная f "(x 0) существует, а следовательно предел, стоящий слева, не зависит от того как Δx → 0, получаем: при Δx → 0 – 0 f" (x 0) ≥ 0 а при Δx → 0 + 0 f" (x 0) ≤ 0. Так как f " (x 0) определяет число, то эти два неравенства совместны только в том случае, когда f " (x 0) = 0.
Доказанная теорема утверждает, что точки максимума и минимума могут находиться только среди тех значений аргумента, при которых производная обращается в нуль.
Мы рассмотрели случай, когда функция во всех точках некоторого отрезка имеет производную. Как же обстоит дело в тех случаях, когда производная не существует? Рассмотрим примеры.
y =|x |.
Функция не имеет производной в точке x =0 (в этой точке график функции не имеет определенной касательной), но в этой точке функция имеет минимум, так как y (0)=0, а при всех x ≠ 0y > 0.
не имеет производной при x =0, так как обращается в бесконечность приx =0. Но в этой точке функция имеет максимум. не имеет производной при x =0, так как при x →0. В этой точке функция не имеет ни максимума, ни минимума. Действительно, f(x) =0 и при x <0f(x) <0, а при x >0f(x) >0.Таким образом, из приведенных примеров и сформулированной теоремы видно, что функция может иметь экстремум лишь в двух случаях: 1) в точках, где производная существует и равна нулю; 2) в точке, где производная не существует.
Однако, если в некоторой точке x 0 мы знаем, что f "(x 0 ) =0, то отсюда нельзя делать вывод, что в точке x 0 функция имеет экстремум.
Например.
.Но точка x =0 не является точкой экстремума, поскольку слева от этой точки значения функции расположены ниже оси Ox , а справа выше.
Значения аргумента из области определения функции, при которых производная функции обращается в нуль или не существует, называются критическими точками .
Из всего вышесказанного следует, что точки экстремума функции находятся среди критических точек, и, однако, не всякая критическая точка является точкой экстремума. Поэтому, чтобы найти экстремум функции, нужно найти все критические точки функции, а затем каждую из этих точек исследовать отдельно на максимум и минимум. Для этого служит следующая теорема.
Теорема 2. (Достаточное условие существования экстремума.) Пусть функция непрерывна на некотором интервале, содержащем критическую точку x 0 , и дифференцируема во всех точках этого интервала (кроме, быть может, самой точки x 0). Если при переходе слева направо через эту точку производная меняет знак с плюса на минус, то в точке x = x 0 функция имеет максимум. Если же при переходе через x 0 слева направо производная меняет знак с минуса на плюс, то функция имеет в этой точке минимум.
Таким образом, если
f "(x) >0 при x <x 0 и f "(x)< 0 при x> x 0 , то x 0 – точка максимума;
при x <x 0 и f "(x)> 0 при x> x 0 , то x 0 – точка минимума.Доказательство . Предположим сначала, что при переходе через x 0 производная меняет знак с плюса на минус, т.е. при всех x , близких к точке x 0 f "(x)> 0 для x< x 0 , f "(x)< 0 для x> x 0 . Применим теорему Лагранжа к разности f(x) - f(x 0 ) = f "(c)(x- x 0), где c лежит между x и x 0 .
Пусть x < x 0 . Тогда c< x 0 и f "(c)> 0. Поэтомуf "(c)(x- x 0)< 0и, следовательно,
f(x) - f(x 0 )< 0,т.е. f(x)< f(x 0 ).
Пусть x > x 0 . Тогда c> x 0 и f "(c)< 0. Значитf "(c)(x- x 0)< 0. Поэтому f(x) - f(x 0 ) <0,т.е.f(x) < f(x 0 ) .
Таким образом, для всех значений x достаточно близких к x 0 f(x) < f(x 0 ) . А это значит, что в точке x 0 функция имеет максимум.
Аналогично доказывается вторая часть теоремы о минимуме.
Проиллюстрируем смысл этой теоремы на рисунке. Пусть f "(x 1 ) =0 и для любых x, достаточно близких к x 1 , выполняются неравенства
f "(x)< 0 при x< x 1 , f "(x)> 0 при x> x 1 .
Тогда слева от точки x 1 функция возрастает, а справа убывает, следовательно, при x = x 1 функция переходит от возрастания к убыванию, то есть имеет максимум.
Аналогично можно рассматривать точки x 2 и x 3 .
Схематически все вышесказанное можно изобразить на картинке:
Правило исследования функции y=f(x) на экстремум
Найти область определения функции f(x).
Найти первую производную функции f "(x) .
Определить критические точки, для этого:
найти действительные корни уравнения f "(x) =0;
найти все значения x при которых производная f "(x) не существует.
Определить знак производной слева и справа от критической точки. Так как знак производной остается постоянным между двумя критическими точками, то достаточно определить знак производной в какой-либо одной точке слева и в одной точке справа от критической точки.
Вычислить значение функции в точках экстремума.
Что такое экстремум функции и каково необходимое условие экстремума?
Экстремумом функции называется максимум и минимум функции.
Необходимое условие максимума и минимума (экстремума) функции следующее: если функция f(x) имеет экстремум в точке х = а, то в этой точке производная либо равна нулю, либо бесконечна, либо не существует.
Это условие необходимое, но не достаточное. Производная в точке х = а может обращаться в нуль, в бесконечность или не существовать без того, чтобы функция имела экстремум в этой точке.
Каково достаточное условие экстремума функции (максимума или минимума)?
Первое условие:
Если в достаточной близости от точки х = а производная f?(x) положительна слева от а и отрицательна справа от а, то в самой точке х = а функция f(x) имеет максимум
Если в достаточной близости от точки х = а производная f?(x) отрицательна слева от а и положительна справа от а, то в самой точке х = а функция f(x) имеет минимум при условии, что функция f(x) здесь непрерывна.
Вместо этого можно воспользоваться вторым достаточным условием экстремума функции:
Пусть в точке х = а первая производная f?(x) обращается в нуль; если при этом вторая производная f??(а) отрицательна, то функция f(x) имеет в точке x = a максимум, если положительна - то минимум.
Что такое критическая точка функции и как её найти?
Это значение аргумента функции, при котором функция имеет экстремум (т.е. максимум или минимум). Чтобы его найти, нужно найти производную функции f?(x) и, приравняв её к нулю, решить уравнение f?(x) = 0. Корни этого уравнения, а также те точки, в которых не существует производная данной функции, являются критическими точками, т. е. значениями аргумента, при которых может быть экстремум. Их можно легко определить, взглянув на график производной : нас интересуют те значения аргумента, при которых график функции пересекает ось абсцисс (ось Ох) и те, при которых график терпит разрывы.
Для примера найдём экстремум параболы .
Функция y(x) = 3x2 + 2x - 50.
Производная функции: y?(x) = 6x + 2
Решаем уравнение: y?(x) = 0
6х + 2 = 0, 6х = -2, х=-2/6 = -1/3
В данном случае критическая точка - это х0=-1/3. Именно при этом значении аргумента функция имеет экстремум . Чтобы его найти , подставляем в выражение для функции вместо «х» найдённое число:
y0 = 3*(-1/3)2 + 2*(-1/3) - 50 = 3*1/9 - 2/3 - 50 = 1/3 - 2/3 - 50 = -1/3 - 50 = -50,333.
Как определить максимум и минимум функции, т.е. её наибольшее и наименьшее значения?
Если знак производной при переходе через критическую точку х0 меняется с «плюса» на «минус», то х0 есть точка максимума ; если же знак производной меняется с минуса на плюс, то х0 есть точка минимума ; если знак не меняется, то в точке х0 ни максимума, ни минимума нет.
Для рассмотренного примера:
Берём произвольное значение аргумента слева от критической точки: х = -1
При х = -1 значение производной будет у?(-1) = 6*(-1) + 2 = -6 + 2 = -4 (т.е. знак - «минус»).
Теперь берём произвольное значение аргумента справа от критической точки: х = 1
При х = 1 значение производной будет у(1) = 6*1 + 2 = 6 + 2 = 8 (т.е. знак - «плюс»).
Как видим, производная при переходе через критическую точку поменяла знак с минуса на плюс. Значит, при критическом значении х0 мы имеем точку минимума.
Наибольшее и наименьшее значение функции на интервале (на отрезке) находят по такой же процедуре, только с учетом того, что, возможно, не все критические точки будут лежать внутри указанного интервала. Те критические точки, которые находятся за пределом интервала, нужно исключить из рассмотрения. Если внутри интервала находится только одна критическая точка - в ней будет либо максимум, либо минимум. В этом случае для определения наибольшего и наименьшего значений функции учитываем также значения функции на концах интервала.
Например, найдём наибольшее и наименьшее значения функции
y(x) = 3sin(x) — 0,5х
на интервалах:
Итак, производная функции —
y?(x) = 3cos(x) — 0,5
Решаем уравнение 3cos(x) — 0,5 = 0
cos(x) = 0,5/3 = 0,16667
х = ±arccos(0,16667) + 2πk.
Находим критические точки на интервале [-9; 9]:
х = arccos(0,16667) — 2π*2 = -11,163 (не входит в интервал)
х = -arccos(0,16667) — 2π*1 = -7,687
х = arccos(0,16667) — 2π*1 = -4,88
х = -arccos(0,16667) + 2π*0 = -1,403
х = arccos(0,16667) + 2π*0 = 1,403
х = -arccos(0,16667) + 2π*1 = 4,88
х = arccos(0,16667) + 2π*1 = 7,687
х = -arccos(0,16667) + 2π*2 = 11,163 (не входит в интервал)
Находим значения функции при критических значениях аргумента:
y(-7,687) = 3cos(-7,687) — 0,5 = 0,885
y(-4,88) = 3cos(-4,88) — 0,5 = 5,398
y(-1,403) = 3cos(-1,403) — 0,5 = -2,256
y(1,403) = 3cos(1,403) — 0,5 = 2,256
y(4,88) = 3cos(4,88) — 0,5 = -5,398
y(7,687) = 3cos(7,687) — 0,5 = -0,885
Видно, что на интервале [-9; 9] наибольшее значение функция имеет при x = -4,88:
x = -4,88, у = 5,398,
а наименьшее - при х = 4,88:
x = 4,88, у = -5,398.
На интервале [-6; -3] мы имеем только одну критическую точку: х = -4,88. Значение функции при х = -4,88 равно у = 5,398.
Находим значение функции на концах интервала:
y(-6) = 3cos(-6) — 0,5 = 3,838
y(-3) = 3cos(-3) — 0,5 = 1,077
На интервале [-6; -3] имеем наибольшее значение функции
у = 5,398 при x = -4,88
наименьшее значение —
у = 1,077 при x = -3
Как найти точки перегиба графика функции и определить стороны выпуклости и вогнутости?
Чтобы найти все точки перегиба линии y = f(x), надо найти вторую производную, приравнять её к нулю (решить уравнение) и испытать все те значения х, для которых вторая производная равна нулю, бесконечна или не существует. Если при переходе через одно из этих значений вторая производная меняет знак, то график функции имеет в этой точке перегиб. Если же не меняет, то перегиба нет.
Корни уравнения f ? (x) = 0, а также возможные точки разрыва функции и второй производной разбивают область определения функции на ряд интервалов. Выпуклость на каждом их интервалов определяется знаком второй производной. Если вторая производная в точке на исследуемом интервале положительна, то линия y = f(x) обращена здесь вогнутостью кверху, а если отрицательна - то книзу.
Как найти экстремумы функции двух переменных?
Чтобы найти экстремумы функции f(x,y), дифференцируемой в области её задания, нужно:
1) найти критические точки, а для этого — решить систему уравнений
fх? (x,y) = 0, fу? (x,y) = 0
2) для каждой критической точки Р0(a;b) исследовать, остается ли неизменным знак разности
для всех точек (х;у), достаточно близких к Р0. Если разность сохраняет положительный знак, то в точке Р0 имеем минимум, если отрицательный - то максимум. Если разность не сохраняет знака, то в точке Р0 экстремума нет.
Аналогично определяют экстремумы функции при большем числе аргументов.
Один из типов задач математического анализа: исследовать функцию одной переменной на минимум и (или) максимум. Иногда экстремум (собирательное название для минимума и максимума) функции требуется найти на некотором интервале. Задачи подобного плана попадаются также в курсе средней школы и среди заданий Единого Государственного Экзамена.
Постановка задачи 1:
Дана функция , определенная на некотором промежутке. Требуется найти точки максимумов (минимумов) функции.
Теоретические основы.
Определение: Говорят, что функция имеет в точке максимум, рис. а) (или минимум, рис. б)) , если существует некоторая окрестность в промежутке, где функция определена, что для всех точек этой окрестности выполняется неравенство
().
Замечание:
Extremum- (латынь) крайнее.
Maximum – (латынь) наибольшее.
Minimum – (латынь) наименьшее.
Необходимое условие экстремума (Теорема Ферма):
Пусть функция определена на некотором промежутке и во внутренней точке с этого промежутка принимает наибольшее (наименьшее) значение. Если существует двусторонняя конечная производная , то необходимо .
Определение:
Если выполняется равенство , то точку будем называть стационарной точкой
.
Определение:
Стационарные точки и точки, в которых не существует двусторонней конечной производной, будем называть точками, подозрительными на экстремум.
Иллюстрация некоторых случаев, кроме представленных выше двух:
1) Экстремума нет, первая производная равна нулю.
2) Точка максимума, первая производная слева и справа бесконечна.
3) Экстремума нет, первая производная слева и справа бесконечна.
4) Точка минимума, первая производная слева не равна первой производной справа.
5) Экстремума нет, первая производная слева не равна первой производной справа.
Замечание (Геометрический смысл производной):
Производная функции в точке численно равна угловому коэффициенту касательной к графику функции , проведенной в точке .
Пример 1:
Рассмотрим функцию .
Вычислим производную этой функции:
Итак, точки, подозрительные на экстремум:
Построим график этой функции.
На графики видно, что функция имеет максимум при , минимумы при . При функция экстремума не имеет.
Из этого примера видно, что равенство нулю производной в точке является обязательным условием экстремума функции в этой точке, но не является достаточным условием.
Теорема (условие монотонности функции):
Пусть функция определена и непрерывна в непрерывна в некотором промежутке и внутри него имеет конечную производную . Для того, чтобы была на этом промежутке монотонно возрастающей (убывающей) в широком смысле, необходимо и достаточно условие
Достаточное условие экстремума:
Предположим, что в некоторой окрестности стационарной точки существует конечная производная и как слева от ,так и справа от (в отдельности) сохраняет определенный знак. Тогда возможны следующие три случая:
1) при и при (производная при переходе через точку меняет свой знак с плюса на минус). Т.е. при функция возрастает, а при — убывает. Значит, значение будет наибольшим в промежутке . Другими словами, в точке функция имеет максимум.
Пояснение:
Сверху от числовой оси указывается знак производной на соответствующем интервале, снизу от числовой оси обозначается поведение функции на соответствующем интервале (убывание или возрастание).
2) при и при (производная при переходе через точку меняет свой знак с минуса на плюс). Т.е. при функция убывает, а при — возрастает. Значит, значение будет наименьшим в промежутке . Другими словами, в точке функция имеет минимум.
3) при и при ( при и при )(производная при переходе через точку не меняет свой знак). Т.е. функция в промежутке убывает (возрастает). Другими словами, в точке функция не имеет экстремума.
Пример 2:
Рассмотрим вновь функцию .
Производная этой функции имеет вид:
Точки, подозрительные на экстремум: . Выясним знаки производной на соответствующих интервалах (решим методом интервалов неравенства и ):
Из рисунка видно, что в точке производная меняет свой знак с минуса на плюс, т.е. при функция имеет минимум.
В точке производная меняет свой знак с плюса на минус, т.е. при функция имеет максимум.
В точке производная меняет свой знак с минуса на плюс, т.е. при функция имеет минимум.
В точке производная своего знака не меняет, т.е. экстремума там нет.
Полученные данные полностью подтверждаются графиком функции.
Алгоритм решения задачи 1.
1) Найти производную функции .
2) Найти стационарные точки (точки, подозрительные на экстремум), решив уравнение .Обратить внимание на точки, в которых не существует двусторонней конечной производной.
3) Выяснить, меняет ли производная свой знак в точках, подозрительных на экстремум.. Если она меняет знак с минуса на плюс, то в этой точке функция имеет свой минимум. Если с плюса на минус, то максимум, а если знак производной не меняется, то экстремума в этой точке нет.
4) Найти значение функции в точках минимума (максимума).
Дополнение:
Исследование знака первой производной функции по разные стороны от стационарной точки (достаточное условие экстремума) можно заменить исследованием знака второй производной в этой стационарной точке (при условии её существования).
1) если , то функция имеет в этой точке минимум.
2) если , то функция имеет в этой точке максимум.
3) если , то вопрос о существовании экстремума в этой точке остается открытым.
Решим неравенство