Быков В.В. bikov@rambler.ru
Содержание
Введение…………………………………………………………………………………………3
§1. Предварительные сведения……………………………………5
§2. Основные факты………………………………………………………………8
§3. Теоремы Штурма……………………………………………………………18
Использованная литература…………………………………………27
Введение
Тема дипломной работы “Теорема Штурма”, связана с именем французского математика Жака Шарля Франсуа Штурма.
Штурм Жак Шарль Франсуа (Sturm J. Ch. F. – правильное произношение:
Стюрм), родился 29 сентября 1803 года в Женеве. Был членом Парижской
академии наук с 1836, а также иностранным членом – корреспондентом
Петербургской академии наук с того же года. С 1840 года был профессором
Политехнической школы в Париже.
Штурм (1824/25) и Раабе (1827) ввели главные формулы сферической тригонометрии при помощи пространственных координат.
Теорему Фурье ( Теорема о числе действительных корней между двумя
данными пределами ), математика Жозефа Фурье (Joseph Fourier, 1768-1830),
затмила более общая теорема, опубликованная Штурмом в Bull. mathem., 1829.
Доказательство сам Штурм представил только в одной премированной работе
1835г. Коши Огюстен (Cauchy Augustin, 1789-1857) распространил теорему
Штурма на комплексные корни (1831). Дополнение к ней дал также Сильвестр
Джемс Джозеф (Sylvester Y.Y., 1814-1897) в 1839 году и позже.
Основные работы Жана Шарля Штурма относятся к решению краевых задач уравнений математической физики и связанной с этим задачей о разыскивании собственных значений и собственных функций для обыкновенных дифференциальных уравнений. (Задача Штурма-Лиувилля, о нахождении отличных от нуля решений дифференциальных уравнений :
-(p(t)u()(+q(t)u=(u, удовлетворяющих граничным условиям вида:
А1u(a)+B1u((a)=0,
A2u(b)+B2u((b)=0,
(так называемых собственных функций), а также о нахождении значений
параметра ( (собственных значений), при которых существуют такие решения.
При некоторых условиях на коэффициенты p(t), q(t) задача Штурма-Лиувилля
сводилась к рассмотрению аналогичной задачи для уравнения вида:
-u((+q(x)u=(u).
Эта задача была впервые исследована Штурмом и Жозефом Лиувиллем (Joseph
Liouville, 1809-1882) в 1837г. и закончена в 1841 г.
Также Жак Штурм дал общий метод для определения числа корней
алгебраических уравнений, лежащих на заданном отрезке, названный правилом
Штурма, который позволяет находить непересекающиеся интервалы, содержащие
каждый по одному действительному корню данного алгебраического многочлена с
действительными коэффициентами (уже упоминалось выше).
Ему принадлежат ряд работ по оптике и механике.
Штурм Жак Шарль Франсуа умер 18 декабря 1855года.
§ 1. Предварительные сведения
Среди дифференциальных уравнений, наиболее часто используемых в математике и физике, следует выделить линейное уравнение второго порядка, имеющее вид u"+ g(t)u' + f(t)u=h(t) (1.1) или
(р (t) и')' + q (f) и = h(t). (1.2)
Как правило, если не оговорено противное, предполагается, что функции (t),
g (f), h (f) и р (f) ?0, q (t), входящие в эти уравнения, являются
непрерывными (вещественными или комплексными) на некотором t-интервале J,
который может быть как ограниченным, так и неограниченным. Причина, по
которой предполагается, что р(t)? 0, скоро станет ясной.
Из двух выражений (1.1) и (1.2) последнее является более общим, поскольку уравнение (1.1) может быть записано в виде
(p(t) и')' + р(t) f(t)u= р (t) h (t), (1.3) если определить p(t) следующим образом:
[pic] (1.4)
при некотором a€J. Частичное обращение этого утверждения также верно, поскольку если функция р(t) непрерывно дифференцируема, уравнение (1.2) можно записать в виде
[pic], а это уравнение имеет вид (1.1).
В случае, если функция р (t) непрерывна, но не имеет непрерывной производной, уравнение (1.2) не может быть записано в виде (1.1). Тогда уравнение (1.2) можно интерпретировать как линейную систему из двух уравнений первого порядка для неизвестного двумерного вектора [pic]:
[pic], [pic]. (1.5)
Другими словами, решение и = и (t) уравнения (1.2) должно быть такой
непрерывно дифференцируемой функцией, что функция р(t) u'(t) имеет
непрерывную производную, удовлетворяющую (1.2). Если р(t) ? 0 и q(t), h(t)
непрерывны, к системе (1.5), а потому и к уравнению (1.2) применимы
стандартные теоремы существования и единственности для линейных систем (Мы
можем рассматривать также более общие (т. е. менее гладкие) типы решений,
если предполагать, например, только, что функции 1/p(t), q (t), h (t)
локально интегрируемы.)
Частному случаю уравнения (1.2) при [pic] соответствует уравнение и" + q(t) u = h(t). (1.6)
Если функция [pic] принимает вещественные значения, уравнение (1.2) может
быть приведено к такому виду с помощью замены независимых переменных
[pic], т.е. [pic] (1.7)
при некотором a € J. Функция s = s (t) имеет производную [pic] и потому
строго монотонна. Следовательно, функция s = s (t) имеет обратную t= t
(s), определенную на некотором s-интервале. После введения новой
независимой переменной s уравнение (1.2) переходит в уравнение
[pic] (1.8)
где аргумент t выражений p(f)q(t) и p(t) h(f)должен быть заменен
функцией t = t(s). Уравнение (1.8) является уравнением типа (1.6).
Если функция g (t) имеет непрерывную производную, то уравнение (1.1)
может быть приведено к виду (1.6) с помощью замены неизвестной функции и на
z:
[pic] (1.9) при некотором a € J. В самом деле, подстановка (1.9) в (1.1) приводит к уравнению
[pic] (1.10) которое имеет вид (1.6).
В силу сказанного выше, мы можем считать, что рассматриваемые уравнения второго порядка в общем случае имеют вид (1.2) или (1.6). Утверждения, содержащиеся в следующих упражнениях, будут часто использоваться в дальнейшем.
§ 2. Основные факты
Прежде чем перейти к рассмотрению специальных вопросов, мы получим следствия, касающиеся однородного и неоднородного уравнений
[pic] (2.1)
[pic] (2.2)
Для этого перепишем скалярные уравнения (2.1) или (2.2) в виде системы двух
уравнений
[pic] (2.3)
[pic] (2.4)
где векторы х= (х1, х2), у == (у1, y2) совпадают с векторами [pic], [pic],
A(t)- матрица второго порядка:
[pic] (2.5)
Если не оговорено противное, то предполагается, что [pic], q (t), h (t) и
другие коэффициенты являются непрерывными комплексными функциями на t-
интервале J (который может быть замкнутым или незамкнутым, ограниченным или
неограниченным).
(i) Если [pic] и [pic], [pic] - произвольные комплексные числа, то задача
Коши для уравнения (2.2)
[pic], [pic] (2.6)
имеет единственное решение, существующее при всех [pic][pic], см. лемму IV.
1.1.
(ii) В частном случае (2.1) уравнения (2.2) и при [pic] соответствующим единственным решением служит функция [pic]. Поэтому, если [pic] есть решение уравнения (2.1), то нули функции и (t) не могут иметь предельной точки в J.
(iii) Принцип суперпозиции. Если [pic], [pic]-решения уравнения (2.1), a
[pic], [pic]-постоянные, то функция [pic] является решением уравнения
(2.1). Если [pic]-решение уравнения (2.2), то функция [pic] также является
решением уравнения (2.2) тогда и только тогда, когда функция [pic]
удовлетворяет уравнению (2.1).
(iv) Если [pic], [pic]-решения уравнения (2.1), то соответствующие векторные решения системы (2.3) [pic], [pic] линейно независимы (в каждой точке t) тогда и только тогда, когда функции [pic], [pic] линейно
независимы в том смысле, что равенство [pic], где [pic] и [pic]- постоянные, влечет за собой [pic].
(v) Если [pic], [pic] - решения уравнения (2.1), то существует
постоянная с, зависящая от и (t) и v (t) и такая, что для их вронскиана W
(t) = W (t; и, v) выполняется тождество
[pic]. (2.7)
Поскольку матричным решением системы (2.3) является
[pic],
detX(t)=p(t)W(t) и trA(t)=0.
(vi) Тождество Лагранжа. Рассмотрим пару уравнений
[pic], [pic], (2.8) где f=f(t), g=g (t) - непрерывные функции на J. Если умножить второе уравнение на и, первое-на v и результаты вычесть, мы получим, что
[pic] , (2.9) так как [pic]. Соотношение (2.9) называется тождеством Лагранжа. Его интегральная форма
[pic] (2.10) где [pic], называется формулой Грина.
(vii) В частности, из (v) следует, что и(t) и v(t) - линейно независимые решения уравнения (2.1) тогда и только тогда, когда в (2.7) [pic]. В этом случае всякое решение уравнения (2.1) является линейной комбинацией [pic] функций и(t) и v(t) с постоянными коэффициентами.
(viii) Если [pic] (например, [pic]), то вронскиан любой пары решений и(t), v(t) уравнения (2.1) равен постоянной .
(ix) В соответствии с результатами общей теории, в случае, когда известно одно решение [pic] уравнения (2.1), отыскание других решений v(t) этого уравнения (по крайней мере локально) сводится к решению некоторого скалярного дифференциального уравнения первого порядка. Если [pic] на подинтервале [pic], этим уравнением служит уравнение (2.7), где и - известная функция, а v - искомая. Если поделить (2.7) на [pic], то это уравнение запишется в виде
[pic], (2.11)
а после интегрирования мы будем иметь
[pic], (2.12) где а, [pic]. Легко проверить, что если [pic],[pic] - произвольные постоянные и а, [pic], то функция (2.12) является решением уравнения (2.1), удовлетворяющим (2.7) на любом интервале J', где [pic] .
(х) Пусть и(t), v(t) - решения уравнения (2.1), удовлетворяющие (2.7) с [pic]. При фиксированном [pic] решением уравнения (2.1), удовлетворяющим начальным условиям и (s) = 0, p(s)u'(s) = 1, является [pic]. Поэтому решением уравнения (2.2), удовлетворяющим условиям [pic], служит функция
[pic]; (2.13)
(проще проверить это непосредственно). Общее решение уравнения (2.2)
получается прибавлением к (2.13) общего решения [pic] уравнения (2.1), что
дает
[pic]. (2.14)
Если замкнутый ограниченный интервал [a,b] содержится в J, то, полагая
[pic], [pic], [pic]
мы получаем из (2.14) частное решение
[pic].(2.15)
Оно может быть записано в виде
[pic], (2.16) где
[pic] (2.17)
матрица С (t) зависит от [pic], но не зависит от их производных. В этом случае уравнение (2.1) и эквивалентная ему система (2.3) сводятся к системе
[pic]. (2.28)
(xii) Если известно частное решение [pic] уравнения (2.27), не равное нулю на J, то мы можем определить линейно независимые решения с помощью квадратур (см. (ix)) и затем найти матрицу, входящую в (2.28). В действительности, тот же результат можно получить более прямым путем. Пусть уравнение (2.27) имеет решение [pic] на интервале J. Заменим неизвестную функцию и в (2.1) на z, так что
[pic]. (2.29)
Функция z удовлетворяет дифференциальному уравнению
[pic].
Умножая его на [pic], мы получаем, что
[pic] (2.30) или, в силу (2.27), что
[pic], (2.31) т. е. подстановка (2.29) приводит уравнение (2.1) к (2.30) или к (2.31). Мы могли также начинать не с решения [pic] дифференциального уравнения (2.27), а с функции [pic], имеющей непрерывную производную [pic] и такой, что [pic] непрерывно дифференцируема. При этом [pic] определяется равенством (2.27), так что [pic] . Подстановка (2.29) будет называться также вариацией постоянных.
(xiii) Подстановка Лиувилля. В качестве частного случая рассмотрим
(2.1) с р (t) = 1: и" + q (t) и = 0. (2.32)
Предположим, что функция q (t) имеет непрерывную производную второго
порядка, вещественна и не равна нулю, так что
±q (t) > 0, где ± = sgn q (t) (2.33)
не зависит от t. Рассмотрим вариацию постоянных
[pic]. (2.34)
Тогда (2.32) сводится к (2.30), где [pic], т. е. к уравнению
[pic] (2.35)
Замена независимых переменных [pic], определенная соотношением
[pic], (2.36)
переводит (2.35) в уравнение
[pic] (2.37) где
[pic] (2.38)
а аргументом функции q и ее производных служит функция t = t (s), обратная
к функции s = s (f), определяемой из (2.36) с помощью квадратуры; см.
(1.7). В этих формулах штрих означает дифференцирование по t, так что q' =
dqldt.
Замена переменных (2.34), (2.36) называется подстановкой Лиувилля. Эта подстановка, или повторное применение ее, часто приводит к дифференциальному уравнению типа (2.37), в котором функция f (s) «близка» к постоянной. Простой предельный случай такой подстановки см. в упр. 1.1(с).
(xiv) Уравнения Риккати. В п. (xi), (xii) и (xiii) рассматривались
преобразования уравнения (2.1) в различные линейные уравнения второго
порядка или в соответствующие линейные системы двух уравнений первого
порядка. Иногда удобно преобразовать (2.1) в соответствующее нелинейное
уравнение или систему. Для этого чаще всего используется следующий метод.
Пусть
[pic], (2.39)
так что [pic]. Тогда после деления (2.1) на и результат можно записать в виде
[pic]. (2.40)
Это уравнение называется уравнением Риккати, соответствующим (2.1). (В
общем случае уравнение вида [pic], где правая часть является квадратичным
полиномом от г, называется дифференциальным уравнением Риккати.)
Читателю предоставляется проверка того факта, что если и (t) - решение уравнения (2.1), не равное нулю на t - интервале [pic], то функция (2.39) является решением уравнения (2.40) на J'; обратно, если [pic] - решение уравнения (2.40) на t-интервале [pic], то, интегрируя (2.39), мы получаем решение
[pic] (2.41) уравнения (2.1), не равное нулю ни в одной точке из J'.
(xv) Преобразование Прюфера. В случае, когда уравнение (2.1) имеет
вещественные коэффициенты, часто используется следующее преобразование .
Пусть [pic]-вещественное решение уравнения 2.1, и пусть
[pic].
Поскольку и и и' не могут обратиться в нуль одновременно, то, фиксируя соответствующее значение функции [pic] в некоторой точке [pic], мы определяем с помощью второго из равенств (2.42) непрерывно дифференцируемую функцию [pic]. Соотношения (2.42) переводят уравнение (2.1) в систему
[pic] , (2.43)
[pic] (2.44)
В уравнение (2.43) входит лишь одна из неизвестных функций [pic]. Если
решение [pic] уравнения (2.43) известно, то соответствующее решение
уравнения (2.44) может быть найдено с помощью квадратуры.
Преимущество уравнения (2.43) по сравнению с (2.40) состоит в том, что
всякое решение уравнения (2.43) существует на всем интервале J, где
непрерывны р и q. Это видно из соотношения, связывающего решения уравнений
(2.1) и (2.43).
Упражнение 2.1. Проверьте, что если функция [pic] непрерывна на J и имеет локально ограниченную вариацию (т. е. имеет ограниченную вариацию на всех замкнутых ограниченных подин-тервалах из J) и если - вещественное решение уравнения (2.1), то равенства
[pic] (2.45)
при фиксированном значении [pic] для некоторого [pic] однозначно определяют непрерывные функции [pic], имеющие локально ограниченную вариацию и
[pic]
Соотношения (2.46) и (2.47) следует понимать так, что интегралы Римана -
Стильтьеса от обеих их частей равны. Обратно, (непрерывные) решения системы
уравнений (2.46), (2.47) определяют решения уравнения (2.1) с помощью
соотношений (2.45). Заметим, что если q (t) > 0, р (t) > 0 и функция q(t)
р(t) имеет локально ограниченную вариацию, то, полагая [pic], мы получаем
q/[pic], а соотношения (2.45), (2.46) и (2.47) переходят в равенства
[pic][pic] (2.48)
[pic] (2.49)
[pic]. (2.50)
§ 3. Теоремы Штурма
В этом параграфе мы будем рассматривать только уравнение вида (2.1) с вещественными непрерывными коэффициентами р (t) > 0, q (t). Под «решением» мы будем понимать «вещественное, нетривиальное (т. е. [pic]) решение». Нас будет интересовать множество нулей решения u (t). Для изучения этих нулей часто оказывается полезным преобразование Прюфера (2.42), поскольку [pic] тогда и только тогда, когда [pic].
Лемма 3.1. Пусть [pic] - вещественное решение уравнения (2.1) при [pic],
где [pic] и [pic] вещественны и непрерывны. Пусть функция и (t) имеет в
точности [pic] нулей [pic] при [pic]. Предположим, что [pic] - непрерывная
функция, определенная равенством (2.42), и [pic] . Тогда [pic]и [pic] при
[pic] .
Доказательство. Заметим, что в той точке t, где u=0, т. е. где [pic], производная [pic] в силу (2.43). Следовательно, функция [pic] возрастает в окрестности точек, где [pic] для некоторого целого j. Отсюда следует, что если [pic] и [pic], то [pic] при [pic], а также что если [pic], то [pic] при [pic]. Тем самым лемма доказана.
В теоремах этого параграфа будут рассматриваться два уравнения
[pic] [pic] где функции [pic] вещественны и непрерывны на интервале J. и
[pic] . (3.2)
В этом случае уравнение (3.1) называется мажорантой Штурма для (3.1) на J,
а уравнение (3.1)-минорантой Штурма для (3.1). Если дополнительно известно,
что соотношения
[pic] (3.32) или
[pic] и [pic] (3.31) выполняются в некоторой точке [pic], то уравнение (3.32) называется строгой мажорантой Штурма для (3.31) на J.
Теорема 3.1 (первая теорема сравнения Штурма). Пусть коэффициенты
уравнения [pic] непрерывны на интервале J: [pic], и пусть уравнение (3.32)
является мажорантой Штурма для (3.11). Предположим, что функция [pic]
является решением уравнения (3.11) и имеет точно [pic] нулей [pic] при
[pic] ,а функция [pic] удовлетворяет уравнению (3.12) и
[pic] (3.4)
при [pic]. [Выражение в правой (соответственно левой) части неравенства
(3.4) при [pic] полагается равным [pic], если [pic] (соответственно если
[pic]); в частности, соотношение (3.4) справедливо при [pic], если [pic].]
Тогда [pic] имеет при [pic] пo крайней мере n нулей. Более того, [pic]
имеет по крайней мере n нулей при [pic], если при [pic] в (3.4) имеет место
строгое неравенство или если уравнение (3.1 г) является строгой мажорантой
Штурма для (3.11) при [pic].
Доказательство. В силу (3.4) можно определить при [pic] пару непрерывных функций [pic] с помощью соотношений
[pic] (3.5)
Тогда справедливы аналоги соотношения (2.43):
[pic] (3.6j)
Поскольку непрерывные функции [pic], гладким образом зависят от [pic],
решения системы (3.6) однозначно определяются своими начальными условиями.
Из (3.2) следует, что [pic] при [pic] и всех [pic]. Поэтому последняя часть
(3.5) и следствие III.4.2 означают, что
[pic] для [pic]В частности, из [pic] следует, что [pic], и первая часть
теоремы вытекает из леммы 3.1.
Чтобы доказать последнюю часть теоремы, предположим вначале, что при
[pic] в (3.4) имеет место строгое неравенство. Тогда [pic]. Обозначим через
[pic] решение уравнения (3.62), удовлетворяющее начальному условию [pic],
так что [pic]. Поскольку решение уравнения (3.62) однозначно определяется
начальными условиями, [pic] при [pic]. Неравенство, аналогичное (3.7),
означает, что [pic] потому [pic]. Следовательно, [pic] имеет n нулей при
[pic].
Рассмотрим теперь тот случай, когда в (3.4) имеет место равенство, но в
некоторой точке из [pic] выполняется либо (3.31), либо (3.32). Запишем
(3.62) в виде
[pic], где
[pic]
Если доказываемое утверждение неверно, то из уже рассмотренного случая
следует, что [pic] при [pic].Поэтому [pic] и [pic]при [pic]. Так как [pic]
только в нулях функции [pic], то отсюда следует, что [pic] при [pic] и
[pic].
Следовательно, если [pic] при некотором t, то [pic], т. е. [pic]. Если
(3.31) не выполняется ни при каком t из отрезка [pic], то при некотором t
имеет место (3.32), и потому (3.32) справедливо на некотором подинтервале
из [pic]. Но тогда на этом интервале [pic] и потому [pic]. Однако это
противоречит условию [pic]. Доказательство закончено.
Следствие 3.1 (теорема Штурма о разделении нулей). Пусть уравнение (3.12) является мажорантой Штурма для (3.11) на интервале J, и пусть [pic] - вещественные решения уравнений, (3.3j). Пусть [pic] обращается в нуль в двух точках [pic] интервала J. Тогда [pic] имеет по крайней мере один нуль на [pic]. В частности, если [pic] и [pic]вещественные линейно независимые решения уравнения (3.11)[pic] (3.12). То нули функции [pic] разделяют нули функции [pic] и разделяются ими.
Заметим, что, последнее утверждение этой теоремы имеет смысл, поскольку
нули функций [pic] и [pic] не имеют на J предельных точек. Кроме того,
[pic], [pic] не могут иметь общего нуля [pic], так как в противном случае в
силу того, что решения уравнения (3.11) единственны, [pic], где [pic] (так
что [pic] и [pic] не являются линейно независимыми).
Упражнение 3.1. (Другое доказательство теоремы Штурма о разделении нулей, когда p1(t)(p2(t)>0, q2(t)(q1(t).)
Предположим, что u1(t)>0 при t10 при t10 чего быть не может.
Решение:
(p1(t)u()(+q1(t)u=0, u=u1
(p1(t)u1()(+q1(t)u1=0.
Умножим левую часть равенства на u2, получим: u2(p1(t)u1()(+q1(t)u1u2=0.
Во втором уравнении проделаем соответствующие операции:
(p2(t)u()(+q2(t)u=0, u2=u
(p2(t)u2()(+q2(t)u2=0.
Умножим левую часть равенства на u1, получим: u1(p2(t)u2()(+q2(t)u1u2=0.
Вычитаем из первого уравнения второе, получим: u2(p1u1()(+q1u1u2-u1(p2u2()(-q2u1u2=0, p=p1=p2 u2(pu1()(+q1u1u2-u1(pu2()(-q2u1u2=0
(u2(pu1()(-u1(pu2()()+u1u2(q1-q2)=0
Упростим это уравнение, u2(p(u1(+pu1(()-u1(p(u2(+pu2(()+u1u2(q1-q2)=0
Раскроем скобки, получим: p(u1(u2+ pu1((u2- p(u1u2(-pu1u2((+u1u2(q1-q2)=0.
Сравнивая с формулой (2.2), получаем:
(p(u1(u2-u1u2())(+u1u2(q1-q2)=0
(p(u1(u2-u1u2())(-u1u2(q2-q1)=0
(p(u1(u2-u1u2())(=u1u2(q2-q1)=0.
Проинтегрируем это уравнение по [t1,t], получим:
[pic][p(u1(u2-u2(u1)](dt = [pic]u1u2(q2-q1)dt, где u1u2>0, q2-q1(0. Значит p(u1(u2-u1u2()(0.
Т.о. (u1/u2)((0 ( u1/u2>0.
Упражнение 3.2. с) Проверьте, что вещественные решения u(t) (0
уравнения u((+(/t2u=0 (1/17) имеет не более одного нуля при t>0, если
(([pic], и эти решения имеют бесконечно много нулей при t>0, если (>[pic].
В последнем случае множество нулей имеет две предельные точки t=0 и t=(.
Решение: в §1 было рассмотрено упражнение 1.1 с), где показали, что
функция u=t( является решением уравнения u((+(/t2u=0 тогда и только тогда,
когда ( удовлетворяет уравнению (((-1)+ (=0. Решая его получили :
(=[pic]([pic](.
Если (>1/4, то корни (1 и (2 – комплексные, т.е. u=t1/2[cos ([pic](-1/4 ln t)c1+c2sin([pic](-1/4 ln t)] имеют бесчисленное множество нулей. В частности, если положить: c1=sinu ,c2=cosu, то получим: u= t1/2[sin u cos ([pic](-1/4 ln t)+cos u sin ([pic](-1/4 ln t)]= t1/2 [sin (u+[pic](-1/4 ln t)].
Если (0 такую последовательность t1