0, t=l, 2, . . ., т.; pa-
406 Гл. 3. Связь с численным анализом зумеется аппроксимация Паде существует и не вырождена. Прирав- Приравнивая коэффициенты при (—z)J' в формуле A.3), получаем соотно- соотношения A.2); такой подход полностью объясняет эти соотношения. Таким образом, мы видим, что полюсы аппроксимаций Паде [т—I/ml функции /(z) совпадают с точками и,-, а вычеты {wjui) определяют веса Wj. Ошибка интегрирования дается явно через характеристическую функцию для квадратурной формулы, определенную [Takehasi and Mori, 1971) соотношением о r I+ги l ' ; Следуя методам ч.1, § 5.3—5.6, введем переменную w = — г. Пусть яо(ш)=1, а полиномы пт (w) определяются соотношением A; 5.3.20) -l/mH— l/w), m=l, 2, ... . Напомним,-^то соотношение A; 5.3.18) показывает, что полиномы пт{и) ортогональны по мере d
(u) 1- I/ml 1(г)Г1 I+ги V 'I W—U d {u)_plm-um]{ J Используя условие порядка аппроксимации для Ет{г), получаем A.5) Если записать A + иг)-1 =1— иг + и2г2+ . . . +(— \)т{иг)т1{\ + иг) и воспользоваться ортогональностью, то A.5) приводит к равенству
§3.1. Квадратура Гаусса 407 из которого сразу же вытекает, что Ет (г) = О (г'2т). Дальнейший анализ соотношения A.6) показывает, что 2 Л КI Замечая, что а г" ) i Г и*— я. И я. (и) (w)-nm (и) — полином от и степени т—1, мы приведем A.7) к виду A.8) а Соотношениями A.5) —¦ A.8) задаются различные представления ха- характеристической функции. Коэффициент при zk в разложении функции Em(z) дает ошибку интегрирования по квадратурной фор- формуле Гаусса. В частности, для наименьшего ненулевого коэффициен- коэффициента имеем ь а Отметим, что пт(и)/С(т—\1т)— m-й ортогональный полином с единичным старшим коэффициентом, как и ожидалось для оптималь- оптимальной квадратурной формулы. Для более подробного изучения этой темы мы отсылаем читателя к работам [Allen et al., 19741, [Karlsson and von Sydow, 1976] и (Brezinski, 19771. Перейдем теперь к выяснению природы погрешностей, возника- возникающих при интегрировании по квадратурным формулам. Это необ- необходимо для того, чтобы по результату численного интегрирования дать правильный ответ. Приближенные значения определенного интеграла можно найти по формулам интегрирования, использую- использующим mlt m2, m8, . . . точек. При этом может быть достигнута сколь угодно большая точность. Предположим, что интеграл 1 Ух A.10) о существует. Его приближенное значение находится по т-точечной формуле трапеции
408 Гл. 3. Связь с численным анализом в которой m точек расположены на равном расстоянии /i=l/m от соседних. Из предположения о существовании интеграла /{/} вытекает существование функции ф(/г), непрерывной при 0г<1, для которой <3<"»{/} = ФA/т), т=\, 2, 3, .... A.12) Например, три приближенных значения интеграла A.10) можно найти, используя ти т2=2т1 и m3=2m2 A-13) квадратурных точек. Положим cp(l/mf) = Q(m'){/}, /=1, 2, 3. A.14) Центральная задача состоит в том, чтобы по этим трем значениям проэкстраиолировать значение функции ф в точке /г=0 и получить более точное приближенное значение величины / {/}. Такую экс- экстраполяцию можно сделать, например, с помощью квадратичного полинома по h, с помощью рациональной дроби по h типа [1/1] или с помощью А2-метода Эйткена. Подчеркнем, что можно выбрать величины т.х, т2 и т3, не удовлетворяющие соотношениям A.3), и что, вообще говоря, нет никаких оснований ограничиваться в точ- точности тремя квадратурными приближениями. Для того чтобы отве- ответить на важный вопрос о том, какой способ экстраполяции явля- является наиболее эффективным, необходимо оценить погрешность при- приближения. Погрешность задается формулой Эйлера —• Маклорена [Lyness and Ninham, 1967] «Ч*(тП Q""' {/}-/{/}= 2- (- 1)" Bят)'« =Ч/<2"-1)A)-/Bя-1)@)], A.15) которая справедлива при условии, что/?С°°[0, П и правая часть сходится. Сомножитель t,Bn) в правой части есть дзета-функция Римана [Abramowitz and Stegun, 1964, ch. 23]; ?Bп)->1 при п-*-оо. Если производные/'2"' растут быстрее, чем BлтJп, то естественно ожидать, что правая часть формулы A.15) расходится. Расходимость будет, например, в том случае, если /(г) является логарифмической функцией. Компактную формулу Эйлера — Маклорена, экви- эквивалентную развернутой формуле A.15), можно использовать для построения асимптотического разложения гамма-функции (см. ч. 1, § 5.5). Связь между этими результатами в контексте настоящего параграфа подробно обсуждается Харди [Hardy, 1956, ch. 13]. В подобных случаях A.15) понимается как асимптотическое равен- равенство в том смысле, что если суммирование в правой части ограни-
§3.1. Квадратура Гаусса 409 чить конечным числом членов, то при т-*-оо разность в A.15) ведет себя как конечная сумма степеней величины т. Такая процедура может оказаться очень эффективной на практике, в чем можно убе- убедиться, взяв в формуле A.15) в точности два члена Мы рекомендуем читателю обратиться к книге [Hardy, 1956) и работе [Ninham and Lyness, 1969) по поводу дальнейших подробно- подробностей, связанных с асимптотическими рядами. Рассмотрим следую- следующий специальный случай: f(x) = x-i'*(\ — x)-i'ah{x), A.16) где h(x)?C°° [0, 1]. Для этого случая найдено [Lyness and Ninham, 1967], что (LIT, Из A.17) вытекает, что cp'(/i)=oo при h—О, хотя lim cp(/i) хорошо ft-»-0 определен. Это обстоятельство, если разложение A.17) рассматри- рассматривать от переменной т~1/4, прямо указывает на то, что в данном случае рациональная интерполяция была бы, вероятно, эффектив- эффективнее линейной интерполяции. Представляется очень курьезным, но аппроксимации Паде и другие методы рациональной интерполяции оказываются падежными и эффективными всякий раз, когда линей- линейные квадратурные методы сходятся недопустимо медленно. Мы от- отсылаем читателя к работе [Joyce, 1971], где приведен исчерпываю- исчерпывающий обзор как линейных, так и нелинейных методов ускорения схо- сходимости квадратурных приближений. Для более подробного зна- знакомства с Паде-методами процитируем работы [Chisholm et al., 1972), [Genz, 1972, 1973, 1974) и [Werner and Wuytack, 1978). Упражнение 1. Найти такую форму соотношения A.15), кото- которая применима для интегрирования на отрезке \а, Ь). Упражнение 2. Какие изменения в рассуждения, соответствующие формулам A.2) — A.8), необходимо внести для того, чтобы получить квадратурные формулы для интервалов @, оо) или (—оо, оо)? Упражнение 3. Доказать, что аналог формулы A.5) для погреш- погрешности в случае аппроксимаций Паде [L/M] функции Стильтьеса A.3)
410 Гл. 3. Связь с численным анализом имеет вид где J = L—М ^—1, QW-1/M] (г)—знаменатель аппроксимации Паде [М—1/М] ряда ¦^ ^ J 1 + ги /=о Jo [Chui et al., 1975]. § 3.2. Неравенства Чебышёва для функции плотности Вернемся к теме § 5.5, ч. 1. В этом параграфе считались заданны- заданными только первые /г+1 моментов ц,0, ц,ь . . ., \ih неизвестной функ- функции плотности Стильтьеса ср(ц) = J u'd
§ 3.2. Неравенства Чебышёва для функции плотности 411 § 5.5, ч. I, состоит в том, чтобы ввести коэффициенты c, = (-iy>, = (-iy/y, / = 0, 1, 2, ... и функцию - i оо со с формальным разложением f (г) = 2 ci2''= 2 /у (—^У- Следую- щий шаг заключается в построении аппроксимации Паде функции /(г) по известным коэффициентам ее разложения. Нам понадо- понадобится аппроксимация Паде Эта аппроксимация Паде соответствует распределению М + 1 ЖЬии(«)= 2 М(«—«() B-5а) с функцией плотности м+\ (")= 2 M(«—«I). B-5Ь; i 1 поскольку справедливо равенство = J 1+ги ' v '* — СО — СО Если бы мы выбрали аппроксимацию Паде [М/М], то нашли бы что м B-6) этой аппроксимации Паде соответствует распределение м d^M+i (и)= ^<$ (и) "Н 2 К& (и—и'д B.7а) с функцией плотности м йи+i («О = *#(«)+ 2 ty (u — u't). B.7b) (= i Отметим, что выражения B.5) и B.7) для i|jm+1(h) и ^м+1(и) являются аппроксимациями функции ty(u).
412 Гл. 3. Связь с численным анализом Для того чтобы получить оценку B.2), построим сначала по- полиномы g(z) = G(z, ы>)= B.8) h(z) = H(г, w) = Л\м/м] B) giM/M + i] (a,)_g[M/M] (да) Д1М/М + 1] (zy B.9) Функция g{z) = G (z, w) связана с ядром Кристоффеля—Дарбу и обращается в нуль при z = w. Функция h(z) выбрана так, что f(z)g(z)-h(z) = O(z*»")\ B.10) это соотношение вытекает из уравнений Паде. Функции g(z) и h(z) являются полиномами от г степени М-\-\, зависящими от пара- параметра w. Таким образом, можно написать, что (г) V Р/ • 19 1П Tu^fti+Xj' BЛ1) это выражение зависит от w и имеет одинаковые с функцией / (г) 2/И -f-1 производных в начале координат. Отметим, что для неко- некоторого k, 1<^<М + 1, lk = — w~1- Лемма 1. СоотношениеB.11) определяет (М + \)-точечную квад- квадратурную формулу, которая является точной на полиномах сте- степени не выше 2М. Доказательство. Из B.10) и B.11) получаем ?1 B12) /= 1 Равенство B.12) определяет квадратурную формулу с узлами ?,, ^2, ...,t,M+i и весами pr, p2, ..., рж+1. Условия порядка аппрокси- аппроксимации, содержащиеся в равенстве B.12), состоят в том, что и' dff (и) = 2 Р/ (W. « = 1. 2, ..., 2М; — 00 гем самым полиномы степени не выше 2М интегрируются точно. Лемма 2. Нули полиномов В^м/мЦг) и B^M/M + '](z) чередуются между собой. Доказательство. Используя B.4), B.6) и Q-тождество, полу- получаем М + 1 М у kj V *": 1'.. С(М+1/М) г*м + 1 B.13)
§ 3.2. Неравенства Чебышёва для функции плотности 413 Так как f(z) — ряд Гамбургера, то и нули полиномов В[М/м + '1 (?) и В1м/М1(г) — вещественные и про- простые. Пусть {г,, 1=1, 2, ..., М + 1} — нули 51^/^ + 4B), а Ь,', ( = 1, 2, ..., М} —нули В1мш1(г). Так как в^/м + пдсм/лп _ полином, то знаки вычетов функции {BW^ + ii^ д[м/лп (г)}-1 чередуются между собой. Поскольку /(г) — ряд Гамбургера, то величины kf и К'[ в B.13) положительны. Свойство чередования нулей вытекает непосредственно из этих наблюдений. Лемма 3. Функция g (г) имеет вещественные нули. Доказательство. В нуле z = zt полинома В1М1М + 1Цг) sign {g (г)} = sign {BiM'M + ^(w)} sign {BlM'Ml (z,)}. Таким образом, функция g (z) имеет М |-1 перемен знака, поэтому она имеет М вещественных нулей. Следовательно, оставшийся нуль также веществен. Теорема 3.2.1. В соответствии с определениями B.8), B.9) и B.11) положим + - н (г- "О = у 9i /2]4v g(z) О(г, ш) ^ 1+ *?,¦ ^t1*' Яз лелл вытекает, что соотношение B.14) определяет зависящее от w распределение («)= 2 Р*6(« — W B.15) и функцию плотности М + I г|)(м)= 2 Р/е (" — ?/)• B.16) Точка u = tk = —w1 является точкой роста функции ^(ы), а гИС&+)>ф(?*+) w ^ (С*—X Ф (С*—)• B.17) Доказательство. Определим полином rik) (и) соотношениями B.18а) B.18Ь) , B.19)
414 Гл. 3. Связь с численным анализом 1,0 с* с* +1 Рис. 1. Полином гк(и). где нули функции g{z) занумерованы так, что Полином гш(") можно выбрать таким образом, чтобы он удов- удовлетворял условиям B.18) и B.19) и имел степень не выше 2М. Так как dty(u) имеет М-\-\ точку роста, то, используя B.15) и B.18), находим Поскольку квадратурная формула имеет точность 2Л4, то Ввиду того что ij/ («) > 0 и гш («) ^ 0, имеем ^ /¦<*» (ы) dq> (м) > ^ /-(ft) (ы) с(ф (а). — 00 —СО Так как г(й)(ы)>1 при —оо<ы<^+, то Отсюда вытекает, что ном t{k) (и), для которого . Используя другой поли- полиполучаем, что if(^ft—)^ф(?л—)> и теорема доказана,
§ 3.2. Неравенства Чебышёва для функции плотности 415 Эти технические приемы находят разнообразные применения в физике и химии, где функции плотности обычно оказываются по- положительными. В заключение этого параграфа упомянем прежде всего проблему Маркова. Если задать только первые fe+1 моментов |л0, ц,и . . ., |яй неизвестной функции плотности Стильтьеса ф(м), предполагая, что в принципе все моменты конечны и задаются по формуле \af = \ u'dq>(u), / = 0, 1, 2, —i то по этим данным находятся некоторые условия на функцию ср (и), но функция ф(м) однозначно не определяется. Для заданной функ- функции h(u) и произвольной величины х, удовлетворяющей неравен- неравенству —1«О<1, проблема Маркова состоит в том, чтобы найти X X inf С h{u)d(p(u) и sup С h(u)dq>(u). — I Мы отсылаем читателя к книге [Shohat and Tamarkin, 1963, ch. 3], где приводится решение этой проблемы при различных условиях на функцию h(u). Метод решения содержит технические приемы, подобные приведенным в настоящем параграфе. Другая интересная проблема возникает в теории равновесия в классической или квантовой статистической механике, в которой состояния систем описываются с помощью функции ехр (—$Е)сЬр(Е), через распределения энергии Е. Для нас представляет интерес слу- случай, когда |J = 1/?T, k— постоянная Больцмана, Т — температура, и, таким образом, р\>0. Проблема состоит в том, чтобы найти оценку интеграла Стильтьеса если заданы 2М первых моментов распределения ), / = 0, 1, 2 2М — 1. Эта проблема была решена в работе [Gordon, 1968] с помощью тех- технических приемов настоящего параграфа. Однако итоговые оценки допускают большую погрешность, поэтому они полезны только для конечных систем. Возможно и другое решение этой проблемы, если воспользоваться методами § 1.2. В качестве исторических ссылок приведем работы П. Л. Чебышёва [Tchebycheff, 1874I, Стильтьеса IStieltjes, 1884] и А. А. Маркова [Markov, 1884]. В последнее время
416 Гл. 3. Связь с численным анализом эти же технические приемы были применены для оценок термоди- термодинамических величин в работах [Isenberg, 1963], [Gordon, 1968] и [Corcoran and Langhoff, 1977]. § 3.3. Метод коллокации и т-метод Экспоненциальная функция ехр х удовлетворяет дифференци- дифференциальному уравнению с граничным условием У(О)=1- C.2) Если искать решение этого уравнения в виде ряда у(х) = ос = 2 cft-**> т0 коэффициенты ck определяются соотношениями (*+1)с»+,—с* = 0, * = 0, 1, 2, ..., C.3) и со=1, которые вытекают соответственно из C.1) и C.2). Обыч- Обычное полиномиальное приближение L-ro порядка функции у (х), а именно у (х) = 2 ckxk> является точным решением модифициро- ванного по отношению к C.1) уравнения |—j/ = ™<- C.4) с тем же самым граничным условием C.2). Из явного вида решения вытекает, что x = l/L!. Для получения более точного полиномиаль- полиномиального приближения функции у{х), которое будет использоваться в точке х—г, уравнения C.1) и C.4) заменяются уравнением ^--у = тп(х), C.5) где п(х) — полином L-ro порядка, а произведение тп(х) мало в не- некотором смысле. Говоря более подробно, в т-методе Ланцоша [Lanc- zos, 1957, р. 438] требуется, чтобы (^ C.6) — сдвинутый полином Чебышёва, обладающий известным мини- минимаксным свойством (см. ч. 1, § 6.6) на отрезке О^л^г. Мы предпо- предположим здесь для простоты рассуждений, что х и г — вещественные положительные числа. Если z — отрицательное или комплексное число, то возникает отрезок х=аг, где O^cc^l. Введение т-члема в правую часть уравнения C.1) приводит к тому, что решения ищутся
§3.3. Метод коллокации и т-метод 417 в виде полиномов пол:. Эти решения, как ожидается, точны на отрез- отрезке О^Сл^г. Если я (а:) — сдвинутый полином Лежандра C-7) то полиномиальное решение уравнения C.5) в точке х -г оказывается аппроксимацией Паде [М/М] для точного решения уравнения C.1) в точке x=z [Luke, 1958, 1960]. Мы обсудим выбор C.7) прежде, чем доказывать последний результат. Одна из причин, по которой соотношению C.7) отдается пред- предпочтение перед C.6), заключается в том, что в этом случае легче най- найти явное алгебраическое решение. Известно (ч. 1, §6.6), что поли- полиномы Чебышёва ^„(а:) удовлетворяют минимаксному спойству в классе !Рп всех полиномов степени не выше п, п^\, с единичным старшим коэффициентом: inf sup \pn(x)\ = 2~{"-1) C.8) достигается при рп(х)=Тп(х). В этом смысле полиномы Лежандра удивительно малы. Хорошо известно [Isaacson and Keller, 1966, p. 219], что при условии обычной нормировки имеем sup |/>„(*) 1 = 1 C.10) — 1<А-<1 и в силу C.9) старший коэффициент равен JML = ^=n + о (n-i)]. (З.п) Используя C.11), равенства C.9) и (ЗЛО) можно перенормировать для того, чтобы сравнить с C.8). Все нули полиномов Лежандра лежат на интервале [—1, 1], кроме того, маловероятно, чтобы оп- оптимальный полином для правой части уравнения C.5) не зависел от специфической структуры уравнения. Таким образом, выбор я(х) = Р"м (х/г) можно считать вполне удовлетворительным. Немного более общим, чем выбор п-=Р*м(х/г), является выбор n(x) = xJGM(J + l, J + l, x/z). C.12) Для краткости обозначим GM(J-\-l, У-j-l, x/z) — RJM (x/z); это— полином Якоби, нормированный так, что он имеет единичный старший коэффициент. Полиномы Якоби Ом (р, q; x) ортогональ- ортогональны на интервале @, 1) с весом w(x) — {\—х)р~9х9~'1\ таким обра-
418 Гл. 3. Связь с численным анализом зом, полиномы RJM (x/z) ортогональны на интервале @, г) с ве- весом xJ. Частный случай при i = 0, когда R"M (x/z) = P'M (x/z), пред- представляет особый интерес, так как он соответствует выбору C.7). Из работы [Abramowitz and Stegun, 1964, p. 775] находим м (J + М)\ у. \\пмг (J + 2M—m)\ /*\ ¦«-"'_ щ — 0 M / „ \ ь C.13) В силу C.12) уравнение C.5) принимает вид C.14) Нам необходимо найти его полиномиальное решение у (х) — = 2 <1кхк в предположении что это возможно. Приравнивая ко- эффипиенты при степенях хк в обеих частях уравнения C.14), получаем (k-l)dk+i— dh = xc^jJ)z''l+J для k = J, J + l L, C.15a) (k~l)dk+i—dk = 0 для k = 0, 1, ..., J — l. C.15b) Из C.15b) вытекает, что dk = jfdj для /г=0, 1, ..., J — \, C.16a) а из C.15а) получаем, что м dk=-i Z c'M- ^ {r+klJ)] z~r для k = J, J+l, .... L, C.16b) r = k—J так как J (x) — полином и dL+^ = 0. Подстановка выражения для С(М, j> из C.13) в C.16) показывает, что do=--cz-MU1FA-- M, —(L + M); —г). C.17) Так как в силу граничного условия C.2) имеем do=l, то х задается по формуле T=-rM[L!1F1(-M, -(L+M); -г)]. C.18) На этом этапе становится ясно, что решение уравнения C.14) есть полином по х в точке z = x\ решение является рациональ- рациональной функцией по г и степень знаменателя равна М. Продолжая вычисление решения и используя C.16Ь), полу-
§ 3.3. Метод коллокации и х-метод 419 чаем м Тогда из C.16) и C.19) вытекает, что М I.-I \z-MM\L\ у у г/+л (— I)/ (jL-f- /И — /)! = (-t)z-mL!1F,(—L, -(L + M); г). C.20) Исключая т из C.18) и C.20), приходим к функции которая является рациональной функцией от г типа [L/M]. Можно показать, что на самом деле это аппроксимация Паде [L/M] функ- функции ехр г. Это можно устаповить как ссылаясь на A; 1.2.12.), так и доказав с использованием присутствующих производных, что у (г) — ехрг = О(г/-+Л1 + 1). C.22) С помощью интегрирующего множителя уравнение C.14) упро- упрощается и приводится к виду C.23) Положим e(x) = J(x) — ехрл:; так как (Г то интегрирование C.23) дает 2 e(z) = ez [e-*xxJRJM (-)dx = о \ г I 0 I = xe*zJ+' j e-ztRJM (t) tJ dt; C.24) в этой формуле учтено условие е @) = 0. Из формулы Родрига C.9) вытекает, что 1 \e-*lRJM(t)tJdt=O{zM); C.25) о следовательно, e(z)=O(x2i+1)=O(zz+'M+1), что подтверждает C.22). Итак, уравнение C.14) при J—L—М определяет аппроксима-
420 Гл. 5. Связь с численным анализом цию Паде 1/.-/Л1) функции ехр г для L^M; явное решение задается формулой C.21). Очевидно, что оптимальное решение получается при J=--0. Выбор J—L, УИ=О дает в качестве решения обычный полином Тейлора. Посмотрим теперь более точно, что же было получено в процессе нахождения аппроксимирующего решения для уравнения C.1) описанным выше методом, который был представлен как т-метод Ланцоша. Этот метод является также методом коллокации [Wright, 1970]. Точки {xt, t = l, 2, . . ., L) выбираются на отрезке [0, г]; они не обя- обязательно различны и на самом деле являются нулями полинома п(х). Аппроксимирующее решение уь{х) является полиномом по- порядка L, который удовлетворяет условиям -% уй = 0 при х=х„ 1 = 1, 2, .... I. C.26) Отсюда непосредственно вытекает, что Тем самым мы вернулись к исходному уравнению C.25) и пока- показали, что описанный выше метод является методом коллокации. В основе метода коллокации лежит построение коэффициентов dj при тех мономах х], которые входят в полином у^(х)= 2 djXJ. Этот метод можно рассматривать и как явный метод типа Рунге—Кутта, если использовать гауссовы точки \х{) из отрезка [0, г]. Метод выдает в квадратурах решение уравнения приводя его к виду г= 0 при Xj—z\j. Таким образом, мы имеем L явных уравнений для L неизвестных коэффициентов {сг, г—\, . . ., L). Функция и ее про- производная находятся явно в узловых точках. Итак, метод коллокации и явный метод Рунге — Кутта в контек- контексте этого параграфа эквивалентны; оба приводят к решению, ко- которое является рациональной функцией от г. Если удастся пока- показать, что это решение удовлетворяет условию аппроксимации C.22) и если г совпадает с длиной шага (обычно обозначаемого через К), то это решение является аппроксимацией Паде. Кроме того, эти
§ 3.3. Метод коллокации и %-метод 421 методы эквивалентны некоторым методам типа метода Галеркина, в которых внутренние произведения выражаются через квадратуру Гаусса — Лежандра. Таким образом, это все методы коллокации, но в различной форме. Связь между явными методами и аппрокси- аппроксимациями Паде вновь проявится в следующем параграфе. Если мы попытаемся применить этот метод к гипергеометриче- гипергеометрическому уравнению ^^^ф=о, C-27) то немедленно столкнемся с тем, что C.27) — уравнение второго порядка. Однако переписав это уравнение в виде мы увидим, что его можно свести к дифференциальному уравне- уравнению первого порядка, если (а—1)(|3—1) = 0. Выберем Р=1 и рассмотрим решение уравнения (х-х')^+(у-1-ах)у = (у~1)у@). C.28) Применим т-метод к уравнению где полином Р (х) порядка М еще предстоит задать. Уравнение C.29) соответствует следующей модификации уравнения C.27): которая однако прямо не лспользуется. Для того чтобы проинтегрировать C.29), перепишем его в виде C.30) Интегрирующий множитель равен х">-1 A — xy~vha, таким обра- образом, C.30) принимает вид C.31)
422 Гл. 3. Связь с численным анализом Интегрируя C.31) и проверяя условие согласованности в точке # = 0, приходим к равенству UxtJ + v-'(l—iy^P^+(y—l)ty-*(l—t)*-vy{O)\dt. C.32) X X О Для функции F(x) = ,iFl(a, 1, у; х) выполняется подобное ин- интегральное равенство с т = 0; следовательно, для функции е(л;) = = у{х) — F(x) имеем X р I y\ i-1-vH v-17—1—а \ riJ +V— 1 П f\a~vP ( -L\ At о *¦ г ' Таким образом, с t v\ •— ¦?¦/+ W I \ у\у— i —a \ vJ + у— ^ ('I v?\y-—уp i y\ иy (?i '^'^^ о ^ЛI ¦— с V / 1 V / ул] Ил. ^t-'.OOl О В качестве полинома P(jc) разумно выбрать полином Якоби, орто- ортогональный с весом r/+v~I; предполагается, что J-)-v>0. Из ра- работы [Abramowitz and Stegun, 1964, p. 774] находим м Р(Х) = при у=1 это соотношение сводится к C.13). Рассуждения, почти полностью аналогичные тем, которые исходили из C.13), показы- показывают, что t-i = z-Vi (—(« + *<). —М' — (V + L + M — 1); г), C.34) и мы получаем QWMi(z) = tF1{—{a + L), —M, — (y + L + M—l); z). C.35) Числитель Р^!/мЦг) в общем случае не имеет какого-либо ком- компактного вида. То, что эта формула является формулой для зна- знаменателя аппроксимации Паде, вытекает из C.33) и C.34), так как е (г) = О(гу + |+м + Л1) = О(г?- + м + 1). Интересно сравнить при- приведенный здесь вывод формулы C.35) для знаменателя Паде функции ^i (ос, 1; у; г) с методом ч. 1, § 1.2 и методом из тео- теории непрерывных дробей, основанными на A; 4.6.14). Того, кто желает получить более полное представление о яв- явных формулах, которые можно вывести с помощью технических при- приемов этого параграфа, мы отсылаем к работам [Luke, 1964, 1969J. Дальнейшие подробности о связи между т-методом, методом колло- кации и явными методами типа метода Рунге — Кутта приводятся в работах [Butcher, 1963, 1964], [Ehle, 1968], IMason, 1967], [Axelsson, 1969, 1972] и [Chipman, 1971].
§ 3.4. Метод Кранка — Никольсона 423 § 3.4. Метод Кранка—Никольсона и близкие к нему методы решения уравнения диффузии Основная задача, возникающая в связи с уравнением диффузии (или уравнением теплопроводности), заключается в том, чтобы найти непрерывную функцию и(х, f), удовлетворяющую уравнению и граничному условию и(*,0) =/(*), —оо<х<оо. D.1Ь) Эти уравнения определяют математическую задачу (т. е. выделяют основную задачу в чистом виде), с помощью которой описываются многие идеализированные диффузионные процессы, в том числе процесс распространения тепла в стержне. Условием и(х, O)=f(x) температура задается в начальный момент времени /-=0; задача состоит в том, чтобы найти распределение температуры в последую- последующие моменты времени t>0. Хорошо известно, что с помощью функции Грина, соответствую- соответствующей уравнению D.1), решение этого уравнения находится в виде u(x' '>в Таким образом, задача нахождения решения уравнения D.1) сво- сводится к задаче численного интегрирования при каждом ?>0. Существует, конечно, значительная заинтересованность в том, чтобы решить уравнение D.1а) другими методами; это может ока- оказаться полезным в том случае, когда метод, связанный с функцией Грина, неприменим. Например, когда само уравнение или гранич- граничные условия немного изменены. В связи с задачами ядерной физики можно было бы рассмотреть следующее уравнение в частных про- производных для функции плотности распределения нейтронов и(\, t): -[5 - ?*" = s(x, 0«. D-2) вариация по диффузия член, отражающий времени наличие источника Мы могли бы рассмотреть процесс распространения тепла в стержне конечных размеров, на концах которого поддерживаются заданные температуры и в котором имеются разнообразные источники тепла; температура и{х, t) удовлетворяет уравнению вида ||-? = s(., 0. 0<*<1, D.3а)
424 Гл. 3. Связь с численным анализом граничным условиям на концах стержня и следующему условию на начальную температуру: и(х, 0) = /(*). D.3с) Из физических соображений очевидно, что условий D.3b) и D.3с) достаточно для однозначного решения уравнения D.3а). Граничные условия, записанные по необходимости в математической форме, не всегда являются такими очевидными. Для численного решения уравнения D.2) и D.3), а также других уравнений такого типа существуют разнообразные методы, напри- например метод Галеркина. Однако простейший из них заключается в замене производных разностями. Прежде всего в D.3) делается ди- дискретной переменная х. Выберем N точек внутри интервала 0<Ос<Х так, чтобы сетка имела шаг AS=L/(N+l), а используемые точки имели вид xt=iAx, i=l, 2, . . ., N. Аппроксимационная схема (метод ломаных) задается следующим образом: и{хи и a*2 x=xg (AxJ После чего для функций U1 (t), ?/a(<), ..., VN(t) решаются уравнения 1 dUj _ t/y+j—2t//+ Ui-i _ s ^fi ^^ . ^4i4j полученные дискретизацией пространственной переменной. Ясно, что U0(t)=T0(t) и UN+1(t)—TL(t). Важно доказать, что эта система уравнений сходится. Это утверждение означает, что при Лл:->-0 и Af->-oo решение, найденное по аппроксимационной схеме с помощью точных арифметических действий, стремится к точному решению. Однако здесь мы даже и не будем пытаться доказывать этот резуль- результат. Уравнение D.4) можно переписать в матричном виде N /), 1 = 1, 2, .... Л/, D.5) где / @ = kS (xt, t) + k {8пи0 (t) + 8iNUN + l (t)\/(Ax)\
§ 3.4. Метод Кража — Никольсона 425 ¦*/-! X,. Рис. 1. Графическое изображение пространственно-временных точек, соответст- соответствующих D.6). Если бы мы обратились к системам более высоких размерностей, таких как трехмерная задача D.2), мы бы пришли к уравнению D.5). Однако члены, соответствующие источникам, были бы другие и, что более существенно, матрица А была бы многомерной матри- матрицей с очень редким расположением элементов. Почти все элементы матрицы с редким расположением элементов равны нулю. Это озна- означает, что при операциях с такими матрицами можно использовать специальные приемы, позволяющие избегать излишних арифмети- арифметических действий. Конкретная проблема, которая имелась в виду при этих общих рассуждениях, состоит в том, чтобы рассмотреть слу- случай, в котором матрица А есть многомерная матрица размера N3x X N3, не обязательно симметричная. Уравнение D.5) служит типичным примером того, во что пре- превращается уравнение, подобное уравнению диффузии, после диск- дискретизации пространства. Очевидным методом является также диск- дискретизация времени. Воспользуемся некоторой последовательностью моментов времени /0=0, tlt К, гя, . . . и положим Ath=tk+1—th. Аппроксимация состоит в следующем: dt 1'='*^ Д/А Тогда уравнение D.5) заменяется на уравнение N uUf -f D.6) которое схематично описано на рис. 1. Рассмотрим теперь уравнения, в которых все граничные условия и член, соответствующий источнику, положены равными пулю. Основные проблемы, которыми мы будем заниматься, не связаны с наличием этих членов; тем самым их присутствие в значительной сте- степени несущественно. Таким образом, уравнение D.6) временно за-
426 Гл. 3. Связь с численным анализом меняется на уравнение U<*+1) = (/ + AM)U(ftl1 D.7) где U(ft> = (t/ift>, Uik\ Uf\ ..., ?/#>) — вектор величин, взятых в момент времени tk. Для того чтобы понять, как действует мат- матричный оператор (I -\-AtA), рассмотрим случай N = 3. Используя формулу D.4), имеем где /2—1 О В.Ц-1 2 -1 V 0 —1 2 Для произвольного N надо положить Собственные значения матрицы В3 легко найти: это 2 и 2+1/2. В общем случае собственные значения матрицы BN положитель- положительны и равны (|i) i=l, 2, .... N. D.8) С помощью некоторого рекуррентного соотношения, аналогич- аналогичного соотношению A; 4.4.5) для трехдиагональных определителей, получаем, что полином det (Ву—XI) связан со сдвинутым поли- полиномом Чебышёва порядка iV. Отсюда вытекает формула D.8). Существенным является то, что собственные значения опера- оператора (/+ЛМ) равны ' (Ax)J ' Так как оператор (I+AtA) в формуле D.7) используется итера- итерационно, то для устойчивости существенно, чтобы |А,|<1. В про- противном случае при итерации ошибки округления будут экспонен- экспоненциально расти. Это условие устойчивости влечет за собой нера- неравенство °<ЩА<2' D.9) из которого вытекает, что необходимым условием для устойчиво- устойчивости является ограниченность шага Д^ At<2(AxJ/k. D.10) Поэтому явный метод, определенный соотношением D.7), называется условно устойчивым. Ограничение сверху на шаг At, заданное не-
§ 3.4. Метод Кранка — Никольсона 427 равенством D.10) и вызванное требованием устойчивости, оказывает- оказывается неудобным. В дальнейшем мы найдем путь для того, чтобы избе- избежать его. Из физических соображений, относящихся к задаче D.3) о рас- распространении тепла, известно, что первоначальное поведение ре- решения соответствует неустановившемуся распространению тепла в стержне и что затем система оказывается в устойчивом состоянии. Это наводит на мысль, что с помощью некоторого метода последние шаги по времени Д^ можно выбрать гораздо большими, чем первона- первоначальные. В самом деле, в более поздние моменты времени истинное решение проявляет себя как доминирующее по причине того эф- эффекта, который вызывает величина ехр(—Х1 Д/)— вариация по вре- времени между узлами, kt— наименьшее из собственных значений D.8). Системы, в которых поведение численного решения управля- управляется некоторым большим собственным значением, а поведение ис- истинного решения управляется гораздо более малым собственным значением, называются негибкими системами. Ясно, что приведен- приведенный здесь явный метод решения для таких систем не годится. Направим наши усилия на то, чтобы найти выход из этого за- затруднительного положения. Будем считать уравнение D.5), взятое без членов, соответствующих источнику, идеальным для этой цели. Это уравнение имеет вид N dUi v л 11 -W==Z.A'JUf D-11) /=i где А — известная постоянная матрица с отрицательными собствен- собственными значениями. Уравнение D.11) имеет решение ш. D.12) Таким образом, вопрос сводится к тому, как вычислить матрицу ехр(ЛД0- Метод 1. Первое, что приходит в голову,— воспользоваться частной суммой Тейлора. Главное возражение против такого метода заключается в том, что он неустойчив. Он также является трудоем- трудоемким в смысле вычислений. Вычисление произведения матриц разме- размерами NxN требует произвести O(N3) операций умножения. Таким образом, наличие г-\-\ членов ряда требует О ((г—l)N3) операций умножения (если игнорировать пользу от того, что матрицы имеют редкое расположение элементов). Метод 2. Во-вторых, можно попытаться найти матрицу {ехр(—A At)}'1, используя частные суммы Тейлора. Этот метод является устойчивым, но таким же трудоемким, как и первый. Подобные методы, требующие операции обращения матрицы, назы- называются неявными методами по причинам, которые станут ясны иозд-
428 Гл. 3. Связь с численным анализом нее. Напомним, что операция обращения матрицы требует произве- произвести 0(Ыя) операций умножения и деления (если использовать метод исключений Гаусса). Таким образом, объем операций в этом случае имеет обычную величину. При прямом решении матричных уравне- уравнений требуется произвести О( -^N3) операций. Такая экономия всегда важна на практике. Напомним также, что существуют специальные методы с 0BN) числом операций для трехдиагональных матриц, возникающих в одномерных задачах (а также в задачах больших раз- размерностей). Метод 3. При достаточно большом п можно воспользоваться формулой П + A/я) A At]", которая уменьшает усилия, затрачивае- затрачиваемые на вычисление. Однако такой метод является не стабильным, и третий подход состоит в том, чтобы использовать выражение [1—(\/n)AAt]n. В то время как [1—A/л)/Щ-«->ехр [AM] при я->оо, только первые два члена ряда Тейлора этих функций совпа- совпадают. Таким образом, это устойчивый метод первого порядка. Ирак-' тически этот метод применяется через я-кратное использование выражения A—Л6/)-1 с некоторым, более малым чем At, шагом вре- времени 8t=At/n. Метод 1 можно считать методом, использующим аппроксимацию Паде [г/0] функции exp (AAt), а метод 2 рассматривать как метод, основанный на аппроксимации Паде [0, 1]. Метод 3 состоит в пов- повторном использовании аппроксимации Паде [0/1]. Это наводит на мысль привлечь другие аппроксимации Паде. Очевидным кандидатом является аппроксимация [1/1]. Тогда ап- аппроксимирующее к D.12) уравнение принимает вид такой метод называется методом Кранка — Никольсона. Это метод второго порядка: он является точным до порядка (АО2- Если ? — собственное значение матрицы А At, то D.14) — собственное значение матрицы A—-^AAf)'1 (I -|—=-Л At). Посколь- Поскольку 1<0, то D.14) показывает, что |Е (?)|<1. Эта черта метода наибо- наиболее важна, так как отсюда вытекает, что ошибка округления не увеличивается в процессе итерации решения. Такой процесс явля- является Л-устойчивым или абсолютно устойчивым. Это является ве- весомой предпосылкой для удовлетворительного численного решения.
§ 3.4. Метод Кранка — Никольсона 429 Подобные вычисления для методов 1 и 2 показывают соответственно неустойчивость и устойчивость. Определение. Предположим, что величины {уп, я=0, 1,2,...} получены как численное решение тестового уравнения у'=%у, так что ynmy(nh). Численный метод называется А-устойчивым, если уп-*~0 при п-^-оо для любых фиксированных k и Л, таких, 4ToRe^<0 и /i>0. Другой желательной чертой метода является L-устойчивость, иногда называемая левой устойчивостью, тугой устойчивостью или тугой А -устойчивостью для того, чтобы добавить таинственности и неразберихи. Определение. Предположим, что величины {уп, я=0, 1,2,...} получены как численное решение тестового уравнения у'='ку, так что упжу (nh) и yn+1=f(hX)yn, где ReX<0 и h>0. Численный метод называется L-устойчивым, если он А -устойчив и f{hk}->-0 при Re(/uH—°°- Эти определения даны в духе теории обыкновенных дифферен- дифференциальных уравненией [Gear, 1971], lLambert, 1974]. В определении L-устойчивости [Axelsson, 1969] используется результат о том, что некоторый численный метод решения обыкновенного дифференциаль- дифференциального уравнения тесно связан с рациональной аппроксимацией f{hl) функции ехр(/Л), как мы видели это (см. D.12) и D.13)) для систем таких уравнений. Примеры D.2) — D.14) показывают, что А-устойчивость эквивалентна требованию \f(hk)\430 Гл. 3. Связь с численным анализом t - ****** - * * I I х>-\ xi xi*l Рис. 2. Графическое изображение теплового потока в точках дс,- для двух после- последовательных моментов времени. и с помощью диаграммы, изображенной на рис. 2. Стрелками пока- показано направление теплового потока, в соответствии с которым про- происходит потеря или увеличение тепла в точке х* в последователь- последовательные моменты времени. Кроме того, к методу Кранка — Никольсона можно прийти, если искать более точное приближение величины dUt/dt в уравнении D.11) с помощью разностей, взятых с центром не в точке th, а в точке th-\—^Atk. Доводы такого рода можно считать скорее выражением подхода с позиций здравого смысла, либо отнести этот метод к методам второго порядка, а также к ме- методам, происходящим от правила трапеции. Это наиболее точный А -устойчивый линейный неявный многошаговый метод. Хотя метод Кранка — Никольсона и не является L-устойчивым, он все же по многим причинам хорошо себя зарекомендовал. До сих пор мы концентрировали свои усилия прежде всего на том, чтобы достигнуть точности (максимизируя порядок локального приближения), а также устойчивости численного решения уравне- уравнений диффузионного типа. Однако все же хорошо вспомнить практи- практический смысл той проблемы, которой мы занимаемся. Наша цель заключается в том, чтобы выбрать наиболее удачную рациональную аппроксимацию для функции ехр х на отрезке [0, At\. Аппроксима- Аппроксимация Паде как раз и является единственной «наилучшей» аппрокси- аппроксимацией при Д/-И) (ср. с § 3.6). Практическое соображение состоит в том, чтобы построить рациональную функцию достаточно эконом- экономным способом. Исходя из этого, желательно, чтобы матричная ап- аппроксимация функции ехр (А А/) имела бы вещественные линейные множители. Таким образом, методы аппроксимации Паде уместно использовать в тех ситуациях, когда разностные схемы не сраба- срабатывают. Только эксперимент покажет, какой из методов в наиболь- наибольшей степени удовлетворяет тем разнообразным и противоречивым требованиям, которые предъявляются к какому-либо конкретному уравнению. Мы отсылаем читателя к книгам [Crank, 1975], [Carslaw and Jaeger, 1959] и [Bell and Glasstone, 1970] для знакомства с основа-
§ 3.5. Обратное преобразование Лапласа 431 ми теории параболических уравнений, примеры которых обсужда- обсуждались в этом параграфе. С целью изучения методов решения таких уравнений процитируем книги [Varga, 1962], Юеаг, 19711 и [Lam- [Lambert, 1975], а также обзор [Argyris et al., 1977]. В качестве выбороч- выборочной библиографии по теме настоящего параграфа приведем работы [Baker, 1960], [Baker and Oliphant, I960], [Ehle, 1968, 1973, 1976], [Cavendish et al., 1972], [Fairweather,, 1971], [Norsett, 1974], [Sie meniuch, 1976], [Saff et al., 1976], [Smith et al., 1973] и [Saff et al., 1977]. § 3.5. Обратное преобразование Лапласа Задача построения обратного преобразования Лапласа состоит в том, чтобы найти функцию / (t) по заданной функции / ((). В принципе эти функции связаны соотношениями ^Ш i T(p)erfdt E.1) E.2) о Соотношением E.1) функция f(t) определяется по J(t) непосредст- непосредственно, если выбран подходящий контур интегрирования, на котором подынтегральное выражение осциллирует допустимым образом. Определенное затруднение при решении указанной задачи связа- связано с тем, что малые колебания функции f(p) оказываются результа- результатом больших колебаний f{t). Здесь мы обсудим только метод Паде, который не включает в себя выбор подходящего контура и неявно предполагает некоторую гладкость. Распространение волн в дефектной упругой среде подчиняется следующему уравнению для функции колебания у(х, t): Для того чтобы записать начальные условия, состоящие в том, что поперечные колебания вызываются сдвигом конца стержня в на- начальный момент времени ^=0 (т. е. соответствующая этому процессу функция имеет единичный скачок при ^=0), воспользуемся функ- функцией Хевисайда Q(t) и положим yOc=O,t)=ye(t)=Q(t). E.4)
432 Гл. 3. Связь с численным анализом С помощью преобразования да ^-Р< y(x,t)dt о уравнение E.3) приводится к более простому уравнению 'р) при х>0' решение которого имеет вид ^J i{^}. E.5) Для того чтобы найти решение у (х, t), требуется применить к функ- функции E.5) обратное преобразование. Функция у(х,р) мероморфна по р при Re/O-T-1 и аналитична при Re /?>0. Следовательно, фор- формула E.1) имеет смысл, если ш>0. Мы опускаем как несуществен- несущественное описание выбора переменной, который на практике применяет- применяется для того, чтобы привести E.5) к каноническому виду. Метод Паде требует трех простых шагов. Шаг 1. Разложить функцию E.5) в ряд Тейлора ру{х, р) = со + с,р + с2р2 + ... и построить ее диагональные аппроксимации Паде Ш/ЛТ] (р). Ко- Коэффициенты зависят от л: и от параметров с, т. Шаг 2. Представить эти аппроксимации Паде в виде где /><*>(*) = 0. E.6) 1 = 0 Если Re р\м'\хр>0 для какой-нибудь пары (г, М'), то аппроксима- аппроксимация Паде [М'/М'] оказывается непригодной, так как она имеет пло- плохую аналитическую структуру. Для полюсов этой аппроксимации Паде не выполняется условие близости к существенной особенности функции E.5) и к естественно проведенным разрезам, соответствую- соответствующим этой функции, которые располагаются в левой полуплоскости. Кроме того, наличие полюса в правой полуплоскости привело бы к решению, не имеющему физического смысла: это решение неогра- неограниченно возрастало бы со временем. Шаг 3. В качестве аппроксимации обратного преобразования принимается обратное преобразование функции E.6)
§ 3.6. Связь с рациональной аппроксимацией 433 Это выражение представляет собой сумму экспонент, амплитуда колебаний которых уменьшается со временем t. Интересно сравнить этот метод с методом аппроксимаций Бейкера — Гаммеля (§1.2) с экспоненциальным ядром. Мы не претендуем на то, что описанный в этом параграфе метод является наилучшим для построения обратного преобразования Лапласа. Усовершенствования этого метода основаны на некоторых наилучших или близких к наилучшим рациональным аппроксима- аппроксимациям к функции /(р) из E.1) [Longman, 1974], [Brezinski, 1979]. Сошлемся па работу [Talbot, 1979], где приведен некоторый другой метод, а также дай список методов, при которых достигается хоро- хорошая точность в общих случаях. § 3.6. Связь с рациональной аппроксимацией Время от времени мы подчеркивали в предыдущих параграфах, что аппроксимации Паде обычно не являются наилучшими рацио- рациональными аппроксимациями. В общем случае заведомо трудно найти наилучшие рациональные аппроксимации как в принципе, так и численно. Для функции f(z) с особенностями, содержащимися в конечном числе областей, теорема Рунге, говоря упрощенно, показывает, что существуют рациональные аппроксимации, которые имеют по- полюсы только в заранее указанных точках из областей с особенностями f(z) и которые сходятся к f(z) в дополнении к этим областям, т. е. там, где/(г) голоморфна. Для того чтобы показать какие возможно- возможности заключаются в рациональной аппроксимации, докажем две вводные леммы, а затем уже строго сформулируем и докажем теорему Рунге. Необходимость рационального приближения вытекает из простого примера, который показывает безуспешность полиноми- полиномиальной аппроксимации в этом частном случае и для которого рацио- рациональная аппроксимация дает точное решение. В заключение мы при- приведем теорему Уолша и некоторые однотипные результаты, показы- показывающие, что аппроксимации Паде являются локально наилучшими рациональными аппроксимациями. Лемма 1. Пусть &) — открытая, связная и ограниченная об- область, граничная кривая С которой состоит из наружной граничной кривой Си и внутренних граничных кривых Си С2, . . ., Сп. Пусть функция f (z) голоморфна в Я) и непрерывна на С. Тогда существует некоторая последовательность рациональных функций {Ph(z)}, по- полюсы которых лежат на С, и такая, что Ph(z)-+f(z) равномерно на компактных подмножествах &>.
434 Гл. 3. Связь с численным анализом Доказательство. Используя теорему Коши, имеем где С—Со—Сх—С2—. • ¦—С„; эта запись означает, что контур Со обходится против часовой стрелки, а остальные контуры обходятся по часовой стрелке, как показано на рис. 1. Мы доказываем сходимость на компактных подмножествах обла- области &>; отступим по крайней мере на расстояние S от границы С. Ясно, что в F.1) имеем \t—г|^б>0. Для того чтобы извлечь рациональную аппроксимацию из пред- представления F.1), выберем "П>0, разделим С на р дуг Гь Г2, . . ., Г^, каждая длины не больше К, и выберем произвольные точки th? Th. Положим 4=1 * F-2) Равенство F.2) определяет рациональную аппроксимацию. Пусть 1{С) обозначает длину кривой С, М=тах |/(г)| на компактном под- подмножестве области &>, о котором идет речь. Тогда легко получаем погрешность рациональной аппроксимации >. F.3) В F.3) величину ц можно выбрать произвольно малой; в частности, выберем ti< — произвольная связная, открытая, огра- ограниченная область, и пусть функция / (г) голоморфна в 3>. Тогда су- существует последовательность рациональных функций, которая сходится к /(г) равномерно на компактных подмножествах &). Доказательство. Мы можем исчерпать &) последовательностью вложенных открытых областей {®„} таких, что для всех п F.4)
§ 3.6. Связь с рациональной аппроксимацией 435 Проще всего это сделать с помощью сетки в декартовой системе координат в г-плоскости с размером ячейки 1~т (см. рис. 2). Тогда пусть $т состоит из тех открытых квадратов сетки, вклю- включая их общие стороны, для которых $т<^<3). Возьмем т больше некоторого минимального т0 так, что $т открыто и связно при m > ma. Тогда существует подпоследовательность последователь- последовательности {<§т, т> тй), обозначаемая через {@>п\, которая удовлет- удовлетворяет условию F.4); для каждого г ? 3) можно найти nz такое, что г^2)„2. Кроме того, граница й)„, обозначаемая через Сп, состоит из простых замкнутых ломаных. Пусть б„ — расстояние между й)„_! и Сп\ из условия F.4) вытекает, что Ьп > 0. Для произвольных цп > 0, используя предыдущую лемму, получаем рациональные функции.Sn(г) с полюсами на Сп такие, что где %п— длина Сп и М„ = тах |/(г)| при z?S)n. Следовательно, ве- величины Х.„ и Мп ограничены. Какой бы ни была величина Ьп, вели- величину т]п можно выбрать достаточно малой, так что последователь- последовательность Sn(z)->/(z) равномерно на компактных подмножествах S), и мы можем считать, что |/(z)-Sn(z)|<2-«. F.5) Построение функции Ра (z) в лемме 1 состоит из выбора полюсов на границе &> — области голоморфности функции Дг). Обычно эти полюсы не являются особенностями f(z). Построение в лемме 2 состоит из выбора полюсов функции Sn (z) внутри области голоморф- голоморфности f(z), но вне компактной подобласти сходимости. В теореме Рунге аппроксимации избавлены от этой непривлекательной черты благодаря тому, что полюсы Sn(z) помещаются в заранее выбранные точки в дополнительных областях. Более подробно см. [Roth, 1938] и [Gauthier, 1977]. Теорема 3.6.1 [Runge, 1885]. Пусть функция f(z) голоморф- голоморфна в S>, где S> — ограниченная открытая область, дополнение которой состоит в точности из т \-\ компонент Sr0, f(z) равномерно на компактных подмножествах Я) и все полюсы функций Rn(z) расположены а заранее выбранных точках {zk}. Если т=0, то вместо рациональных функций в качестве {Rn (г)} можно взять полиномы. Доказательство. Доказательство будет дано для случая пС^\. Используя метод леммы 2, предположим, что п достаточно велико,
436 Гл. 3. Связь с численным анализом так что границу n-й области, заключенной между ломаными линия- линиями, можно записать в виде /"* /"* У f> f> где внешность кривой СОп содержит§~0, а внутри кривых Сгп, С2п, • ¦ ¦ . . ., Стп содержатся соответственно ?и ?2, . . ., ?т- Пусть Sn(z) — рациональная аппроксимация, имеющая но построению простые полюсы на каждой из п+l кривых Chn. Эти полюсы «за- «заменяются» кратными полюсами в т+1 точках z0, zu . . ., zm без сколько-нибудь заметного изменения в точности приближения. Для того чтобы «перевести» полюс из точки г=а на кривой Ch в точку z=b, которая ближе к точке z=zh, воспользуемся тожде- тождеством 1 1 а — Ь (а — Ь)Р-у (а—Ь)Р г—а = г — Ь """(г — ЬJ' ' ' ' •" (г — Ь)Р > {г—a) (z — b)P ' откуда получаем J V г-а ++. (z-b)J \a—b\P ~ \г-а\.\г-Ь\Р Для любого 2^й)„_! и Ь, такого, что 2\b—a\<\z—b\, F.6) имеем Р " :^- F.7) Выражение F.7) является ключевым в теореме, так как из него видно, что полюс в точке z=a может быть «заменен» кратным по- полюсом высокого порядка в точке z=b. Кроме того, любой кратный полюс, помещенный в точку г—а (т. е. произвольный полином от (z—а)'1), может быть аппроксимирован подобным образом. Если бы можно было взять b—zh, то теорема уже была бы доказана. Однако в общем случае при b=zh условие F.6) не выполняется. Вместо этого на ломаной линии L, соединяющей точки а и zk, не- необходимо найти последовательность точек bo=a, bu b2, . . ., bN=z, такую, что \bj—bj_t\§ 3.6. Связь с рациональной аппроксимацией 437 Рис. 1. Область голоморфности функции /(г) (не заштрихована); показаны гра- граничные контуры Со, Си С2- I Im z Рис. 2. Декартова сетка и область точках z0, zt zh, такую, что )Sn{z)-Rn(z)\<2'-\ F.8) В совокупности соотношения F.5) и F.8) показывают, что |/(z)— — #„(г)| < 21"" для г^й)л_,. Это завершает доказательство для
438 Гл. 3. Связь с численным анализом случая т > 0. Доказательство в случае т = 0 мы оставляем чита- читателю в качестве простого упражнения [Hille, 1962, р. 229]. Интересно сравнить теорему Рунге и теорему Лорана о рацио- рациональной аппроксимации, сходящейся внутри кольца голоморфно- голоморфности. В последнем случае имеются два кратных полюса: один в центре кольца, другой в бесконечности. Таким образом, к настоящему моменту мы установили возмож- возможность равномерной сходимости рациональных аппроксимаций к функции, область голоморфности которой аналогична области, изо- изображенной на рис. 1. Мы пока далеки от того, чтобы доказать, что некоторая подпоследовательность аппроксимаций Паде сходится в области такого вида. Однако можно легко показать, что в неко- некоторых случаях полиномиальная аппроксимация не дает результата, и объяснить, почему так важна теорема Рунге. Покажем, что полином pn(z)=Q является наилучшей полино- полиномиальной аппроксимацией порядка п функции f(z)=z~1 в кольце l^|z|^2. Для этого предположим, что полином рп (г) дает более точ- точное приближение. Тогда max \pn(z)-z-4~r§ 3.7. Аппроксимации Паде для уравнения Риккаты 439 jL-voo сходятся к /(г) равномерно на компактных подмножествах круга |г|<р, не содержащих полюсов f(z). Кроме того, полюсы /?(L/M»(e, г) сходятся к М полюсам /(г), лежащим в кольце r<.\z\ (е> Z) = 2 rk (e) zk при | г |< е. 6=0 Используя интегральное представление, получаем г*(8)-с* = ай 3 || Вновь из-за того, что R(Lim(z) — наилучшая рациональная ап- аппроксимация в круге |z|(e, г) — f (z)\ < ma\\[L/M]f(z)—f(z)\ при |г| = е, поэтому Следовательно, /"ft(e)~>cft при е->0, fe=0, 1 L+M. Если С(иМ)ф§, то коэффициенты {ck, k=0, I, . . ., L+M} однозначно определяют функцию [L/M\. Если при k=0, 1 L + M величи- величины |rft(e)—ch\ достаточно малы, то RiL/M)(&, г) однозначно определя- определяется по коэффициентам rh(e) для таких значений k и R[L/M)(e, г) равномерно сходятся к [UM]j(z), если соответствующий знамена- знаменатель не обращается в нуль. Это требование выполняется по условиям теоремы. Значение этой теоремы Уолша заключается в следующем: ее можно интерпретировать как утверждение о том, что аппроксима- аппроксимации Паде являются локально наилучшими рациональными аппрок- аппроксимациями. Имеются интересные результаты, близкие к этой теоре- теореме, которые мы приведем без доказательства в виде следствий.
440 Гл. 3. Связь с численным анализом Следствие 1. Утверждение теоремы 3.6.3 остается справедли- справедливым, если под функцией №1/М)(г,г) понимать наилучшую рацио- рациональную аппроксимацию на замкнутом вещественном интервале О^ (вместо круга ||^) Следствие 2. Пусть f(z) —вещественнозначная функция, имею- имеющая т-\-п-\-\ непрерывных производных на отрезке [0, б] при не- некотором 8>0. Для каждого е, 0<е<б; через R{L/M)(e, г) обозначим наилучшую рациональную аппроксимацию типа (L/M) функции f(z) на [0, е]. Тогда при е-МЗ /?(Z-/M>(e, z)-^ALIM\f(z) на некотором замкнутом интервале [О, е0], О<ео^б, где для [ЫМ \f(z) используется классическое определение, а не определение Бейкера. Следствие 1 представляет собой результат, подобный теореме Уолша. Следствие 2 показывает, что аппроксимации Паде, опре- определенные классическим методом, возникают как предел наилучших рациональных аппроксимаций [Chui et al., 1974]. Для более подробного знакомства с последними результатами типа теоремы Уолша мы отсылаем читателя к работам FChui et al., 1975, 1978] и [Walsh, 1965 a, b, 1970]. Поучительными и интересны- интересными являются примеры, в которых показана неединственность на- наилучших рациональных аппроксимаций с комплексными коэффи- коэффициентами для вещественнозначных функций на вещественных интер- интервалах [Saff and Varga, 19781. В качестве полезной ссылки общего характера на тему о рациональных аппроксимациях приведем [Hille, 1962]. § 3.7. Аппроксимации Паде для уравнения Риккати Уравнением Риккати называется обыкновенное нелинейное дифференциальное уравнение вида A(x)fx + B(x)u + C(x)u* = D(x). G.1) Уравнения такого типа естественным образом возникают при ана- анализе однородного обыкновенного дифференциального уравнения второй степени. В качестве примера рассмотрим одномерное урав- уравнение Шрёдингера, представимое в виде Ф"—D(*)q>=0. G.2) Подстановкой и(х)=ц>' (х)/ц(х) уравнение G.2) приводится к урав- уравнению которое является частным случаем уравнения G.1). На самом деле общее уравнение Риккати вида G.1) всегда можно привести к линей- линейному однородному обыкновенному дифференциальному уравнению
§ 3.7. Аппроксимации Паде для уравнения Риккати 44_1 второго порядка [Ince, 1944, р. 24]. Если присутствующие в G.1) функции А (х), В(х), С(х) и D(x) являются полиномами, то уравне- уравнение может быть решено с помощью некоторого варианта метода Фробениуса, использующего непрерывные дроби. Отметим, что под- подстановка в G.1) приводит к уравнению A(x)f'-B(x)f+D(x)f*=C(x), G.3) которое также является уравнением Риккати. В этом смысле урав- уравнение Риккати «сохраняет свой вид при указанной замене функ- функции» х). Метод решения мы разъясним на наглядном примере. Рассмотрим уравнение Риккати (ax+b)y' + (cx+d)y+ (ex+g)y^h, G.4) где а, Ь, с, d, e, g и h — постоянные. Сделаем подстановку у(х) =—,—-—-г-., G.5) а v ; ск-\-а.— и(х) \'•") которая приведет к уравнению (ах+Ь)и'+(сх+а—и) (d—a+u)+h(ex+g)—c(ax—b)=O. G.6) Уравнения G.5), G.6) согласуются с предположением |*H-oo, _ G.7) при условии что величина а выбрана равной a=d—a+eh/c. G.8) Тогда G.6) приводится к уравнению (ax+b)u'+ (cx—d+2a)u—u2=a(a—d)-~gh+cb. G.9) Сравнение G.4) и G.9) показывает, что при подстановке G.5) вид уравнения Риккати G.4) сохраняется. Постоянные а, Ъ и с не изме- изменяются d-+2a—d, e-+0, g-+—l, h-+a (a—d)—gh+cb. G.10) Поэтому, многократно применяя подстановку вида G.5), решение произвольного уравнения Риккати типа G.4) можно дать в виде не- непрерывной дроби. В качестве примера такого уравнения Риккати рассмотрим уравнение xy'—(x+n—l)y=—l. G.11) 1) Зинн-Жюстен, частное сообщение.
442 Гл. 3. Связь с численным анализом Впервые решения дифференциальных уравнений такого типа в виде непрерывных дробей были получены Лагерром lLaguerre, 1879, 18851; он использовал уравнение G.11) для случая л = 1 в качестве явного примера. Уравнение G.11) имеет решение у(х) = е*Еа{х), G.12) где со со En(x)=\e-xtt-»dt = xn-1 \e-"u~"du G-13) 1 X при Rex>0. Следуя G.5) и G.9), сделаем подстановку у (*)=_,-7-иМ; GЛ4) тогда из G.10) находим, что и(\) удовлетворяет уравнению хи' — (х-\-п + 1)и — и2 = п. G.15) В качестве шага индукции рассмотрим уравнение xu'r—(x + n + 2r— \)ur — u* = r(n + r— 1); G.16) отметим, что G.15) в точности совпадает с G.16) в случае г=\. Учитывая G.5), сделаем подстановку Используя G.8), находим аг= — п — 2г, G.18) а из G.10) вытекает, что функция иг+х(х) удовлетворяет урав- уравнению xur.l — (x + n+2r+l)ur+1 — u*ril = {r+l)(n + r). G.19) Из G.19) следует, что по индукции уравнение G.16) распростра- распространяется на все положительные целые г. Из G.14), G.17) и G.18) находим решение уравнения G.11): — х — п х—п — 2 х — п— 4— "' ' х—п—2 (г,-\-1)— ' ' ' 1 п -2—х-\-п-\ 4- ' " " У(х) = Относительно переменной г=-х~1 М-я подходящая дробь дроби G.20) является аппроксимацией Паде функции у (Hz); условия порядка аппроксимации выполняются благодаря G.5), G.7) и G.8). В действительности непрерывная дробь G.20) есть в точности дробь A; 4.6.8), хотя метод ее построения совершенно иной. Про- Проделанный анализ ясно показывает, что точное, завершенное выра-
§3.7. Аппроксимации Паде. для уравнения Риккати 443 жение для решения уравнения Риккати может быть получено толь- только в исключительных случаях. В общем метод, содержащийся в соотношениях G.4), G.5), G.8) и G.10), приводит к представлению ре- решения у(х) уравнения Риккати в виде непрерывной дроби при усло- условии, что можно согласованно наложить условия порядка аппрокси- аппроксимации. Необходимое условие для такого согласования, в случае когда коэффициенты А(х), В(х), С(х) и D (х) в уравнении G.1) — полиномы, заключается в том, что степени этих полиномов удовлет- удовлетворяют неравенствам deg{D(x)}Глава 4. СВЯЗЬ С КВАНТОВОЙ ТЕОРИЕЙ ПОЛЯ §4.1. Возмущенные гармонические осцилляторы Эта глава состоит из трех параграфов. В первом приводятся аргументы в пользу применения метода аппроксимаций Паде для суммирования разложений, которые возникают в квантовой теории поля при возмущениях. Во втором параграфе обсуждаются два ти- типа модели пион-пион рассеяния, для которых метод аппроксимаций Паде открыл новые перспективы в теории возмущений. В послед- последнем параграфе дается набор приложений Паде-методов к критиче- критическим явлениям и указывается, каким образом это связано с кванто- квантовой теорией поля. Здесь мы не в состоянии передать в полной мере содержание мно- многочисленных книг по квантовой теории поля. Основы квантовой ме- механики, которые используются в этом параграфе, изложены Дираком в «The Principles of Quantum Mechanics» [Dirac, 1958J. Элементы тео- теории поля и квантовой электродинамики имеются в книге [Schweber, 1961]. Особенно мы рекомендуем читателю книгу «Cargese Lecture in Physics» [Bessis, 1972] для знакомства с современной трактовкой основ квантовой теории поля. Квантовая электродинамика (КЭД) имеет дело с фотонами и электронами. Состояние вакуума в ней постулируется как состояние с наименьшим уровнем энергии. Характерной чертой КЭД является возможность образования виртуальных пар электрон-позитрон. Это явление лежит в основе вакуумной поляризации, эффект от которой точно проверяется на энергетических уровнях водорода. Взрывы черных дыр могут оказаться более драматичной реализацией этого явления. Дайсон [Dyson, 1952] рассмотрел конфигурацию, состоя- состоящую из большого числа близко расположенных электронов и на некотором расстоянии от них такого же большого числа близко рас- расположенных позитронов. Пример такой конфигурации мы приво- приводим на рис. 1. В собственной энергии взаимодействия этой вирту- виртуальной системы преобладает благодаря малому расстоянию энергия отталкивания в каждой из групп. Таким образом, конфигурация имеет большую положительную собственную энергию, соответствую- соответствующую очень малому промежутку времени и оказывающую незначи- незначительное влияние на любое вычисление.
§4.1. Возмущенные гармонические осцилляторы 445 Рис 1. Конфигурация виртуальных электронов и позитронов. Предположим, что некоторая произвольная величина в кванто- квантовой электродинамике вычислена по возмущенному ряду в точке %—е2 и что ряд в этой точке сходится. Тогда его радиус сходимости не меньше е2 и, таким образом, ряд сходится в точке %=—-^е2. С физической точки зрения это соответствует изменению знака взаимодействия пары электрон-позитрон. Система, изображенная на рис. 1, имеет теперь большую отрицательную энергию, и такая конфигурация становится чрезвычайно вероятной. Это физическое явление образно называется «взрывающимся» вакуумом. Следст- Следствием этого является то, что любой возмущенный ряд в КЭД рас- расходится. Если какой-нибудь ряд в КЭД ассоциирован с некоторой функцией, аналитической при \k\.|2 = Ф„(У) = с/Тг/Яп(у), A.1b) где ст, т = 0, 1, 2,... — нормирующие постоянные. Объединен- Объединенная волновая функция осцилляторов равна \т,п> = уя, „ (х, у) = сяс/Т* +"' Нт (х) На (у); A.2)
446 Гл. 4. Связь с квантовой теорией поля это — собственная функция гамильтониана Решение A.2), не зависящее от времени, возмущается с помощью мгновенного взаимодействия A.4) Такое взаимодействие приводит к уравнению Шрёдингера, зави- зависящему от времени: При t < 0 его решения совпадают с невозмущенными решениями так что при / = 0 |- возмущенная волновая функция равна Поэтому S-матрица для такого взаимодействия задается интег- интегралом перекрытия S(m'n\ /пл)= $ 1С',г(^!/)^\,„(^ЙЛA!/. A.5) — со — со Заданная формулой A.1) и нормированная волновая функция, соответствующая основному состоянию, равна Если подставить это в A.5), то получим, что амплитуда перехо- перехода из основного состояния в основное равна A.6) A.7) A.8) По формулам A.6), A.7) или A.8) функция S00(g2) определяется для всех вещественных значений g. Далее, из A.7) вытекает, 4ToS00(g2}-> ->-1 при вещественных g->0. Однако формула A.7) не определена при Re^2<0; очевидно также, что S00(g'2) имеет особенность в точке ga=0. Хотя A.8) дает явное выражение для Sw{g2), удобнее проин-
§ 4.1. Возмущённые гармонические осцилляторы 447 тегрировать в A.6) по х и получить л — оо з ,Н-4 *{} T/(-g^) + — ее 2/-(-sV)" г Уя I \ / 3 Используя рекуррентные соотношения для гамма-функции и фор- формулу ¦§¦), получаем Эти формальные действия с расходящимися рядами законны в силу теоремы Карлемана. Мы видим также, что Soo^g2) есть ряд Стиль- тьеса с нулевым радиусом сходимости. Формула A.9) для асимпто- асимптотического ряда показывает, что теория возмущений конечного порядка при достаточно малой константе взаимодействия может да- давать вполне приемлемые результаты. Однако при произвольном вза- взаимодействии такие результаты не могут быть получены простым сум- суммированием рядов. Как известно, для ряда A.9) сходятся диагональ- диагональные аппроксимации Паде, и численные результаты красноречиво подтверждают это [Baker and Chisholm, 19661. Проведем еще раз подобный анализ, используя представление Гейзенберга, в котором пространственная переменная х и импульс рх являются зависящими от времени операторами. Тождественно
448 Гл. 4. Связь с квантовой теорией поля по времени они удовлетворяют соотношению коммутирования lx(t), p (t)]=i. Его решения таковы х (t) = х0 cos / \-рхп sin/, Отсюда следует, что [х{(), x'(t)] = — is\n(t — t'). A.11) Рассмотрим теперь операторы p-\-ix * р — ix которые играют роль операторов рождения и уничтожения. Сле- Следуя Дираку, найдем, что собственные состояния гейзенберговских операторов даются выражением г)" | 0> и имеют собственные зна- значения Л„ = « + 1/2. Тогда оператор х = (ц—Tf)/j/2 соответствует квантованному полю, а его иропагатор дается формулой A.11). Следовательно, мы видим, что взаимодействие, описываемое га- гамильтонианом A.4), аналогично некоторому взаимодействию вида gijn|xp и подобно электрон-фотонному взаимодействию в К.ЭД. После этого естественно ожидать сингулярность возмущенных разложений в КЭД в нуле параметра взаимодействия. Ангармонический осциллятор Рассматриваемый здесь одномерный квантово-механический ангармонический осциллятор порождается гамильтонианом Ч-Рх\ Р>0. A.12) Проблема состоит в том, чтобы найти собственные значения энер- энергии и собственные энергетические уровни для уравнения Шрё- дингера ^) *=-?*• A.13) Если Р = 0, то решение дается формулой A.1а), а теория возму- возмущений дает метод для вычисления Е и г|з (лг) в виде рядов по р. Решение уравнения A.13) асимптотически ведет себя следую- следующим образом: ф() е-1Т*7з при х—^оо. Мы видим, что вид волновой функции резко меняется приР=0. Удобнее рассмотреть другую задачу с гамильтонианом
§ 4.1. Возмущённые гармонические осцилляторы 449 и решать уравнение Шрёдингера Можно доказать, что для этой задачи возмущенное решение анали- тично по а в точке а=0 и что разложение сходится при малых |а|. Для большей общности рассмотрим гамильтониан Н=р2+ах*+$х*, A-14) который имеет энергетические уровни Е=Еп(а, |3). Мы уже уста- установили, что функция Еп(си, 1) аналитична в точке а=0. Сделаем в уравнении A.13) замену переменных х-^-х'—Кх. Каж- Каждое решение уравнения A.13) приводит к целому классу решений уравнения A.14); мы находим ?„ (а, C) = к~2 Еп (акх, |ЗА,в). Выбирая а=\, (iX6=l, получаем ?дA, P) = |i'/8?n(p-2/s, 1), A.15) откуда вытекает, что функция ?„A,|}) определена в Р-плоскости с некоторым разрезом, оканчивающимся в точке Р=оо. Кроме того, это соотношение наводит на верную мысль, что точка C =0 является кубической точкой ветвления. Так как функция ?„A, f>) вещест- вещественно-симметрична, то разрез проходит по полуоси —оо<;р^0. I Ьдчеркнем, что следствием этого является то, что возмущенный ряд. для функции ?n(l, P) имеет нулевой радиус сходимости. Можно до- доказать, что ?„A, |3) есть рядСтильтьеса пор, для которого сходится диагональная последовательность аппроксимаций Паде. Для более подробного изучения теории ангармонических осцилляторов и ее связи с теорией поля мы отсылаем читателя к книгам [Bender and Wu, 1968] и (Simon, 19701. Статья [Loeffel et al., 1969) является важной в плане подтверждения сходимости метода Паде для $хг- ангармонического осциллятора. Для рх8-ангармонического осцил- осциллятора возмущенный ряд расходится так быстро, что проблема мо- моментов не определена [Graffi and Grecchi, 1978). За дальней- дальнейшими деталями мы отсылаем читателя к работам [Killingleck, 1980), [Graffi et al., 1971], [Greffi et al., 1970] и [Ruijgrok, 1972]. В картине Гейзенберга Рх4-возмущение в уравнении A.12) со- соответствует (р4-теории поля. Вывод состоит в том, что возмущенное разложение в такой теории поля всегда расходится и необходимо использовать аппроксимации Паде. В самом деле, полученные не- недавно точные оценки для коэффициентов показывают, что в случае четырех измерений коэффициенты возмущенного ряда расходятся как с'к ~ {ш2 У [к + т) ' "Ри k ~~* °° [Brezin, 1977J.
450 Гл. 4. Связь с квантовой теорией поля § 4.2. Пион-пион рассеяние В этом параграфе мы обсудим, как с помощью аппроксимаций Паде проверяются основные положения теории элементарных ча- частиц. Отвлекаясь от физической стороны дела, остановимся прежде всего на том, каким образом свойства аппроксимаций Паде оказы- оказываются полезными для таких приложений. В типичной ситуации мы не в состоянии вычислить с произвольной точностью произволь- произвольно много членов степенного ряда. В пионной динамике в настоящее время доступны самое большее пять членов, а для получения даже нескольких точных десятичных знаков членов более высокого по- порядка требуются трудоемкие вычисления. Отсутствие места не поз- позволяет достаточно полно обсудить техническую сторону теории эле- элементарных частиц. Вновь мы отсылаем читателя к книге «Cargese Lectures in Physics» JBessis, 19721. Разнообразные вычисления проведены с помощью аппроксима- аппроксимации Паде для систем нуклон-нуклон и мезон-нуклон. Прототипом вычисления адронного спектра с помощью аппроксимаций Паде яв- является расчет (ф4-модели пион-пион рассеяния с помощью таких аппроксимаций. Возмущенный ряд порождается лагранжианом Я = у (д»<РаГ + j m2q4 +1X (фафа)?. B.1) Элементы Г-матрицы порождаются графами Фейнмана, изображен- изображенными на рис. 1; формально СП T(s, t, u)=2T*(s, *> «)• 1 = 0 Каждая независимая замкнутая петля любого из графов соответ- соответствует некоторому четырехмерному пространственно-временному интегралу, а каждая внутренняя линия представляет собой некото- некоторый пропагатор. Сомножитель X. ассоциирован с каждой вершиной — пересечением четырех линий. Если графом изображается некоторый процесс рассеяния, в котором промежуточные частицы могут удов- удовлетворять классическим законам сохранения энергии и импульса (как если бы пионы были сталкивающимися бильярдными шарами), то графы оказываются расходящимися и неизбежно требуются мно- многомерные сингулярные квадратуры. Кроме того, такие графы пред- представляют интерес и с числовой точки зрения, поэтому важен ак- аккуратный расчет этих графов. Из теории графов Фейнмана известно, что Т-матрица перекрест- перекрестно симметрична. Это означает, что T{s, t, и) — симметричная функ- функция всех трех переменных s, t и и. Переменная s соответствует энер- энергии, доступной для процесса рассеяния, а переменная t — передаче импульса. Переменные s, t и и являются релятивистскими инвари- инвариантами, образованными из четырех-импульса пиона, и s+/-f м=4.
§ 4.2. Пион-пион рассеяние 451 T0(s,t,u) « 0. , аналогичные члены, с тремя вершинами другие члены с четырьмя вершинами Рис. I. Некоторые графы Фейнмана. Следовательно, ы является зависимой переменной. Если игнориро- игнорировать сложность изоспина, то возмущенный ряд для Г-матрицы ока- оказывается циклично симметричным Tt(s, t, u) = Tt(t, и, s) = Tt(u, t, s). B.2) Следовательно, для любой [/.ШЬаппроксимации Паде Г-матрицы такая симметрия сохраняется. Другой важной характеристикой Г-матрицы является ее уни- унитарность. С помощью разложения Лежандра образуем парциаль- парциальную волну tt(k2) = p(k2) J T(i + 4k\ —2кЦ1—х), —2k2{l+x))Pl(x)dx, -i ¦ где p(k2) — кинематический множитель, k — модуль импульса любого из пионов, взятый в системе центра масс, a x=cos 9 — ко- косинус угла рассеяния 9. Свойство унитарности Г-матрицы состоит в том, что [1+ ««(*•)] [1 + «I № =1. B.3) Так же как и в теории потенциала (см. B.4.12)), любое ограничение теории возмущений конечным порядком не сохраняет свойства уни- унитарности. Однако диагональные аппроксимации Паде S-матрицы и аппроксимации Паде [LIM] Г-матричного возмущенного ряда яв-
452 Гл. 4. Связь с квантовой теорией поля ляются унитарными при условии M^L (см. ч. 1, 1.5, теорема 1.5.5 и упражнение 1). Подводя итог ситуации, отметим, что все аппроксимации Паде для полной амплитуды перекрестно-симметричны, но не унитарны, в то время как диагональные аппроксимации для амплитуд парци- парциальных волн унитарны, но не являются компонентами перекрестно- симметричной амплитуды. Мы сталкиваемся с дилеммой выбора на- наилучшего метода. Фактически лучше всего использовать оба метода и сравнивать их на устойчивость и состоятельность. До сих пор предполагалось, что аппроксимации Паде используют- используются для ускорения сходимости возмущенного ряда. Однако сущест- существует другой сильный аргумент в пользу построения таких аппрок- аппроксимаций, а именно то, что они пригодны для представления ре- зонансов. Множество резонансов возникает в различных каналах упругого рассеяния пионов, таких как р-мезон в канале с /=/ = 1, где / обозначает изотопный спин, а / — угловой момент пионов. Если канале /=/ = 1 открыт, тор-мезонный вклад является домини- доминирующим в пион-пион взаимодействии при энергии относительно центра масс, близкой к 760 MeV, что соответствует кгтаЬЛ в едини- единицах массы пиона. Принято считать, что существование этого мезона есть следствие действующего пион-пион лагранжиана, такого как B.1). Следова- Следовательно, р-мезон должен соответствовать некоторой особенности амплитуды, вычисляемой по лагранжиану, и фактически р-мезон должен быть полюсом амплитуды для парциальной волны. Более точ- точно это означает, что tt(k2) при постоянном g имеет полюс около точ- точки k2—6.4. Естественно думать, что аппроксимация Паде выдаст полюс по переменной а2—• параметру взаимодействия — в точке /г2. Фактически полюс t, как функции от а2 в фиксированной точке k2 соответствует двум полюсам функции tt(k2) па двулистной поверх- поверхности, если выполнены свойства унитарности и аналитичности. Займемся теперь качественной оценкой тех достижений теории, которые основаны па лср4-лагранжиане. При /=/ = 1 амплитуда должна содержать полюср-мезона; мы предполагаем, что постоянная взаимодействия подобрана так, что некоторая аппроксимация Паде для возмущенного ряда парциальной волны имеет полюс при пра- правильной энергии. Выбор аппроксимаций для использования в не- некоторой степени ограничен, поскольку в разложении /] (k2) по К2 постоянный член и член первого порядка равны пулю. В работе [Bessis and Pusterla, 19671 с помощью [2/21-аппроксимации была вычислена величина а2 по массе р-мезона и с помощью этого зафик- зафиксирован единственный свободный параметр в теории. К предска- предсказаниям теории относятся: сдвиги фаз парциальных волн, резонансы и их ширины. Эти предсказания теории должны пройти проверку на устойчивость, например, с помощью сравнения с результатами, по- полученными применением аппроксимаций Паде [2/1] и [1/2]. В модели
§ 4.2. Пион-пион рассеяние 453 в целом не должно слишком сильно нарушаться условие перекрест- перекрестной симметрии. Итак, к предсказаниям теории относится то, что (>-мезон существует и устойчив, т. е. слишком узкий; /°-мезон A=0, J=2) предсказуем и очень узкий; предсказание относительно 5- волн ошибочно; не верно предсказан некоторый экзотический мезон A=2, J=2). Условие перекрестной симметрии проверяется с по- помощью неравенства Мартина и оказывается хорошо выполненным. Другой подход, использующий аппроксимации Паде для полной амплитуды, требует вычисления члена с полюсом. Говоря упрощенно, мы ожидаем, что [2/2]г (k\ cos 0) = ^Дк • const + остаток. Знаменатель аппроксимации Паде есть функция от (s, t) или, что эквивалентно, от (k2, cos Э). Нуль знаменателя определяет так на- называемый полоид, при этом нуль не зависит от cos Э. Проверка того, что полоид — плоский при физически разумных ограниче- ограничениях (—l^cosB^l) является важным тестом на состоятельность такого подхода; это условие достаточно хорошо удовлетворяется в случае Хф4-модели четвертого порядка. При таком подходе амплиту- амплитуды парциальных волн определяются так J Pt(x)[2/2]TD + 4k2, —2k2 A-х), —2 Эти величины должны быть унитарны в том смысле, что соотношение B.3) выполняется приближенно. Нарушение симметрии в Хф4-мо- дели составляет всего лишь несколько процентов. Подводя итог использованию аппроксимаций Паде малого по- порядка в Хф4-теории (как для полной амплитуды, так и для амплитуд парциальных волн), отметим, что все тесты на внутреннюю согласо- согласованность теории хорошо удовлетворяются и в то же время только не- несколько предсказаний этой модели оказываются верными. Этих ре- результатов оказалось достаточно для стимулирования дальнейших важных исследований, однако они также показали, что ^"-лагран- ^"-лагранжиан, вероятно, является неполным. Здесь мы не рассматриваем более глубокий вопрос о том, приводят ли на самом деле результаты о перенормировании возмущенных рядов в Хф4-теории в случае четырех измерений к верным результатам теории поля. В случае двух и трех измерений возмущенные ряды суммируемы методом Бо- реля к функциям Швингера [(Eckmann et al., 1974;Dimock, 1974; Magnen and Seneor, 1976; Feldman and Osterwalcler, 1976]. Самые лучшие предсказания для пион-пион рассеяния сделаны в рамках ст-модели. Метод в основном аналогичен предыдущему,
4 54 Гл. 4. Связь с квантовой теорией поля за исключением того, что лагранжиан равен ^ = у[(^о)Ч-(а1глв)»]—1ц»[а« + <]-1х[о»-г-<]»+са. B.14) Мы ввели некоторое скалярное поле а, которое является двухпи- онным (/=0, 7=0) резонансом. Этот лагранжиан имеет киральную симметрию только в том случае, если опустить член с о. Параметров разложения два: с и X; их величины фиксируются заданием массы р-мезона и скорости распада пиона (через частичное сохранение ак- аксиально-векторного тока). Размер графов в возмущенном разложе- разложении определяется числом петель; обычно имеется возможность ис- использовать аппроксимации Паде от одной переменной. Как это ни прискорбно, но модель можно рассчитать только ограничиваясь одпопетлевыми аппроксимациями, т. е. разрешая построение аппрок- аппроксимаций Паде [1/1]. Однако замечательно то, что даже при таком малом порядке аппроксимации энергетические уровни /=0 и /=2 для фазовых сдвигов S-волны оказываются в хорошем согласии с экспериментом. Кроме того, сохраняется такая привлекательная черта Хф4-модели как существование р- и /° -мезонов, хорошо удов- удовлетворяются также тесты на согласованность. К недостаткам метода относится то, что членов ряда не хватает для тестов на устойчивость; экзотический мезон (/=2) все еще предсказывается теорией, а р- и /°-мезоны слишком узки. Даже при этом наиболее впечатляющим в а-модели является то, что в ней сохраняются лучшие черты Хф4- теории и исправлено самое неудачное в этой теории — ошибочное предсказание относительно 5-волн. Все еще не ясно, каких именно членов не хватает в B.4) для по- построения полной теории. Несомненно, что положение в а-модели могло бы проясниться, если применить более современную технику, такую как использование импульса вне энергетической поверхности в качестве вариационного параметра [Alabiso et al., 1972 a, b] и аппроксимаций Паде от двух переменных [Graves-Morris and Sam- well, 19751, Это замечание отражает направление всей второй части книги — как свести наибольшее число задач к суммированию чис- числового степенного ряда. Для более детального изучения состояния дел в описанной моде- модели мы отсылаем читателя к обзорам [Basdevant, 1970, 1973] и [Zinn- Justin, 1970], а также к первоисточникам [Bessis and Pusterla, 1967, 1968; Copley and Masson, 1967; Copley et al., 1968; Basdevant et al., 1968, 1969; Basdevant and Lee, 1969a; Bessis and Turchetti, 1972].
§ 4.3. Решеточное обрезание в 'к^-евклидовой теории поля 455 § 4.3 Решеточное обрезание в ?ор4-евклидовой теории поля или модель Изинга непрерывного спина В этом параграфе мы укажем некоторые пути использования ап- аппроксимаций Паде для изучения более глубоких вопросов существо- существования в теории поля и рассмотрим их связь с перенормированной те- теорией возмущений. Данный подход приводит здесь к сопоставлению задач теории поля с соответствующими проблемами в статистической механике. Важным шагом в этом направлении является теорема Нельсона [Nelson, 1973], которая показывает, что теорию бозонного поля можно полностью изучить в евклидовом пространстве, а соот- соответствующая теория в пространстве Минковского всегда может быть построена исходя из евклидовой теории. Некоммутирующие опера- операторы в евклидовом пространстве обычной теории поля заменяются коррелированными случайными полями. Иногда в евклидовом про- пространстве используется ультрафиолетовое обрезание решеточного типа. Лагранжиан J? (подобный D.2.1) за исключением в точности одной компоненты, соответствующей некоторому полю) и действие Л связаны соотношением C.1) где т0— голая масса, к0— голая постоянная связи, а: ф2^: означает нормально упорядоченное произведение. В соответствии с целью этого параграфа под :ф2Л' можно понимать четный полином от ф степени 2р с единичным старшим коэффициентом, другие коэффи- коэффициенты которого — числовые функции от /л2, размерности про- пространства и ультрафиолетового обрезания. В пространстве двух или более измерений эти коэффициенты становятся бесконечными, если отсутствует обрезание. Основной функцией для решеточного обрезания является функция разбиения + оо у Д dm х l F! ' • J, C.2) где v456 Гл. 4. Связь с квантовой теорией поля щая постоянная. Теория поля строится на основе функций Швингера d"lnZ C.3) отнормированных для подходящего (возможно, зависящего от пе- периода решетки) выбора величин л, и А, в пределе, когда период решетки стремится к нулю. Подходящей перенормировкой поля ф можно привести равенство C.2) к виду C.4) который непосредственно является формой модели Изинга непрерыв- непрерывного спина на d-мерной пространственной решетке. В пределе при бесконечном возрастании объема теория поля приводит к уже изу- изученному пределу в статистической механике. Этот предел при усло- условии, что период решетки стремится к нулю, можно представлять себе как такой предел, когда отношение периода решетки и другой длины в задаче (т. е. длина корреляции) стремится к нулю. Эта си- ситуация соответствует в точности такому приближению к критиче- критической точке, при котором флуктуации велики, а корреляции дейст- действуют на большом расстоянии. Пример дает явление ферромагнетиз- ферромагнетизма, когда при высоких температурах вещество — ферромагнетик (например, брусок железа) может сохранять самопроизвольную намагниченность при отсутствии магнитного поля. Таким образом, оказывается, что более тщательное изучение основных вопросов теории поля эквивалентно изучению в статистической механике то- того, как ведет себя некоторый процесс при приближении к критиче- критической точке. Бейкер и Кинсайд [Baker and Kincaid, 1979, 1981] уже начали такое изучение и получили замечательные результаты с помощью Паде-методов и методов из § 1.3. Для того чтобы увидеть как Паде-методы помогают в таких ис- исследованиях, мы рассмотрим некоторые приложения этих методов к задачам для критических явлений в статистической механике. Приложения такого рода оказываются среди наиболее удачно раз- разработанных приложений Паде-методов к задачам, возникающим из практики. С помощью равенства C.4) можно определить обычную свободную энергию на каждый спин /=— (pW)-4nZ, C.5) где P = i/fe7\ k — постоянная Больцмана, Т — температура. Ти- Типичные термодинамические величины, представляющие интерес,
§ 4.3. Решеточное обрезание в kg^-евклидовой теории поля 457 могут быть получены непосредственно из C.5). В критической точ- точке различные термодинамические величины имеют особенности в виде точек ветвления, характер которых представляет значительный физический интерес. Для всех этих величин можно построить разло- разложение в ряд, например, по К ос \lkT. После этого возникает идея использовать Паде-метод для того, чтобы найти особую точку и определить характер ветвления. Типичными величинами, с которы- которыми имеют дело в квантовой термодинамике, являются СИсхд-1\н«\К-Кс\-а, где С#—удельная теплота в постоянном магнитном поле, М — спонтанная намагниченность, х—магнитная восприимчивость, а Кс — критическая величина К- Мы заключаем, что М = 0 для е и М > 0 для К> Кс- C-7) Для модели Изинга спин-1/2 (получается переходом к пределу при А,0-»-оо при условии, что <ст;> = 1 для фиксированного /(=0) в двумерном случае точно известны некоторые критические харак- характеристики [Me Coyand Wu, 1973]; например, у=1-75, Р = 1/8, а Сяос In \К—КС1. что соответствует а-=0. Для более высоких размер- размерностей (458 Гл. 4. Связь с квантовой теорией поля Другой путь использования метода аппроксимаций Паде в моде- модели Изинга спин-1/2 связан с разложениями по сильным полям. Если в равенстве C.4) положить все #;=#, то можно разложить свобод- свободную энергию около упорядоченного состояния (все спины парал- параллельны) по степеням \х=е~2". Используя замечательную теорему из работы [Lee and Yang, 1952], в которой утверждается, что для вещественных К, К и А все особенности в [г-плоскости лежат на единичной окружности |ц| = 1 и происходят от нулей функции Z, можно показать [Bessis et al., 1976] в терминах переменной v-jgff. C.9) что намагниченность равна (l + cos80)/2 J ?Lg, C.10) где при К<.КС величина 00 положительна и определяет сектор —Q00>0>1>7o>1>7i>6fc>1>1>