Р, мл., П. Грейвс-моррис аппроксимации паде основы теории Обобщения и приложения Перевод с английского Е. А. Рахманова и С. П. Суетина под редакцией А. А. Гончара Москва «Мир» 1986 ббк 22. 13 Б 41



бет1/4
Дата07.02.2022
өлшемі343 Kb.
#86530
  1   2   3   4
Байланысты:
[Beiker Dzh., Greivs-Morris P. (Baker,Graves-Morri(BookFi)


АППРОКСИМАЦИИ ПАДЕ
GIAN-CARLO ROTA, Editor ENCYCLOPEDIA OF MATHEMATICS AND ITS APPLICATIONS Volume 13,14 Section: Mathematics of Physics Peter A. Carrothers, Section Editor Pade Approximants Part I: Basic Theory Part II: Extensions and Applications George A. Baker, Jr. Peter Graves-Morris Los Alamos National Laboratory University of Kent Los Alamos, New Mexico Canterbury, Kent, England Foreword by Peter A. Carruthers Los Alamos National Laboratory Ў Г 1981 Addison-Wesley Publishing CdL Advanced Book Program Reading, Massachusetts London • Amsterdam • Don Mills. Ontario • Sydney • Toby»
Дж. БЕЙКЕР, мл., П. ГРЕЙВС-МОРРИС АППРОКСИМАЦИИ ПАДЕ 1. Основы теории 2.Обобщения и приложения Перевод с английского Е. А. Рахманова и С. П. Суетина под редакцией А. А. Гончара Москва «Мир» 1986
ББК 22.13 Б 41 УДК 511.3 Бейкер Дж., мл., Грейвс-Моррис П. Б41 Аппроксимации Паде. Пер. с англ.— М.! Мир, 1986.—502 с, ил. Монография известных специалистов (США, Англия) посвящена актуальному методу рациональной аппроксимации функций —аппроксимациям Паде, нашед- нашедшим новые и разнообразные применения в вычислительных задачах теоретической физики и механики. В ч. 1 изложены основы теории и дана программа вычисления аппроксимаций Паде на языке Фортран-IV. Ч. 2 содержит обобщения аппроксима- аппроксимации Паде и их применения к решению интегральных уравнений, к задачам теории рассеяния и квантовой теории поля. Для математиков, механиков, физиков, аспирантов и студентов университетов. 1702070000-160 30-86, ч. 1 ББК 22.13 041 @1)-86 Редакция литературы по математическим наукам © 1981 by Addison-Wesley Publishing Company, Inc. © перевод на русский язык, «Мир», 1986
ОТ ИЗДАТЕЛЬСТВА В последние годы резко возрос интерес к классическим мето- методам рациональной аппроксимации аналитических функций и в первую очередь—к аппроксимациям Паде и их обобщениям. Это связано с тем, что такие аппроксимации нашли разнообраз- разнообразные применения в вычислительных задачах теоретической физики и механики. Оригинальное издание настоящей книги вышло в известной «Энциклопедии математики и ее приложений» под общей редак- редакцией Дж.-К. Роты в серии «Математическая физика» (тт. 13 и 14). Ряд книг из этой Энциклопедии выпущен в русском пере- переводе или готовится к печати издательствами «Наука» и «Мир»1). Авторы монографии широко известны своими работами по теории и, главным образом, приложениям метода аппроксимаций Паде к различным задачам математической физики. В целом моног- монография имеет прикладную направленность, но дает достаточно полное представление о сущности этого метода. И теоретические результаты и решения конкретных задач иллюстрируются разно- разнообразными примерами, графиками и таблицами, приводится прог- программа вычисления аппроксимаций Паде на языке Фортран IV. Обсуждаются различные трудности, которые могут возникнуть при реализации метода аппроксимаций Паде, и приемы, с помощью которых эти трудности можно преодолеть. Авторы не всегда ограничиваются строгими рамками теории — большой вычислительный опыт и физические соображения позво- позволяют им сформулировать ряд важных выводов и рекомендаций, которые пока еще не удается подкрепить теоретическими резуль- результатами. В книге приводятся связи метода аппроксимаций Паде с дру- другими численными методами. Особенно тесно этот метод связан с методом непрерывных дробей, которому посвящен отдельный том Энциклопедии, написанный У. Джоунсом и У. Троном; рус- русское издание его недавно вышло в издательстве «Мир». Нет сомнения, что эта богатая содержанием книга будет инте- интересна как математикам, так и специалистам во многих приклад- прикладных областях, особенно механикам и физикам. Перевод гл. 1—3 части 1 и гл. 1, 2 части 2 выполнен Р.. А. Рахмановым, гл. 4—6 и приложение части 1 и гл. 3, 4 части 2 перевел С. П. Суетин. ') Л. Сантале Интегральная геометрия и геометрическая вероятность (т.1). Дж. Эндрюс. Теория разбиений (т. 2). У. Миллер. Симметрия и разделение переменных (т. 4). Г. Минк. Перманенты (т. 6). У. Джоунс, У. Трон. Непрерывные дроби (т. 11). Н. Мартин, Дж. Ингланд. Математическая теория энтропии (т. 12).
Полюсы и нули аппроксимации Паде высокого порядка экспоненциальной функции описывают замечательные траектории в комплексной плоскости. Эта иллюстрация, воспроизведенная с любезного разрешения профессоров Саффа и Варги, демонстрирует взаимодействие и общие характеристики большого числа таких траекторий. Для более подробного описания см. с. 226—228.
ОТ РЕДАКТОРА ЭНЦИКЛОПЕДИИ Математика состоит главным образом из фактов, которые можно представить и описать подобно любому естественному явлению. Эти факты, иногда сформулированные явно в виде теорем, иногда используемые по ходу доказательств, и составля- составляют основную часть приложений математики и будут существовать всегда, несмотря на изменчивость направлений и интересов в дан- данной науке. Цель настоящей энциклопедии — постараться осветить все области математики. От каждого автора требуется ясное и чет- четкое изложение, доступное для понимания широкого круга чита- читателей, а также подробная библиография. Тома объединяются в серии, которые соответствуют различным областям современной математики; порядок выхода книг в отдельных сериях не уста- устанавливается. Число томов и серий время от времени будет пе- пересматриваться. Мы надеемся, что наше смелое предприятие будет способст- способствовать еще более широкому применению математики не только там, где без нее нельзя обойтись, но даже в тех областях, где ее следовало бы применять и где из-за недостатка информации это пока почти не делается. Джан-Карло Рота
ПРЕДИСЛОВИЕ РЕДАКТОРА СЕРИИ Изучение представления функций степенными рядами приво- приводит к новому, все более глубокому проникновению в математи- математические проблемы и физические приложения. Эта книга посвящена подробному описанию метода аппроксимаций Паде х). Значение этого способа аппроксимации для изучения широкого спектра физических проблем существенно возросло в последние годы. Эта книга представляет собой хороший пример взаимодействия физики и математики, каждая из которых стимулирует другую к появлению новых понятий и методов. Трудно представить более подходящих авторов для изложения теории и способов применения аппроксимаций Паде, чем Бейкер и Грейвс-Моррис, которые широко известны своими оригиналь- оригинальными работами как по математике, так и по физическим прило- приложениям. Книга написана ясно, без ущерба для математической строгости и все же легко доступна для современного физика-тео- физика-теоретика. Нужно заметить, что их книга служит примером здоровой тенденции, наблюдаемой в последние годы, но которой совре- современные математические исследования все больше и больше ини- инициируются самыми передовыми физическими теориями и даже излагаются на языке последних. Например, повышение интереса к статистической механике и теории поля, наблюдаемое в последнее время, потребовало раз- развития таких методов как метод Вильсона ренормализации групп и метод аппроксимаций Паде. Упомянем также, что серьезное изучение непрерывных групп и их представлений вызвано попыт- попытками объединить слабые, электромагнитные, сильные и гравита- гравитационные взаимодействия. Эти же теории лучше всего формулируются в виде неабелевых теорий калибровочных полей, при построении которых существенно используются понятия дифференциальной геометрии и топологии. *) Среди близких методов отметим метод непрерывных дробей, изложенный в книге Джоунса и Трона [Jones, Thron 1980].
Предисловие редактора серии Коротко говоря, аппроксимация Паде представляет функцию в виде отношения двух полиномов. Коэффициенты этих поли- полиномов определяются коэффициентами разложения функции в ряд Тейлора. Таким образом, если задано разложение в степенной ряд то с помощью метода, описанного в тексте, можно оптимальным образом выбрать коэффициенты at, bt и получить аппроксимацию Паде ...-\-aLzL_ Использование этой простой идеи и ее обобщений привело ко многим результатам и превратилось в настоящее время практиче- практически в фундаментальный метод исследования. Не будем, однако, по- портить впечатление от книги подробным пересказом ее содержания. По оглавлению книги можно судить, насколько подробно ав- авторы излагают свойства аппроксимаций Паде. Вводимые понятия иллюстрируются многочисленными примерами. Некоторые срав- сравнительно недавно полученные результаты излагаются в моногра- монографическом виде впервые. Среди них — усовершенствования надежных алгоритмов A; 2.1, 2.4, 4.5 и 2; 1.1), теоремы Саффа и Варги об аппроксимациях Паде экспоненциальной функции A; 5.7), теория Поммеренке о сходимости по емкости A; 6.6), аппрокси- аппроксимации Кентербери для двух переменных B; 1.4) и результаты из евклидовой 1ср4-теории поля, возникшие в связи с использо- использованием аппроксимаций Паде. Кроме этого в B; 3.7) рассматривается новый подход к методу Лагерра. Подробное обсуждение прило- приложений делает их полезными для научного исследования. В главе 2 второй части изучается связь аппроксимаций Паде с интег- интегральными уравнениями и квантовой механикой. Там же, в гл. 3 обсуждается связь с численным анализом. Авторы рассматривают задачи с граничными условиями, приложения аппроксимаций Паде к задачам квантовой теории поля. Наконец, обширная биб- библиография предоставляет читателю возможность для более де- детального изучения указанных проблем. Настоящая книга представляет собой прекрасный пример обзора, ориентированного на творческую деятельность, ибо в ней сотканы воедино и живые идеи метода аппроксимаций Паде и их применения, а это создает основу для новых активных исследо- исследований как в теории, так и в приложениях. Эта книга с течением времени непременно выполнит свою роль. Питер Э. Каррузерс, Главный редактор серии математической физики
Нашим женам Элизабет Бейкер и Люсии Г рейве-Моррис и нашим семьям. ПРЕДИСЛОВИЕ Назначение этой книги—изложить основы одного из подходов к проблеме восстановления функции по степенному ряду. Мы попытались описать основные результаты и методы в наиболее ясном виде, следуя общей традиции Энциклопедии. Основная идея метода аппроксимаций Паде, который, в частности, является весьма эффективным методом построения и вычисления значений степенных рядов, была открыта независимо по крайней мере дважды. Авторство Паде основывается на его диссертации 1892 г., в которой он изучил такие аппроксимации и расположил их в таблицу, уделив при этом особое внимание экспоненциальной функции. Он, по-видимому, не знал о более ранней работе Якоби A846 г.), посвященной упроще- упрощению метода рациональной аппроксимации Коши, где дано детерми- нантное представление решения этой задачи. Работе Паде предшест- предшествовала также работа Фробениуса A881 г.), который вывел тождества между соседними рациональными функциями Якоби. Интересно отме- отметить, что в 1740 г. Андерсон, вероятно случайно, натолкнулся на аппроксимации Паде логарифмической функции. Фотографию Паде можно найти в книге "The Pade Approximant Method and Its Appli- Application to Mechanics", изданной под редакцией А. Кабане. Копия диссертации Паде находится в библиотеке Корнельского универ- университета. Настоящая книга основана на обширной литературе и моногра- монографии "The Essentials of Pade Approximants", написанной одним из нас. Ссылки на нее делаются особенно часто, а для названия ис- используются сокращения ЕРА. Хотя по содержанию обе книги име- имеют независимый характер, они в большей степени дополняют одна другую, а система обозначений настоящего издания, как правило, согласована с ЕРА. Существенное отличие заключается в располо- расположении таблицы Паде: таблица в этой книге получается из таблицы в ЕРА отражением относительно главной диагонали. Изданные иод редакцией второго из нас Труды кентерберийской летней школы и международной конференции содержат многочисленные резуль- результаты, которые способствовали появлению работ из самых разных
Предисловие 11 дисциплин; мы надеемся, что нам удалось перенести этот общий подход и в настоящую книгу. Многие публикации, существенно ис- использованные в этой книге, включены в список литературы. Мы бла- благодарны нашим многочисленным коллегам в Брукхейвене, Кентер- Кентербери, Корнелле, Лос-Аламосе и Сакле за непринужденные дискус- дискуссии, которые расширили область наших исследований. Мы особенно признательны Р. Чисхольму, Дж. Гаммелю и Д. Бесису за много- многочисленные обсуждения; мы благодарим за гостеприимство СЕ.А в Сакле, где частично была написана эта книга. При написании этой книги труднее всего было выбрать такую форму изложения, которая сделала бы текст легко читаемым и в то же время не нанесла бы ущерба математической строгости. Исполь- Использование языка теории множеств и чрезмерная строгость рассужде- рассуждений отодвинули бы на второй план прикладные методы. С другой стороны, отсутствие формулировок условий, при которых справед- справедливы теоремы, могло привести читателей к заблуждениям. Мы выбрали форму изложения, наиболее удобную для наших целей. Например, связность множеств упоминается только там, где это существенно, а в других случаях о ней не говорится. Полученные б последнее время приложения к физическим и инженерным зада- задачам рассматриваются на конкретных примерах. Ссылки на формулы в тексте делаются так, чтобы устранить всякую неопределенность: ссылка A; 6.5.3) означает формулу E.3), гл. 6 ч. 1, если ссылка делается внутри части и главы, то их номера опускаются. И последнее: вся книга проникнута безграничной верой в силу метода аппроксимаций Паде. В 1963 г. в одном обзоре, посвящен- посвященном рациональным аппроксимациям утверждалось, что метод Паде неприменим для приближений на всем отрезке @, оо); мы убеждены, что пересмотр такого рода утверждений давно назрел. Джордж А. Ветер, мл. Питер Грейвс-Моррис
Часть 1 ОСНОВЫ ТЕОРИИ Глава 1 ВВЕДЕНИЕ И ОПРЕДЕЛЕНИЯ 1.1. Введение и основные понятия Пусть задан степенной ряд 2 A.1) 2 1 = 0 представляющий функцию /(г). Разложение A.1) является исход- исходным пунктом любого анализа, использующего аппроксимации Паде. Всюду в дальнейшем через ct, г = 0, 1, 2, ..., обозначаются дан- данные коэффициенты ряда, а через / (г)—соответствующая функция. Аппроксимация Паде—это рациональная функция вида разложение которой в ряд Тейлора (с центром в нуле) совпадает с разложением A.1) до тех пор, пока это возможно. Более полное и точное определение мы дадим в § 1.4. Отметим, что функция вида A.2) имеет L + 1 коэффициентов в числителе и М + 1 в зна- знаменателе. Весь набор коэффициентов определяется с точностью до общего множителя, и мы для определенности положим Ьо = \. Та- Такой выбор станет затем существенной чертой точного определения, и мы условимся считать, что в записи A.2) он подразумевается. Теперь мы имеем L-\-\ свободных параметров в числителе и М в знаменателе формулы A.2); всего L-j-M-j-l свободных парамет- параметров. Это означает, что в общем случае коэффициенты тейлоров- тейлоровского разложения функции [L/M] при степенях 1, г, г2, ..., zL+M должны совпадать с соответствующими коэффициентами ряда A.1); другими словами, должно выполняться соотношение
1.1. Введение и основные понятия 13 Пример. [1/0] = 1—1г = /(г) + 0B [o/ij Ц / [i/i] = - Умножая A.3) на знаменатель дроби, находим, что = а0 + агг + ... + а^1 + О (zi+^+i). A.4) Сравнивая коэффициенты при z?+1, zi+2,.. . ,г1+Л1, получим равен- равенства A.5) Для полноты мы положим Су = О при / < 0. С учетом соглашения Ьо = 1 равенства A.5) можно переписать в виде системы М линей- линейных уравнений с М неизвестными коэффициентами знаменателя! cL-M+\ cL-M+i CL-M+3 CL-M+2 CL-M+3 CL-M+i CL-M+3 cL-M+4 CI.+M+b UL+M -г {bi J CL+M. • A.6) Отсюда могут быть найдены bt. Коэффициенты числителя а0, alt ... , aL находятся теперь из A.4) сравнением коэффициентов при I, г, г2, ... , zL\ а, = A.7) min (L, М) 2
14 Гл. 1. Введение и определения Уравнения A.6), A.7) называются уравнениями Паде; в случае когда система A.6) разрешима, они определяют коэффициенты числителя и знаменателя аппроксимации Паде [L/M]. Коэффи- Коэффициенты тейлоровского разложения этой функции при 1, г, г2, ... ... , zL+M совпадают с соответствующими коэффициентами ряда A.1). Поскольку исходной точкой наших рассуждений являются коэффициенты ряда 2^oc/2'' т0 нет необходимости заранее счи- считать эти коэффициенты коэффициентами Тейлора какой-либо функции. Конечно, мы ожидаем, что с помощью аппроксимаций Паде ряда 2?=<>с,-г' можно приблизить функцию /(г), для кото- которой этот ряд является рядом Тейлора, но здесь важно подчерк- подчеркнуть различие между проблемой сходимости аппроксимаций Паде и проблемой их построения. Для решения второй из этих проб- проблем требуются только коэффициенты ряда; способ построения указывают формулы A.6), A.7). Каждый степенной ряд имеет круг сходимости |г|/? расходится). Если R = oo, то ряд представляет функцию, аналитическую всюду в комплексной плоскости (такие функции называют целыми); значение функции в любой точке г может быть получено непосредственным сумми- суммированием ряда. Если /? = 0, то ряд расходится всюду (кроме г = 0) и является только формальным. Такой ряд может содер- содержать информацию о функции, но не всегда сразу ясно, как можно использовать эту информацию. В этом случае когда после- последовательность аппроксимаций Паде формального степенного ряда сходится к функции g(z) для г?й5, есть основания считать, что g(z)—функция, соответствующая данному ряду. В определенных предположениях мы сможем дать точные формулировки и дока- доказательства таких утверждений (см. гл. 5). Однако в этой книге мы не будем обращать большого внимания на недостаточную строгость тех или иных рассуждений и в известных пределах будем принимать во внимание наличие эмпирической сходимости. Если данный ряд сходится к функции f (z) в круге |z|1.1. Введение и основные понятия 15 1,0 0,9 0,8 0,7 0,6 0,5 0,0 -Отрезок ряда Тейлора Аппроксимация Паде[1/1] «-Ш I ^ i,o 2,0 3,0 4.0' Рис. 1. Графики функций / (г)= J^(l +z/2) A +2г), отрезка ее ряда Тейлора 1—3z/4 + 39z2/32 и соответствующей аппроксимации Паде [1/1]. Вычислим аппроксимацию Паде [1/1]. Уравнение A.6) в данном ( 3 \ , 39 , 13 ,, случае имеет вид [ — j )b, = —^ > и> следовательно, Ь1 = ^. Урав- Уравнение A.7) дает ао = 1, а1 = ^-; правильность вычислений прове- проверяется равенством 1+ Таким образом, мы нашли, что На рис. 1 приведены для сравнения графики функций /(г) и [1/1] (г) при г>0. В частности, имеем /(се) = 0.5, [1/1J (се) = = -jg = 0.54... , т. е. значение в бесконечности аппроксимация Паде [1/1J Дает с точностью 8%. Этот пример показывает замеча-
16 Гл. 1. Введение и определения тельную точность, достигаемую аппроксимацией, которая использует всего три члена разложения. Следует сразу подчеркнуть одну особенность, связанную с приближенными вычислениями аппроксимаций Паде: эти вычисле- вычисления требуют большей точности, чем можно было бы заранее предположить. Аппроксимации Паде экстраполируют всю последо- последовательность коэффициентов по их конечному числу, поэтому исходные коэффициенты должны быть вычислены достаточно точно. Мы рассмотрим проблему точности вычислений в § 2.4. А пока будем считать, что аппроксимации Паде определяются непосредственно по формулам A.6), A.7) без использования каких- либо приближенных методов. Из A.6) с помощью правила Кра- Крамера можно получить явный вид коэффициентов Ь„ bt, ... , Ьм и, следовательно, знаменателя функции A.2). Пренебрегая числовым множителем, результат можно записать в виде определителя QLM/Ц ф = CL-M+\ CL-M + 2 • • • CL С1+л cL-M + 2 Cl-M+3 ••• CL + 1 CL + 2 -г cL+M-\ yM-1 A.8) 2Ш ?M — X ij /./. Введение и основные понятия 17 няя только начальные отрезки этих рядов, при ходим к определителю С[.-М+2 CL- L-M+S CL+2 • A.9) L-M L-M+I L 2r ?M+i "V c zM+t-l V c . 1 = 0 1=0 1=0 Формула A.9) так же, как и A.8), используется ниже в качест- качестве стандартного обозначения. Докажем теперь нашу первую тео- теорему. Теорема 1. 1. 1. Для многочленов, определенных равенствами A. 1.8) и A. 1. 9), справедливо соотношение Q.UM1 (г) = 0 A.10) Доказательство. Отметим, что degP^L/M^(z)^.L, degQCL M\z)^M. Преобразуя левую часть A.10), получим 2 ciz'— 1=0 CL-M+t CL-M+i CL-M+3 cL+i ~L+M 2 otz = 1 + 1 с,г M+i-1 2 сгг' 1 = L + М + 1 2 i= 1 CL- L-M+S С L+M A.11) Этим теорема доказана.
18 Гл. 1. Введение и определения Представление остатка в форме A.11) иногда бывает полезно при оценках погрешностей, связанных с использованием аппроксима- аппроксимаций Паде. Рассмотрим теперь определитель QU./M] @) = CL-M+l CL- M+t '1+1 CL+M-1 Определители такого вида называются определителями Ганкеля. Заметим, что если QiL/M~\ @) Ф0, то система уравнений A.6) не вырождена и коэффициенты многочлена QlL'M^(z)/Q^-L/M^@) пред- представляют ее единственное решение. Независимо от этого условие qil/m] @) фО позволяет разделить соотношение A.10) на QJ-L/Mi (г); это дает 2 c*f- 1=0 Тем самым доказана наша вторая теорема. Теорема 1.1.2. [Jacobi, 1846]. Если CPL/M]@)ф0, то ап- аппроксимация Паде [L/M] определяется равенством Р\.им 1 (г) : [L/M] где Р^мЦг), CfL'Mh определены формулами A.8), A.9). A.12) Обсуждение трудностей, встречающихся при Q[L/A1 ] @) = 0, мы отложим до § 1.4. В случае когда нужно подчеркнуть зависимость аппроксима- аппроксимации Паде от /, мы будем использовать запись \L/M]f. Для явно- явного указания зависимости от г будем писать [L/M] (г). Таким об- образом, мы имеем следующие формы записи: [L/M] = \ЫМ\, = [L/M]/ (г) = [ЦМ] (г), применяемые в соответствии с обстоятельствами. Набор аппроксимаций Паде принято записывать в виде таб- таблицы которая называется таблицей Паде
1.2. Аппроксимации Паде экспоненциальной функции 19 ТАБЛИЦА 1. ТАБЛИЦА ПАДЕ 0 1 2 0 [О/О] [0/1] [0/2] I [1/0] [I/I] [1/2] 2 [2/0] [2/IJ [2/2] Часть таблицы Паде функции ехр(г) показана в табл. 2; эти ра- равенства вытекают из общих формул, которые будут получены в следующем параграфе. § 1.2. Аппроксимации Паде экспоненциальной функции Коэффициенты с(. = — тейлоровского разложения функции ехр(г) достаточно просты для того, чтобы числитель и знамена- знаменатель соответствующих аппроксимаций Паде можно было найти в явном виде. В этом параграфе мы вычислим знаменатель QWMi (г). Числитель находится затем с помощью простого и элегантного приема, основанного на тождестве е~г — ~ (см. § 1.5). ТАБЛИЦА 2. ЧАСТЬ ТАБЛИЦЫ ПАДЕ ФУНКЦИИ ехр (г) [Паде, 1982] \ L 0 i 1 0 1 1 1 1-г 2 2-2z4-z2 1 1+z 1 2 + z 2-z 6-4z + z2 2 2 + 2z + z2 2 6 + 4z+z2 6-2z 12-6z4z2 В своей диссертации, посвященной исследованию свойств аппрок- аппроксимаций, носящих его имя, Паде уделил примеру экспоненциаль- экспоненциальной функции особое внимание; этот пример наглядно показывает,
20 Гл. 1. Введение и определения как работают аппроксимации Паде в идеальной ситуации. Даль- Дальнейшие свойства аппроксимаций Паде функции ег устанавлива- устанавливаются в § 4.6, 5.7, 2; 3.3 и 2; 3.4. Наша задача состоит в вычислении определителя j 1 j_ |_ L! (L — М+1)! (L — УИ+2)! 1 1 (L + 1)! 1 (L — Л1+2)! (L — М + 3)\ (L + 1)! U уМ. 1 (L + 2)! 1 (L+1)T — 1)! (L + Al)! 1 B.1) Мы начнем с вычисления постоянного слагаемого (коэффициента при 1 в правом нижнем углу); для этой величины введем спе- специальное обозначение 1 J_ +2)l ¦" L\ I 1 1 C(L/M) = (L — (L-M-\-2)\ (L — M+3)! (L+1)! B.2) (L+1)! •'• (L + M-l)! Мы предполагаем, что L^M—1, так что все элементы отличны от нуля. Изменения в случае L < М — 1 очевидны: мы должны положить 1//!=0 при /<0 (дальнейшие вычисления не изменя- изменяются). Пусть М •произведение элементов последнего столбца, тогда U U . L .. L + 1 (L — М + 1)! (L — М + 2)! l (L + I)! (L_AI+2)! (L —M + 3)! (L + M —1I (L + УИ —1)! LI L + M — • B-3)
1.2. Аппроксимации Паде экспоненциальной функции 21 Определитель в B.3) имеет М строк. Вычитая (М—1)-ю строку из М-и, затем (М—2)-ю из (М — 1)-й и т. д. и используя пов- повторно равенство г\ (г—1I _/ (л—1)! ,п .. si (s—1I ' si (в первом столбце B.3) имеем г—s = M — 1, во втором г — s =ч es М — 2 И Т. Д.), ПОЛУЧИМ и и C(L/M) = 1)! (L — M + I)! (L- L! (L — Л1 + 3I (L — LI = /?(—l [-1)! L! L! (L —Л1+2I (L — (L — УИ + 3)! (L —Л1+4)! — 2I (L + M — 2I L! L 1 1 0 1 0 .. 1 .. 1 .. 1 ¦ B.5) Определитель в B.5) имеет ту же форму, что и B.3) с заменой М на М — 1. Теперь по индукции находим значение М (М - 1) Л1 = (—П 2 п 0-1I B.6) В частности, при М = 1, 2 имеем соответственно C(L/2) = C(L/l)=-L, 1 J_ L! (L-l)! J_ Отметим, что чередование знака в B.6) характеризует частот- частотные ряды Пойа, к которым мы обратимся в § 5.7. Те операции, которые мы применили, чтобы вывести B.6) из B.2), позволяют найти и остальные коэффициенты многочлена QlL/Ml(z), хотя си- ситуация несколько усложняется. Рассмотрим коэффициент при
Гл. 1. Введение и определения {—zI, который равен , —/И + 1)! 1 (L — (L— /И+ 2)! I (L — M+ЗУ. 1 (L-/+1)! 1 (?.-/ + 2I 1 (? + 2I 1 , B.7) где столбец, выделенный пунктиром, опускается. Положим тогда имеем (? + 01 (?-/+1I (L-/M + 2)! •••; (?. — / +2!) L! . B.8, Последовательно вычитая строки и используя равенство B.4/, получим / X (?+1)! (?,_ /И + 2)! (? + 2)! (L — /И+3)! — 1)! L! ... 1 Определитель порядка М — 1 в правой части но форме совпадает с B.8). Производя последовательно / таких редукций, полу-
1.2. Аппроксимации Паде экспоненциальной функции 23 чим = ± JL Ц (М-i+ 1)! х X \)\ (L —/И+/ + 1)! (L + 2)! (L —M + / + 2)! L! (L+ 2I (L+l)! (L + M —/I —i— \Y Z.I Производя деление каждой строки на ее последний элемент, по- получаем " :=aLfl<*-i+i)r* 1=1 Ц.-/И+/+!)! '•• ;-м+ +2)! ••• -/—1I Определители такого вида уже рассматривались выше при вы- вычислении C(L/M); действуя тем же способом (с использованием тождества B.4)), окончательно находим (-1^М1-±{ПтгЬ VI = 1 ^"Г*. (П (м-1 + 1) х M-/-I х — — (L + /M-/)! Л1 B.9) Легко видеть, что знак правой части B.9) тот же, что и в B.6), поскольку определители B.2) и B.7) имеют одинаковый порядок и разлагаются при каждой редукции одинаковым спо- способом— по последнему столбцу. Таким образом, мы показали, что )!
24 Гл. 1. Введение и определения Отметим, что B.6) получается отсюда как частный случай при / = 0. Из B.10) с учетом B.6) вытекает представление AL/M1 _ , .уС ,, М) (L + M-jy. Ml I и мы получаем 0[l/m i (z) = с /?/АЯ V (+) (Л1 —/)! /I —1) 2! (-г) ¦••| 2! ^•' ,/7,(—Af, —L—M; —z). B.11) Из B.11), следуя методу § 1.6, можно вывести, что (г) = С (L/Af),/=",(—L, — L—Af; z), и, таким образом, аппроксимация Паде [L/M] функции ег пред- ставима в виде § 1.3. Последовательности и ряды. Трудности В § 1.1 мы рассмотрели способ нахождения аппроксимаций Паде, соответствующих данному степенному ряду, а в § 1.2 по- получили явный вид аппроксимаций Паде для функции expz. В этом параграфе мы рассмотрим предварительно несколько вопро- вопросов, которые будут подробнее обсуждаться в следующих главах. Метод аппроксимаций Паде непосредственно применим для улучшения сходимости последовательностей и рядов. Полностью эти приложения обсуждаются в гл. 3. Пусть, например, известно, что некоторая последовательность аппроксимаций [Lk/Mk] (z), k = = !, 2, .... сходится в точке г=1. В этом смысле аппроксима- аппроксимации Паде можно использовать для суммирования ряда 2 ck= lim [LklMk)}(\). C.1) Аналогично, если дана последовательность {Sn, n = 0, 1,2, ...}, мы определим соответствующий ряд, полагая с0 = 50, cn+1 = Sn+1-Sn = ASn, n = 0, 1,2, ....
1.3. Последовательности и ряды 25 и тогда аппроксимации Паде можно использовать для рассмот- рассмотрения свойств последовательности. Обычно, если нет препятст- препятствующих причин, применяются диагональные аппроксимации Паде. Этих моментов мы коснемся в гл. 3. Вернемся к формуле A.8): CL-M+3 ,M Преобразуем этот определитель, вычитая каждый столбец, умно- умноженный на z, из предыдущего (начиная с последнего); получим компактную и симметричную форму записи QIL/M1 (г) = Ci^ma-л гс L-M+г с, — гс i+i CL-M+2 ZC L-M+3 ? + 2 с, — гс ? + 1 • C.2) Для числителя, используя формулу A.9), получим CL-M+l L-M CL-M+3 cL + i L-M + 2 1=0 CL+-i • • • CL+M L ... 2 0 2 1 = 0 и производя аналогичные преобразования, получим Г.-/И+1" ZCI-M+2 ••• CL—ZC?+l t —Л1+2 *CL-M+3 ••• ^/+1 '6? + 2 -i ZCI+M
26 Гл. 1. Введение и определения Прибавляем к последнему столбцу первый, умноженный на z~M, затем второй, умноженный на z~M+1, и т. д.; это дает cl.-M+i zcl.-M+i CL-M+1 ZCL-M+3 CL i — ZCL+ yL+l Определим теперь матрицы W (z) = Ci-M+\ ZCl-M+2 cL-M + 2 ZCL-M + 3 cL-M+2 zcl.-M + a CL-M+n zcL-M + i ct — zc t+1 cL+,—zc t + 2 cL-M+lZ -M -M C,Z~M L-M 2 [ = 0 CL C.3) C.4) cL). C.5) Тогда имеем QtL^Mi (z) = det W (z). Разлагая определитель C.3) по последней строке, затем каждый из полученных определите- определителей по последнему столбцу и используя выражение обратной матрицы W~* (z) через алгебраические дополнения к элементам W (г), получим 1—М [L/M]= 2 ctz'+{crW-i(z)c}zL-M+K C.6) Это равенство называют компактной формой Натолла для ап- аппроксимаций Паде. При L < М полиномиальный член в C.6) обращается в нуль в соответствии с нашим соглашением о том, что су=0 при /' < 0. Преобразования, подобные использованным выше, приводят и к другой интересной форме записи аппроксимаций Паде, полез- полезной в вопросах, связанных с ускорением сходимости последова- последовательностей. Пусть дана последовательность {Sn, « = 0, 1, ...}; положим A'Sb -.0 при / < 0, ,+1— Sk при k — 0, 1,2, ... и —А^~1Бк при всех k и г = 1, 2, 3, C.7)
1.3. Последовательности и ряды. 27 Согласно A.8), имеем ... ASL AS r _ м,, Ао, S?_f ASL ... /> 1 1 ... 1 и после нескольких элементарных операций с последним опре- определителем получим представление = (—\\м A3S L-M ДЖ+2С Справа определитель Ганкеля порядка М, в котором все разност- разностные операторы отнесены к SL_M. Аналогично находим выражение для PWM] B) через определитель Ганкеля порядка M + li piL/M] A) = bSL_M L-M ¦ • • ЛЛ+15ь_л Последовательности вида {[УИ/УИ], /И = 0, 1, 2, ...} называют диагональными; приведенные формулы подсказывают, что для улучшения сходимости разумно (но вовсе не обязательно) исполь- использовать именно диагональные аппроксимации Паде. Окончательная формула имеет замечательно элегантный вид ([Shanks, 1955J); ^L-M ^L-M :-м ^Sl-m ^^L-M L-M C.8)-
28 Гл. 1. Введение и определения В заключение этого параграфа мы приведем несколько при- примеров, иллюстрирующих те трудности, которые встречаются при исследованиях, связанных с формальными степенными рядами. Пусть х—действительная положительная переменная, тогда функция /(*) = exp( ) бесконечно дифференцируема во всем промежутке 0<1х< оо. Важным моментом здесь является то, что все производные этой функции в точке х = 0 обращаются в нуль: / @) = /' @) = /" @) = ... = 0; таким образом, тейлоровское раз- разложение f (x) с центром в нуле тождественно равно нулю. Конечно, это искусственный пример, основанный на том, что функция / (х) не аналитична в начале координат (т. е. f не аналитична ни в каком круге |z|<$ с положительным б). Ясно, что f (х) не определяется своим тейлоровским разложением и наши теоремы должны формулироваться так, чтобы исключить такие возможно- возможности. Другой важный (и более естественный) пример—функция Эйлера, определяемая разложением E(z) = l — l!z + 2!z2—3!г3+... . C.9) Теория, относящаяся к этому случаю, подробно изложена в § 5.5, 5.6; предположим пока, что эмпирически установлена сходимость некоторой последовательности аппроксимаций Паде, соответствую- соответствующих ряду C.9). Здесь важно обратить внимание на вопрос о том, к какой именно функции сходятся аппроксимации Паде. Поскольку ряд C.9) является формальным, то заранее неясно, в каком смысле он определяет функцию Е (z). Вопрос об определении Е (х) при х^О полностью решается с учетом того факта, что ряд C.9) является асимптотическим. Для удобства рассмотрим значение x — tq • Значения абсолют- абсолютных величин членов ряда C.9) при этом х показаны на рис. 1. Считая ряд асимптотическим, разумно определить приближенное значение Е(-^), обрывая ряд в точке минимума, т. е. принять это значение равным 2«=° ft' ( — То) • ^та пР°ИеДУРа значительно менее удовлетворительна при больших z и оказывается совсем мало-пригодной при малых отрицательных г. Суть дела в том, что при естественном подходе функция Е (г) определяется в пло- плоскости с разрезом —oo1.4. Определение Бейкера 29 0.001 - 0,0001 - 5 Ю 15 20 25 Рис. 1. Абсолютные величины |а„| = @.1)п п\ членов гипергеометрического ряда для Е (х), соответствующие точке л-= 0.1. Еще один пример математических тонкостей можно найти в § 3.9, ч. 2; там рассматривается функция, аналитическая и кольце, которую нельзя приблизить в этом кольце многочленами. Другая похожая функция рассматривалась в наглядном примере § 1.1, где мы показали успешное практическое применение аппрок- аппроксимаций Паде малого порядка; отметим, что быстрая сходимость с увеличением порядка аппроксимации в этом примере может быть доказана методом рядов Стильтьеса гл. 5. Заканчивая эгот краткий обзор, заметим, что значительная часть этой книги в основном посвящена способам преодоления тех или иных естественных трудностей, подобных тем, что опи- описаны выше. § 1.4. Определение Бейкера, С-таблица и блочная структура Чтобы мотивировать обсуждение вопроса о современном опре- определении, анализ которого принадлежит Бейкеру, мы должны понять, какие трудности связаны с основным подходом, обсуж- обсуждавшимся до сих пор. Классический пример, демонстрирующий недостатки наивного подхода к определению, дает задача построе- построения аппроксимации Паде [1/1] для функции 1 + z2.
30 Гл. 1. Введение и определения Требуется определить р0, pit q0, qt так, чтобы выполнялось соотношение D.1) Отсюда вытекает, что рв-{-ptz = qo +q^ +q0z2 + O (г3), и, следо- следовательно, Таким образом аппроксимация [1/1] должна быть равна D.2) <4-3> Однако 1 Ф 1 +22-j- О (г3), и мы быстро и справедливо заключаем, что уравнение D.1) не имеет решений. В действительности мы получили решение уравнения р0 + pxz = (q0 + q,z) A + га) + О (г3), D.4) но это не то, что требуется в D.1). Отметим, что детерминантные формулы дают также решение D.2); C2 сйг со + с^ C, Cj z 1 0 2 0 1 г 1 1 1 Долгое время уравнение вида D.4) принималось в качестве подходящего определения аппроксимаций Паде. Точнее, класси- классическое определение, называемое также определением Паде или Фробениуса — Паде, состоит в следующем.1 пусть pi(z), qm(z) — многочлены степени L и М соответственно такие, что1) qM(z)f(z)-pL(z) = O(zL+M + l), D.5) тогда pL(z)iqM(z) называется аппроксимацией Паде функции / (z) (уравнение D.5) есть общая форма уравнения D.4)). Замечатель- Замечательным является тот факт, что многочлены pt(z), qK{z), удовлетво- удовлетворяющие D.5), всегда существуют. Однако наш пример показы- показывает, что если qM @) = 0, то, возможно ) дмФ^', конечно, каждый из многочленов pL, дщ зависит от пары индек- индексов L, М. Отношение Pilqm любой пары таких многочленов единственно.— Прим. перев.
1.4. Определение Бейкера 31 Паде определил индекс дефекта <о?<Л1 — наименьшее неотрица- неотрицательное число, для которого т. е., (о?, м—мера недостаточности аппроксимации. Короче говоря, рациональная функция pL (z)/qM (z) может не аппроксимировать функцию f (z) до порядка L + M, и при таких обстоятельствах мы предпочитаем говорить, что аппроксимации Паде не существует. В общей теории рациональной интерполяции хорошо известно, что существуют определенные «выпадающие» значения; например, условие интерполяции значения /(г,) в узле г, может быть не согласование другими условиями интерполяции и при таких обстоя- обстоятельствах считается, что интерполирующей функции не сущест- существует. Наш подход полностью согласован с этой точкой зрения. Поскольку требование точности порядка аппроксимации яв- является основным, существенно сохранить его в определении, и поэтому мы пользуемся современным определением, которое было тщательно исследовано Бейкером [Baker, 1973 b]. Определение. (Бейкер). Если существуют многочлены А1'-/М1 (г), /m] () степени L и М соответственно такие, что Аl?L / (?) |П (?i+M + i\ (Л ел Я(*./м1@)г=1, D.7) то мы по определению полагаем Форма записи подчеркивает, что и числитель и знаменатель зависят от каждого из чисел L и М. Замена D.6) на соотношение дает полностью эквивалентный вариант определения при условии, что требование D.7) сохраняется. Введенные обозначения исполь- используются на протяжении всей книги без дальнейших оговорок. Если QlL/Ml (О)фО (см. A.8)), то с помощью нового обозна- обозначения
32 Гл. 1. Введение и определения можно убедиться, что оба рассматриваемых определения совпа- совпадают с точностью до несущественного числового множителя. По- Поэтому вопрос о различии определений иногда считают само собой разумеющимся. Как бы то ни было, случай, когда QWMI @)=0, требует уточнения терминологии. Обращение Qt^/^i] @) в нуль является очень важным обстоятельством, и поэтому мы вводим для этой величины специальное обозначение. Определение. CL~M+lCL~M+2 CL-M+2Cl.-M+3 CL+1 D.8) Подведем итог. Если С (L/M) ф 0, то классическое определение Фробениуса—Паде и определение Бейкера эквивалентны. Если С (L/M) = 0, то аппроксимации Паде [L/M], возможно, не сущест- существует. Однако многочлены, удовлетворяющие D.5), существуют и определяют рациональную функцию, которая исторически назы- называлась аппроксимацией Паде1). ТАБЛИЦА 1. С-ТАБЛИЦА С@/0) С@/1) С@/2) С{\/\) С(\/2) СB/0) СB/1) СB/2) Множество {C{L/M), L, /VI = 0, 1, 2, ...} удобно изображать в виде таблицы, которую мы будем называть С-таблицей (эту таблицу значений определителей не следует пугать с таблицей Паде). Пример. Пусть '^'~ l-f-г + г3 • Разложение этой функции в ряд Тейлора имеет вид _г4_|_гб_г«_|_2г'_Зг8 + 4г9— ... . D.9) См. сноску на стр. ЗЬ.— Прим. перев.
1.4. Определение Бейкера 33 ТАБЛИЦА 2. С-ТАБЛИЦА ДЛЯ x 0 1 2 3 4 5 0 1 1 — 1 _'1 1 1 1 1 1 — 1 -1 2 4 2 I 0 0 1 0 2 * * 3 1 0 0 -1 1 1 4 I „ i _ i 1 0 0 5 I 1 0 0 0 6 1 -1 1 1 0 0 * 7 1 2 -1 -1 0 0 8 I -3 0 0 9 ... 1 ••• Д, • • • ... • ¦ • 0 ••• 0 ••• Соответствующая С-таблица приведена в табл. 2. Наиболее при- примечательной особенностью таблицы являются квадратные блоки из нулей; нулевой элемент С D/4) является вершиной бесконечного квадратного блока. Прежде чем доказывать эти утверждения, рассмотрим вопрос о построении табл. 1. Например, чтобы построить табл. 2 исходя непосредственно из определения D.8) и коэффициентов ряда D.9), требуется множество алгебраических операций; на самом деле, большинство элементов таблицы можно найти без этой алгебры. Согласно определению, имеем С (L/0) = 1, С (L/1) = с,, С @/М)= (\)М(М)/М Большинство оставшихся элементов можно найти с помощью тождества CГа. 1. Введение и определения получается из А вычеркиванием строк о номерами г и s и столб- столбцов с номерами р и q. Если г < s и р < q, то det А¦ det Art s,p< g = det Ar, p det A,,,—det Лл,, det A.t p. Доказательство. Пусть порядок матрицы А равен п -}-2; поло- поло+1 2 З А р жим сначала г = /? = л+1, ^ = виде, обозначив Ап_и„.„_и„ = 'М г, и+2 — р Запишем А в блочном •n+2, n+i ¦ м t Рассмотрим теперь следующий определитель (используется блочная форма записи): порядка 2/г + 2 /1 с S е Ь h d а iO 1° I с oio М g h О f e d О с b а о М h g M М 0 g О f 0 d О О Ь а с О Л ? М g f e О Ь О h h О d О а с 8 М М h f о • а с 8 М + М g f d b с h M О |Л1 М' g h О / е d О О 0 а с О 0 g h С учетом принятых обозначений это дает равенство det Л .det An+U „+i. K+u „+5 = det An+U n+i det An+i< n+i— —det^n+i, „+2det4,,+s, n+1. Переставляя местами столбцы с номерами р и л+1. q и л + 2 и строки с номерами s и л + 2, г и л+1, получим утверждение теоремы. Следствие. C(L/M — l)C(L/M+l) = C(L+l/M)C(L—l/M)—С (L/M)\ D.11) Доказательство. Положим det A = C (LlM-\-1) (см. D.8)). При г = р=1, s = <7 = yiW получим D.11). Если С(L/M — 1)=й=0, то отсюда следует D.10). Соотношение D.11) является ключом к доказательству блоч- блочной структуры С-таблицы. Теорема. 1.4.2. Нулевые элементы образуют в С-таблице квадрат- квадратные блоки, которые окружены со всех сторон ненулевыми элементами.
1.4. Определение Бейкера 35 Доказательство. Левая верхняя вершина блока определяется следующими условиями: C(//m) = 0, C(l — l/m)#0, С(Цт—1)ф0 D.12а) (если одно из двух или оба последних условия не выполнены, то / и т переопределяются очевидным образом). Из / — 1/т-звезд- ного тождества СA— \1т — \)СA— 1Цп+1) = СA—2/т)СA/т)— C(l—1 и D.12) находим, что — Mm— и, следовательно, СA—1/гп — СA—Цт+1)Ф0. Аналогично, из 1/т — 1-звездного тождества следует, что СA-\- \/т — 1) Ф 0; соответствующая часть С-таблицы показана в табл. 3. ТАБЛИЦА 3. СЛЕДСТВИЯ D. 12А) ТАБЛИЦА 4. ЛЕВАЯ ГРАНИЦА БЛОКА С(/-1/т+1) С(/-1/т) С{1-\/т+\) С(//м-1) фО СA/т) =0 С(/+1/м-1) фО Ф0 фО фО ФО ФО ФО 0 0 0 0 =7^=0 фО Предположим, что СA/т+\)ф0. D.12Ь) Тогда из 1/т-\-\ -звездного тождества следует, чтоС (Z+1/m-f 1) фО, и из /-J-1//п-звездного тождества следует, что C(/-f l/m) Ф0.
36 Гл. 1. Введение и определения Таким образом, //m-блок состоит из одного элемента, и утверж- утверждение теоремы для этого случая доказано. Пусть, наоборот, С(//т + 1) = 0. D.12с) Тогда можно найти натуральное k, такое, что + /) = 0, / = 0, 1, .... k— 1 и Используя I—1//п +/-звездное тождество, установим последова- последовательно, что С{1 — \/т + }+1)Ф0 при / = 0, 1, .... k — l. Поскольку С(I—\1т-\-ЩФ0 и С (l/tn-\-k) ФО, мы заключаем, что С(/ + l/m + k)=/=0. Таким образом, мы получили столбец нулей, окаймленный слева сверху и снизу ненулевыми элементами, как показано в табл. 4.' Аналогичные рассуждения показывают, что блок является прямоугольником, и если он конечен, то окайм- окаймлен со всех сторон ненулевыми элементами; см. табл. 5. ТАБЛИЦА 5. ЧАСТЬ С-ТАБЛИЦЫ, СООТВЕТСТВУЮЩАЯ БЛОКУ ФО ФО фО ФО Ф0 Ф0 0 0 0 ФО фО 0 0 0 фО 0 0 0 фО ^0 0' 0 0 =?0 ФО фО фО фО ФО Докажем теперь, что блоки являются квадратами (как в табл. 5). Рассмотрим произвольный блок с г строками и s столб- столбцами. Покажем сначала, что r^s; для этого рассмотрим простой пример, который делает общий случай очевидным. Пусть известно, что С B/2) = С C/2) = С D/2) = 0; другими словами, имеют место равенства с4 Это означает, что некоторая линейная комбинация векторов ) обращается в нуль, и то же самое верно для каж- с3 J
1.4. Определение Бейкера 37 дой из пар . Используя эти линей- линейные комбинации для преобразования определителей, получим Co ci c2 ci c. c3 c2 c3 c4 = * с О с О с i * а О з О = 0 D.13) (звездочки заменяют несущественные элементы) и аналогично Съ Съ с8 с4 Ci Ca = 0. D.14) Теперь, интерпретируя D.13), D.14) как утверждения о линейной зависимости соответствующих столбцов так же, как и выше, получаем 'B/4) = О с0 ci ci Со Ci ci с, е, Cj Cj С8 с3 с4 с4 с6 * 0 0 0 с» Ci ci С3 Ci с2 Сз с4 * О О О = 0. Аналогичным образом получаются равенства С C/4) == С C/3) = 0. После этого очевидно, что если блок С-таблицы имеет s столб- столбцов, то число строк в нем не меньше s. Другими словами, для блока с г строками и s столбцами имеем r~^s. Для доказательства обратного утверждения r^s восполь- воспользуемся теоремой Адамара из § 1.6. Не ограничивая общности, можно считать, что со=/=О. Рассмотрим С-таблицу для функции g (г)= 1//(г), элементы которой будем обозначать через С" (*/*). Из теоремы Адамара вытекает, что С (L/M) и С" {M/L) обращаются в нуль одновременно (см. F.9)). Следовательно, С-таблица функ- функции g (г) имеет блок из r' = s строк и s' = r столбцов. Согласно доказанному выше неравенству имеем r'^s'; это означает что r^s, и теорема доказана. Мы переходим теперь к теореме Паде. Формулировка теоремы была модернизирована Бейкером, но ее содержание осталось по существу без изменений. Стиль доказательства, конечно, совер- совершенно иной, чем в прошлом столетии. Теорема 1.4.3. Элементы [LfM] таблицы Паде, для которых С (Ь/М)Ф0, единственным образом определяются равенствами №-^§г-
38 Гл. 1. Введение и определения Наоборот, пусть С (L/M) = О для всех элементов некоторого г х г блока С-таблицы. Этому блоку С-таблицы соответствует (г + 1)х(г + \)-блок в таблице Ладе, для которого C(h/\i)=^O, С (Л. + i/ц) =И= 0, С(к/ц-\-1)фО, i = l, 2, .... г, С(Я+1/A+/) = О, I, /=1, 2, ..., г. Аппроксимации Паде этого блока однозначно определяются усло- условиями Х) [L/M] = [Я/|*], если [L/M] не существует, если Доказательство теоремы разобьем на три пункта. 1. Если С (L/M)=^=0, то уравнения Паде линейно независимы и вместе с условием Ьо = 1 однозначно определяют коэффициенты соответствующей аппроксимации. В частности, это замечание исключает возможность того, что многочлены A^L/M^ (z) и ВШмЦг) имеют общие множители. 2. Аппроксимации Паде, соответствующие левой и верхней линиям блока, определяются равенствами i=l, 2 г. Доказательство основывается на единственности этих аппрокси- аппроксимаций (см. п. 1 выше) и блочной структуре С-таблицы. При i—\ нужный результат вытекает из равенств коэффициент при гш в Я* + */n] (z) равен ±G(A,+1/ц+1) = 0, коэффициент при z^+1 в QWn+i]B) равен ±С(к+ 1/ц +1) = 0. Далее рассуждаем по индукции; коэффициент при гя+' в Р&+'М (г) равен ±С(к + »'/И-+ 1) = 0; следовательно, [X. + i/p,] = [% +1 — 1/ц], i = l, 2, ..., г. Аналогичным образом получаются равенства [%/\i + i] = [%/\i + i—l], i = \, 2, ..., г, и утверждение п. 2 доказано. 3. Аппроксимации Паде [L/M], соответствующие блоку С-таб- С-таблицы, удовлетворяют условиям [L/Af]=[V|-i] при L+yW Х + ц + г. Доказательство. Поскольку аппроксимации Паде [l + i/\i], i = 0, I, 2, ..., г, соответствующие верхней границе блока, сов- совпадают, то коэффициенты знаменателя Паде удовлетворяют сле- 11 Классические аппроксимации Паде существуют и совпадают с [Х/ц\ во I блоки. всем блоке.
1.4. Определение Бейкера 39 дующим \i-\-r уравнениям: ck+v -О, D.15) ¦г) и поскольку не лежит в этом блоке, то „<7„=5*О. D.16) Предположим, что [L/M]—некоторая аппроксимация Паде в блоке, не лежащая на верхней или левой границе, т. е. А.-)- 1 ^L^ k-\-r, и \i-{-1 ^ М ^ [г-i r и BtL/Ml(O) = l. Анализ соответствующих систем уравнений показывает, что в этом случае мы должны иметь равенство [L/M] = [L—\/М — 1J. С учетом утверждения п. 2 мы заключаем, что если аппроксимация Паде в блоке суще- существует, то она приводится к [Х/ц], и, таким образом, ее знаме- знаменатель удовлетворяет системе D.15). Таким образом, мы видим, что условия точности порядка аппроксимации выполняются при L + /W^^ + H' + ''> так что эти аппроксимации Паде существуют и приводимы. Далее, из D.16) вытекает, что условие L-f Л1 > > Л. + ц-f-f аппроксимации для степени zx+^+r+1 нарушается и соответствующей аппроксимации Паде не существует. Теперь тео- теорема полностью доказана. Основной факт, связанный с системой линейных уравнений, состоит в следующем: система может быть совместной и иметь решение и может быть несовместной и не иметь решений. Этот факт отражен в доказанной теореме, где система линейных урав- уравнений определяет или не определяет аппроксимацию Паде; в тео- теореме рассматривается, конечно, и вопрос единственности. Таблица 6 графически суммирует связь между блоком С-таблицы и соот- соответствующим блоком таблицы Паде. До сих пор мы не касались вопроса о бесконечных блоках С-таблицы и таблицы Паде. Теперь мы покажем, что бесконеч- бесконечные блоки встречаются в тех и только тех таблицах, которые со- соответствуют рациональным функциям. Отметим, что следствием теоремы 1.4.2 является тот факт, что если одна из сторон блока бесконечна, то вторая его сторона также бесконечна. Теорема 1.4.4. Предположим, что функция f (z) аналитична в начале координат и задана разложением в ряд Тейлора f(z)=.
40 Гл. 1. Введение и определения ТАБЛИЦА 6. ЧАСТЬ С-ТАБЛИЦЫ, ИЗОБРАЖАЮЩАЯ ЗхЗ-БЛОК И ЧАСТЬ ТАБЛИЦЫ ПАДЕ, ПОКАЗЫВАЮЩАЯ СООТВЕТСТВУЮЩИЙ 4X4-БЛОК г 1 =^° 1 0 0 —• 0 1 1 0 0 0 г 1 0 0 . 0 IV/O п п л п с С И п С н н п н н н П. — соответствующая аппроксимация Паде имеет невырожденную систему уравнений, но приводится к порядку [X, ц]. С. — аппроксимации Паде соответствует вырожденная, но совместная сис- система уравнений. Н. —аппроксимация Паде имеет несовместную систему уравнений и не су- существует. = 2 ctz'- Тогда существование бесконечного блока в С-таблице, i= О 00 соответствующей ряду 2 ciz' > необходимо и достаточно для того, чтобы / (г) была рациональной функцией. Рациональной функции типа [Х/ц] соответствует блок С-таблицы, определяемый условиями Это условие необходимо и достаточно также для того, чтобы имело место представление N М/ 1=1 х=\ (-$0<-.>- всех —\i. D.17) Доказательство. Предположим, что в таблице Паде есть беско- бесконечный блок; согласно теореме 1.4.3, все его элементы при- приводятся к виду Р-'/ц']- Тогда, сравнивая последовательно члены разложений, получим t—AWi (z) = 0. Таким образом, () fl?V/|x'JB) '
1.4. Определение Бейкера 41 и, учитывая предположения теоремы, имеем X'— X, ц' = И" По- Положим л/ N Ь(г) = В1Ш (г) = ПA ~f', где Z^fx, и пусть я(г) = 2 сьг1> если ^ > М-- и /г=0 я(г) = 0 в противном случае. Тогда существует многочлен я2(г) степени не выше \i, такой, что / (г) представима в виде суммы Таким образом, при k^k—\i коэффициенты ct имеют представ- представление D.17). Наоборот, если известно, что/(г) — рациональная функция,то утверждение теоремы вытекает из единственности аппроксимаций Паде (см. теорему 1.4.4). Мы установили, что в определенных обстоятельствах некото- некоторые аппроксимации Паде не существуют. Следующая теорема показывает, что в каждой строке, столбце и диагонали сущест- существует бесконечно много аппроксимаций Паде. 00 Теорема 1.4.5. Пусть 2 ciz'—формальный степенной ряд. 1 = 0 В соответствующей таблице Паде существует бесконечно много аппроксимаций Паде: (i) в каждой строке [L/M]; М фиксировано, L —* оо, (и) в каждом столбце [L/M]; L фиксировано, М—*оо, (ш) в каждой диагонали [M + j/M]; / фиксировано, М—»-оо. В случае строк для доказательства теоремы достаточно заме- заметить, что в любой строке любого блока существует по крайней мере одна аппроксимация Паде (если блоков конечное число, то утверждение очевидно). Рассуждение для столбцов и диагоналей аналогично. Заметим, что теорема ничего не говорит о сходимости аппрок- аппроксимаций Паде, но из нее вытекает, что вопрос о сходимости строк, столбцов и диагоналей имеет смысл. Упражнение 1. Найти функцию, для которой аппроксимации Паде [3/2] не существует. Упражнение 2. Не используя ЭВМ, вычислить С-таблицу для функции (l + z—z*)/{l+z-\ г2).
42 Гл. 1. Введение и определения Упражнение 3. Пусть С (L/M)=?O. Показать, что многочлены м] () и Q[^/a*1 (г) не имеют общих множителей. Упражнение 4. Используя непрерывность QWM~b (г) по пара- параметру cL M+1 и непрерывность знаменателя Паде [Roth, 1965], преобразовать QWMl(z) При C(L/M) = 0. § 1.5. Двойственность и инвариантность В этом параграфе мы установим ряд алгебраических свойств аппроксимаций Паде, которые обусловлены свойствами инвариант- инвариантности класса аппроксимирующих функций. Следующие ниже тео- теоремы легко доказываются и имеют важные следствия. Подчерк- Подчеркнем, что все теоремы этого параграфа касаются алгебраических свойств степенных рядов и не затрагивают прямо свойств сходи- сходимости . Теорема 1.5.1 (Двойственность). Пусть g{z) = {f(z)}~1 и f@)=^=0. Тогда [L/M]g(z) = {[M/L]/}~1 при условии, что одна из этих аппроксимаций существует. Доказательство. Предположим, что [M/L]^ существует. Тогда где рм(г), q, (г)— полиномы степени не выше М и L соответст- соответственно и рмФ)Ф®, поскольку [M/L]f(Q) = f(QH Имеем qL (г) - Рм (г)~f (z) QL {г) О следовательно, [L/M]g == gL (г)/рм (г). Доказательстю в предположе- предположении, что существует [L/M]g, аналогично. Таким образом, свойство двойственности состоит в том, что аппроксимация Паде от обратной функции равна обращению ап- аппроксимации Паде самой функции (под обращением / здесь пони- понимается 1//). Другими словами, операция нахождения аппрокси- аппроксимаций Паде коммутирует с обращением. Двойственность является особенно ценным свойством в случае, когда рассматриваемый класс функций {/} совпадает с классом обратных функций {1//}. Это имеет место, например, для меро- морфных функций. Теорема 1.5.2 (Инвариантность при дробно-линейных преобра- преобразованиях аргумента). Пусть f {г) = ^Т=ьСгг'. Рассмотрим дробно-
1.5. Двойственность и инвариантность 43 линейное преобразование, сохраняющее начало координат аг и соответствующую новую функцию g(w) = f (г). Тогда при условии, что одна из этих аппроксимаций существует. Доказательство. Пусть [М/М] (w) существует, тогда м [M{M]g (w) = ^ =g{w)+O i i= о Положим M Тогда имеем соотношение Поскольку AM(z), Вм(г) — полиномы от г порядка М, то отсюда вытекает, что AM(z)/BM(z) = [M/M]f(z). Доказательство в предположении, что [M/M]j существует, ана- аналогично. Теорема доказана. Отметим, что теорема справедлива только для диагональных аппроксимаций Паде; обычно ее называют теоремой Бейкера, Гаммеляи Уиллса [Baker, Gammel and Wills, 19611. Еще раньше близкий результат был получен Эдреи [Edrei, 1939]. Оптимистический взгляд на аппроксимации Паде основывается сейчас главным образом на практическом опыте, а не на дока- доказанных георемах. Теорема об инвариантности аппроксимаций Паде при дробно-линейных заменах аргумента является одним из теоретических доводов в пользу этого оптимизма. Основания для этого таковы: отображение вида w — az/(\-\-bz) позволяет отобра- отобразить любой круг Г, содержащий начало координат на круг |ш|<р с центром в начале координат (см. рис. 1). Поэтому если удается доказать, что последовательность диагональных ап- аппроксимаций Паде функции g(w) сходится в круге |до|<р, то отсюда следует, что та же последовательность для соответствую-
44 Гл. 1. Введение и определения Рис. 1. Отображение tt> = az/(l-f-fcz) и обратное отображение. щей функции / сходится в круге Г (см. квази-теорему из §6.7). Отметим также возможность ускорения сходимости с помощью диагональных аппроксимаций Паде, упоминаемую в гл. 3, в тер- терминах обобщенного преобразования Эйлера [Thacher, 1974]. Дру- Другие приложения этой теоремы обсуждаются в § 6.7. Теорема 1.5.3 (Инвариантность при дробно-линейных преобра- преобразованиях функции). Пусть дана функция } (г) = 2?= о ctz'. Положим Если , то W — c+d [M/M)f(z) при условии, что [M/M]f существует. Доказательство. Поскольку c-\-df @)^=0, то можно найти полиномы рм(г), Цм(г) степени не выше М, такие, что pM(z) а+Ь[М[М\,1г] и ЯмФ)?=0. Тогда РМ(') qM(z) c+d[M/M]f(z) >¦ - {c+d\MIM\t{z)){c+df(z)} ~ Следовательно, рм {z)/qM (z) является аппроксимацией Паде [М//И] функции g(z). Доказанная теорема, как и предыдущая, верна только для диагональных аппроксимаций Паде. Интересным следствием этого
1.5. Двойственность и инвариантность 45 результата является то, что бесконечные значения аппроксима- аппроксимаций Паде можно рассматривать наравне с конечными значениями; это существенно при рассмотрении сходимости в сферической метрике (см. § 6.4). Преобразование a+bf « c+df может быть представлено в виде композиции элементарных пре- преобразований каждое из которых имеет простую интерпретацию. Подробности можно найти в ЕРА, с. 113. со Теорема 1.5.4 (Теорема усечения). Пусть f (z)= 2сгг' и 1 = 0 L— Ьг /(J ( = 0 \ (=0 Тогда [L—klM\gB)^<[LtM\f—J^ctit>z-it при > М — 1 и при условии существования одной из указанных аппроксимаций. Доказательство. Пусть [L/M]f == AtL/Mi (z)jBWMi (г) существует (доказательство теоремы при альтернативном предположении мы оставляем в качестве упражнения). Положим S (г). i = 0 I Тогда Pi-k(z)—многочлен степени L—k, и мы имеем Следовательно, Эта теорема многократно используется в гл. 5, где мы доказы- доказываем серию результатов, относящихся к аппроксимациям Паде вида [M + j/M] при /^—1. Теорема 1.5.5 (Унитарность) [Gammel, Me Donald, 1966]. 00 Пусть f (z) = 2 cizi—унитарная функция, т. е.
46 Гл. 1. Введение и определения Если [М/М] = [M[M]f (г) — диагональные аппроксимации Ладе функции }, то [М/М][М/М]* = 1. Доказательство1). Пусть [М/М] = CL/A<] ¦ Тогда [М/М] [М/М]*= {/ (г) + О (г2Л1+1)} {[/ (г)]* + О (г2Л1+1)} = 1+0 (z2jM+I) и, следовательно, Левая часть равенства представляет собой полином степени не выше 2М; следовательно, этот полином равен нулю, и мы полу- получаем Л^/л" (г) [А1М'М1 (г)}*= {В^/лп (г)}*§[М1Щ (г). Следовательно, [М/М] [М/М]* = 1. Доказанная теорема означает, что аппроксима- аппроксимации Паде сохраняют унитарность. Это важно в теории S-матриц (см. т. 2, гл. 4), поскольку 5-матрицы унитарны. В качестве предостережения отметим, что комплексное сопряжение может нарушить аналитичность2), поэтому правильнее рассматривать функцию g (г) == [f (г)]* = 1 // (г), чем обсуждать аналитическую структуру [/(г)]*. Теоремы инвариантности этого параграфа во многом обуслов- обусловливают ценность аппроксимаций Паде как практического метода приближения функций. Наличие столь полезных свойств является также очевидным критерием достоинств того или иного обобще- обобщения аппроксимаций Паде. Упражнение 1. Пусть /(г) удовлетворяет условиям георемы 1.5.5. Положим / (г)= 1 -f it (г), так что ^(г) удовлетворяет усло- условию Показать, что при L ^ М аппроксимации Паде [L/M]t сохраняют указанное соотношение [Masson, 1967 а, Ь]. Упражнение 2. Пусть «^; c+df(z) ¦ Предполагая, что L^M, [L/M]f существует и с -\-df @)^=0, доказать, что9) [L/M]g ==: 1) Знак ( )* означает в этой книге комплексное сопряжение; под z в фор- формулировке и доказательстве этой леммы следует понимать вещественную пере- переменную.— Прим. перев. г) На вещественной оси сопряжение не нарушает аналитичность.— Прим. перев. 8) D. BesiSj частное сообщение.
1.6. Биградиенты и формула Адамара 47 § 1.6. Биградиенты и формула Адамара До сих пор мы рассматривали проблему нахождения рацио- рациональной функции, удовлетворяющей условию Lp[L t=o F.1) где с{—данные коэффициенты и с„, ciy ..., cL+M—коэффициенты, необходимые для решения задачи при данных L и М. Естествен- Естественным обобщением этой проблемы является задача нахождения поли- полиномов piL/Ml (г) и Qwm](z) степеней L и М соответственно, удовлетворяющих условию * plLIMh*) F.2) 2 (=0 Здесь gf, dt—данные коэффициенты, из которых необходимо знать §о> gtf •••> ei+м и do> di> •••> dL+M- Если d(z) — полином сте- степени т и m48 Гл. 1. Введение и определения QIL/M) (г) = d, О d0 ... о ... о О о .. о ¦••go dL-i ... d0 Si gM Sm gL • F-4) О О ... О zM ... z 1 Мы можем проверить, что решения F.3), F.4) действительно удовлетворяют соотношению F.2), рассмотрев следующее выра- выражение: О dn ... О ... О ... dn О О ... О go Si gM-л lL+M +Л1-1 d(z) zd(z) ... zLd(z) zMg(z) (г) g (г) . F.5) Вычитая из последней строки первую, затем вторую, умноженную на г, третью, умноженную на га, и т. д., получим d0 0 ... О 0 ... g0 ?(г)= 2 'х что доказывает F.2). 0 g0 dM gL 4-L gM Sk
1.6. Биградиенты и формула Адамара 49 Определители. вида F.3), F.4) называют полиномиальными биградиентами. Точнее, биградиент Ль M(dl, g{)—это определитель порядка L+/W, образованный из коэффициентов dt в первых L столбцах и (симметричным образом) из коэффициентов g, в послед- последних/И столбцах следующим образом: gt) = О О О О о о 0 go 8 м-2 dL dL_1 ... dj 8 м-1 8m . F.6) •'• dM gL ... gL+M-2 Мы используем биградиенты для доказательства теоремы Ада- Адамара. Начнем с рассмотрения функции e (z) ~ th\ ~ 2i* etz'- (=0 Из F.2) вытекает, что e(z)g(z) = f (г), и, следовательно, i 2j eydf_y = 6fi0, t = 0, 1, 2, ..., 2 /=о 0, 1, 2, Эти равенства удобно записать в матричной форме; например, для матриц третьего порядка имеем 'е0 0 0\ /d0 0 0\ /10 в, е„ 0 )( d, d0 0 =( 0 1 0 V / V d, do ° F.7) F.8)
50 Гл. 1. Введение и определения Рассмотрим теперь следующую о eL+M-l ej для которой det? = e^+M. Умножая матрицу Е слева на матрицу биградиента и используя соотношения вида F.7), F.8) соответ- соответствующих порядков, находим, что M (d{, g{) = 1 О О 1 О О О О О О с0 О О О О СЛ!-1 См О О О с, Отсюда вытекает, что &L,M(d{, gt) = db+MC (L/M), где C(L/M) определяется формулой D.8). Этот результат позволяет нам дока- доказать теорему Адама ра. Теорема 1.6.1. Пусть /(г) = 2^«сгг' и C(L/M)—определитель Ганкеля D.8). Пусть {/(г)}~1 = 2^ос«г^ « С A/т)—соответствую- A/т)—соответствующий определитель Ганкеля. Тогда С'{МЩ = (— lyL+M)(L+M-i)/aC (L/M) CoiL+M'. F.9) Доказательство. Для биградиента F.6), соответствующего F.1), F.2), мы установили равенство
1.6. Биградиенты и формула Адамара 51 Если бы мы рассматривали обратное отношение 00 s w , = 0 то для соответствующего биградиента получили бы равенство Дм. ;.fei. d,) На самом деле, эти два биградиента отличаются только порядком столбцов. Чтобы преобразовать один биградиент в другой, тре- требуется y (L -f- M) (L + М—1) перестановок; отсюда вытекает, что С (M/L) = (- lYL + w * + «-»'* ( *a)L+MC(L/M). \ go / Поскольку co = go/do, то формула F.9) доказана. Благодаря алгеб- алгебраической природе этой формулы, она остается справедливой во всех случаях, когда входящие в нее выражения имеют смысл (это имеет место, если с„, g0 и d0 отличны от нуля). Теорема Труди является, вероятно, наиболее известным резуль- результатом, относящимся непосредственно к биградиентам; она пока- показывает, какова природа вырождения биградиентов. Теорема 1.6.2 [Trudi, 1862]. Пусть g(z)— полином степени I и d(z)— полином степени т. Пусть биградиент АЛ m(d{, gt) опре- определен по формуле F.6). Если А1. « №• St) = Д l-i, m-x (di> Si) = • • • = Д|_у+1, ¦-/+! (dt, gt) == О и Д,_/, m-/(dt, g{)?=0, то наибольшим общим делителем d(z) и g(z) является многочлен степени /. Доказательство. Если ^lГлава 2 ПРЯМЫЕ ПРИЛОЖЕНИЯ § 2.1. Прямой метод нахождения аппроксимаций Паде В этом параграфе мы рассмотрим метод нахождения знамена- знаменателей аппроксимаций Паде, основанный непосредственно на детер- мннантной формуле A.1.8) для QlL/M~i (г) при L^M—1. Мы смо- сможем применить его для класса функций вида ,/ч(а, 1, у; г). A.1a) Как следствие получаются результаты для функций вида f(z)=/t(i. т; *) (lib) и /(г)-Л(«. 1; *)• A.1с) В § 1.2 мы показали, что прямым методом можно найти и знаме- знаменатель, и числитель аппроксимаций Паде экспоненциальной функ- функции; однако существование простой явной формулы для числителя характерно только для этого случая. В любом случае если знаме- знаменатель аппроксимаций Паде найден, то коэффициенты числителя находятся прямо из формулы A.1.9); эквивалентный способ состоит в нахождении первых L членов разложения функции fiiL/M5(z)/(z), которые составляют многочлен А^Ь/МЦг). Мы, конечно, не подразумеваем, что вычисления должны быть всегда основаны на детерминантных формулах, и в1 § 2.4 обсудим этот вопрос подробнее. Мы также не утверждаем, что метод этой главы является наилучшим всегда, когда коэффициенты Cj заданы алгебраическими формулами. Может оказаться, что проще исполь- использовать Q.D.-алгоритм, хотя он приводит к представлению аппрок- аппроксимаций Паде в виде непрерывной дроби. Явные формулы для числителя и знаменателя аппроксимаций Паде можно было бы находить и на основе рекуррентных соотношений D.2.7). Коэффициенты гипергеометрического ряда A.1а) задаются фор- формулами г - («)/ _(«+'-1)'(Т-1)'_Г(а+0Г(у) .. 1 (Т)/ (а-1)!(т + <-1I Г(о)Г(т+0" У >
2.1. Прямой метод нахождения аппроксимаций Паде 53 Подставляя эти выражения в A.4.8) при LIJsM — 1, получим («к С (L/M) = (°0г (y)L '" (y)L + M~i Для упрощения записи введем величину A.3) — произведение элементов первого столбца. Производя в каждой строке A.3) деление на ее первый элемент, получим • A-4) 1 y+L Последовательное вычитание строк и разложение по первому столбцу приводят определитель к виду П (y+L- X —M+2 —M-j-3 V-fL— 1 ¦ A-5) •** (Т+*.+ 1)Л!-. Повторяя эту редукцию последовательно М раз, получим м-\ Р П Ка—V—1+\)м-'(М—1I} П П (y+L-i+2k-2)t A.6)
54 Гл. 2. Прямые приложения Чтобы вычислить коэффициент многочлена QlLMl{z) при г}, рас- рассмотрим следующий определитель, в котором столбец выделенный пунктиром, опускается: (a)t+i (Vh-M + 1 I (V)l-/+i a-fL — М-j- 1 y + L—M-f 1 ' - ' a+Z. —УИ+2 y + L—M-j-2 ' " " 1 v+л Производя M—/ таких же редукций, как при выводе A.5) из A.4) (разложение по левому верхнему элементу после вычитания строк), н вводя обозначение ТТ {(а у (_)- 1)ЛГ—? (Д} i_[_ijn A,7) Pj~ P м-j м-i (M-f)\ JJ Д k k -i+2k-2) для произведения общих множителей, мы получаем a+L l •" (y+L-M — j), Продолжая преобразования с помощью тех же редукций, получим м И {(« + L-i+D(/-1)'} П (a-V-'+DM-' i= i=м-;+1 (=1 к= I i = fc A.8)
2.1. Прямой метод нахождения аппроксимаций Паде 55 Теперь из A.6), A.7), A.8), производя возможные сокращения, находим o\Lim C(LM\ Ml (а + Ц ... (« + /--/Ч-0 Таким образом, при L^ M — 1 справедливо равенство (г) - С (L/M) х {1 + ((,~ ^I^f,, г + -r (\—yZ-~i—M)B—y — L — M)-2\ "~ " ~r--'f — = C(L/M)/I(-M, -a—L, l-y-L-M; z). A.9) Этим завершен вывод формулы для знаменателя аппроксимаций Паде ряда A.1а). Следствие этого результата, относящееся к ряду A.1b) полу- получается с помощью формулы Л (Р. Ъ *)= Ига /i(a; p, Y; |Л. С учетом этого для знаменателя Паде функции /(г) = ЛA. y; г) имеем представление В№/«](г)= lira 2fJ — M, —a—L, l—y — L— а->- оо V = 1FI(— M, l—y—L — M, —г), L>/W-l. A.10) Значению у=1 здесь соответствует случай экспоненциальной функции, рассмотренный в § 1.2. Аналогичным образом знаменатель Паде асимптотического ряда 2F0(a, 1; г) получается из A.9) заменой г на уг и перехо- переходом к пределу при у —* оо: fi^/лл (г)«/.(—М, a_L; г), L>M—1. Существует другой класс формальных степенных рядов, для которых можно указать явный вид знаменателей аппроксимаций Паде; это ряды с коэффициентами вида ct=fl A~qjll> l = 0' *• 2 0-И) Соответствующий ряд имеет вид Метод вычисления аналогичен тому, который использован выше для случая гипергеометрических рядов. Например, для C(L/M)
56 Гл. 2. Прямые приложения имеем /=0 \B— , L-M + l + l, L-Ai + l + m), где М-! II A —q* 2M-2 п 0 iS — 2.2. Распознавание особенностей 57 § 2.2. Распознавание особенностей с помощью аппроксимаций Паде Согласно теории аналитического продолжения функций комп- комплексного переменного все свойства функции, аналитической в некоторой точке, определяются ее степенным разложением в этой гочке. Хотя в принципе аналитическое продолжение функции может быть получено путем ее переразложений в ряды с цент- центрами в других точках, центральной практической задачей явля- является изучение свойств функции непосредственно по заданным коэффициентам ряда. Аппроксимации Паде могут очень эффек- эффективно применяться для вычисления значений функций, особенно если имеется качественная информация о свойствах функции. С другой стороны, они позволяют получать важную информацию о характере и расположении особенностей функции непосредственно по коэффициентам степенного разложения. Прежде чем подробно рассматривать эти применения аппроксимаций Паде, остановимся коротко на характеристике особенностей аналитических функций. Предположим сначала, что функция /(г) аналитична и одно- однозначна при \г—zo\ 1 говорят, что / (г) имеет кратный полюс. Если для каждого т существует п>т, такое, что Ьпф0, то г0—существенная особенность f(z). Если г0 не является существенной особенностью, го разложе- разложение B.1) дает основания предполагать, что аппроксимации Паде могут приблизить функцию [(г). Существенная особенность, если расстояние до нее не слишком мало, приближается конечной
58 Гл. 2. Прямые приложения lm z \z-zo\=R -Re z Рис. 1. Одно из колец, в котором аналитична функция f(z). суммой кратных полюсов. Это происходит потому, что согласно B.2) коэффициенты Ьп убывают очень быстро: | Ъп | < г" при любом г > 0 и достаточно больших п. Пример. ir ) • B-3) f(z) имеет существенную особенность в точке z — —1, однако коэффициенты Ь„= 1/п\ убывают очень быстро. Этот качественный факт может быть основой строгого рассуждения, как при дока- доказательстве теоремы 6.5.4. Далее, аналитическая функция /(г) может иметь точки вет- ветвления. Если при аналитическом продолжении /(г) путем пере- переразложений в ряды с центрами в различных точках эта функция остается однозначной, то точек ветвления нет. Однако если су- существует точка г0, такая, что аналитическое продолжение /(г) по окружностям произвольно малого радиуса вокруг z0 в двух различных направлениях (по часовой стрелке и против) приво- приводит к различным значениям в одной и той же точке, то функ- функция /(г) не является однозначной и г0—точка ветвления. Суще- Существуют различные способы получить соответствующую / (г) одно- однозначную функцию. Один из них —построение звезды Миттаг-Леф- флера путем проведения прямолипейггых резервов, соединяющих все точки ветвления с бесконечно удаленной точкой вдоль пря-
2.2. Распознавание особенностей 59 Imz Рис. 2. Точка ветвления г0, соответствующий разрез и два пути аналитическо- аналитического продолжения. мых, исходящих из начала координат. Иногда однозначную функцию можно получить, проводя разрезы, соединяющие две или более точек ветвления. Например, f(z) = ]/~(z—a)(z—^опре- ]/~(z—a)(z—^определяется как однозначная аналитическая функция в плоскости с разрезом, соединяющим точки а и Ь. Линия разреза будет ли- линией разрыва этой функции. Наконец, существуют естественные границы аналитичности функций. Например, функция 00 /(г) = 1+2 + га-т-24 + 2»+ ... = 2 гB"' B-4) имеет в качестве естественной границы окружность | z | = 1. Чтобы доказать это утверждение, отметим, что ряд B.4) сходится в круге |г|< 1 и определяет функцию /(г), аналитическую в этом круге. Пусть р и q—произвольные целые числа и тогда х) q— 1 = 2 и РЯД расходится. Поскольку множество точек {гр< ц) всюду плотно на окружности, то аналитическое продолжение / в область |г|>1 вдоль радиу- радиусов невозможно. Отметим, что иногда аналитическое продолже- продолжение возможно в каком-либо обобщенном смысле и иногда ап- всех Точнее было бы использовать тот факт, что lim | / (rz) | = -j- oo при г = гр<д.—Прим. перев.
60 Гл. 2. Прямые приложения Jfaz Рис. 3. Отрезок Р и контур Г в комплексной плоскости. проксимации Паде сходятся к продолженной таким образом функции; ссылки на приложения аппроксимаций Паде к вопро- вопросам квазианалитичности можно найти в библиографии, приведен- приведенной в конце книги. Для того чтобы правильно интерпретировать результаты при- применения аппроксимаций Паде для исследования особенностей функций, рассмотрим, каким образом поведение аппроксимаций Паде отражает наличие у функции особенностей рассмотренных выше типов. Если f(z) имеет простой полюс, то вблизи этого полюса ожидается появление простого нуля знаменателя аппрок- аппроксимаций Паде. При наличии у /(г) кратного полюса ожидается появление рядом группы нулей знаменателя Паде; с ростом по- порядка аппроксимации эти нули стягиваются к рассматриваемому полюсу /(г). Переходя к рассмотрению существенно особых то- точек, следует вспомнить теорему Вейерштрасса: пусть /(г) имеет существенную особенность в точке г = г0; тогда для любых р > 0, е > 0 и комплексного v существует точка г, такая, что \г—го|<ри |/(г) —и|<е [Titchmarsh, 1939, р. 51]. Другими словами, теорема утверждает, что /(г) стремится к любому на- наперед заданному пределу v, когда zr-*-z0 по выбранной подхо- подходящим образом последовательности точек. Таким образом, следует ожидать, что к существенно особой точке функции накаплива- накапливается неограниченное количество нулей и полюсов аппроксимаций Паде. Конечно, при низком порядке аппроксимации существен- существенная особенность и полюс большой кратности дают похожую картину. При наличии ветвлений ожидается появление моделирующих разрезы линий, образованных из чередующихся каким-либо об- образом нулей и полюсов аппроксимаций Паде. Поясним это вы-
2.2. Распознавание особенностей 61 оказывание следующим примером. Пусть &?. B.5, где Р—отрезок, соединяющий точки а и Ъ комплексной пло- плоскости, Г — контур, охватывающий Р, так что второе из равенств B.5) является следствием теоремы Коши. Функция /(г) комп- комплексно дифференцируема и, следовательно, аналитична в допол- дополнении к Р; в этой области функцию можно приблизить суммами Римана которые имеют ряд простых полюсов с вычетами р(«;Nи(. Сле- Следует ожидать, что эта структура отразится в поведении аппрок- аппроксимаций Паде функции /. Пример. ~г л J (z-x) y= Функция f (г) однозначно определена в плоскости с разрезом —оо<г^—1; полюсы аппроксимаций Паде расположены на этом разрезе, как показано на рис. 4. Поскольку разрезы, определяющие область однозначности аналитической функции, можно выбирать различными способами (построение звезды Миттаг-Леффлера—только одна из возможно- возможностей), то заманчиво предположить, что предельное распределе- распределение нулей и полюсов подходящим образом выбранной последова- последовательности аппроксимаций Паде образует некоторую естественную структуру разрезов. Наше предположение состоит в том, что разрезы, порождаемые аппроксимациями Паде, после инверсии z —<- 1/г имеют минимальную емкость; этот вопрос мы коротко обсудим в § 6.7. Мы описали таким образом, какого поведения мы ожидаем от аппроксимаций Паде аналитических функций с различными особенностями. В идеальных ситуациях все происходит именно так; практически, ожидаем мы того или нет, во всех случаях, за исключением простейших, встречаются определенного рода дефекты. Пару, составленную из расположенных рядом полюса и нуля, которые являются случайными, не обусловленными при- природой функции, будем называть дефектом. Качественную иллю- иллюстрацию такого строения аппроксимаций Паде может дать сле- следующий пример. Пусть функция f(z) аналитична в окрестности
62 Гл. 2. Прямые приложения Рис. 4. Аппроксимация Паде [2/2] для функции / (г) = A— г)~1/2; показаны полюсы в точках г , =— 2 ± 2/^ 5, лежащих на разрезе —оо < х<—1. точки г = а, положим Если |е| мало по сравнению с |г—ос|, то /(z)»g(z); заметно отличаются эти функции только вблизи точки г = а. Функция g(z) имеет полюс в точке г = а и рядом—в точке г = Р = а + -f- е// (а) + О (г2) она имеет нуль. Таким образом, прибавление к функции /(г) полюса с малым вычетом приводит к образованию дефекта, и такая особенность строения весьма характерна для аппроксимаций Паде. Мы считаем, что природе дефекта более всего соответствует тот взгляд, по которому пара близлежащих нулей числителя и знаменателя аппроксимаций Паде «приблизи- «приблизительно сокращается». Дефекты легко распознаются благодаря своей случайной при-
2.2. Распознавание особенностей 63 роде: в естественных последовательностях аппроксимаций Паде дефектный полюс, возникший около некоторой точки, имеет тен- тенденцию исчезать при переходе к следующей аппроксимации. Это резко отличается от регулярного поведения тех полюсов аппрок- аппроксимаций Паде, которые обусловлены особенностями функции. К этому вопросу мы вернемся в следующем параграфе; в § 6.5 мы докажем, что для мероморфной функции вычеты дефектных по- полюсов стремятся к нулю с ростом порядка аппроксимации. От- Отметим, что имеются определенные проблемы, связанные с числен- численным распознаванием дефектов; по этому поводу см. работу [Abd-Elalletal., 1970]. Следующий пример показывает, почему, вообще говоря, не следует принимать во внимание информацию, полученную с по- помощью тех аппроксимаций Паде, которые имеют дефект, близкий к началу координат. Аппроксимация Паде [1/1] функции l + za не существует (см. § 1.4); рассмотрим функцию [Zinn-Justin, 1970] для которой [1/1]-аппроксимация Паде существует и равна эта функция имеет полюс в точке z — e с вычетом —е3. Если е мало, то полюс близок к началу координат, а вычет мал. Мы понимаем такую ситуацию, как близость к вырождению, и счи- считаем полученную от таких аппроксимаций Паде информацию не- ненадежной. Итак, пусть функция задана (формальным) степенным рядом. Ее изучение на основе данных коэффициентов ряда начинается с построения некоторого множества аппроксимаций Паде, по меньшей мере тех, которые лежат в достаточно широкой полосе около главной диагонали. Отметим, что с вычислением коэффи- коэффициентов ряда обычно связано больше трудностей, чем с построе- построением по этому ряду аппроксимаций Паде, поэтому вычисление всех разумных аппроксимаций Паде обходится сравнительно не- недорого. Следующий шаг — исследование распределения нулей и полюсов аппроксимаций Паде: повторяются они регулярно или образуют дефекты. Это позволяет в общих чертах определить ха- характер и расположение особенностей функции. Иногда на этой стадии можно установить, что функция имеет в одной из полу- полуплоскостей асимптотическое поведение вида zJ« для некоторого Jo по признаку стабильности аппроксимаций вида [М + JQ/M] или по полюсам, уходящим в бесконечность при L—М < J„. Когда общая природа функции установлена в процессе этого
64 Гл. 2. Прямые приложения анализа или на основе другой качественной информации (см. ч. 2, § 1.3), можно перейти к более топкому анализу. Наличие и характеристики полюсов обычно достаточно ясны; их влияние на функцию зависит от вычетов, кратности и близости к началу координат. Следующий тип особенностей, который полезно про- проанализировать,—точки ветвления и соответствующие разрезы. Важной стратегией при таком анализе являются манипуляции с рядом для приведения его к форме, которая по возможности точнее изображается аппроксимациями Паде. Для примера пред- предположим, что функция / имеет особенность вида f(z) = A(z)(l-lizr'+B(z). B.6) Предполагается, что функции Л (г) и В (г) аналитичны в точке z^ii'1 и в целом имеют достаточно простую структуру. Следую- Следующие ниже методы были использованы в вычислениях и дали хо- хорошие результаты [Baker, 1961; Baker et a!, 1967: Hunter and Baker, 1973; Baker, 1977]. (i) Вычисление аппроксимаций Паде для функции F, (z) = ± bg / (*) аг jp^, г ~ fi B.7) позволяет определить положение полюса г = р,~% и вычету. Оценки значений, которые дает этот метод, называют независи- независимыми, поскольку используются только коэффициенты разложе- разложения функции F, (эти коэффициенты вычисляются непосредственно по коэффициентам разложения f) и не используются никакие значения параметров. Аппроксимации, которые получаются при этом для функции f, не являются обязательно рациональными; их принято называть аппроксимациями Паде D-log (см. § 5.3). (ii) Вычисление аппроксимаций Паде для функции Fs(z) = (уг*-г)± log /(z)» v B-8) в точке г = |л~1 при найденном приближенно значении ц дает зависимую оценку величины у. (iii) Вычисление аппроксимаций Паде для функции B.9) при известном у дает оценки величин Л(ц-1) и jit1 через вычет и полюс аппроксимаций Паде.
2.2. Распознавание особенностей 65 (iv) Вычисление аппроксимаций Паде для функции F, (г) = A -цгУ f (z) « Л (ц) B.10) в точке г = ^~2 при известных р,, у дает зависимую оценку ве- величины А ((л). (v) Вычисление аппроксимаций Паде для функции B.11) в точке г = р,~1 при приближенном значении ц'1 дает зависимую оценку у; на практике точность этой оценки относительно слабо зависит от точности исходной оценки величины (л, [Baker et al., 1967]. (vi) В тех случаях, когда имеются два или более степенных ряда с общей алгебраической особенностью, близкой к началу координат, можно получить независимую оценку разности пока- показателей следующим методом (метод «ренормализации критических точек»). Пусть 2 i=0 и функции А (г), В (г), С (z), D(z) аналитичны в точке г = [ Положим -z'«(l— z)-y+e~\ г»1. B.13) i Теперь вычисление аппроксимаций Паде для функции F,(z)=*(l—z)-jLloghiz)~y — e+l B.14) в точке г = 1 дает независимую оценку величины е—у. Можно использовать этот метод для исследования одного ряда / (г), по- полагая1) в B.12) g(z) = f(z)p, где р^2 — целое; тогда г — ур и 1)Д. Бесис (D. Besis), частное сообщение.
66 Гл. 2. Прямые приложения Fn (г) ~ 1 + уA—р). Похожая схема была предложена в работе [Sheludyak and Rabinovich, 1979]. (vii) Метод Понтера — Бейкера [Hunter and Baker, 1973] по- позволяет иногда обнаруживать слившиеся субдоминантные особен- особенности. Эта процедура является тонкой, и иногда влияние других сильных особенностей препятствует ее успешному применению. Предположим, что вместо B.6) мы имеем оо т Hz) = 2 сп2»«2 i4/(l-nz)-v, B.15) при г ~ и и у, > у2 > ... > ут. Тогда / (г) имеет т слившихся особенностей в точке г = \х~х. Произведем замену переменной г = ц-1A-е-?), B.16) так что ga) = f(z{Z))= 2 ?В5Я«2 А^А. B.17) 1=0 ;=1 Рассмотрим следующее преобразование функции g(i)s -2.3. Предполагаемые ошибки 67 § 2.3. Предполагаемые ошибки В любой аппроксимационной схеме необходимо иметь воз- возможность оценить погрешность вычислений. При использовании аппроксимаций Паде имеются три основных источника ошибок: (i) коэффициенты с,- известны лишь приближенно; (и) точность теряется при вычислении коэффициентов аппрок- аппроксимаций Паде и их значений; (iii) сами аппроксимации Паде представляют функцию лишь приближенно, с чем связана основная погрешность аппроксимации. В связи с (i) мало что можно сделать. Ограничимся гем за- замечанием, что точность вычисления коэффициентов с{ существен- существенна, поскольку аппроксимации Паде сильно реагируют на их малые изменения- Вариации коэффициентов в пределах погрешностей их значений могут дать быструю и очень полезную информацию о точности, с которой найдены аппроксимации Паде. Потеря точности типа (ii) в практических вычислениях яв- является непростительной В режиме двойной точности современные ЭВМ позволяют вести вычисления с 20 или 30 десятичными зна- знаками, и при необходимости все эти знаки должны быть исполь- использованы. Конечно, если задача недостаточно корректно поставле- поставлена, точность на выходе меньше, чем на входе, даже если исполь- использовать точную арифметику, но это другой вопрос. Часто можно наблюдать, что вычислители, не имеющие опыта применения ап- аппроксимаций Паде, используя высокий, часто очень высокий по- порядок аппроксимаций, уделяют недостаточно внимания надежно- надежности вычислений Грубое практическое правило таково: каждый надежный десятичный знак в ответе требует одного лишнего зна- знака в промежуточных вычислениях. Обратимся теперь к проблеме оценки математической точности аппроксимаций. Практически здесь всегда приходится основы- основываться на тех или иных гипотезах, так что говорить приходится о предполагаемых ошибках. Оценка этих ошибок является на- наукой в такой же мере как и искусством. В предыдущем параграфе мы столкнулись с дефектами в ап- аппроксимациях Паде; дефектом мы назвали комбинацию из полю- полюса и близко расположенного нуля. Дефекты становятся сущест- существенным явлением, когда попадают в рассматриваемую область. В качестве такой области чаще всего удобно выбирать макси- максимальный круг, содержащий начало координат и все особенности функции, которые представляют интерес; другие неполярные осо- особенности удобно оставить за пределами рассматриваемого круга. Тогда дефектом можно считать полюс в этой области, вычет ко- которого мал: скажем 0.3% от минимального ожидаемого значения
68 Гл. 2. Прямые приложения вычета функции. Дефектные аппроксимации Паде мы склонны исключать из рассмотрения. Таким образом, мы ожидаем полу- получить последовательность аппроксимаций Паде, которая равномер- равномерно ограничена в некоторой области, не содержащей особенностей функции. Если удается получить последовательность, содержа- содержащую достаточное количество аппроксимаций, то теорема из § 6.4 гарантирует сходимость. В связи с вопросом о наблюдаемых ошибках следует отметить другой важный практический момент. Наличие дефектов часто сопровождается явлением „почти совпа- совпадения" нескольких последовательных аппроксимаций Паде (с Д/„= 1 или АМ—1 или AZ. = ДМ = 1); если дефект не был прямо или косвенно обнаружен, это может привести к заблуждению относи- относительно скорости сходимости. В самом деле, появление дефекта можно понимать, как близость к вырождению, когда определи- определитель C(L/M) отличен от нуля, но очень мал, другими словами, как близость к появлению блока в таблице Паде. При наличии блока несколько последовательных аппроксимаций Паде совпада- совпадают; при близости к вырождению возможно появление нескольких последовательных аппроксимаций Паде, которые очень мало от- отличаются друг от друга. Все это показывает, как важно про- проанализировать таблицу Паде в целом, чтобы определить, какие полюсы аппроксимаций Паде обусловлены особенностями функ- функции, а какие являются дефектами, указывающими на ненадеж- ненадежность рассматриваемой аппроксимации. В этой связи ясно, что при изолированном вычислении значений аппроксимаций Паде в одной конкретной точке (в том числе с помощью е-алгорит- ма) теряется важная информация, которую доставляют структу- структура аппроксимаций Паде и характер их сходимости во всей г-плос- кости. Рассмотрим теперь функцию, которая имеет доминантную осо- особенность вида А{1-\и)-У C.1) (см. B.6)). Предположим, что с помощью методов, например, приведенных в § 2.2, мы нашли следующие приближенные зна- значения параметров: А'A—ц'г)-У. . C.2) Три параметра A, \i, у определяются, вообще говоря, тремя уравнениями из числа тех, что содержатся в условиях точности порядка аппроксимации. Пусть соответствующие равенства спра- справедливы для коэффициентов при степенях zJ, zJ+1, zJ+2; тогда мы имеем (])(]')^ = y, J+\, J + 2, C.3)
2.3. Предполагаемые ошибки 69 где т)у—малые относительные ошибки. Очевидно, если т)у=0, то рассматриваемые значения параметров совпадают, так что т)у должны рассматриваться как источник ошибок в схеме аппрокси- аппроксимации. Мы рассматриваем относительные погрешности, посколь- поскольку значение ц определяет масштаб в г-плоскости, и если ц зна- значительно отличается от единицы, то величины коэффициентов быстро меняются вместе с /. При естественных предположениях об аппроксимации мы можем выделить линейную часть погреш- погрешностей А' = А + 8А, y' = y+Sv, ц'=11+8ц. C.4) Из C.3) логарифмическим дифференцированием с точностью до членов второго порядка получаем ( Эти три равенства можно переписать в виде ^ , C.6a) C.6b) ЬА т Ьи, I \* 1 А с /о с \ ir = 4j-J4r-[l* -Ttt 6V. C.6c) ЬА т Ьи, ( V Из C.6а) при условии, что в правой части нет каких-либо не- необычных сокращений, мы видим, что бц/р,—величина порядка Jr\/, из C.6b) следует, что бу—величина порядка /ф/ц; нако- наконец, C.6с) показывает, что ЬА/А порядка J2\nJr\j. Таким образом, мы заключаем, что погрешности оценок параметров находятся между собой в следующих отношениях: Oil с О л л т т 1 т /о т\ -?-i6y:-T=\:J:JlnJ, C.7) где /—порядок активных членов ряда. Определение абсолютных значений ошибок сложнее. Остано- Остановимся подробнее на примере, когда эта процедура применяется вместе с методами предыдущего параграфа, такими как (i) или (iv). В этих случаях параметр ц является нулем обратной функции, так что бц,/^ пропорционально ошибке в оценке значений функции
70 Гл. 2. Прямые приложения 1/Fj (г). Таким образом, мы можем сопоставить ошибку р( ошибкам в таблице значений, которые па практике относительно несложно вычислить. Рассмотрим сначала структуру разностей соседних аппрокси- аппроксимаций Паде. Согласно (**)-тождеству C.4.5), имеем где детерминанты определены формулой A.4.8). 11оскольку функция [L/M] осуществляет аппроксимацию до порядка zL+M, то правая часть C.8) дает ошибку в коэффициенте [L—1/М] прн zL+M. Сле- Следующий шаг состоит в соотнесении этой ошибки с величиной т). Здесь принимается гипотеза об отсутствии случайных сокраще- сокращений, так что разумная оценка величины ц найдена. Поскольку B^/MJ @) = 1, го можно оценить коэффициент при zL+M, до известной степени принимая во внимание члены более высокого порядка путем составления таблицы значений левой части C.8) в области 0<2^р,~1 и сравнения ее со значениями монома zL+M; коэффициент оценивается с помощью той точки рассматриваемой области, которая дает для него максимальное значение. Далее, при исследовании по методу (i), § 2.2 (Fx) удобна дру- другая форма записи соотношений C.6): Здесь 8у = 0, поскольку y = ?' = 1- Тогда бц/р,—величина поряд ка т], и величина 8А/А, которая, согласно B.7), играет роль бу, имеет порядок Уб^х/ц,, что согласуется с C.7). Из этого анализа с учетом C.8) получаем "f* J|~ C(L-t/M) Мы использовали также, что( i"'- Упражнение. Почему вариации диагональных аппроксимаций Паде при малых вариациях б0 дают обычно плохую оценку точ- точности этих аппроксимаций?
2.4. Численные методы нахождения аппроксимаций Паде 71 § 2.4. Численные методы нахождения аппроксимаций Паде Вероятно, одной из первых проблем, с которой сталкивается каждый исследователь, интересующийся аппроксимациями Паде, оказывается вычисление значений диагональных аппроксимаций Паде, соответствующих заданному ряду. Точные вычисления мож- можно производить вручную лишь для аппроксимаций самого малого порядка, поэтому с самого начала возникает потребность в хо- хорошем машинном алгоритме. В этом параграфе мы обсудим из- известные методы и те общие требования, которым должен удовлет- удовлетворять «хороший метод». Начнем с рассмотрения прямого метода (см. § 2.1) Централь- Центральным вопросом здесь является численное решение системы линей- линейных уравнений CL-M + 2 'ы ¦-Z.+ 1 с1+г D.1) где действительные или комплексные коэффициенты с{, i — 0, 1, 2, . . ., L-\-M (с, = 0 при i < 0) заданы с определенной точностью. Простейшим подходом, который может быть рекомендован для решения этой задачи, является метод исключения Гаусса с полной перестановкой; в приложении к книге приведена под- подпрограмма на Фортране для вычисления этим способом коэффи- коэффициентов Ь{ и значений аппроксимаций Паде [L/M] в вещественных точках. Программа PADE(**) написана для вещественных коэф- коэффициентов с{ с одинарной точностью и может быть легко при- приспособлена к другим входным характеристикам. Итак, при прямом методе вычисления аппроксимаций Паде основная работа заключается в вычислении коэффициентов Ьх, Ьг, ..., Ьм из системы D.1). Является ли метод Гаусса с полной перестановкой наилучшим методом решения этой задачи? При ответе на этот вопрос важно учесть возможность вырождения системы в случае С (L/M) = 0. Предположим, что коэффициенты с„, с,, ..., cL + M не являются целыми или рациональными с точ- точными бинарными представлениями (когда применимы символиче- символические методы), так что вычисления являются заведомо приближен- приближенными. Тогда программа по методу Гаусса не сможет, вероятно, обнаружить, что С(L/M) = 0, если это имеет место, из-за ошибок округления; всякий результат, который мы при этом получим,
72 Гл. 2. Прямые приложения будет обусловлен ошибками округления и скорее всего будет ошибочным. Подчеркнем, что это вполне реальная ситуация: на- например, если f(z) = ~E(azy—геометрический ряд, то все аппрок- аппроксимации Паде [L/2] вырождены. Наш численный алгоритм дол- должен распознавать такие ситуации, в которых, вполне возможно, достаточно применения аппроксимаций малого порядка. Короче говоря, если одно из требований к методу состоит в высокой точности решения системы D.1), то еще важнее —в большей сте- степени, чем это может показаться с первого взгляда,— чтобы метод обнаруживал вырожденность системы. Метод Гаусса удовлетво- удовлетворяет первому из приведенных требований при использовании двойной точности (как в программе, приведенной в дополнении к ч. 1) или, если необходимо, еще более высокой, но такой лобо- лобовой подход не является наилучшим. Мы хотим устанавливать не только точное соответствие ис- исходных коэффициентов вырожденной задаче, а должны также знать, не является ли рассматриваемая задача плохо поставлен- поставленной; это имеет место в случае, когда задача становится вырож- вырожденной при вариациях исходных данных в пределах точности их значений. В почти вырожденных случаях особенно полезен метод, состоящий из выравнивания, частичной перестановки с образо- образованием LU-разложения и последовательности итерационных уточ- уточнений решения. Мы отсылаем к Уилкинсону [Wilkinson, 1963, 1965] за подробностями, связанными с этим методом решения об- общих линейных систем; там же можно найти детали, касающиеся анализа ошибок. Главной частью этого изощренного метода яв- является /-{/-разложение матрицы коэффициентов D.1), которое используется для построения последовательности векторов, ап- аппроксимирующих решение. Итерационный процесс сходится гео- геометрически и для стабильных хорошо обусловленных задач и для многих плохо обусловленных задач, которые так часто встреча- встречаются при вычислении аппроксимаций Паде. Если итерации схо- сходятся плохо, то почти определенно можно заключить, что реше- решение обусловлено ошибками округления и соответствует вырож- вырожденной аппроксимации. Численные характеристики процесса позволяют лучше отличить плохо обусловленную, но невырож- невырожденную задачу от вырожденной. Рассматриваемый метод реали- реализован в библиотечном алгоритме N. A. G. (Mark 6). Какой бы метод решения системы D.1) ни был избран, пол- полный алгоритм должен указывать на выходе, что вычисляемая аппроксимация является вырожденной согласно принятому кри- критерию. Если алгоритм включает поточечное вычисление аппрок- аппроксимаций Паде, он должен включать также специальный сигнал на тот случай, когда рассматриваемая точка оказывается полюсом аппроксимации. Итак, мы подчеркиваем, что хороший численный алгоритм
2.4. Численные методы нахождения аппроксимаций Паде 73 должен включать надежный тест на вырожденность. Если ап- аппроксимация Паде, соответствующая входным данным, не сущест- существует, то хороший алгоритм должен это обнаружить и указать на вырожденность. Мы называем такие алгоритмы надежными. Далее, мы могли бы поставить условие, чтобы малые вариации исходных данных в пределах их погрешностей не вызывали зна- значительных изменений вычисленных значений аппроксимаций Паде. Однако плохо обусловленные задачи часто встречаются при вычислении аппроксимаций Паде, и поэтому более реалистично требование, чтобы исчезающе малым вариациям данных коэффи- коэффициентов ряда соответствовали исчезающе малые изменения вы- вычисленных значений коэффициентов числителя и знаменателя Паде. Это условие отражает математическую идею непрерывности, и методы, обладающие таким свойством, называют устойчивыми. Плохо обусловленные задачи распознаются по увеличению в ре- решении ошибок, связанных с округлением начальных данных. Кроме сказанного выше мы хотим, чтобы наш алгоритм был эф- эффективным, но эффективность не так важна, как надежность и устойчивость. Вычислители, имеющие опыт применения ап- аппроксимаций Паде, хорошо знают о значении вырожденности и плохой обусловленности; они предпочитают скорее использо- использовать более сложные методы, чем прибегать к аппроксимациям высокого порядка. Кроме всего прочего вычисление аппрокси- аппроксимаций Паде обычно занимает меньшую часть общего времени вы- вычислений; большая часть времени уходит на вычисление с высо- высокой точностью коэффициентов ряда. Отметим, что решение системы D.1) методом исключения требует Оу-^мЛ операций, если не используются итерационные уточнения решения. Ни- Ниже в этом параграфе мы рассмотрим более эффективные ме- методы и обсудим, чем приходится платить за увеличение эффектив- эффективности. Наши рекомендации, касающиеся точности численных расче- расчетов, основаны в первую очередь на практическом опыте. В пре- предыдущем параграфе мы упомянули эмпирическое правило, со- согласно которому вычисление аппроксимации Паде [L/MJ следует вести с М дополнительными десятичными знаками. Конечно, ни- никто не сможет сказать a priori, что потребуется М, М — 1, 2-М или другое количество дополнительных знаков. Просто мы хотим предостеречь от вычислений с малым числом резервных знаков и высказать предположение, что не следует особенно полагаться на результат вычисления аппроксимации Паде [L/M], если рас- расчет производился менее чем с М защитными знаками. С вычис- вычислительной точки зрения информация, позволяющая аппроксима- аппроксимациям Паде осуществлять аналитическое продолжение функции далеко за пределы круга сходимости, заключена в далеких деся-
74 Гл. 2. Прямые приложения тичных знаках записи данных коэффициентов ряда; поэтому естест- естественно, что точность исходных данных имеет первостепенное зна- значение. Некоторые из приведенных высказываний можно лучше по- понять на следующем примере. Рассмотрим ряды Стильтьеса (см. гл. 5; этот и другие материалы данного параграфа станут понят- понятнее при повторном чтении книги), коэффициенты которых имеют вид Cj= = 0, 1, 2 D.2) где а>0 и ц>(и)—ограниченная неубывающая функция (это обо- обозначение несколько отличается от обозначений § 5.1). Свойства сходимости различных последовательностей аппроксимаций Паде для рядов Стильтьеса хорошо известны; ряды Стильтьеса пред- представляют основной класс функций, для которого имеется полная теория сходимости. Простейшим частным случаем таких рядов является ряд с коэффициентами = 0, 1, 2 D.3) Система D.1), соответствующая этому ряду, имеет вид 1 1 1 \ i , \ ( — 1 L—M+2 L — I L—M+3 L — L+l 1 \ L-'r 1 1 L + 2 1 L + Mj h • 1 ; — 1 T+T" -1 , D-4) где L^M — 1. Матрица коэффициентов представляет собой часть матрицы Гильберта, плохая обусловленность которой хорошо известна Таким образом мы сталкиваемся с плохой обусловлен- обусловленностью в идеальном, по существу, случае, который никак нельзя назвать вырожденным. В этой связи интересно рассмотреть чис- число обусловленности ганкелевой матрицы С1.-М+\ cL+l D.5)
2.4. Численные методы нахождения аппроксимаций Паде 75 элементы которой определены равенствами D.2). Числом обу- обусловленности называется величина Матрицы с большим числом обусловленности соответствуют пло- плохо обусловленным системам, и в качестве грубого приближения можно полагать, что \ogl0K(H м) — -жо количество десятичных знаков, которые теряются при решении системы D.1) из-за оши- ошибок округления. В общем случае D.2), D.5) Тейлор [Taylor, 1978] показал, что HrainfK(//iM)"*r>4 при условии d(f(a — )>0. Для частного случая матрицы Гильбер- Гильберта, соответствующего D.3), D.5), имеем i lira inf к (#«)¦*"> 16. Эти результаты являются хорошим аргументом в пользу наше- нашего правила о потере приблизительно М знаков точности при вычислении аппроксимации Паде [L/M]. В действительности это означает, что если ЬЛ, Ьг, ..., Ьм нужно вычислить с N знака- знаками, то коэффициенты cL_M+i, cL_M+2, ..., cL+M требуется зада- задавать с N-\-М знаками. Значительная потеря точности при даль- дальнейших вычислениях маловероятна. До сих пор в этом параграфе мы молчаливо предполагали, что нашей конечной задачей является вычисление коэффициентов конкретной аппроксимации Паде [L/M] с целью последующего вычисления значения этой аппроксимации в данной точке г. Практически более вероятно, что задача состоит в табулирова- табулировании значений аппроксимаций Паде или в вычислении значений последовательности таких аппроксимаций в указанной точке. Вы- Выбор наилучшего алгоритма вычисления аппроксимаций Паде за- зависит и от конкретной постановки задачи. Обычно различают проблему коэффициентов и проблему значений При 1абулирова- нии значений одной аппроксимации Паде удобнее вычислить сна- сначала коэффициенты а„, а,, ..., aL, b0, blt ..., bM и затем вычис- вычислять значения аппроксимации. Если требуется найти значения целой последовательности аппроксимации Паде, то предпочти- предпочтительнее, может быть, рекуррентные методы, такие как е-алгоритм или Q. D.-алгоритм. Прямые методы вычисления аппроксимаций Паде надежны и устойчивы, но могут оказаться не самыми эффективными. Суще- Существует несколько «О (аМ2)» методов, где а обычно равно 4 или 6, которые выигрывают в вычислительной эффективности за счет
76 Гл. 2. Прямые приложения надежности. Их применение предпочтительнее в тех случаях, когда существование и невырожденность аппроксимаций Паде не вызы- вызывают сомнений. Возможно, некоторые из этих методов могут быть усовершенствованы и сделаны надежными. Мы приводим здесь краткую характеристику некоторых О(аМ2) методов, каждый из которых имеет свои достоинства: (i) Алгоритм Кронекера для коэффициентов числителя и знаме- знаменателя. (ii) Q.D.-алгоритм для представления аппроксимаций Паде в виде непрерывной дроби. (iii) Алгоритм Бейкера для коэффициентов числителя и знаме- знаменателя. (iv) Алгоритм Ватсона для коэффициентов числителя и знаме- знаменателя. (v) Метод ганкелевых и теплицевых матриц для коэффициентов знаменателя. Алгоритм Кронекера [Kronecker, 1881] обсуждается в § 1.1. ч. 2. Этот алгоритм относится к общей задаче рациональной ин терполяции; аппроксимации Паде соответствуют случаю совпаде ния всех узлов интерполяции zo= zi — ¦ ¦ • — zl+m = О- Коэффициенты интерполяционного полинома Ньютона совпадаю! в этом случае с коэффициентами с0, сх, ..., cL+M ряда Тейлора. Алгоритм Кронекера основывается главным образом на (^^-тож- (^^-тождестве C.5.12) и позволяет восстанавливать антидиагональные пос- последовательности таблицы Паде. Следовательно, алгоритм корректно определен только в том случае, когда все элементы рассматривае- рассматриваемой антидиагональной последовательности существуют и невырож- невырождены. Однако в любом вырожденном случае алгоритм Кронекера может быть усовершенствован с помощью алгоритма Евклида ГС1а- essens, (диссертация), 1976; Me Eliece and Shearer, 1978; Cordellier, 1979 b; Graves-Morris 1979]. Q.D.-алгоритм. Этот алгоритм дает представление последова- последовательности аппроксимаций Паде в виде непрерывной дроби и полностью обсуждается в § 4.4. Требуется, чтобы все элементы соответствующей дроби были конечны и отличны от нуля; это эк- эквивалентно условию невырожденности подходящих дробей. Алгоритм Бейкера [Baker, 1973 а]. С помощью этого алгоритма строится последовательность числителей г)((г), г = 0, 1, 2, ..., и знаменателей 9;(г), t = 0, 1, 2, ..., аппроксимаций Паде, обра- образующих в таблице Паде последовательности типа «лестниц»:
2.4. Численные методы нахождения аппроксимаций Паде 77 Коэффициенты многочленов r\{(z), 0{(z) определяются по рекур- рекуррентным формулам, использующим (Л)-и (»*)-тождества C.5.11). Существенно, что этот алгоритм является быстрым методом вы- вычисления последовательностей типа антидиагональиых лестниц. За подробностями мы отсылаем к ЕРА, с. 77, и [Pindor, 1976]. Алгоритм Ватсона [Watson, 1973]. С его помощью строится последовательность числителей r\t(z), г —О, 1, 2, ..., и знамена- знаменателей 9f(z), г = 0, 1, 2, ..., аппроксимаций Паде, образующих лестничные последовательности вида Коэффициенты многочленов i\t (z), 0,B) вычисляются с помощью рекуррентных формул, основанных на(**) и (**)-тождествах C.5.11). Это быстрый метод вычисления последовательностей типа лестниц, параллельных главной диагонали, подробнее см. [ЕРА, с. 79, Wat- Watson, 1973; Рас1ё,1894]. Отметим, что в алгоритме Ватсона исполь- используются условия точности порядка аппроксимации. Алгоритм Грэгга [Gragg, 1974J аналогичен алгоритму Ватсона, но не использует этих условий. Метод, основанный на структуре теплицевых и ганкелевых мат- матриц. Система уравнений D.1) имеет ганкелеву матрицу коэффициен- коэффициентов. Структура NxN ганкелевой матрицы Н такова, что ее (г, /) элемент имеет вид H{,/ = h{+/> », / = 1, 2, .... W. Переставляя столбцы и строки системы D.1), можно получить сле- следующую эквивалентную форму этой системы: УС1.-М + 1 CI.-M + i bM-l I —C L + M — С L + M-i ¦—С /.+1 D.6) Матрица коэффициентов системы D.6) является теплицевой. Струк- Структура N xN теплицевой матрицы Т такова, что ее (г, /) элемент име- имеет вид Tt,j = h-/- M = l, 2, 3, ...,N. Существуют специальные .методы, использующие структуру систем
78 Гл. 2. Прямые приложения уравнений с ганкелевыми и теплицевыми матрицами для их реше- решения в невырожденном случае. Эти методы не используют переста- перестановок; вычисления проводятся по итерационной схеме, основанной па принципе вложения Мы отсылаем за деталями к следующим работам: [Bareiss 1969; Trench, 1964, 1965; Rissanen, 1973; Zohar, 1974; Bultheel, 1979; Graves-Morris, 1979; Brent et al, 1980; Bult- heel and Wuytack, 1981]. Детали, касающиеся надежных вычислений диагональных после- последовательностей таблицы Паде вида [L-\- ///], можно найти в работах [Brezinski, 1976], [Bultheel, 1979, 1980а]. В работе [Luke, 1980] можно найти замечание о проблеме точности вычислений при ма- малых \г\. В работе [Pindor, 1979aj имеются некоторые интересные гипотезы по проблеме вычисления значений аппроксимаций Паде. Библиография вплоть до настоящего времени составлена Вуйтаком [Wuytack, 1979] Упражнение 1. Найти аппроксимацию Паде [3/3] ряда Эйлера E.5.9). используя каждый из методов этого параграфа. Упражнение 2. Показать, что алгоритм Бейкера есть ОDУИ2)-ме- тод, а алгоритм Кропексра — О DУИ2)-метод при L<^.M, считая, что значимыми операциями являются умножение и деление.
Глава 3 АППРОКСИМАЦИИ ПАДЕ И ЧИСЛЕННЫЕ МЕТОДЫ § 3.1. Д2-метод Эйткена как метод аппроксимаций Паде [L/l] Один из наиболее известных и простейших приемов ускорения сходимости последовательности—это Д'-'-метод Эйткена. Предполо- Предположим дана последовательность действительных или комплексных чисел Гл. 3. Аппроксимации Паде и численные методы ложим, что Sn = S—aan, A.3) где а Ф 0 и | ос | < 1. Тогда ASn = aa"(l—a), A2S,; = — аап A—аJ и из B) вытекает, что „ — ^0 — act ) -f- \u се.
3.1. к-метод Эйткена 81 Из A.1.8) —A.1.10) получаем L-\ i = 0 !. 2 С, 1=0 /> /> что согласуется с A.2) и показывает, что метод Эйткена эквива- эквивалентен использованию последовательности аппроксимаций Паде [/-, 1]. Тот же результат еще быстрее можно получить, полагая М = 1 в формуле A.3.8). В численном анализе часто встречаются последовательности вида . A.9) Функцию / называют в этом контексте одношаговой итерацион- итерационной функцией [Traub, 1964]. Например, геометрическая последо- последовательность A.3): Sn = S—аос" может быть представлена в виде где /(z) = S + aB—5), т. е. геометрической последовательности соответствует линейная итерационная функция /. Отметим, что случаю сходящейся последовательности соответствуют значения a — f'(S), удовлетворяющие условию )а)<1; при а=1 имеем Sn = S—а и метод Эйткена неприменим. Дальнейшим подтверждением силы метода Эйткена и тем самым аппроксимаций Паде [Х/1] является следующая теорема. Теорема 3.1.1 [Henrici, 1964]. Пусть Sn+l = f (SJ — последова- последовательность действительных чисел, сходящаяся к пределу S. Если f (х) дважды дифференцируема в точке S и f' E) Ф 1, то где последовательность Тп определена по формулам A.2). Доказательство. Имеем где ln лежит между S и 5„. Из сходимости Sn —>¦ S и непрерыв- непрерывности / в точке S вытекает, что /(S) = 5. Следовательно, A.10)
82 Гл. 3. Аппроксимации Паде и численные методы можно переписать в виде ASn = A(Sn-S) + O((S-Sn)*), A.11) где Л=/'E)-1?=0. Аналогичным образом из A.10) и A.11) получаем = A(Sn+l-S) + O((S-Snf). A.12) Из A.11), A.12) вытекает, что A2Sn = AASn^ O((S — Sn)*), и мы получаем Т _=S (A Теорема доказана. Приведенная теорема делает строгим утверждение о том, что метод Эйткена ускоряет сходимость последовательностей вида A.9) с геометрической главной частью. Дальнейшие подробности, отно- относящиеся к общей теории, можно найти в [Brezinski, 1977J. Если обе последовательности ^и/, определяемые формулами A.1), A.2), сходятся, го их пределы совпадают [Lubkin, 1952]. Относительно недавних достижений в этом направлении см. работы [Cordellier, 1979a] и [Germain —Bonne, 1979]. Упражнение 1. Показать, что метод Ньютона для вычисления нуля функции ф(х) сводится к итерациям вида A.9) с итерацион- итерационной функцией фB) f{z) = z — ф' (г)' Упражнение 2. Имеет ли смысл применять метод Эйткена для ускорения сходимости последовательности ньютоновских итераций из предыдущего упражнения, если (i) г0 — простой нуль функции ф (г)? (И) г0 — кратный нуль функции ф(г)? Упражнение 3. Рассмотрим ряд со 2^Ci = 1f '~3 б"^"Т"г"^ 20"т" • • •» 1 = 0 где
3.2. Ускорение и сверхускорение сходимости 83 [Marx, 1963J. Пусть S,, = 2 ci и ^п определяется согласно A.2). Доказать, что (i) S3m_, = 0 при w=l, 2, 3, ... . (ii) S4 —> 0 при /г —>¦ оо. Oii) 7\и — О, ГЗИ_, — 1 и T3ia_t -* 0 при /я — оо. Следует отметить, что \Sn\ сходится, а {Гп} расходится (осцилли- (осциллирует). § 3.2. Ускорение и сверхускорение1) сходимости Возникает вопрос, как можно еще более ускорить сходимость последовательности, которая уже получена из исходной с помощью Дг-метода Эйткена? Естественный ответ —применять метод Эйткена итеративно. Однако такой ответ, не подкрепленный анализом кон- конкретной ситуации, не может быть полностью удовлетворительным. Мы поясним это утверждение с помощью нескольких замечаний. Схема Эйткена дает хороший результат, когда исходная после- последовательность сходится геометрически; ускорение происходит пу- путем «снятия» доминирующей геометрической прогрессии. Теперь можно спросить: какой смысл в повторном применении метода Эйткена? Предположим, что исходная последовательность получа- получается из геометрической путем округления членов последователь- последовательности с определенной точностью. Тогда, согласно A.4), все члены ускоренной последовательности совпадают с ее пределом с точ- точностью до ошибок округления. При повторном применении метода Эйткена мы будем оперировать с разностями членов последова- последовательности, которые теперь полностью обусловлены ошибками ок- округления. Этот пример показывает, что вопрос об итерировании схемы Эйткена требует существенного теоретического анализа или эмпирических критериев. Было бы все же заманчиво извлечь по возможности больше информации из ограниченного числа членов последовательности с помощью методов ускорения сходимости. Рассмотрим частичные суммы ряда Se= 2A+в,) @.5)', л=1, 2, .... где числа е, представляют собой случайные ошибки округления и [e^j^e. Рассмотрим вычисление предела этой последователь- последовательности S^ с помощью построения диагональных аппроксимаций х) В оригинале — overacceleration; это понятие, как будет видно из даль- дальнейшего, имеет у авторов негативный характер.— Прим. перев.
84 Гл. 3. Аппроксимации Паде и численные методы Паде для функции и вычисления их значений в точке г = 0.5. (Это незначительное видоизменение метода, описанного в § 3.1, где аппроксимации вы- вычисляются в точке z=l.) Из A.1.8), A.1.9), пренебрегая членами второго порядка по е, находим оценки = 2±7е, которые показывают, что эта аппроксимация чувствительна к ошиб- ошибкам округления, но не слишком. Однако, переходя к аппроксима- аппроксимации [2/2], получаем (так же как в линейном приближении). Мы видим, что многочлен Q[2/2'(z) полностью определяется ошибками округления; нули это- этого многочлена, которые являются полюсами аппроксимаций Паде, расположены случайным образом но всей комплексной плоскости. (Мы не утверждаем, что это совершенно случайное распределение; в частности, мы склонны ожидать, что около [г|= 1 накапливается больше нулей, чем около г = 0.) Поскольку значение аппроксима- аппроксимации Паде [2/2] полностью обусловлено ошибками округления, в то время как аппроксимация [I/I] имеет правильную главную часть, то использование аппроксимации [2/2] является примером сверх- сверхускорения последовательности. Вывод состоит в том, что и подоб- подобных случаях следует использовать аппроксимации более низкого порядка. Метод аппроксимаций Паде имеет (среди прочих) следующую интерпретацию, относящуюся к случаю, когда исходная последо вательность имеет определенное число доминирующих геометри ческих компонент Предположим, что а а Sn = а 2 аГ + b 2 Р1" + малый остаток, B. Г, г=0 г-0 где афО, ЬфО, \а\ < 1, ||3| < 1 и л = 0, 1, 2, ... .В другой форме S_=-r^—A—а"+1) + -г^-д-A—Рч+1)-|-малый остаток. B.2) Отметим, что последовательность Sn образована разностями ряда с коэффициентами co=So = a-|-fr-|-малый остаток, cn=Sa—Sn_1 = aa" -[-ftp1" + малый остаток. ' '
3.3. г-алгоритм и ц-алгоритм 85 Строка соответствующей таблицы Паде [Z./2] полностью учитывает главные члены в B.1), B.2), B.3); в то же время легко проверить, что для метода Эйткена это не так. Мы предположили, что афО, b=?=Q в B.1), так что в главной части действительно имеются две геометрические компоненты, и это предположение является реша- решающим. Мы не формулируем здесь точно предположений об оста- остаточных членах, чтобы не ограничивать общности рассуждений и не исключать такие возможности, как сп = а"-\- (—а)", когда глав- главная часть в четных членах обращается в нуль. Предположение о том, что | ех | < 1, |[3| < 1, имеет очевидный смысл, но не явля- является строго обязательным: метод Паде позволяет корректно ста- ставить задачи, относящиеся к расходящимся последовательностям вида B.1) с |а|>1 или ||3|>1. Если а=1 или Р = 1, так что имеется одна доминирующая компонента, представляющая собой расходящуюся арифметическую прогрессию, то метод Паде дает Sm = oo с очевидной интерпретацией. Уточним теперь схему применения метода Паде. Как и в § 1.3, вводим соответствующую ряду B.3) функцию " h /(z)= 2 cr zr = т^ТГ, + i—n- +остаточный член, B.4) значение которой мы хотим вычислить в точке 2=1. Учитывая форму доминирующего члена в B.4), предпочтительнее использо- использовать для этой цели строку таблицы Паде [2/2J. Теперь мы поза- позаимствуем из § 6.2 теорему А^онтессу; точнее, мы воспользуемся следствием этой теоремы, относящимся к данному случаю. Пусть /?>|а|-1 и i?>|p|~1. Предположим, что остаточные члены в B.3) имеют порядок о(R~n) (это уточняет наше предпо- предположение о малости этих остаточных членов). Тем самым, функция мероморфна и имеет ровно два полюса в круге |г| < R. Посколь- Поскольку |ех| < 1, то R > 1; кроме того, точка г=1 не является полю- полюсом функции /. Теперь теорема Монтессу утверждает, что после- последовательность аппроксимаций Паде [L/2] сходится к функции / в точке 2=1. Таким образом, приведенные выше условия теоре- теоремы Монтессу являются условиями применимости метода Паде для ускорения сходимости последовательностей вида B.1) или рядов вида B.3). § 3.3. е-алгоритм и ^-алгоритм В этом параграфе мы рассмотрим сначала е-алгоритм преоб- преобразования последовательностей и покажем, что один из его столб- тв соответствует Л2-методу Эйткена. Затем мы рассмотрим т)-ал- горитм аналогичного преобразования рядов.
86 Гл. 3. Аппроксимации Паде и численные методы е-алгоритм был открыт п работах Шенкса [Shanks, 1955] и Випна [Wynn, 1956]. В его описании участвует двумерная таб- таблица чисел е)>\ которая называется к-таблицей (табл. 1). Ниж- Нижний индекс k элемента е^,л является номером столбца, в котором расположен элемент, нижний индекс определяет положение эле- ТАБЛИЦА I. е-ТАБЛИЦА ДО) ?@) .0) @) й й •-B) ?0 мента в столбце (нумерация идет сверху вниз). Таблица строится итерационно по заданным элементам 6^ = 0 и ej", / = 0, 1, 2,... с помощью е-алгоритма eft.,=i#.+j' + [er1> —еу»]-1. C.1) Чтобы лучше понять действие этого правила, заметим, что оно связывает четыре элемента, расположенных в вершинах ромба и позволяет выразить элемент е^.,, находящийся в правой верши- вершине, через три остальные (рис. 1.). Теперь ясно, что е-алгоритм позволяет восстановить всю таблицу по начальным данным. Да- Далее, понятно, что если ejJ) = elk>+]\ т.е. два последовательных эле- элемента одного столбца совпадают, то элемент е)$, не существует. Условимся считать, что все элементы рассматриваемых таблиц существуют, если прямо не указано противное (в противном слу- случае таблицу называют вырожденной). Покажем, что столбец {е'2л, /' = 0, 1, 2,...} е-таблицы совпа- совпадает с последовательностью, которая получается из заданного столбца {е?/\ / = 0, 1,...} с помощью метода Эйткена. Согласно C.1), имеем
3.3. z-алгоршпм и ц-адгоритм 87 Рис. 1. Расположение элементов е-таблицы, связан- связанной правилом е-алгоритма. и далее до где A2Sy = A2Sy+,—ASy. Эта формула совпадает с формулой A.2) метода Эйткена; напомним, что тот же результат получается ТАБЛИЦА 2. ЧЕТНЫЕ СТОЛБЦЫ е-ТАБЛИЦЫ ДЛЯ ВЫЧИСЛЕНИЯ л /; = 0 1 2 3 4 5 6 7 8 9 4.0000000 2.6666667 3.4666667 2.8952381 3.3396825 2.9760462 3.2837385 3.0170718 3.2523659 3.0418396 3.1666667 3.1333333 3.1452381 3.1396825 3.1427129 3.1408813 3.1420718 3.1412548 3.1423423 3.1413919 3.1416627 3.1415634 3.1416065 3.1415854 3. 3. 3. 3. 1416149 1415873 1415943 1415921 3.1415933 3.1415925 при использовании первой строки Паде как метода ускорения сходимости В § 3.4 ниже мы докажем тождество Винна и с его помощью в § 3.5 докажем, что е-таблица и таблица Паде связаны соотно- соотношением Только что мы доказали этот результат для k= 1 и / = 0, 1, 2,.... Пример 1. Рассмотрим ряд Грегори, представляющий число л и отличающийся плохой сходимостью
Гл. 3. Аппроксимации Паде и численные методы В табл. 2 приведены четные столбцы е-таблицы, соответствующей этому ряду. По первому столбцу (последовательности частичных сумм ряда) едва ли можно сделать вывод о сходимости. В то же время последние экстраполяции достаточно убедительны. ТАБЛИЦА 3. ЧЕТНЫЕ СТОЛБЦЫ е-ТАБЛИЦЫ ДЛЯ ВЫЧИСЛЕНИЯ In 3 /1=0 1 2 3 4 5 6 7 8 9 .000000 2.000000 .000000 2.666667 -1.333333 5.066667 -5.600000 12.685714 -19.314286 37.574603 1.000000 1.142857 1.066667 1.128205 1.066667 1.136842 1.049351 1.165714 1.090909 1.101449 1.097046 1.099725 1.097674 1.099507 1.098039 1.098805 1.098521 1.098667 1.098570 1.098626 Пример 2. Рассмотрим известный расходящийся ряд, представ- представляющий собой ряд Тейлора функции In(l-f2) в точке 2 = 2: ему соответствует интересная е-таблица, четные столбцы которой приведены в табл. 3. Для сравнения отметим, что In 3= 1.098612; мы видим, что е-алгоритм может быть использован для суммиро- суммирования расходящихся рядов. Упомянем еще кратко забавный парадокс Харди, имеющий простое объяснение. Пусть f{,\ 1 Л ' I 2Z У I ' 3 ( 2Х Рассмотрим две области &) и $, определяемые условиями z ?.&>, если |г — /|<К~2 и | г+ i | < j/, если |г —t|>K2 и |z + t|>K. 2г Заметим, что C.2) есть биномиальный ряд (от у-цтр). который сходится при |2г| < | 1 + гг|. Граница области сходимости опре- определяется уравнением (гг* + iz* — iz — 1) (zz* + iz — /г* — 1) = 0. Отсюда получаем, что
3.3. г-алгоритм и ц-алгоритм i Imz Рис. 2. Области i?) и $ в г-плоскости. 2г Поскольку рассматриваемая переменная ¦ . 2 инвариантна относительно замены г —*¦ —, то правильный ответ должен быть ясен; он может быть эмпирически проверен путем вычисления величины e!j0), которая дает хорошее приближение. Строгое обос- обоснование решения требует применения техники, содержащейся в теореме Бейкера, Гаммеля и Уиллса, § 6.7. В качестве последнего замечания об е-алгоритме отметим, что последовательность <У={гк', k = 0, 1,...} может оказаться рас- расходящейся. Тогда возможно повторное применение е-алгоритма с начальными данными e'i/' = е(/0), / = 0, 1, 2,..., которое может привести к сходящейся последовательности {е'^,"'} (см. табл. 1, ч. 2, § 1.3). Однако никаких теоретических аргументов в пользу итерирования е-алгоритма сейчас не известно. е-алгоритм можно рассматривать как оператор преобразования последовательностей, который последовательности элементов столбца {ef/'} ставит в соответствие последовательность {ef1} элементов главной диагонали. т]-алгоритм Бауэра осуществляет аналогичное преобразование рядов. СО т)-алгоритм [Bauer, 1959]. Пусть дан ряд 2 ct> т]-алгоритм ;=о состоит в построении т)-таблицы (рис. 3) по двум заданным
90 Гл. 3. Аппроксимации [lade и численные методы I — 1 Tin' ^2 „С?, . Рис. 3. г)-таблица. столбцам: 2 C.3) 2, ... , C.4) с помощью следующей рекуррентной схемы: 1 1 , 1 1г* Л2*-2 Л~ Чз*- 1 ~~Чг*-1 • Равенства C.5), C76) связывают элементы, лежащие в вершинах ромбов, показанных на рис. 4: элемент в правой вершине вычис- вычисляется по трем остальным. Таким образом, вся таблица, пока- показанная на рис 3, восстанавливается по первым двум столбцам. Соотношения C.3) — C.6) определяют преобразование, которое 3D а> оо со ряду 2 ct — 2 Чо1' ставит п соответствие ряд 2 с'< — 2 Ч?"- i= 0 1=0 (= 0 1= О Одной из целей, которую преследует г|-алгоритм, является по- построение по сходящемуся ряду 2е/ нового ряда 2си сходяще- сходящегося быстрее к той же сумме. В качестве эмпирического приме ра рассмотрим опять ряд Грегори ?=1 L_|_l_l_i_i_ C7) Пример 3. В табл. 4 показан результат применения ^-алго- ^-алгоритма к ряду C.7)i ряд C.7) преобразуется при этом в ряд
3.3. г-алгорнтм и ц-алгоритм 9] Элементы E) Элементы (С) Рис. 4. Расположение элементов т)-таблицы, связанных соотношениями C.5), C.6). Т~ 4+24 136+ 3145 ¦"¦ ^ j Первые члены ряда C.8) подтверждают предположение, что этот ряд сходится быстрее, чем C.7). Для того чтобы обосновать эти ТАБЛИЦА 4. П-ТАБЛИЦА РЯДА ГРЕГОРИ DO 00 oo oo, * 1 1 3 1 5 1 7 1 9 1 4 1 8 1 ~ 12 1 16 * 1 24 1 120 I 336 * 1 136 1 444 * 4 3145 • действия, мы покажем сначала, что е-алгоритм и т)-алгоригм эк- эквивалентны в том смысле, что 2ft 2 $=2<'- C.9) В контексте примера 3 это означает, что четные частичные суммы ряда C.8) совпадают с приближенными значениями л, доставляв-
92 Гл. 3. Аппроксимации Паде и численные метооы ш Рис. 5. Пять элементов е-таблицы. мыми главной диагональю табл. 2, что легко проверяется сравне- сравнением таблиц. Теорема 3.3.1. Справедливы тождества eSl-i]-1, (ЗЛО) еЙгЛ»]-* C.11) (существование всех фигурирующих здесь величин предполагается). Доказательство. Поскольку соотношения C.5), C.6) или C.10), C.11) одинаковым образом однозначно определяют т)-таблицу, мы покажем, что из C.10), C.11) вытекает C.5), C.6), что эквива- эквивалентно утверждению теоремы. Для нулевого столбца равенство C.3) дает то же значение, что и C.10) с k — 0, поскольку <#> = 2 с,. ; = о Для первого столбца из C.11) получаем [т]<»]-1 = е«>—е'Г" = [е<-+1)—ej/'] — -[er-er"]"x = [rirI)J-x-№']-i, что совпадает с C.5) при k — О. Для доказательства соотношений C.5), C.6) при k > 0 рассмотрим тождество, связывающее эле- элементы А, В, С, D е-таблицы, расположенные в вершинах прямо- прямоугольника, показанного на рис. 5. С помощью C.10), C.11) тож- тождество (D—В) — {C — A) = (D—С) — (В—А) можно переписать в виде h<" I r«3.4. Тождество Винна и е-алгоритм 93 ~z2k-2 X е2к г2к-\ Рис. 6. Пять элементов е-таблицы. ются равенства с<-1> в@) b2k +2 fc2ft- Таким образом, г^, — Г|B^+2 = 8^+2—е^', и, следовательно, е|$ = = 2л^от1Г' что доказывает C.9). Тем самым мы установили экви- эквивалентность г|-алгоритма преобразования рядов и е-алгоритма преобразования соответствующих последовательностей. Дальнейшие детали, касающиеся е-алгоритма и т)-алгоритма, можно найти в работах [Bauer et al, 1963], [Wynn, 1960, 1961a] и [Brezinski, 1977]. Относительно приложений е-алгоритма к век- торно- и матрично- значимым функциям см. работы [Wynn, 1962, 1964; Me Cleod, 1971; Gekeler, 1972; Mills, 1975; Brezinski, 1977]. § 3.4. Тождество Винна и е-алгоритм Тождество Винна связывает соседние аппроксимации Паде в таблице Паде: \ > i [L—\/M] — [L/M]~r[L+l/M] — lL/M] * ^ ' Эту формулу легко запомнить, и идентифицируя входящие сюда элементы таблицы Паде с направлениями стрелки компаса, как показано на рис. 1. С помощью этой мнемотехники тождество Винна записывается в виде Предполагается, что входящие сюда аппроксимации Паде сущест- существуют и невырождены. Этот параграф посвящен главным образом прямому доказательству тождества Винна; в § 3.5 мы подробно рассмотрим ряд других тождеств. В конце этого параграфа мы используем тождество Винна для доказательства того, что четные столбцы е-таблицы являются на самом деле аппроксимациями Паде.
94 Гл. 3. Аппроксимации Паде и численные методы [L/M-1] [L-IM] [L/M] [L-П/Щ \L/M+\] N W С Е S Рис. 1. Способ обозначения элементов таблицы Паде с помощью направлений стрелки компаса. В процессе доказательства нам потребуются два тождества Фробениуса. Рассмотрим определитель "l-M CL-M+\ • • • CL CI + i 7M+i 1 Применим тождество Сильвестра (теорема 1.4.1) для исключения первой и последней строки и первого и последнего столбца. Все определители, получающиеся при таком исключении, имеют ана- аналогичный вид, и в результате получается равенство B) C(L+ 1/М) = ) B) С {L/M + 1) — —zQlL>Mi(z)C(L+ l/M+l). Мы.будем использовать его в следующей форме: L С (L+ 1/М + 1) QiL + hMi B) QjL/м + 1] (г) _ C(L-\-MM) C(LJM+\) C(L/M + Чтобы получить другое тождество, представим многочлен I/M]() B ввде с/.-Л1 + 1 Ч- -Л гм CL+M~\ г
3.4. Тождество Винна и г-алгоритм 95 Применение тождества Сильвестра для исключения первого и по- последнего столбца и первой и последней строки приводит к дру- другому тождеству: J B) С (L/M + 1) + QWM1 (г) С {L/M) = Ql'-1/M i B) С (L + l/M), которое мы будем использовать в форме C±L,M) D3) C(L+\/M) Переходим теперь непосредственно к доказательству тождества Винна. Имеем [L + l/M](z)-[L/M\(z) = -? ^QgJg- ~ Числитель имеет степень L + M + l, а коэффициенты аппрокси- аппроксимаций в левой части, согласно определению, совпадают до поряд- порядка zL+M, поэтому [L + 1/М] (z)—[L/M] (г) = -^хтШц^оТГШТ^ ' const. Постоянный множитель здесь равен произведению коэффициента при zL+1 в ри-+чм1[г} и коэффициента при zM в QlLim(z), посколь- поскольку все остальные члены имеют меньший порядок. Отсюда, исполь- используя A.1.8) и A.1.9), находим, что и, заменяя L на L — 1, получаем \LlM\- [L 1 ,'ЛП - С{L/M) C{L/M • г+ <4 Ъ Далее, рассмотрим другую разность соседних аппроксимаций Паде; * м (г) QlLiM+U (Z) QIL/AU (г) Как и выше, числитель имеет степень L-f-Af-j-l. а коэффициен- коэффициенты аппроксимаций совпадает до порядка zL+M\ тем самым г, ,.. ., г, ...-, const. [L/M + 1 ] - [L/M] = где постоянный множитель равен нроизвецению коэффициента при гм+1 в Qr/7'M+1)(z) и коэффициента при zl в Ра'да(г). Отсю- Отсюда следует, что
96 Гл. 3. Аппроксимации Паде и численные методы и, заменяя М на М — 1, получаем другое равенство: \LIM\ \UM 11- C(L'M) c(L + llM> ~ QtL.Ml | Тождество Винна получается теперь комбинацией соотношений D.2) —D.7). Используя D.2), D.4), D.6), получаем 1 1 QIL + 1, C(L + l/M) C(LJM+1) f = zL + MC(L+l/M)C(L/M+l) ¦ D"8) С другой стороны, из D.3), D.5), D.7) вытекает, что 1 1 [L—\/M] — [L/M] [ЦМ — 1] — [ ) Q[L M-li C(L+l/M) . D.9) Сравнивая D.8) и D.9), получаем D.1). До сих пор в этом параграфе мы предполагали, что все рас- рассматриваемые элементы таблицы Паде невырождены. Модифика- Модификацией тождества Винна D.1), учитывающей существование блоков в таблице Паде, является тождество Корделье. Это тождество связывает пять элементов таблицы Паде, четыре из которых рас- расположены в вершинах прямоугольника. Тождество Корделье. Пусть G== [L/M]—невырожденный элемент пхп блока в таблице Паде (на рис. 2 он показан в левом верх- верхнем углу) Пусть 0
3.4. Тождество Винна и г-алгоритм 97 щ G у S \ \ \ \ \ \ / sk / / У «к / \ \ \ м Рис. 2. Блок в таблице Паде; отмечены элементы, связанные тождеством Кор- дел ье. при условии, что эти величины существуют. В § 3.2 мы опре- определили столбец гу'\ / = 0, 1, 2, ..., е-таблицы как последова- последовательность [/70] аппроксимаций Паде, т. е. полипомов Тейлора: далее, мы показали, что столбец е2л, / = 0, 1, ..., совпадает со строкой [/ + 1/1] (в обоих случаях рассматриваются значения аппроксимаций Паде в точке г=1). Теперь будем доказывать соотношение D.10) по индукции, исходя из того, что при ft— i, 2 оно уже доказано. Сначала с помощью правила е-алгоригма мы выведем соотношение, связывающее элементы e'Jl, eD+i'2I е^~|>, в!//1' и е24~Г) е-таблицы (они расположены в вершинах и центре большого ромба, показанного па рис. 3). Этот способ рассужде- рассуждений подсказан тем, что в таблице Паде имеет место соотношение, связывающее элементы [L/M], [L/M+1] и [/-±1/MJ, которым, согласно D.10), должны соответствовать элементы е-таблицы, расположенные в вершинах и центре ромба (рис. 3). Отметим, что столбцам е-таблицы, как мы хотим показать, соответствуют строки таблицы Паде; это соответствие меняет направления, и, чтобы подчеркнуть это обстоятельство, мы используем в обозна- обозначениях рис. 3 маленькие буквы (ср. рис. 1). Согласно правилу е-алгоритма D.11) и обозначениям рис. 3, имеем равенства ne—nW — {с—и), Se—SIF = (S—с), {SW — nw) 1 = с—W, (Ье—пе)~ =(е—с) .
98 Гл. 3. Аппроксимации Паде и численные методы П &2А ' nw ne nw яе WC e = ?2^2 E2A sw se sw se Рис. З. Часть е-таблицы. Комбинируя эти равенства, получаем соотношение я—с ' S—c которое представляет собой аналог тождества Винна для элемен- элементов четных столбцов е-таблицы. Остается заметить, что четные столбцы е-таблицы восстанавливаются по данным е?/\ е^', / = = 0, 1, 2, ..., с помощью правила D.12), действующего слева направо, а таблица Паде восстанавливается по двум строкам [//0], [/71], / = 0, 1, 2, ..., с помощью тождества Виина, дей- действующего сверху вниз. Таким образом, исходные данные и пра- правила восстановления таблиц совпадают, и формула D.10) доказана. Обратим еще раз внимание на то, что нечетные столбцы е-таб- е-таблицы не являются аппроксимациями Паде, а четные столбцы соответствуют аппроксимациям Паде, расположенным на и выше главной диагонали (как и раньше, имеются в виду значения аппроксимаций Паде в точке г=1). Связь между е-алгоритмом и таблицей Паде может быть уста- установлена прямо на основе соотношений A.1.8); A.1.9) и C.3.8) [Shanks, 1955; Wynn, 1961 b], по вывод на этом пути тождества Корделье затруднителен. Упражнение. Доказать, что в нормальной таблице Паде спра- справедливо следующее соотношение: <#-' —С1-1)-1-,-^-'—С) = («7-1 —С) + (?-J — С)-1, где использованы обозначения рис. 1 *). § 3.5. Общие тождества и рекуррентные формулы Тождества, которые мы обсуждаем в этом параграфе, связы- связывают как сами аппроксимации Паде, так и их числители и зна- знаменатели. Таким образом, имеются два различных типа соотно- соотношений, которые не следует путать. Одним из наиболее замечательных фактов теории является то, что числители и знаменатели соседних аппроксимаций Паде J) С. Brezinski, частное сообщение.
3.5. Общие тождества и рекуррентные формулы 99 L/M-1 L4/M-1 L/M 'Af Рис. 1. Расположение аппроксимаций Паде, знаменатели которых связаны соот- соотношениями E.2). удовлетворяют одним и тем же рекуррентным соотношениям; на этом основаны связи аппроксимаций Паде с непрерывными дро- дробями. Другие соотношения, которые мы будем доказывать, нахо- находят широкое применение в настоящей книге. Начнем опять с основного определения CL-M+\ cL-M+2 •¦• CL CL + l QIL/М] B) _ ,M 1 E.1) Общая структура этого определителя сохранится, если вычерк- вычеркнуть первую строку и первый или последний столбец: обе эти операции приводят к другим определителям вида Qi'""J (z). Учи- Учитывая это замечание, воспользуемся тождеством Сильвестра для исключения первой и последней строки и первого и последнего столбца определителя E.1); это приводит к соотношению IFro- benius, 1881] n(z)C(L/M)- {52) Равенство E.2) называют (**)-тождеством, что отражает распо- расположение аппроксимаций Паде, знаменатели которых фигурируют в равенстве (см. рис. 1).
100 Гл. 3. Аппроксимации Паде и численные методы ' sll-i/M-n Г г /„Л 1 . I Рис. 2. Схема для тождеств Фробениуса. Аналогичный результат получается, если использовать тож- тождество Сильвестра для исключения из определителя E.1) первого и последнего столбца и двух последних строк: q[L/m 1 B) с A/уи _ 1) = с (L/M) QlL'M -' 1 (г) — E.3) Это соотношение называется (**)-тождеством. Равенства E.2), E.3) можно переписать соответственно в виде С (L/M) zQlL~''м -' 3 B)—С (L— 1 /М) QiL'M ~' 1 B) + + C(L/M— l)QiL-l>M4z) = O, E.4) С (L + 1 /М) zQlL~ l'M ~' 1 (г) — С (L/M) QlL/M-' 1 B) + + C(L/M — l)QtL-/m(z) = 0. E.5) Из E.4), E.5) путем исключения тех или иных членов .можно получить два новых равенства: + С (L/M) С (L/M— —С (L/M —I) С (L/M) QL^/M] B) = О {C(L/Mf—C(L+ \/M)C(L— \/M)} zQ[*-I/«- + С (L/M) С (L/M — 1) Qf- ¦ Iм 1 B) — —С (L—l/M) С (L/M — 1) Qi'-/Mi (z) = 0. Отсюда, используя простейший вариант тождества Сильвестра A.4.11): С(L/M + 1) С (L/M — 1) = С (L— 1/М) С(L + \/M)—C(LlM)\ получаем - С (L/M + 1) QlL'M - • 3 B) + С (L -f I /M) QI^~' /м 1 (г) _ ) = 0 E.6) — (• ») -тождество и — C(L/M + 1) zQlL~ '/м-'! B) + С (L/M) Qi.L-lW B) — E.7) — (• „)-тождество.
3.5. Общие тождества и рекуррентные формулы 101 Равенства E.4)—E.7) представляют собой тождества Фробе- Фробениуса для знаменателей Паде. Для числителей PIL/Щ B) = CL-M+i CL-M + 2 cL-M+2 cL-M + 3 Xе'-' L 2 i jmM-l L i= ¦ E.8) исключением первой и последней строки и первого и последнего столбца с помощью тождества Сильвестра получаем PIL/М] B) с (L+ 1/М — 1) = Ри-*1/«-Ч (г) С (L/M) — E.9) Равенство E.9) по форме в точности аналогично равенству E.2); таким же способом получаются другие тождества для числителей, аналогичные тождествам E.2) — E.7). Учитывая эту аналогию, тождества Фробениуса удобно записывать, вводя величину SWMl(z), которую можно выбирать одним из следующих способов: E.10а) E.10Ь) E.10с) Тождества, относящиеся к случаю E.10с), справедливы, если функции G (г) и Н (z) не зависят от L и М; этот случай явля- является следствием случаев E.10а) и E.10Ь) и линейности тождеств Фробениуса. С учетом обозначений E.10) имеем Тождества Фробеииуса E.11) b^b//Vi)^OL (Z) L. (L, I/IVI)^1 l '(Z)-\- (* *\ zC(L+ l/M) SlL~l'M-n (z)—C (L/M) С (L/M + 1) zSU- UM~ 4 (z)—C (L/M) (схема обозначений показана на рис. 2). (Z) +
102 Гл. 3. Аппроксимации Паде и численные методы Из этих важных результатов можно получить еще ряд ана- аналогичных соотношений. Используя символ • для обозначения элементов, подлежащих исключению, рассмотрим конфигура- цию !•* 1, для которой можно написать три соотношения, при- применяя два раза (?*)-тождество и один раз (#?)-тождество. Это приводит к одному равенству, связывающему элементы ( * j-koh- фигурации: С(L + MM)*SlL-^M + ^(z) + C (L/M + IJ + C(L + 1/M) С (L/M + 1) zSW^ (z). E.12) Последнее соотношение полезно при выводе алгоритма Кронекера (§ 2.4). Аналогичным образом получается ( * J-тождество C(L!M) С (L/M) "~ C(L+l/M + l)C(L/M) Существуют также (*)- и (***)-тождества, которые приведены в ЕРА. Этим мы завершаем обзор соотношений, связывающих много- многочлены PlL/Ml(z) и QSLm}(z), и переходим к рассмотрению тож- тождеств для самих аппроксимаций Паде. Приведем сначала основ- основные двухчленные соотношения, связывающие соседние аппрокси- аппроксимации Паде: ^f , E.13) Если рассматриваемые аппроксимации вырождены, то в E.13), E.14) следует произвести умножение на знаменатель (в такой форме они будут справедливы во всех случаях). Окончательные результаты являются чисто алгебраическими и, по существу, ие зависят от вырождения. Вычитая E.13) из E.14), получим ? W ? w n i7l+m + \\ q[L+!/M](z) QlQM](z) W^ I и, следовательно, QIL/M] ф piL+ l/M] (Z)__QIL+ I/Mi (Z) РШМ\ ^ _ Q (ZL + M + lj E.15)
3.6. QЛ.-алгоритм и проблема корней 103 Поскольку левая часть E.15) представляет собой многочлен сте- степени не выше L-\-M-\-l, то отсюда вытекает, что Q[L/M]B)p[L+l/Al]B)_Q[L+l/iM]B)p[L/Al]B) = /B?.+ M + l> E.16) Рассматривая детерминантные формулы E.1), E.8), находим, что коэффициент при гм в 0^1/мЦг) равен (—1 )МС(L-|-1 /М) и коэф- коэффициент при г1 в Р^'мЦг) равен (—l)MC(L/M-\-\). Отсюда следует, что коэффициент в E.16) имеет вид и после деления E.16) на QiL/Ml(z)CfL+*/M](z) окончательно получаем Это соотношение представляет собой (**)-тождество. Таким же способом получаются и другие соотношения: [L/M + 1]-[L/M1, С 104 Гл. 3. Аппроксимации Паде и численные методы Действительно, существует развитая теория, относящаяся к проб- проблеме корней; мы остановимся на одном простом методе, который применим в случае, когда все полюсы / имеют различные мо- модули и то же самое верно для нулей /. Занумеруем нули ut и полюсы и{ функции / в порядке возрастания модулей: \ul\<\ui\<...<\uM\<..., F.2) \v,\<\vt\<...<\vL\<.... (&-Щ Тогда I(z) имеет представление Д (- где h (г) аналитична и отлична от нуля в круге | г | < min {|ui+1-|, I "ли-11}- Отметим, что случай, когда /(г) не имеет или нулей, или полюсов, затруднений в принципе не вызывает. В то же время условие, что полюсы и нули имеют соответственно различ- различные модули, является важным как практически, так и принци- принципиально. Для нахождения полюсов /, т. е. величин ut, мы строим последовательность соответствующих / аппроксимаций Паде [L/M], где М фиксировано, a L—> оо; при этом мы ожидаем, что 43й-дМ). Действительно, этот факт является следствием теоремы Монтессу. Положим Используя формулу связи между корнями и коэффициентами многочлена и детерминантную формулу E.1) для коэффициентов qlM/M] и q[L/M], получим соотношение Заменяя здесь М на М — 1, получим еще одно соотношение Введем теперь следующее обозначение: ciLjM-l)C(LjM)
3.6. Q.D.-алгоритм и проблема корней 105 Отметим, что в частном случае М = 1 имеем ^1. F.9) Теперь из F.6), F.7), F.8) получаем uM = \imu{L/M). F.10) Л->оо Согласно теореме двойственности 1.5.1, аппроксимация Наде [M/L] функции j—- совпадает с [L/M]'1, где [L/M]—аппрокси- [L/M]—аппроксимация Паде функции /. Будем обозначать через С (MIL) опре- определители Ганкеля, соответствующие аппроксимациям Паде [M/L] функции ?(г) = ?ут. С учетом этих обозначений, так же как при выводе формулы F.6), получим и по аналогии с F.8) вводим обозначение с (M/L) с (Mil— i) ~~ ^¦l*> ^- F.13) С(/- — \/M)C(L/M) (F.13) вытекает из F.12) и формулы Адамара A.6.9)). В частном случае L=1 имеем F.14) где g(z)= 2 §iz'- С помощью введенного обозначения F.12) для 1=0 нулей v, функции /(г) получаем формулу Jim v(L/M) = vL. F.15) Для приближенного вычисления значений ит, vt нам пона- понадобятся следующие правила. Правило произведения u(L/M)u(L/M)-^u(L/M-\ l)u(L+\/M). F.16) Доказательство. Из определений F.8), F.13) получаем u(L/M)v(L/M)= ("Г ' с~(/1/Л4J~ / + ) = u{L/M+\)v(L+\/M). Правило суммы F.17)
106 Гл. 3. Аппроксимации Паде и численные методы 4VA/-H) v(L+l/M) v(L+\/M+\) (a) (b) Рис. 1. Графическое изображение правил, связывающих элементы ы-и-таблицы: (а) правило произведения, (Ь) правило суммы. Доказательство. Используя F.8), F.13) и тождество Силь- Сильвестра, получаем следующие равенства: С (L+1/M) С (L— 1/M-fl) С (L+1/M+1)—С (L/M) С (L/M+2) С (L+1/M) _ _ C(L+\/M)C(L/M+lf _C(L+l/M)C(L/M + l) ~C(L/M)C{L/M+l) С (L+l/M+\)~C(LIM)C(L+l/M + l) ' Преобразуя аналогичным образом разность и (L-\- 1/M-f-1) — — v(L+1/M), получим тот же результат. Графические представ- представления полученных тождеств приведены на рис. 1. Вся совокупность величин и {L, M), v(L/M), L, М = 0, 1, 2, ..., может быть найдена с помощью соотношений F.16). F.17) по начальным данным u(L/l) = cL_JcL (см. F.9)), если предполо- предположить дополнительно, что w(L/0) = 0, L = 0, I, 2, ..., F.18) u@/M) = 0, M = 1, 2, 3 F.19) Легко видеть, что F.18) согласовано с F.17) при М = 0, F.8) и F.13); F.19) согласовано с F.17) при L = 0, F.8) и F.13). Множество величин {u(L/M), и (L/M)}, L, /VI =0, 1, 2, .. ., изобра- изображается обычно в виде u-u-таблицы [Gragg, 1972], показанной в табл. 1. ТАБЛИЦА 1. «-^-ТАБЛИЦА 0 ~0 1~~0 0 0 «(I/I) t< 1/2) иA/3) иA/4) ••• i>, "A/1) "A/2) «A/3) иA/4) О оB/1) с B/2) t-B/3) иB/4) ••• ог "B/1) иB/2) «B/3) иB/4) О uC/I) uC/2) uC/3) ИЗ/4) ••• с3 «C/3) иC/4) «I «2 ».!
3.6. Q.D.-алгоритм и проблема корней 107 Итог. Первые дпа столбца и первая строка u-u-таблицы со- содержат начальные данные, которые определяются согласно F.9), F.18), F.19). Остальные элементы таблицы однозначно опреде- определяются по начальным данным с помощью Q. D.-алгоритма, выра- выраженного правилами F.16), F.17). Полюсы иг, «2, ... функции /(г) являются пределами ««-столбцов» таблицы; нули vu vs, ... функции /(г) являются пределами «и-строк» таблицы. Теоретически скорость сходимости Q. D.-алгоритма для полю- полюсов и нулей является геометрической. Чтобы увидеть это, мы сошлемся на анализ, который будет осуществлен в § 6.2. В обо- обозначениях этого параграфа, согласно F.2.11), имеем |detC| = |C(L/M)|, F.20) и из F.2.22) мы замечаем, что доминирующая часть в F.20) имеет вид м |detD| = /ClIl«irS F-21) где К—положительное число, не зависящее от L. Сравнение соотношений F.2.11), F.2.14) —F.2.22) и F.2.23) показывает, что м Последнее соотношение называется формулой Адамара; эта фор- формула справедлива в предположении, что функция/(г) мероморфна в круге | г | г?С R и имеет ровно М полюсов с учетом кратностей в кольце 0 < | г \ < R. Предположим, что полюсы ик_х, им и uM+i имеют различные модули: F-23) Подстановка F.22) в F.8) показывает, что F.24) где UM UM+i г (Согласно F.23), имеем 9 < 1, и из F.24) вытекает, что и-столбцы н-у-таблицы сходится геометрически. Практически Q.D.-алгоритм в том виде, как он описан выше, является неустойчивым. В «-столбцах, которые теоретически сходятся к полюсам функции / (г) согласно F.10), F.14), проис- происходит накопление ошибок. Чтобы продемонстрировать это, рас-
108 Гл. 3. Аппроксимации Паде и численные методы смотрим соотношение v (Z.+ 1/М) _ С (L/M+ l)-C{L + l/M — \)-C (L—l/M) v (L/M) ~~ C(L—\/M+ \)-C{LIM — 1)-C (L+l/M) ' которое получается из F.13). Теперь из F.10) находим, что и мы можем грубо оценить v(L/M) следующим образом: Отсюда следует, что v (L/M) —* 0 при L —*¦ оо. Мы приходим к заклю- заключению, что вычисление столбца v(L/\), L = 0, 1,2, ..., связанное с вычитанием близких величин в первом u-столбце, приводит к срав- сравнительно большим ошибкам округления (относительная точность мала). Посредством правила умножения F.16) большие относи- относительные ошибки передаются на каждый элемент столбца u(L/2)y L = 0, 1,2, ..., и вычисление и2 становится неустойчивым. Те же соображения относятся и3, и4, .... Для исправления неустойчи- неустойчивости Хенричи [Henrici, 1958] предложил усовершенствованную форму Q.D.-алгоритма, в которой порядок вычислений устанав- устанавливается таким образом, чтобы избежать арифметических дейст- действий, приводящих к большим ошибкам. Усовершенствованный Q.D.-алгоритм. Этот алгоритм может быть использован для вычисления полюсов функции f(z) при условии, что модули полюсов различны. Процедура начинается с вычисле- вычисления коэффициентов gt ряда г(Jг/ |/( Последовательность {gt, i — 0, I, 2, ...} определяется по после- последовательности {С{, t = 0, 1, 2, ...} с помощью рекуррентных фор- формул 1 v gt = — Z 0 ft=0 Зате.м в соответствии с F.14) определяются величины v(l/M) = gM_1/gM. Остальные начальные соотношения F.9), F.18), F.19) сохра- сохраняются. Усовершенствованная форма Q.D.-алгоритма требует, чтобы вычисления, основанные на формулах F.16), F.17), произ- производились в том порядке, который схематически показан в табл. 2: элементы, обозначенные цифрами, вычисляются в порядке нуме- нумерации: 1,2, 3, ..., 11, 12, 13, ..., 21, 22
3.6. Q.D.-алгоритм и проблема корней 109 ТАБЛИЦА 2. ЭЛЕМЕНТЫ ы-у-ТАБЛИЦЫ, СХЕМАТИЧЕСКИ ПОКАЗЫВАЮЩИЕ ПОРЯДОК ВЫЧИСЛЕНИЙ В УСОВЕРШЕНСТВОВАННОЙ ФОРМЕ Q. D.-АЛГОРИТМА 0 0 0 0 0 1.A/1) 0B/1) «C/1) «D/1) «(VD A) B) C) О (П) A2) A3) "B/D B1) B2) О C1) C2) "C/0 D1) «2 Отметим, что усовершенствованный Q.D.-алгоритм может есте- естественным образом рассматриваться как практический метод на- нахождения нулей мероморфной функции g(z) = 2wgB(, заданной степенным разложением, при условии, что нули имеют различные модули. Трудный случай, связанный с наличием у /(г) нулей с одинаковыми модулями, исследован в работах [Henrici, 1974, с. 642] и [Rutishauser, 1954, с. 35]. Упражнение 1. Если /(г)—полином, то последовательность F.9) не определена. Как применять Q.D.-алгоритм в этом случае? Упражнение 2. Разумно ли применять е-алгоритм к и-столб- цам и-у-таблицы? Упражнение 3. Построить u-a-таблицу для функции /(z) = = expz.
Глава 4 СВЯЗЬ С НЕПРЕРЫВНЫМИ ДРОБЯМИ § 4.1. Определения и рекуррентные соотношения В этой главе мы не стремимся пересказать содержание книги Джоунса и Трона [Jones and Thron, 1980]1), которая посвящена общей теории непрерывных дробей. По этой теме в конце настоя- настоящей книги имеется выборочная библиография. Здесь же приво- приводятся только те результаты из теории непрерывных дробей, кото- которые помогут нам в изучении аппроксимаций Паде. Начало исследованию непрерывных дробей на Западе поло- положил, по-видимому, Бомбелли [Bombelli, 1572]; Джоунсу и Трону [Jones and Thron, 1980], а также Брезинскому принадлежат исто- исторические обзоры. В § 4.7 этой главы приводятся основные тео- теоремы о сходимости непрерывных дробей общего вида; за доказа- доказательствами мы отсылаем читателя к упомянутой выше книге. В основном мы имеем дело с такими непрерывными дробями, ассоциированными со степенными рядами, которые связаны с ап- аппроксимациями Паде. В самом деле, в следующей главе мы уви- увидим, что S-дроби соответствуют рядам Стильтьеса, а веществен- вещественные У-дроби ассоциированы с рядами Гамбургера. Подходящие дроби таких дробей образуют последовательности в таблице Паде. Вне всяких сомнений, часть теории аппроксимаций Паде воз- возникла на основе теории непрерывных дробей. Мы рассматриваем таблицу Паде как основной набор рациональных аппроксимаций степенного ряда, а подходящие дроби различных непрерывных дробей, соответствующих этому ряду, будем рассматривать как некоторые последовательности в таблице Паде. Вопрос о выборе наилучшего представления ряда непрерывной дробью часто прояс- проясняется, если сначала узнать, какая последовательность в таб- таблице Паде имеет нужное асимптотическое поведение или скорость сходимости. Такой подход, безусловно, не отражает историче- исторического развития темы. ') Джоунс У., Трон В. Непрерывные дроби. Аналитическая теория и при- приложения. Пер. с англ.— М.: Мир, 1985.
4.1. Определения и рекуррентные соотношения Ш Непрерывная дробь в общем случае имеет вид A.1) Величины at и bt, входящие в A.1), называются элементами не- непрерывной дроби. Обычно это вещественные или комплексные числа. Дробь можно записать в более компактном виде: имеющем тот же смысл, что и A.1). Обрывая дробь, мы полу- получим ее подходящие дроби, которые записываются в виде отно- отношения Aj/Bi, i=0, 1, 2 В частности, имеем Ai — h I пх — W = b» + Если дробь содержит только конечное число элементов, то она принимает вид Ьп + ^ ^ ... ^ A4) Такая дробь эквивалентна A.2) при ап+1 = 0; она называется конечной непрерывной дробью. Величина конечной дроби опре- определяется с помощью обычных арифметических действий. Отметим также, что A.4) —(п+1)-я подходящая дробь дроби A.2). В общем случае говорят, что непрерывная дробь сходится и ее величина равна v, если lim (yr)=v. A-5) И-*- GO V П / Другими словами, если предел отношений AjBn при п—>-оо существует, то он называется величиной непрерывной дроби. В противном случае говорят, что непрерывная дробь расходится. Термин «ряд» употребляют по отношению к последователь- последовательности чисел с0, clt с2, ..., которые надо просуммировать. Этим же словом обозначают величину указанной суммы, если она конечна. Аналогичная двусмысленность в терминологии возникает для не- непрерывных дробей. В литературе можно встретить как выраже-
112 Гл. 4. Связь с непрерывными дробями ния A.1), A.2), так и выражения или Они означают, что пары (a,, br), («2, b2) (a3, b:i). ... образуют непрерывную дробь и, кроме того, величину дроби в случае ее сходимости. Отметим, что такая двусмысленность обычно не при- приводит к каким-либо недоразумениям. Определение сходимости непрерывной дроби (см. A.5)) дается через величины подходящих дробей AjBn. Можно строить раз- различные непрерывные дроби, у которых все соответствующие под- подходящие дроби равны. Такие дроби называются эквивалентными. По определению эквивалентные дроби имеют одну и ту же вели- величину. Например, следующее преобразование: 1 + A.6) является эквивалентным, так как сохраняет величины подходя- подходящих дробей; при этом элементы новой дроби имеют вид [а± Л /_02_ Л f_a1_ \bi ' J \ &1&2 ' J ' \ Ьф3 ' Аналогичным образом можно на место всех а{, /=1, 2, ..., по- поставить единицу: Такая свобода в представлении непрерывной дроби порождает эквивалентные преобразования вида где параметры {е^ е2, е3, .. . \ обратимы. Подходящие дроби A.4) задаются отношениями AjBn. Можно, однако, определить числители Ап и знаменатели Вп по отдель- отдельности так, чтобы их отношение давало A.4). Теорема 4.1.1 [Euler, 1737]. Для непрерывной дроби положим A0 — b0, A1 = b1b0-\ au A, = biAi_1^-a,At_t при / = 2,3,4,... A.10)
4.1. Определения и рекуррентные соотношения 113 и Во=1, В, = Ь, fif = &fSf_,-l-Q,B,_2 при / = 2, 3, 4, .... A.11) Тогда отношение Ап/Вп равно (я+1)-й подходящей дроби A.9). Доказательство. Нетрудно проверить, что для Ао/Во и Al/Bi выполняются соотношения A.3). Докажем утверждение теоремы индукцией но т. Предположим, что оно справедливо для i = m. Тогда для (т + 1)-й подходящей дроби имеем ^ т т^т— \Л~ &тА т — 2 /i ] О\ Для того чтобы найти (т+2)-ю подходящую дробь, достаточно в выражении для AjBm заменить Ьт на Ьт -\-am+l/bm+l. Используя A.10) —A.12), получаем — ~h 7T _i n w v • / Нами получены наиболее важные формулы в теории непрерыв- непрерывных дробей: рекуррентные соотношения для числителей А{ и зна- знаменателей В{. В качестве упражнения можно проверить эти фор- формулы для отношения Аг)Вг и убедиться, что имеет место A.3). Полагая в формулах Ь0 = 0, приходим к рекуррентным соотно- соотношениям для дроби A.6). В качестве следствия из теоремы 4.1.1 получаем, что следующий вариант определения сходимости не- непрерывной дроби полностью эквивалентен предыдущему. Альтернативное определение. Непрерывная дробь сходится к величине v, если отношение A,jBn величин Ап и Вп, определенных рекуррентными соотношениями A.10) и A.11), стремится к v при /г —>• оо. Упражнение 1. Показать, что 1 + 1 + 1 +""' К + р. + р. + — Упражнение 2. Показать, что flj Oj _1 1 1 1 1 + 1 + 1 + " " ~~ 1/ui+01/02 + 02/@1031 + 0103/@204) +а2о4/(о1Озо5) + Упражнение 3. Пусть A,jBn—n-я подходящая дробь дроби Л 1 ?l Ч±1 ^ в"гл+&+* + —
114 Гл. 4. Связь с непрерывными дробями Доказать, что ее элементы можно выразить в терминах числи- числителя и знаменателя: Ь„ = А0, а1 = Аг — ВгА0, ba = Bi и AjBj^i — Aj_iBj , Л/_2В/ — ДЛЯ § 4.2. Непрерывные дроби, связанные с рядом Тейлора Формальный ряд может быть преобразован в непрерывную дробь очень простым способом. В этом параграфе мы игнори- игнорируем все вопросы о сходимости. Предполагается, что все необ- необходимые операции обращения определены и что мы не столк- столкнемся с вырожденным случаем. Пусть дан степенной ряд Произведем операцию обращения ряда: , Cj Cj -г- ¦ • • — -t- <-, г -+- сг г ¦+- ...) , отсюда получаем переразложение ряда B.1): qJ^q2-\-CZ2jt...=C -| — . B 2) Теперь обратим ряд Сл с) откуда получаем другое переразложение: *+...=?!„+ ^ . B.3) С помощью такого итерационного метода мы приходим к непре- непрерывной дроби, соответствующей ряду B.1); имеет место фор- формальное равенство: il! Подходящие дроби для дроби B.4) — это рациональные функции от г. Для достаточной общности предположим, что непрерывная
4.2. Непрерывные дроби 115 дробь, соответствующая степенному ряду, имеет вид h -Х- 2li a*z ?*L ¦ /о ел О0+ bi+-s-+bt+..., B.5) тогда B.4) —частный случай B.5). Несколько первых подходя- подходящих дробей дроби B.5) можно легко найти: Лр (г) _ , Л] (г) _Ьф1+а1г Во(*) °' В,(г)~ h At (г) bublb2-Jt-(aib0-ira1bt) г 9 Кч Таким образом, формулы B.6) получаются из A.3) заменой at на atz для всех i. Из результатов § 4,1, прежде всего из тео- теоремы 4.1.1, вытекает, что числители At (г) и знаменатели Вг (г) дроби B.5) находятся по формулам и В В S°(Z)=1'B fi'(z)=^' B.7b) Следующая теорема выражает связь между подходящими дро- дробями дроби B.4) и элементами в таблице Паде ряда B.1). Теорема 4.2.1. Если сг и все коэффициенты с\" отличны от нуля, то непрерывная дробь B.4) имеет тейлоровское разложение B.1). В этом случае аппроксимации Паде ряда B.1) совпадают с подходящими дробями непрерывной дроби) при М = 0, 1, 2, .... Замечание. Об областях сходимости как ряда B.1), так и дроби B.4) в теореме ничего не утверждается. Если же такие нетри- нетривиальные области существуют, то они могут быть различными. Даже если B.1) и B.4) сходятся, из теоремы прямо не следует, что эти пределы равны. Доказательство. Так как каждое из выражений B.1), B.2), B.3) имеет одно и то же формальное тейлоровское разложение, то первое утверждение теоремы легко доказывается по индук- индукции. Для того чтобы установить B.8), заметим, что = 0, deg116 Гл. 4. Связь с непрерывными дробями ' М% Рис. 1. Лестничная последовательность в таблице Паде, соответствующая под- подходящим дробям дроби B.4). B.10) Докажем B.8) по индукции. Предположим, что deg{A2m(z)}^m, deg {Bim (г)\ < т, deg {А2m+1 (г)} < m + 1, deg {Вгт+1 (г)} < т для т = 0, 1, 2, ..., М. Тогда deg \АШ+, (г)} = deg {Ьш+,А2т+, (г) + агт+ггАгт (г)} < т + 1, deg {Лгт+3 (г)} = deg {Ьгт+3А,т+, (г) + агт+3гА2т+, (г)} < m + 2, deg {B2ffl+2 (г)} = deg {&2m+Am+1 (г) + а2,я+2гВ2т (г)} < т + 1, deg{B2m+3 (z)} = deg {b2m+3B.im+2(z) + a2m+3zB2m+l (z)} < m+ 1. Следовательно, для всех m дробь Ат (z)/Bm (г) имеет числитель и знаменатель нужного порядка, и ее разложение в степенной ряд совпадает с B.1) до степени гт включительно. Тем самым выполняется B.8). Отметим, что дроби {Ат(г)/Вт (г)} образуют в таблице Паде последовательность в виде лестницы (рис. 1). Для примера отметим, что, используя пять коэффициентов тейлоровского разложения функции ехрг, можно показать, что ¦ . г г г г ехр г — i -f- — _~2 +-д _~2 B.11) Этот пример показывает преимущество представления B.5) перед B.4), так как в таком представлении элементы дробей можно выбрать целыми числами. Вид общего члена в B.11) будет полу- получен в § 4.6. Если мы обратим B.11) и заменим г на —г, то полу- получим другое представление: B.12)
4.2. Непрерывные дроби 117 w Рис. 2. Лестничная последовательность в таблице Паде, соответствующая под- подходящим дробям дроби B.13). Общий вид такого представления следующий: B.13) Числители и знаменатели дроби B.13) находят по формулам Л,+1(г) = &,+1Л,(г) + о,+1гЛ, t(z), i = 2%, 4, ..., BЛ4а) и 2) 2 i = bi+1Bi(z)+ai+yzBl_1(z), f=2, 3, 4 B.14b) Аппроксимации Паде ряда B.1) и подходящие дроби для дроби B.13) связаны соотношениями 1; B.15) в таблице Паде они образуют «лестницу», показанную на рис. 2. Сравнение разложений B.5) и B.13) с последовательностью аппроксимаций Паде показывает, что разложение B.5) предпочти- предпочтительнее в тех областях г-плоскости, где |/ (г) | возрастает при возрастании |г|, а разложение B.13)—там, где \f(z)\ убывает. Если функция четная или нечетная, то она преобразуется в непрерывную дробь более простым образом; подробно этот вопрос здесь обсуждаться не будет. В случае когда функция чет- четная, используется одно из разложений: «even) /z\ __ _?i. 2^ Оз?2 ' W * b b ¦ ¦ •
118 Гл. 4. Связь с непрерывными дробями или «even) /-ч _ и , °lZ2 а2г2 Если функция нечетная, то, как правило, выбирается представ- представление Обычно используется наиболее удобная форма представления в виде непрерывной дроби, которая выбирается по следующему правилу. Подходящие дроби всех известных переразложений задан- заданной функции располагаются в таблице Паде этой функции в виде последовательности. Из всех представлений выбирается то, которое обладает нужными асимптотическими свойствами. Упражнение 1. Доказать соотношения B.15). Упражнение 2. Найти, чему соответствуют в таблице Паде подходящие дроби непрерывной дроби B.16). § 4.3. Алгебраические и численные методы В этом параграфе сначала рассматривается один практический метод разложения степенного ряда в непрерывную дробь (с тео- теоретической точки зрения задача о разложении была решена в пре- предыдущем параграфе). Затем обсуждаются некоторые методы численного нахождения величины непрерывной дроби. Метод Висковатова [Viskovatov, 1803] — удобный практический метод построения непрерывной дроби, или эквивалентной ей лестничной последовательности аппроксимаций Паде, по задан- заданному степенному ряду, Он позволяв! избежать операции обраще- обращения рядов, которая применялась в B.2) и B.3). Этот экономия ный метод полезен как в теории, так и в машинных вычисле ниях. Метод основан на формальном тождестве СО 6A 2^ ±brz' C.1) X 2 (°r+i—«(Л+г/ьо)*1' г=0
4.3. Алгебраические и численные методы 119 Метод Висковатова проще всего объяснить на примере: exp (z) = 1 -f z + 4- + 4- + -|г + • • • = = + 2 т 6 т 24 г Тем самым в невырожденном случае этот метод позволяв! прямо находить лестничные последовательности аппроксимации Паде. Другой прямой экономичный метод построения непрерывной дроби по степенному ряду—Q.D.-алгоритм — будет подробно рассмотрен в следующем параграфе. Рассмотрим теперь второй важный вопрос этого параграфа — численное нахождение величины дроби. Ни один из известных методов вычисления непрерывной дроби не признан наилучшим, поэтому мы приведем здесь три основных метода, не выделяя особо какой-либо из них. Итак, задача заключается в том, чтобы по заданным элементам at, b{ и значению переменной г найти величину дроби z: про которую известно, что она сходится. Метод прямых рекуррентных соотношений. Числители At (z) и знаменатели В,- (г) вычисляются по рекуррентным соотноше- соотношениям B.7). Из-за удобства вычисления подходящих дробей этот метод является одним из общепринятых методов. На практике иногда оказывается, что грубое приближение C.4) дает готовую оценку скорости роста /1„ и Вп. Уравнение C.4) является точным в случае постоянных коэффициентов а{ и Ь{ в B.7). При |/"i|>|r2| в C.4) преобладают первые члены, а вто-
120 Гл. 4. Связь с непрерывными дробями рые становятся несущественными при п —<¦ оо. Эти рассуждения помогают понять, почему метод прямых рекуррентных соотноше- соотношений может привести к следующим неудачным результатам при численных расчетах. (a) Переполнение при вычислении величин Ап и Вп с плавающей запятой. Если | rt |^> 1, то в процессе вычисления нужных вели- величин с плавающей запятой может произойти переполнение. В этом случае рекомендуется очевидный пересчет величин Ап, Ап_Л, Вп и В11_1 в критической точке. Подобным же образом предупреж- предупреждается появление машинного нуля. (b) Подавление искомого решения доминантным решением. Пусть уравнение B.7) имеет другое решение Ап, Ви, порожденное иными начальными данными (т. е. А„Ф Ао), и Ап/А„ —»- 0, BjBn —* 0. В этом случае истинное решение А„, Вп может подавляться доми- доминантным решением. Ошибка округления при введении начальных данных всегда приводит к такому эффекту при рассматриваемом методе вычислений. То же самое замечание относится к методу обратных рекуррентных соотношений, принадлежащему Миллеру. (c) Накопление погрешности а доминантном решении. Если \Ап\ и \Вп\ — убывающие последовательности, то использование метода прямых рекуррентных соотношений может привести к на- накоплению погрешности вычислений. Этот факт был эмпирически обнаружен [Jones and Thron, 1974] для следующей непрерывной дроби: Т-7-Т-Т--. <3> значение которой вычислялось в точке 2=1/4. При этом опера- операции проводились в форме с плавающей запятой, а результаты находились с фиксированной десятичной точностью. Значение дроби вычислялось на границе области сходимости; тем самым этот пример является характерным для ситуации, в которой накапливается ошибка. Метод обратных рекуррентных соотношений. Этот метод заклю- заключается в том, что значение п-н подходящей дроби вычисляется начиная с ее конца. Положим т» _ о, /ли — и> tin) /г\_ а'г i—n n 1 п 2 ..., 1 C 6) Тогда /У" (г) — п-я подходящая дробь для /(г). Основной недоста- недостаток этого метода заключается в том, что необходимо заранее знать, при каком п подходящая дробь хорошо приближает /(г).
4.3. Алгебраические и численные методы. 121 Формула суммирования. Подходящая дробь непрерывной дро- дроби C.3) находится по формуле Ш- C7> где величины pi, р2, ..., р„ определяются через элементы непре- непрерывной дроби: J C.8) 4 '3-9> Доказательство. Воспользуемся тождеством (ср. с G.6)) А„_( Ап Л„_ I3-10) Положим Pt= ~ °нВ''"' , t = 3, 4, 5, ... . C.11) Легко проверить, что C.8) выполняется. Для того чтобы устано- установить C.9), воспользуемся рекуррентными соотношениями из которых соответственно получим L l C.12) После перемножения C.12) и C.13) получаем C.9). Следствием C.8), C.9) и эквивалентного преобразования A.6) является новое представление An (г) __ Pi Pi Рз рп /о м\ В „{г) 1 — 1+ра — 1+Ps —" " "— 1—Ря К ' (ср. с E.55)). Достоинство формул суммирования C.7) —C.9) заключается в итерационное™ вычислений. Это важно в том случае, когда скорость сходимости заранее не известна.
122 Гл. 4. Связь с непрерывными дробями Более подробно по поводу численных методов, в особенности метода оценки погрешности, см. книгу Джоунса и Трона [Jones and Thron, 1980], а также [Blanch, 1964] и [Gautschi, 1967]. Упражнение 1. Доказать, что величина дроби сходящейся при z г 2 2 2 Z '-j-T-T-T—••• • ; 1/4, удовлетворяет уравнению Вывести формулу для величины дроби. По поводу нахождения величины периодической непрерывной дроби см. [Pringsheim, 1910]. Упражнение 2. Найти числители и знаменатели подходящих дробей дроби с _Р ? Р Доказать, что при q > 0 и § 4.4. Различные представления непрерывных дробей В основном мы имеем дело с такими непрерывными дробями, у которых подходящие дроби являются аппроксимациями Паде степенного ряда. Для сохранения этой связи с аппроксимациями Паде ниже будут рассматриваться непрерывные дроби, явным образом содержащие комплексную переменную г. Все формулы остаются справедливыми и при г=1; это может быть полезно для общей теории непрерывных дробей. Докажем прежде всего некоторые детерминантные формулы для числителей и знамена- знаменателей подходящих дробей. Теорема 4.4.1. Для числителей Ап(г) и знаменателей Bn(z) подходящих дробей непрерывной дроби справедливы формулы '+" D.1) — аЛг о, — а2г 1 Ь2 —а3 О 0 а„ i' —ааг D.2)
4.4. Различные представления непрерывных дробей 123 л = 0, 1, 2, ..., и Ь1 —агг 1 — а3г 1 Ья — а. О , D.3) л=1, 2, 3, Доказательство. Разлагая определитель D.2) по последнему столбцу, получаем An(z) = bnAn_i (г) АГапгАп_г (г). D.4) При л = 0 Ай(г) = Ь0, при л = 1 At(z) = bobl-\-a1z. Из рекуррент- рекуррентного соотношения B.7а) и D.4) вытекает представление D.2). Аналогично, используя соотношения B.7Ь), получаем пред- представление D.3) для знаменателей Bn(z). Теорема 4.4.2. Для числителей Ап(г) подходящих дробей непре- непрерывной дроби D.5) имеет место формула D.6) л = 2, 3, ..., для знаменателей Вп(г) справедлива формула D.3). Доказательство аналогично доказательству теоремы 4.4.1. В соответствии с результатами § 4.2 определители D.2) и D.3) представляют собой числители и знаменатели аппроксимаций Паде вида [М/М] или [УИ + 1/Af]. Формулы D.2) и D.3) содер- содержат величины аг и bt — элементы непрерывной дроби D.1). При- Приведем теперь выражение для дроби D.1) через определители Ган- келя с той целью, чтобы представить D.1), D.2) и D.3) явно через коэффициенты с,- разложения f (г) в ряд Тейлора. Иг) ла 1 0 —а. bs ш b, + —at Г а3г bs + " 2 tt— 1 1 0 ьп
124 Гл. 4. Связь с непрерывными дробями Теорема 4.4.3. Непрерывную дробь D.1) можно представить в виде П,\-гЛ-СЛ CJ1 гСB/2)/СA/1) гСC/2)/СB/1) ,. „ f(Z)-co-t , _ Cl _ с B/1)/С A/1) — С B/2)/С B/1) — ^-'f Начальные элементы дроби D.1) равны 60 = с01 а1 = с1, Ь,= 1, аа = —ся, Ь^с^. D.8) При И = 1, 2, 3, ... имеем _ { + i/ + ) a2M+i- с (М/М) • С (AI/AI) ' при М = 2,3, 4, ... _ - — С(А1/Л«—1)' _ С (М/М) ~ 4 —1)" Числители и знаменатели подходящих дробей для всех М удовлет- удовлетворяют соотношениям г) B(z) QM«4z) ), DЛЗ) Замечание. Исли непрерывная дробь D.1) имеет заданное раз- разложение в ряд Тейлора, то ее элементы а{, Ь{ по формулам D.8)— D.12) определяются однозначно с точностью до эквивалентного преобразования; условия D.13) определяют эти элементы однознач- однозначно. Доказательство. В D.3) положим 2 = 0, получим Я„(О)=ПЬ,. D-14) Выбирая коэффициенты bt в соответствии с формулами D.10) и D.12), имеем 2М Д ь, = QlM/м] (О) = с (М/М) D.15а) 2М + 1 П D.156)
4.4. Различные представления непрерывных дробей 125 Непосредственной проверкой убеждаемся, что в силу начальных условий D.8) выполняются соотношения Л„(г)=Л = с0, В0(г) = 1. Л ^° Gl Z — Л- B1(z) = b1 = l D.16) Чтобы доказать соотношения D.9) и D.11) для элементов а,-, вос- воспользуемся тождествами Фробениуса C.5.3.) и C.5.7). Тождество ш/м м+\/м м+\/м+\ имеет вид . D.17) Сравним теперь рекуррентное ссотношение B.7в) для знаменате- знаменателей B2M+2(z) четной степени + а гм+2 с D.17). Нетрудно видеть, что если агЛ,+2 определены по форму- формуле D.11), то ?2AI+2(z) = Q[M + I/M + 1]B) D.18) при условии, что все знаменатели меньшего порядка совпадают. Тождество Л//Л/-1 М/М м+\/м имеет вид С (М/М) Q\-M + i'M'i — zC(M+ D.19) Знаменатели нечетной степени В2М+1 (г) также удовлетворяют со- соотношению B.7Ь), поэтому Сравнивая это уравнение с D.19) и учитывая формулу D.9) для «2Л1+,, получаем B2M+1(z) = QlM + UM]z, D.20) если все знаменатели меньших степеней совпадают. Объединяя D.18), D.20) и D.8), получаем по индукции представление D.13). Числители Ргм/м] Ир[м + 1/м] аппроксимаций Паде удовлетворяют тем же самым соотношениям D.17) и D.19), что и знаменатели qim/m] и QiM + i/M]- аналогичное относится и к числителям Ап дроби D.1). Следовательно, соотношения D.13) доказаны по индукции с учетом начальных условий D.16).
126 Гл. 4. Связь с непрерывными дробями Теорема 4.4.4. Формальное равенство между степенным рядом и непрерывной дробью имеет место, если h С (М/М) п _ С(М/м+\) С(М — 1/М)' D.22) С(М/М) при М= 1,2, 3,... . Числители и знаменатели подходящих дробей, построенные рекуррентно, совпадают с числителями и знамена- знаменателями из теоремы 4.4.3. Следствие. При помощи эквивалентного преобразования равенст- равенство D,21) можно представить в виде 2*чг—-+—г~+~г+ •••• D-id) где С A /2) а, =с0, а^ = —с,/с„, аз = —СA/1)Со ¦ D.24) M — 1/Af— 1) ' _ C(Af//M+D С (М — 1//М —1) D-25) — С(М/М)С(М — [/М) При М = 2, 3, 4, В § 5 мы увидим (см. формулы E. 5. 25) и E. 6. 33)), что такое представление и его сжатие особенно важны для рядов Стильтьеса. Тождество D.23) носит формальный характер, его основное содержаниег заключается в связи между степенным рядом и по- последовательностью аппроксимаций Паде [М/М] и [М—\/М]. Элементы а\ из D.23) относительно легко вычисляются непосред- непосредственно по коэффициентам с, с помощью Q. D.-алгоритма; соотно- соотношения D.25) для вычислений обычно не применяются из-за возможной плохой обусловленности определителей Ганкеля. При вычислениях разложение D.23) обычно записывают в виде \. ( ^0 Q\% €l% Ч%% ?-2% i Л с\с.\ 2*ciz =Т-П~—~~г— 1 —~Г— ¦••• ^ ' 1=0
4.4. Различные представления непрерывных дробей 127 где ^ = Cl/c0, $ = ?№!, D.27) 0 С(М/М)С(М-2/М-1) Чм~С(М— \/М — \)С(М — 1/М)' 1 „ С{М/М+\)С(М-ЦМ-1) . при М = 2,3,4, Напишем более общее разложение •4=0 1 = 0 частным случаем которого при J = 0 является равенство D.26). Из D.28) следует, что при М = 2, 3, 4,... и У>0 , C(LiM)C(L-2iM~\) 4m-C(L-\/M-1)C(L-1/M) ( LM + l)C(Ll/Ml) ем— C(L_ i/M)C(L/M) ' ( где, как обычно, L = M-\-J. Теорема 4.4.5. При i>0 и М = 1,2,3, ... элементы непре- непрерывной дроби D.29) удовлетворяют соотношениям =<Гм+1<7лГ D.31) qJM-ei^-e^\ + q\V- D.32) Первый способ доказательства. Из D.30) получаем C(L-\/M-l)C(L-l-l/M + l) J + , ,+1 — С (L/УИJ — м "Л1 где М =2, 3, 4,. .. и / ^0. Для УИ=1 соотношение D.31) про- проверяется непосредственно; можно не выделять этот случай, если воспользоваться соглашением C(L/Q)-^l. Подобным же образом проверяем D.32): ./.и C(L-l/M-\){C(L/M+\)C(L/M-l)-C(L+\/M)C(L-l/M)} м C(L—\/ C(L/M) С (L— 1/.M —I) , ./.и м Ям ~~ C(L—\/M)C(L/M)C{L/M — ~ C(L-l/M)C(L/M — 1)' C(L/M){C(L-2/M-\)C(L/M-\)-C(L — \/M—2)C(L- — C(L—\lM—\)C(L—\iM)C(LlM — \) _C(L/M)C (L-\/M-\)_ , _ ,+1 /M — 1) м ''Л1 ' Второй способ доказательства. Рассмотрим следующее алге- алгебраическое тождество для двух различных разложений в непре-
128 Гл. 4. Связь с непрерывными дробями рывные дроби: СО I J J J J i = J „ -j i cJ+i2 q\ z i\ z q% z ,. qq — CjZ -\ j —j— —j— —j ... . D.oo) Применяя к этим дробям сжатие по правилу E.3) из следующего параграфа, находим r „J , CjqizJ+i eiqjz"- J-J " {) z-\-{q( + e() z-\-{qi + ) Приравнивая коэффициенты в этих разложениях, получаем D.31) и D.32). Q.D.-алгоритм. Этот алгоритм можно использовать для построе- построения коэффициентов ц\, е\ в представлении D.26), которое приво- ТАБЛИЦА 1. Q. D.-ТАБЛИЦА. ДВА ЛЕВЫХ СТОЛБЦА ОПРЕДЕЛЯЮТСЯ УСЛОВИЯМИ D.35), ОСТАЛЬНЫЕ ЭЛЕМЕНТЫ НАХОДЯТСЯ ИЗ СООТНОШЕНИЙ D.31) И D.32). ВДОЛЬ КАЖДОЙ ДИАГОНАЛИ РАСПОЛАГАЮТСЯ ЭЛЕМЕНТЫ НЕПРЕРЫВНОЙ ДРОБИ D.29). eh el el- el я\ я} я\ f! el Я'г Я1 • el
4.4. Различные представления непрерывных дробей 129 дит к аппроксимациям Паде степенного ряда. В соответствии с D.34) выбираются начальные данные е{ = 0, J = l, 2, 3, .... qi = cJ+JCj, J = 0, 1, 2 D.35) Основу алгоритма составляют уравнения D.31) и D.32). Найден- Найденные элементы обычно располагаются в виде Q.D.-таблицы (см. табл. 1). Q.D.-таблица функции expz. Левый столбец состоит из нулей, следующий—из величин (см. табл. 2). Соотношения D.31) и D.32) связывают элементы таблицы, расположенные в вершинах ромба. Это позволяет нахо- ТАБЛИЦА 2. ЧАСТЬ Q. D.-ТАБЛИЦЫ ФУНКЦИИ ехр г 0 0 0 0 0 1 1 г т X 4 1 5 г -{ — Л 12 1 20 1 V 1 6 3 20 _ 1 6 1 "То дить столбец за столбцом табл. 2. Таким образом, получаем фор- формальное представление 1111 ехг = - - — — — ^ которое согласуется с F.1а). Можно расширить Q. D.-таблицу, полагая #+i = 0 для г=1, 2, 3, .... В таком случае все элементы в вершинах ^-столбцов, кроме q\, равны нулю и правило ромба справедливо для всех элементов таблицы. Если используются коэффициенты обращен- обращенного ряда A.6.10) и формула е{ = с'1+1/с1 для t = 0, 1, 2, ..., то, выбирая подходящую точность вычислений, с помощью усовер- усовершенствованного Q. D.-алгоритма (см. § 3.6) можно вычислить всю
130 Гл. 4. Связь с непрерывными дробями таблицу более устойчиво; иначе Q. D.-алгоритм заведомо оказы- оказывается неустойчивым. Если функция /(г) мероморфна и все ее полюсы различны по модулю, то элементы ^-столбцов q'u сходятся к величинам, обратным полюсам / (г); аналогично, элементы е- столбцов сходятся к величинам, обратным нулям функции f (г) при условии, что нули различны по модулю. Это свойство выте- вытекает из D.30) и C.6.8). Полезно сравнить форму Q. D.-алгоритма, приведенную в этом параграфе, с формой из § 3.6 и убедиться в их отличии. Всюду в этом параграфе мы предполагаем, что все необходи- необходимые операции обращения определены. Может получиться так, что в D.1) bk — 0 для некоторого k. В этом случае определены только первые k подходящих дробей, и понятие сходимости теряет смысл. Подобным же образом Q. D.-алгоритм может прерваться, если встретится нулевой делитель. Хуже с вычислительной точки зре- зрения, если результаты вычисления порождаются погрешностью в выборе начальных данных. Мы отсылаем читателя к работе [Claessens and Wuytack 1979], где изучены обобщения формул D.31) и D.32) на случай Q. D.-таблицы, не являющейся нор- нормальной. Упражнение 1. Доказать теорему 4.4.2. Упражнение 2. Доказать теорему 4.4.4. Упражнение 3. Построить Q. D.-таблицу, соответствующую; коэффициентам Тейлора функции а^о(а> 1; 2)- § 4.5. Типы непрерывных дробей § 4.5.1. Регулярные дроби в невырожденных случаях Основным типом непрерывных дробей, используемых для пред ставления степенного ряда, являются регулярные С-дроби. Они имеют C(z) = be + ??+!f+ff+..., E.1) где а{ф0 при ( = 1, 2, 3, ... . Регулярные С-дроби можно по- построить по заданному степенному ряду методом Висковатова, Q. D.-алгоритмом или каким-либо другим удобным методом. По этим дробям восстанавливается степенной ряд; условие регуляр- регулярности заключается в том, что а{Ф§ для всех i. Последователь- Последовательное пере разложение подходящих дробей дроби E.1) показывает, как и в § 4.2, что записанные одна за другой подходящие дроби соответствуют последовательности аппроксимаций Паде [0/0], [1/0], [1/1], [2/1], [2/2], ..., заданного степенного ряда.
4.5. Типы непрерывных дробей 131 Если в процессе построения E.1) по степенному ряду мето- методом B.1)—B.4) величина а{ оказалась равной нулю, то необхо- необходимо использовать другое представление, например С-дробь общего вида E.11). Другая возможная форма регулярной С-дроби следующая; где элементы а{ отличны от соответствующих величин в E.1); для регулярности по-прежнему требуется, что а(^ф0 для всех i. Соотношение E.2) соответствует последовательности аппроксима- аппроксимаций Паде [0/0], [0, 1J, [1/1], [1/2], [2/2] Прост ое алгебраическое тождество приводит к сжатию непрерывной дроби. Положив р{=аг{, можно сжать E.1) и построить ассоциированную дробь: Подходящие дроби для А (г) разделяются подходящими дробями для С (г) II в этом случае занимают главную диагональ в таб- таблице Паде. Частным случаем регулярной С-дроби является дробь Стильтьеса или S-дробь: где af>0, t = l, 2, 3, ... Свойства подходящих дробей и схо- сходимость S-дробей подробно обсуждаются в следующей главе в связи с аппроксимациями Паде функций Стильтьеса. Мы уви- увидим, что если S-дробь сходится (например если выполняется усло- условие расходимости из § 4.7), то E-6) где ф(и) — ограниченная и неубывающая функция, определенная при О^и < оо. Используя переменную w = z~\ дробь E.5) часто представляется в виде S(«)\ — zs(z\ — Si- Si Si ?i E.7)
132 Гл. 4. Связь с непрерывными дробями который получается из нее простым эквивалентным преобразова- преобразованием; из результатов § 5.5 и 5.6 следует, что ' largo. |< я. E.8) Непрерывные дроби вида *L *L *» ..., E.9) где й/=#=0, /=1, 2, 3, ..., называются J-дробями. Если &г > О и /f вещественны при t=l, 2, 3, ..., то E.9) называется веще- вещественной J-дробью [Wall, 1931, 1932а, b, 1948J. Такая дробь может быть получена из E.7) с помощью сжатия E.3), если по- положить для i = 2, 3, 4 Таким образом, мы видим, что подходящие дроби для E.9) соот- соответствуют подходящим дробям дроби E.7), взятым через одну. В § 5.6 мы увидим, что любая сходящаяся вещественная У-дробь имеет представление оо j^ O, E.10) где 1|з(и)—ограниченная и неубывающая функция, определенная при —оо<и<оо. Равенство E.8) является частным случаем E.10), когда ор(ы) постоянна при — оо<н^0. $ 4.5.2. Дроби общего вида в вырожденных случаях Рассмотрим теперь ситуацию, когда метод Висковатова ока- оказывается непригодным и ряд не может быть представлен в виде регулярной С-дроби. Применение алгоритма прекращается на та- таком представлении E.11) 1+а3г 1 +
4.5. Типы непрерывных дробей 133 где с(/" = 0. Ясно, что если с^'фО, т0 имеется корректно опре- определенная процедура, с помощью которой можно найти числитель, равный с%"гг, и продолжить построение дроби. На основании этой процедуры определяется соответствующая дробь общего вида или С-дробь общего вида [Lieghton and Scott, 1939; Scott and Wall, 1940a, b] где а}ф0 и а, >1 для всех i. Подходящие дроби таких дробей не обязательно образуют в таблице Паде последовательности в виде простой лестницы. Рассмотрим ряд Дг) = 1 + г2—z° + kz«+... . E.13) Третья подходящая дробь С-дроби вида E.12), соответствующей этой функции, есть ^4 тогда как аппроксимация Паде [3/3] функции f (г) равна Первая и вторая подходящие дроби для /(г)—аппроксимации Паде [0/0] и [2/0], однако третья дробь E.14) не является аппрок- аппроксимацией Паде, кроме случая к = 0. В случае ХфО четвертая подходящая дробь для / (г) равна + 1 что является в точности аппроксимацией Паде [3/3]. Очень часто функции, имеющие естественную границу анали- тичности, задаются в виде ряда 2cjz'c лакунами Адамара, как, ;=о например, B.2.4). Говорят, что разложение имеет лакуну (п{, п\), если Cj = 0 для всех / в интервале n{^.j^.n'i. Ряд имеет лакуны Адамара, если для некоторого X > 0 ряд имеет бесконечное число лакун (лг, n'i), таких, что п}/п{^1+к. В связи с этим интерес- интересный пример С-дроби общего вида представляет собой дробь Ра- мануджана I? i^ — _ — — IX w— 1 + 1 + 1 +.1 +•'• ' которая имеет естественной границей аналитичности множество |z|=l, хотя ее степенной ряд не имеет лакун Адамара. Правильное соотношение между непрерывными дробями и таб- таблицей Паде восстанавливается с помощью Р-дробей [Magnus, 1962];
134 Гл. 4. Связь с непрерывными дробями Р символизирует процесс выделения главной части (principal part plus). Все подходящие дроби Р-дробей лежат в таблице Паде. Переходя к переменной co = z~1, Р-дробь можно записать в виде Р(г) с+--' EЛ6) где 6/(w) — полином от ш в точности степени N(. Например, третья подходящая дробь Р-дроби функции /(z), заданной рядом E.13), равна 14J ' Это в точности аппроксимация Паде [3/3] функции f{z). В дей- действительности рекуррентные соотношения D.4) для At и В{ и проверка условий порядка аппроксимации показывают, что 1-я подходящая дробь, непрерывной дроби E.16) есть диагональная аппроксимация Паде [Li/Lt], где L{= 2 Nf. /= i Далее, с помощью замены с0 в E.16) па полином Ьо (ш) непо- непосредственно определяются Р-дроби функций f(z), имеющих ряд Лорана с конечной главной частью. Этим способом Магнус опре- определил Р-дроби так, что каждому элементу таблицы Паде можно однозначно сопоставить Р-дробь функции zsf (z) для некоторого целого s. § 4.5.3. Алгоритм Висковатова в общем случае Для того чтобы обобщить алгоритм Висковатова на вырожден- вырожденные случаи, необходимо разумно выбрать способ представления аппроксимации Паде [L/M] в виде непрерывной дроби. Рассмот- Рассмотрим выражение г— Л. *""-' E.17) которое надо сравнить с С-дробью общего вида E.12) и с Р-дробью Магнуса E.16). В E.17) каждый элемент р{ (г) — это полином с условием р{@)ф0, а at—положительное целое число; р1 (г) и а, полностью определены соотношениями E.21) и E.22). Как обычно, предполагаем, что задано разложение в ряд / (z) = 2 ctz\ E.18) требуется найти аппроксимацию Паде [L/M] функции E.18) при ^М. Если L < М, то необходимо сократить E.18) на множи-
4.5. Типы непрерывных дробей 135 тель 2*, где k—наибольший показатель степени такой, что гк делит E.18), и начать с обратного ряда. Мы рассматриваем бес- бесконечный ряд E.18) для удобства представления; в действитель- действительности требуется только L-\-M-\-\ членов ряда E.18), а вопросы сходимости не рассматриваются. Следуя [Werner, 1979, 1980], определим обобщенный алгоритм Висковатова. Начальные данные. Пусть /0 = L, mo = M . E.19) /(г) = 2 ctz< - 2 СГ2''- E-20) i=0 1=0 Итерация. Для / = 0, 1, 2, ... процесс продолжается рекур- рентно. Определим af как наименьшее целое число, для которого aj>lj-mj, сЦ^О. E.21) Затем соотношением 00 ОС 2 сУ'г' = pj (г) + гаУ 2 ф'~а/ E.22) i=0 i'=a. можно определить полином pj(z) степени, строго меньшей, чем а./. Наша цель заключается в том, чтобы найти аппроксимацию Паде \ljlnij] выражения, стоящего в левой части E.12). Если «/> I/ I m.j, то положим n = j. В этом случае, как показано ниже в теореме 4.5.1, дробь E.17)—требуемая аппроксимация Паде. Если /, E.23) то, как показано в теореме 4.5.1, аппроксимации Паде [L/M] заданного ряда E.18) не существует. Рассмотрим теперь обратный ряд, определенный соотношением I -I E.24) Тогда, по крайней мере формально, имеем •Mz)+-^-L—• E-25) 1=0 Для того чтобы найти аппроксимацию Паде [Ij/irij] левой части E.25), найдем аппроксимацию Паде [nij/lj—aj\ левой части E.24). С этого момента положим l.+i = m, и tnJ+l = lj—aj. E.26)
136 Гл. 4. Связь с непрерывными дробями Выполнение требования lj+i^m.j+i гарантируется E.21); имеем также т^+1^0 ввиду E.23). Следовательно, необходимо найти со аппроксимацию Паде [L+1/m.j+1\ ряда 2с1;к'г/(см- E-24), E.26)); процесс становится рекуррентным. Имея определенный итерацион- итерационный процесс для построения E.17), необходимо проверить, что он приводит к цели. Из E.26) замечаем, что h+i + mJ+i:sih + mJ—aJ' E-27) и поэтому п-1 2 2), E.28) где degp(z) означает степень полинома p(z). Мы видим, что дробь E.17) имеет самое большее L + M частных делителей (это прои- произойдет, если а{ = \ для 1 = 0, 1, 2, ... , п—1). Следовательно, процесс завершается. Теорема 4.5.1. Обобщенный алгоритм Висковатова, определен- определенный в E.19)—E.26), является надежным: если аппроксимация Паде [L/M] существует, то она находится с помощью алгоритма; если не существует, то имеет место неравенство E.23). Доказательство. Предположим, что аппроксимация Паде [L/M] функции E.20) существует, однако алгоритм не применим. Пусть аппроксимация имеет разложение Тейлора [L/M],(z) =%&?'*, F.29) (=0 тогда <$»'** cf для i = 0, 1, ..., L + M. E.30) Так как применение метода редукции E.25) для вычисления аппроксимации [L/M] основано только на коэффициентах разло- разложения в ряд, то представление E.17), полученное этим методом, L + M совпадает с представлением, построенным по 2 ctz' и п0 самой (=0 аппроксимации [L/M]. Сначала при условии L^ М находим где ро(г)—частное, а га»Т@)(г)—остаток от деления Рш (г) на Q@) (г). Если po(z) само не является аппроксимацией Паде [ljm0] функции /(г), то из E.21) следует, что Т(о) @) #= 0, и по-
4.5. Типы непрерывных дробей 137 этому можно использовать разложение Тейлора (см. E.24)) |StS=I; 4V + О (г^+ '-".). E.32) Будем считать, что Рт (z)/Q{0) (г) из E.31) последовательно пре- преобразуется способом, указанным в E.19)—E.26), как можно дольше. Пусть ^Ч?> 2^> E.33) при / = 0, 1, ..., k. Тем самым мы последовательно редуцируем аппроксимацию Паде с помощью соотношения где полагаем ) E.35) г). E.36) Допустим, что процесс останавливается на k-м шаге, т. е. E.23) выполняется при j = k. Из E.33) получаем Р< *> (Z)_ Q(« (г) Л (г) = г«*7-«« (г), E*.37) где /ft138 Гл. 4. Связь с непрерывными дробями Предположим, что () = 2cf>z< + 0[zL+M+l~J!l«t). E.42) Тогда из E.25) и E.41) следует, что E.42) справедливо с заме- заменой k на k—1. Используя E.39), получаем по индукции #<0)(г) = 2 с{0J'4-ОB1+Л1 + 1). E.43) ( = 0 Теорема доказана. В ходе доказательства теоремы можно было заметить связь между E.31), E.33) и алгоритмом Евклида. Эта связь становится явной, если использовать переменную w = z~1. Очевидно, что каж- каждый общий множитель полиномов P^(z) и QiJ)(z) является также множителем Тк/) (г), / = 0, 1, ..., п. Таким образом, процесс редукции и теорему 4.5.1 можно рассматривать как доказатель- доказательство при помощи алгоритма Евклида того, что Pm (z) и Q(o) (z) не имеют общих множителей. Конечно, доказательство этого факта, приведенное в теореме 1.4.3, является более прямым. Установим теперь некоторые рекуррентные соотношения для полиномов PW(z) и QV)(z). Из E.33) находим /> (г) = р, (г) QW (г) + га/Т^ (г) E.44) для / = 0, 1, ..., п. Положим P^(z) = pn(z) и Q(n)(z)=l. E.45) Из E.35), E.36) и E.44) вытекает, что /> (г) = Pj (г) Р<'+» (г) + г°7/^+2) (г) E.46) и QI/-U (г) = pj (г) qv) (г) + za/Qt/+i> (г). E.47) Эти рекуррентные соотношения определяют числители и знаме- знаменатели функций Соотношения E.35), E.36), E.44) удобнее объединить в рекур рентной записи 1 0 } = п—1, п—2, ..., 0, с начальными данными E.45). Теперь ясно, как, опираясь на E.17)—E.25), определить мо> дифицированный алгоритм Висковатова, содержащий в качестве
4.5. Типы непрерывных дробей 139 частного случая алгоритм C.1). Рассмотрим задачу нахождения аппроксимации Паде [L/MJ, L^M, для функции E.49) 2 tfv [ = 0 где gf\ df\ i = 0, 1, 2, ..., L + M,—заданные коэффициенты и а10)ф0. Эта задача была решена в § 1.6 с помощью биградиен- тов. Ниже в общих чертах описывается модифицированный алго- алгоритм Висковатова [Bultheel, 1980b] построения аппроксимации Паде [L/M] функции E.49). Начальные данные. Положим lo = L, mo = M. Итерация. Для / = 0, 1, 2, ...—процесс является итераци- итерационным. Построим полином pj(z) степени не выше /у-—trij—та- /у-—trij—такой, что —pj (г) 2 ^'г' = z"' 2 У>г', E.50) iO i=0 S gpj ) 2 ^ 2 •¦ = 0 iiO i=0 где af~>lj—rrij. Фактически нам необходимо найти коэффициен- коэффициенты полинома 1Гт1 2 i=0 и \L-\-М-\-\— 2аг ) коэффициентов ряда Я (z) = 2 hf*. E.52) i=0 Построение коэффициентов E.51) и E.52) проводится рекуррентно. Пусть (Jg i =0 Для k = Q, I, ..., lj—mj положим ) = fs 2 L i=0 Тогда имеем (г), E.53)
140 Гл. 4. Связь с непрерывными дробями где a.j—наименьшее целое число, для которого выполняется E.53) с /iJ/'r^O. Тем самым все коэффициенты E.52) однозначно опре- определены. Если ау>/у + /"/ или E.53) обращается в нуль тождественно, то построение заканчивается и полагаем n = j. Если lj < olj ^ lj -f trij, то аппроксимации Паде не существует. В оставшемся случае положим gili+1) = d(l1' и d\l+l' = h^ при 1 = 0, 1, ..., lj-\-mj—а.]. Тогда 2 iN г«, ^= /»/(«) + - г • E-54) /7 & 2 № 2 ^/+1>г'7 2 &"* 1 = 0 1 = 0 ' 1 = 0 Положим теперь lJ+i = mj и tn/+1 = lf—af. Тем самым алгоритм полностью определен. Обобщенный алгоритм Висковатова E.49) —E.54) представляет собой надежный метод построения аппроксимаций Паде, который приводит к результату только в том случае, если аппроксимация Паде [L/M] существует. Его можно рекомендовать в качестве вычислительного алгоритма во всех случаях, когда возможны точные арифметические действия и однозначное нахождение вели- величин а0, «!, .. ., а„_,. Методику обобщенного алгоритма Вискова- Висковатова можно приспособить и для рациональной интерполяции, используя обобщенные дроби Тиле (см. ч. 2, § 1.1, и [Werner, 1979а, Ь]), за исключением гого случая, когда алгоритм должен легко перестраиваться при изменении точек интерполяции [Tha- cher and Tukey, 1960; Graves-Morris and Hopkins, 1978; Graves- Morris, 1980a]. Подобным же образом, опираясь на алгоритм Евклида, можно обобщить на вырожденные случаи алгоритм Кронекера (см. § 2.4; [Graves-Morris, 1980a]). § 4.5.4. Некоторые специальные типы непрерывных дробей Эйлер использовал некоторый метод для построения непре- непрерывной дроби, эквивалентной ряду Тейлора. Подходящие дроби такой непрерывной дроби совпадают с частными суммами ряда Тейлора. Используя рекуррентные соотношения D.4), нетрудно показать, что ,с,г =Ce + __—j-^ _ _ _ , .E.55)
4.6. Примеры непрерывных дробей 141 Излишне говорить, что в этом случае сходимость дроби эквива- эквивалентна сходимости первоначального ряда. Пример сравнительно недавно возникшего типа непрерывных дробей представляют собой общие Т-дроби [Thron, 1948]; + .... E.56) где все е(ф0. Их часто называют двухточечными аппроксима- аппроксимациями Паде. Если все et=\ и d{ > 0, то Г-дробь имеет интег- интегральное представление E.57) где ф(/)—ограниченная и неубывающая на [0, оо) функция. Подробнее Г-дроби изучаются в§ 1.1 ч. 2. Там же обсуждается идея о том, что решение проблемы рациональной интерполяции всегда может быть представлено в виде подходящей дроби неко- некоторой непрерывной дроби. Упражнение 1. Проверить справедливость соотношения E.7). Упражнение 2. Используя результаты § 4.3 и упражнение 1, доказать, что 7т+т*==т+т+т+т+"--= A) ~~ z + 2z + 2z + 2z + ¦ " ~ ( ' I г z г г ,...ч = -Q-7 Г Т> .... (ill) Разложение (i) дает хорошее приближение функции при малых |г|, (и) — при больших |г|, a (iii) — при тех и других \г\. Доказать, что (i) сходится всюду вне разрядов от ± i до ± too, (ii) сходится всюду вне разреза от i до —i, (iii) сходится всюду вне полуокружности |z|=^l, Re; § 4.6. Примеры непрерывных дробей, являющихся аппроксимациями Паде В этом параграфе мы приведем некоторые примеры непрерыв- непрерывных дробей, которые являются аппроксимациями Паде. В таб- таблице Паде такие /-дроби или S-дроби образуют либо диагональ, либо лестничную последовательность. Зйлеровское разложение, при котором подходящие дроби совпадают с частными суммами
142 Гл. 4. Связь с непрерывными дробями ряда Тейлора, нами не рассматривается. Мы приводим довольно широкий набор формул для разложений в непрерывные дроби тех функций, для которых известна эффективность таких разло- разложений. В заключение параграфа мы докажем эти формулы в фор- формальном алгебраическом смысле, т. е. покажем, что каждая дробь имеет тот же ряд Тейлора, что и заданная функция. Вопрос о сходимости будет рассмотрен в § 4.7. Экспоненциальная функция 1 '" z*D z г 1 X 1 z z z 35) + z z г г Za/D X г .. . — 4- 3) ,2/( г z1 + 1 z 2_ Z 2~ X 1 ¦1)) -2л 15) 1 + г г г -2+2«+l + Эти разложения сходятся при всех г. Тангенс у 72 72 72 Разложение сходится при всех г, исключая г = Bя+ 1)я/2, где п—целое. Гиперболический тангенс + Ц , z z2 z2 г2 г2 +++++Й+ Разложение сходится при всех г, исключая г = Bя+1)я/2, где п—целое. Биномиальная функция nj-r^-lo.™ (I—v)z (l + v)z B—v) г U-t-zj —1 +—+ г + 3 4- 2^ 4-"* ffi 4 Это разложение сходится всюду вне разреза —оо<г^1; если v—целое, то непрерывная дробь обрывается и формула F.4) становится точной. Арктангенс I 1Хг' *Хг2 п*г* , сходимость всюду в 2-плоскости вне разрезов от г до too и от —i до г'оо. Обратный гиперболический тангенс ^.... F.б,
4.6. Примеры непрерывных дробей 143 Эта дробь сходится во всей г-плоскости с разрезами по лучам (—оо, —1] и [1, +оо). Натуральный логарифм Дробь сходится для всех г, исключая —оо<г^ — 1. Интегральная показательная функция 00 p-Zt 1 я 2(я+1) (л + 1)(/г+/-I \ fi „ п~ г+/г + 2 — г+я+4 — ' " ' — г + я+2г+2 —"')' ^ > Разложение справедливо во всей г-плоскости с разрезом — оо < <г^0; интегральное представление имеет место только при Rez>0 (см. упражнение 1). Дополнительная функция ошибок 00 2 С * erfc г = 1 —erf г = -== \ е~г dt = 1/2 1 3/2 2 п/2 г +г+ г г Дробь сходится при Re г > 0. Основная неполная гамма-функция Г (а, г) = г-г„а( 1 1-a 2B-a) я (я-о) \ \г+1 +а — г+3—а—г + 5—а— " ' — г + 2я + 1— а — " " ) ' F.10) Разложение справедливо для всех г, исключая — оо<г<0. Если а—положительное целое, то дробь обрывается и F.10) выполняется для всех г. Отметим связь с F.8): Еп{г)~ =2П~1ГA—о, г). Функция ошибок г erf г- 2ге-'~ D« + 2)г2 \ ... _ 4«+з +•••;• ( } Разложение имеет место при всех г. Однако при Иег^>2 дробь сходится медленно, поэтому в приложениях лучше использовать
144 Гл. 4. Связь с непрерывными дробями функцию erf с г и ее разложение F.9). Связь функции ошибок г с интегралом Доусона e~z* \ ^ dt и ее представление Г-дробью о даны во второй части (см. соответственно B; 1.1.44) и B; 1.1.45Ь)). Неполная гамма-функция у (а, z) = (а+\)г 2г о—a+l+a+2— a + 3 +a+4— "" + nz где афО,—1,—2,... . При положительном целом а представ- представление F.12) справедливо при всех г. Если а—не целое, то дробь F.12) также сходится при всех г, но функция у (а, г) определена только в плоскости с разрезом —оо<г^0. Разло- Разложение этой функции в Т-дробь дается формулой B; 1.1.45); фор- формула для погрешности приводится в работе [Luke, 1975J. Определение гипергеометрической функции. В дальнейшем используется гипергеометрическая функция pFq(al, a2, ..., ар, Ь1,Ь2, ...,bq, г), в записи которой имеется р параметров в чис- числителе и q параметров в знаменателе. Общее определение стано- становится ясным из следующих примеров: с(с+1) ... (с+n—1)я1 -г • • • . , ,„ а (а+ 1) • • • (а+я-1) KHD- (Ь+п-\) , Определение формально корректно при условии, что параметры знаменателя не принимают нулевого и целых отрицательных значений. Отметим, что „F^ajz) — целая функция, 2F, (a, b; с; г) аналитична в плоскости с разрезом 1^г<оо, а 2F0 (a, b; г) определена чисто формально, так как радиус сходимости ряда равен нулю. Следующее равенство понимается в смысле совпаде- совпадения формальных разложений в ряды:
4.6. Примеры непрерывных дробей 145 Это равенство можно считать точным определением функции iF0(a, b; г) при Rea> 0 для г, лежащих вне вещественной поло- положительной полуоси. Отношение двух гипергеометрических функций вида 0/ о^, (о +1; г) _ а г г г г _ О/-Ч(а; г) ~~ а + о + 1 + а + 2 + а + 3 + " '+а-\ F.13а) Разложение сходится для всех г, отличных от нулей функции Fl(a; г). Так как для функции Бесселя Jy(z) имеем ТО Отношение вырожденных гипергеометрических функций &+1; г) _ fe (& — а) г (а+1)г (/;—а+1)г jz) ~ b — Ь+1 + 6 + 2 — 6 + 3 + Разложение справедливо всюду, исключая нули функции 1F1 (а, Ь; г). Отношение гипергеометрических функций вида ZFU: tFu(a,b+\;z) _ 1 аг_ F+1) г (а+1)г F + 2) г 2F0 (a, 6; г) 1 - 1 - 1 - 1 - I — *' ' Ф+п)г (а + п)г .. . •••_ j _ i _ F15) Дробь сходится вне разреза 0^г<оо. Отношение гипергеометрических функций вида 2F, [Gauss, 1813J: iFiJa, 6+1, с+1; z) _ с а (с—Ь) г (&+ 1) (с—а+ 1) г gfifo, ft, с;г) с— с+1 — с+2 _"• Разложение имеет место для всех г, лежащих вне разреза 1 ^ г < оо и отличных от нулей функции 2Fj (a, 6, с; г). Известны также другие непрерывные дроби для некоторых специальных функций, которые являются аппроксимациями Паде [Wall, 1945, с. 369]; большей частью это интегралы от гиперболи- гиперболических и эллиптических функций. Доказательство каждой из формул F.1) — F.16) состоит из двух этапов: алгебраического и аналитического. Прежде всего покажем, что тейлоровские разложения обеих частей этих фор- формул совпадают друг с другом. Так как соотношения F.1) — F.12)
146 Гл. 4. Связь с непрерывными дробями являются следствиями F.13), F.14) и F.15), то мы обсудим эти соотношения в первую очередь. Доказательство F.1). Пусть по определению 1F1@, b; z) = l. Следующий прием часто используется в дальнейшем. Положим в F.14) а = 0, тогда _L г ' X г (&+]!) z _ ь+3 +" ' + пг (Ь-\-п)г + Ь+2п — Отсюда при Ь = 0 получаем F.1а). Используя представление F.1а) для функции ехр(—г) и соотношение ехрг = {ехр(—г)}, полу- получаем F.1Ь). Из формулы вытекает, что при 2г/ = Таким образом, F.1с) следует из F.3). Доказательство F.2). Имеем sinz = z0F1C/2; -22/4), cos г = ,F1A/,; — г2/4). Поэтому F.2) является следствием F.13). Доказательство F.3). Имеем sh г = z0Ft C/2; г»/4), ch2 = 0F,(V3; г«/4). Поэтому F.3) также является следствием F.13). Доказательство F.4) — F.7). Так как 7 A/. 1 8/ . ,2\ arth г = ZjF, (Va. I, 8/a'> 2i!). In A 4- г) = z2Ff A, 1, 2; —г), то F.4)—F.7) вытекает из F.16) при Ь — 0. Доказательство F.8). В представлении, I С e-4a~i-dt Л(а, &; ^) = ТйЗ A_2
4.6. Примеры непрерывных дробей 147 положим а=\, Ь = п, г' — —\/г. При Re г > 0 имеем Еп(г) = e-zz-\F0(l, n\ —1/г), поэтому F.8) следует из F.15). Доказательство F.9). Так как /я J то F.9) получается из F.10). Доказательство F.10) аналогично доказательству F.8). Доказательство F.11). Воспользуемся равенством тогда F.11) вытекает из F.14). Доказательство F.12). Делая замену переменных t = z—и, получаем Z 2 у (a, z) = l С-^ dt =е-* I (г—иу^е* du=zae-*a-11Fi(l, \+a; z). о о Тем самым разложение F.12) следует из F.14). Доказательство F.13). Из определения гипергеометрической функции q/7! вытекает, что поэтому имеем UJI L aFi(a; г) г 0Fi(a+2; г) * "ra(a + l) „F, (а+1; г) Из этой формулы легко следует разложение F.13а). Доказательство F.14). Для вырожденных гипергеометрических функций справедливо тождество 1. 6+1; г) = Л(а. Ь; 2) + -$=?-1Fi{a + 2t b + 2; z). Таким образом, ^_ ift (". ft: г) , z(f>—a) iFt (a+2, & + 2; г) ' b{b + l) ^F^ (a+l, 6+1; г) Итерируя последнюю формулу, приходим к разложению F.14).
148 Гл. 4. Связь с непрерывными дробями Доказательство F.15). С помощью формальных операций над степенными рядами получаем формулу ,Г0(а, 6+1; z) = 2F»(a, /;; г) +az2Fu(a+\, 6+1; г). ,F.17) Эту же формулу можно получить, если воспользоваться пред- представлением 0 v справедливым при Rea>0 и z, не принадлежащих положитель- положительной полуоси, и тождеством fa~i fa — i 2ta Для комплексных значений а формула устанавливается с помощью аналитического продолжения. Следовательно, 2F0 (а, 6+1: г) F.19) ^ 0(a, 6+1; г) ,. , n.8fo(a+l, Ь + 2; г) ' F.20) 2F0 (а, 6; г) ] _^ 2F0(a+l, fe+1; г) ' х 2f0 (о, 6+1; г) Так как гР0 (а, 6; 2) = 2F0F, a; г), то из F.19) получаем aF0 (о + 1, 6 + 1; г) 1 Из F.19) и F.20) вытекает формула, которая приводит к F.15). Доказательство F.16). Из определения гипергеометрической функции г/7, получаем тождество J\(a,b,c; 2) = /, (а, 6+1, с+1; г) °^~*| г/,(а+1,6+1, с+2; г), которое можно переписать в виде с+1; г) .>/¦', (о, 6, с; г) а(с-6) ^ 2F, (»+l, 6 + 1, е+2; г) ' F.21) с (с+1) ' 2f, (а, 6+1, с+1; г) Так как 2F, (a, 6, с; г) = 2Р1F, а, с; г), то, заменив в F.21) с на с + 1 и г. д., получим 1, с + 2; г) 1 2Fi(a, 6+1, с+1; г) ~'_ F+ 1) (с-а+ 1)^ (а+ I, 6 + 2, с + 3; г) ' (c+l)(c+2Jf1(o+l, t+l.c+2; г) F.22) Соотношения F.21) и F.22) приводят к итерационной формуле для отношения гипергеометрических функций. При этом на каж-
4.7. Сходимость непрерывных дробей 149 дом шаге параметры а и Ь, стоящие в числителе, возрастают на 1, а параметр с, стоящий в знаменателе, возрастает на 2. Из этой формулы следует F.16). В заключение этого параграфа отметим, что формулами F.1) — F.16) задаются разложения в непрерывные дроби многих извест- известных функций анализа. Используя алгебраические результаты F.17), F.19) — F.22), мы доказали, что тейлоровское разложение каждой функции совпадает с тейлоровским разложением соответ- соответствующей непрерывной дроби. Знак равенства в F.1) — F.16) означает только этот факт. Следующий параграф посвящен иссле- исследованию вопроса о том, при каких г справедливы равенства F.1)—F.16). Упражнение 1. Доказать, что сжатие непрерывной дроби г*Е fzt-1 - 1 ill 1 H±L 1+L задается формулой F.8). Упражнение 2. Доказать, что сжатие непрерывной дроби ег 1(а, г)-г+ , +г+ , +...+г+ j +... задается формулой F.10). § 4.7. Сходимость непрерывных дробей Приведенные в § 4.6 примеры разложения некоторых извест- известных функций анализа в непрерывные дроби получены чисто алгебраическим путем. Для того чтобы придать знаку равенства в формулах из § 4.6 обычный смысл, необходимо доказать, что (i) каждая непрерывная дробь сходится и (ii) предельная функция совпадает с исходной. В связи с этим мы приведем некоторые общие теоремы о сходи- сходимости непрерывных дробей, доказательство которых имеется в книге Джоунса и Трона [Jones and Thron, 1980]. Подходящие дроби непрерывных дробей, приведенных в § 4.6, являются рациональными функциями от г. Поэтому при изучении сходимости непрерывных дробей естественно рассмотреть такие условия, при которых предельная функция мероморфна. Как правило под сходимостью подходящих дробей понимается равно- равномерная сходимость в областях, не содержащих полюсов предель- предельной функции. Однако некоторые авторы предпочитают иметь дело со сходимостью в сферической метрике, т. е. со сходимостью на сфере Римана. Ниже мы используем сходимость в обычном смысле,
150 Гл. 4. Связь с непрерывными дробями кроме специально оговоренных случаев. Тем самым упомянутая двусмысленность не приведет ни к каким недоразумениям. Рассмотрим непрерывную дробь Всякое условие сходимости дроби G.1) является по существу условием на поведение ее остатка; в связи с этим величина Ьо всюду в дальнейшем опускается. Важное необходимое условие сходимости дроби представляет собой так называемое «условие расходимости». Теорема 4.7.1. Если непрерывная дробь G.1) сходится при некотором г, отличном от нуля, то по крайней мере один из рядов а3а-0 или а2п G.2) л=1 расходится. Замечание. Расходимость одного из рядов G.2) является необ- необходимым, но не достаточным условием сходимости G.1). При доказательстве теорем о сходимости непрерывных дробей делаются дополнительные предположения об элементах at (см., например, теорему 4.7.3). Мы не будем доказывать здесь теорему 4.7.1. Вместо этого установим следующий аналогичный результат, принадлежащий Зейделю и интересный как сам по себе, так и в связи с рядами Стильтьеса. Теорема 4.7.2. Расемотрим непрерывную дробь где b( > О для всех I. Дробь G.73) сходится тогда и толью тогда, когда ряд 2 ^ расходится. Доказательство. Покажем сначала, что из расходимости ряда 2^| следует сходимость дроби G.3). Установим прежде всего некоторое тождество, из которого будет вытекать, что подхо- подходящие дроби для G.3) могут быть представлены как частные суммы некоторого знакочередующегося ряда. Имеем G.4)
4.7. Сходимость непрерывных дробей 151 Из рекуррентных соотношений ». G-5а) 2 G.5b) получаем 4A-i-SA-i = (-i)nHA-Mi) = (-i)n+l- Подставляя это выражение в G.4), находим Ail- ' | V (-')/+х и_9 3 4 П &\ Вп —ъ+?? В/В/1 ' ' '" " ( Так как B1 = b1, Bi = \-\-b1bi, то из G.5Ь) следует, что В^т — min (I, &t) > 0 при всех t>l. Таким образом, каждая подходящая дробь G.3) по формуле G.6) представляется в виде частной суммы знакочередующегося ряда. Знакочередующийся ряд 2(—1)п"п> "п > 0, сходится, если (i) {«„} — убывающая последовательность, (и) ип—>-0 при и—»¦ оо. Покажем, что расходимость ряда "^bn влечет за собой схо- сходимость последовательности {AjBn\ при я—* оо. Заметим, что В(-.вм при всех i, поэтому 2 (=2 Таким образом, выполнено условие (ii), значит, последователь- последовательность \AnjBn) сходится. Если ряд 2^п сходится, то положим Используя G.5Ь), легко получаем по индукции, что поэтому 1пВп<В и Ва < ев при всех п. Следовательно, модули слагаемых в G.6) отграничены от нуля; значит, отношение Ап/Вп не может сходиться. ^ Используя теорему 4.7.2, можно непосредственно доказать сходимость дроби Стильтьеса E.5.24) на положительной вещест- вещественной полуоси. Связь между теоремами 4.7.1 и 4.7.2 становится ясной, если сделать эквивалентное преобразование дроби (см. упр. 1).
152 Гл. 4. Связь с непрерывными дробями 3.0 -V3 2.о з.о 4.о Рис. 1. Параболическая область д* из теоремы 4.7.3, соответствующая а = л/12. В следующей теореме дается достаточное условие сходимости непрерывной дроби. Теорема 4.7.3. (теорема о параболе [Scott and Wall, 1940b; Thron, 1974). Непрерывная дробь а2г сходится, если (i) найдутся число а из интервала—л/2<а<л/2 и номер п0, такие, что при всех /г > п0 элементы дроби G.7) удовлетворяют неравенству |an2|-Re(an2e-2toK-icos2a; G.8) (и) выполняется условие расходимости G.2). Следствие. Рассмотрим случай, когда последовательность \ап\ имеет ненулевой предел: ап-^а, афО. Выберем а = 0. Тогда условие G.8) выполняется, если г удовлетворяет неравенству Это неравенство определяет параболическую область 5*, изо- изображенную на рис. 1. Гранина области 3* — парабола с фокусом в точке г = 0, ось которой проходит через точку г = —1/Dа). Геометрически условие G.8) означает, что точка г должна лежать
4.7. Сходимость непрерывных дробей 153 ближе к фокусу параболы, чем к ее директрисе. Предположение ап—+а, афО, влечет за собой также выполнение условия рас- расходимости. Таким образом, из теоремы о параболе вытекает сходимость непрерывной дроби в области 5>. Теорема 4.7.4. (Теорема о кардиоиде [Paydon and Wall, 1942; Dennis and Wall, 1945; Thron, 1974]). Если существуют числа n0 и k, такие, что (a) k > О, (b) \aa\ — Rean^l/Bk) при всех п>п0 и (c) выполняется условие расходимости G.2), то дробь G.7) сходится при всех z, лежащих внутри кардиоиды |z|<*[l+cos(ai-gz)]. G.9) Геометрическая интерпретация. Условие (Ь) теоремы означает, что все элементы ап непрерывной дроби G.7) лежат внутри параболической области ^1г изображенной на рис. 2. Если выполняются условия (а), (Ь) и (с) теоремы, то дробь сходится внутри кардиоиды, показанной на рис. 3. Отметим, что увели- увеличение величины k приводит к сужению области 5*j и увеличению области сходимости дроби, ограниченной кардиоидой. Теорема 4.7.5. Если подходящие дроби G.7) сходятся равно- равномерно внутри круга \г\ < R, R>0, к функции f(z), то /(г) ана- литична в круге I z | < R и ее степенной ряд порождает дробь G.7). Замечание. Эта теорема вытекает непосредственно из теоремы Вейерштрасса [Titchmarsh, 1939, с. 95; Copson, 1948, с. 97]. Теорема 4.7.6. [Van Vleck, 1904]. Если ап—»-0 при /г—юо, то дробь G.7) сходится к функции, мероморфной во всей плоскости. Если ап —>• а при п —> со и а Ф 0, то G.7) сходится к функции f (г), мероморфной в плоскости с разрезом. Разрез делается по направ- направлению тени, отбрасываемой точкой—Dа), если источник света расположен в начале координат (см. рис. 4). В каждом случае сходимость равномерная на компактных подмножествах, не содер- содержащих полюсов предельной функции, а разложение предельной функции в непрерывную дробь совпадает с G.7). Ниже мы воспользуемся приведенными теоремами для обосно- обоснования разложений предыдущего параграфа. Теорема Ван Флека используется при доказательстве разложений F.13), F.14) и F.16); для доказательства F.15) привлекается теорема о кар- кардиоиде.
154 Гл. 4. Связь с непрерывными дробями 2.0 1.0 -ш -Z0 Л L i.o ao з,о 4.0 Рис. 2. Параболическая область 5s! из теоремы 4.7.4, соответствующая k= 1.07 ¦>-Rez -20 - Рис. 3. Область из теоремы 4.7.4, ограниченная кардиоидой, при fe=1.07.
4.7. Сходимость 'непрерывных дробей 155 , linz Рис. 4. Разрез из точки го = — Dа)-1 в оо, фигурирующий в теореме 4.7.6, Доказательство F.13). Ранее мы установили, что обе части доказываемого равенства pfi (а+1; г) 1 агг а2г апг 0F,(a; г) ~ 1 + 1 + 1 + " ' ' + 1 + ¦ ' ' • где ап = {(а + п— l)(a + n)}~\ имеют одинаковые формальные разложения в степенной ряд. Так как ап—«-О, то по теореме 4.7.6 равенство G.10) выполняется для всех г, отличных от нулей функции „^ (а; г). Доказательство F.14). В предыдущем параграфе мы показали, что обе части доказываемого равенства l, b+l; 2) \F\(a, b; г) где _ 1 at2 агг акг ,? ... 1 + 1 + 1 + *'' + 1 +' ' ' • (ln> n—l, 2, 3, .... )\-\ n=\, 2, 3, .... имеют одно и то же формальное разложение в степенной ряд. Так как ап—->-0, то из теоремы 4.7.6 вытекает, что правая часть G.11) сходится и G.11) является тождеством при всех г, отлич- отличных от нулей функции 1F1 (a, b; z). Доказательство F.15) в частном случае. Ранее мы установили, что соотношение 2F0(a, b+l; г) 1 о (—г) (b+l) (—г) (а+1)(— г) 2F0(a, Ь; г) 1 + 1 + 1 + 1 + — а„г где + "• + 1 + •••' а2п г=Ь + п, п=1, 2, 3, .... , п = 0, 1, 2, ... , G.12)
156 Гл. 4. Связь с непрерывными дробями • • а.} -»-Веа„ ае а» Рис. 5. Элементы ап, определенные формулами G.12). можно понимать в смысле совпадения формальных разложений обеих частей. Используя то, что отношение последовательных коэффициентов ак1ак+л стремится к 1, можно показать, что выпол- выполняется условие расходимости — необходимое условие сходимости дроби с элементами G.12). В дальнейшем удобнее использовать переменную г' = —г; после такой замены получаем iifp (a, 6+1;—г')_\ <цг а* г'2 ... aft*'* .... 2F0(a, Ь;—г') ~" 1 + 1 + 1 + + 1 + G.13) Последнее равенство представляет собой формальное алгебраи- алгебраическое тождество. Покажем теперь, что оно превращается в тождество между функциями при г', лежащих в плоскости с раз- разрезом. Последовательность ап изображена на рис. 5. Легко увидеть, что для любого k^O найдется номер nl) = n0(k), такой, что \ап\—Re ап^ртпри всех п > п0. Следовательно, непрерывная дробь G.13) сходится внутри кар- кардиоиды |z'|<*[l + cos(argz')]. Так как это справедливо для любого k > 0, то непрерывная дробь сходится всюду вне разреза —со < г' < 0, которому соот- соответствует разрез по положительной вещественной полуоси в плоскости переменного г. В частном случае, когда Ь > 0, а > 0, мы получаем дробь Стильтьеса по переменному г', и можно использовать результаты § 5.5. В этом случае равенство обеих частей в G.13) при | argz' | < ц
4.7. Сходимость непрерывных дробей 157 вытекает из теоремы Карлемана. Доказательство G.13) в общем случае имеется в работе [Wall, 1945]. Доказательство F.16). В § 4.6 было установлено, что обе части доказываемого тождества 2^1 (а, 6+1; с+1; г) _ 1 at г а2 г ... (^г ... «F, (с, Ь; с; г) ~ 1 + 1 + 1 + + 1 + , G.14) F +я) (а—с—/г) (а+п) (Ь—с—п) где а2« —(с + 2л—1) (е+2я) и а имеют одинаковые формальные разложения. Так как ап—+ —1/4, то по теореме 4.7.6 G.14) обращается в равенство всюду вне разреза 1^г<оо. Как было отмечено выше, именно в этой области и определена гипергеометрическая функция 2F,. Следо- Следовательно, дробь G.14) сходится для всех г, лежащих вне разреза и отличных от нулей функции 2F, {а, Ь\с;г). Упражнение 1. Рассмотрим дробь где Ьг>0при всех i. Показать, что условие расходимости G.2) в точности означает расходимость ряда 2 bt. i= 1 Упражнение 2. Доказать, что условие аа/ап+х—>-с при п—> оо, где |с|> 1, достаточно для выполнения условия расходимости. Упражнение 3. Доказать, что дробь A X2)v Bx3)v ... 1 + 1 + + 1 + сходится при 0^7^1 и расходится при y>
Глава 5 РЯДЫ СТИЛЬТЬЕСА И РЯДЫ ПОЙА §5.1. Ряды Стильтьеса; введение Определение. Функция Стильтьеса определяется представле- представлением х) " "Ш. 0.1) где ф (и)—ограниченная, неубывающая функция на полуоси О ^ и < со (принимающая бесконечно много различных значений), имеющая конечные вещественные моменты , / = 0, 1, 2 A.2) Из A.1) немедленно следует, что /(г) — вещественно-симмет- вещественно-симметричная функция, определенная на плоскости с разрезом по отри- отрицательной полуоси (рис 1); вещественно-симметричные функции определяются соотношением A.6). Формальное разложение функции A.1) приводит к ряду Стиль- Стильтьеса /(г)=!о//(-гУ. A.3) Ряд называется формальным, так как он может расходиться при всех г (исключая г = 0); тем не менее, как будет показано в этой главе, такой ряд является полезным представлением функции /(г), если дать ему новую правильную интерпретацию. В дальнейшем разложение A.3) с положительными коэффициентами \f\ удобнее использовать, чем наше стандартное представление 00 = zj 67г/> поскольку неравенства в теореме 5.1.2 принимают 1 = 0 более простой вид. х) Понятие интеграла Стильтьеса хорошо изложено Перроном [Perron, 1957, т. 2, с, 180] и Рудином [Rudin, 1976, гл. 6].
5.1. Ряды Стилыпьеса; введение 159 i Imz -Kez Рис. 1. Плоскость с разрезом, на которой функция /(г) определена представ- представлением A.1). Условие, что функция ср(н) принимает бесконечно много раз- различных значений, включено в определение функции Стильтьеса для того, чтобы избежать следующего частного случая. Пусть функция q>(u) принимает конечное число значений, скажем т+\ различных значений; тогда ф(«) кусочно-постоянна на m-f-1 интервалах, покрывающих полуось О^и < оо. Предположим, что ф(м) = 0 при 0<ц < й1( ф(ы) = Ф,- при «,-< и ит. Тогда йф(ы) = 0 всюду, за исключением точек « = «,-, i=l,2, ... ... , т, и поэтому 1=1 где 1+ZU/ для ' = A.4) [/(«,)—окрестность точки «f. Следовательно, /(г) —рациональная функция от г, имеющая яг простых полюсов с положительными вычетами в точках г=—и~? на отрицательной полуоси. Кроме того, при L>m—1 и М^г/я все аппроксимации Паде [L/M] функции /(г) совпадают с ней. Таким образом, случай, когда ц>(и) принимает лишь конечное число значений, носит довольно частный характер и обычно исключается при определении ряда Стильтьеса. Если ф(и) постоянна при Х^м<оо, то
160 Гл. 5. Ряды Стильтьеса и ряды Попа ,bnz Rez Рис. 2. Плоскость с разрезом, на которой функция f (г) определена представ- представлением A.5). В таком случае функция /(г) определена в плоскости с разрезом по лучу —оо<г^—К'1, и ее разложение в ряд A.3) сходится в круге показанном на рис. 2. В этой главе мы увидим, что независимо от того, имеет ли 00 формальный ряд2//(—г);. соответствующий функции /(г), ну- нулевой радиус сходимости или нет, с помощью аппроксимаций Паде, построенных по этому ряду, можно исследовать функцию /(г) и вычислять ее значения. Мы сможем доказать сходимость аппроксимаций Паде, опираясь в значительной степени на тот факт, что полюсы аппроксимаций Паде лежат на разрезе, соот- соответствующем функции Стильтьеса. Функции Стильтьеса являются вещественно-симметричными функциями, определенными в плос- плоскости с разрезом по отрицательной вещественной полуоси. Функция называется вещественно-симметричной, если она принимает комплексно-сопряженные значения в комплексно-соп- комплексно-сопряженных точках [Titchmarsh, 1939, с. 155]. Это условие запи- записывается в виде /(г*) = [/(г)]*. A.6) Важное и немедленное следствие этого соотношения относится к случаю, когда функция /(г) аналитична в точке z = x0 на ве-
5.1. Ряды Стилыпьеса; введение 161 щественной оси, так что разложение 1 = 0 сходится в некоторой окрестности точки г = х0. Коэффициенты d{, г' = 0, I, 2, ... , вещественны тогда и только тогда, когда /(г) вещественно-симметрична. Это объясняет название «вещественно- симметричная». Функции Стильтьеса вещественно-симметричны и, как можно показать с помощью A.1), имеют отрицательную мнимую часть на разрезе в следующем смысле: \mf(x+ie) = —lmf(x—te) = j q/( —-J, где x = Re г < 0, A.7) при условии, что подразумеваемые в A.7) пределы (при е —>¦ 0) существуют (ср. с леммой 3 из ^ 5.6). Мы различаем три случая; (\)(f(u) дифференцируема, (П)ф(и) непрерывна, но не дифферен- дифференцируема и (ш)ф(ы) разрывна в точке и [Riesz and Nagy, 1955]. Прежде чем устанавливать свойства рядов Стильтьеса, рас- рассмотрим пример такого ряда. Пусть Un(\ + z) = l-Iz + lz2+... при |z|162 Гл. 5. Ряды Стилыпьеса и ряды Пойа имеем Im /(г+ i8) = — для всех x=Rez < — 1, что иллюстрирует соотношение A.7). Следующая теорема показывает, к чему приводит отбрасыва- отбрасывание первых ./ членов ряда Стильтьеса. Теорема 5.1.1. Пусть /(z)—ряд Стильтьеса с формальным разложением 1 = 0 и представлением Тогда ряд g(z), заданный формальным разложением Я(г) = (-г)-^ I; fyi-гу, также является рядом Стильтьеса с представлением A.10) (U1) Доказательство. Утверждения теоремы немедленно вытекают из определений A.1) — A.3). Ряд Стильтьеса можно распознать благодаря детерминантным соотношениям, которым удовлетворяют коэффициенты //. Введем следующие определители, которые удобнее определителей C(L/M) из § 1.4 (см. A.4.8)): 1т Iт+1 • * • 1т + п я + 1 /от + 2 • • • /от + и + D(m, n) = A.12) Величины D(L, M) и C(L/M) связаны соотношениями (см. упраж- упражнение 1) D(L — M+\, M — \) = C(L/M), если L — M нечетно, D(L —М+1, М — 1) = (— 1)AIC(L//W), если L — М четно.
5.1. Ряды Стильтьеса; введение 163 Теорема 5.1.2. Необходимое условие того, что /(г) — ряд Стильтьеса, заключается в по ожительности определителей D(т, п) для всех т~^0 и п> 0. Замечание. Это условие является также и достаточным в предположении, что /(г) в принципе однозначно определяется своим степенным рядом. Доказательство соответствующего резуль- результата будет дано позже. Доказательство. Используя свойства ряда Стильтьеса докажем, что D(tn, n) > 0. Замечая, что все коэффициенты fn положительны, получаем D (т, 0) > 0. Пусть m и \x0, хл, ... , xn) - jm о ~ n n = 22 «т+/+/ х, х, Up (и) = 2 2 /,+/+. x{Xj A.13) j V=o /=o / i=n /=o — вещественная положительная квадратичная форма относитель- относительно п-\-1 вещественных переменных х0, *,, ... , хп. Тогда G(x0,... ...,хп) имеет минимум на (п-\- 1)-мерной сфере и S(Xo, ...,*„)= 2 J«1 = *i + *?+•.•+*«=!¦ A.14) 0 2 (= 0 Для точки минимума {хг} методом неопределенного множителя Лагранжа (варьируя п независимых координат) получаем урав- уравнения и S (х) = 1. Следовательно, координаты х0, х,, ... , хп удовлетворяют сис- системе однородных уравнений п .2 fi+j+mxj— te, = 0, i = 0, 1,...,л, A.16)
164 Гл. 5. Ряды Стильтьеса и ряды Попа где К—собственное значение вещественной симметричной матрицы 1т /от + 1 • • • I т + п f f t + i I ст+2 • * • I m + n + l '. '. '. • A-17) • • • f f f - Пусть x 0. Для доказательства теоремы осталось проверить случай D(m, n) — 0. В этом случае однородная система линейных урав- уравнений имеет нетривиальное решение, поэтому для некоторого х, хг-х= 1, имеем Из A.13) следует, что существует нетривиальный полином р„(и), для которого Это возможно только в том случае, когда d5.1. Ряды Стильтьеса; введение 165 ксимаций Паде [L/M] ряда Стильтьеса рассматриваются при ус- условии J = L—М = const с естественным ограничением 7^—1. Следствие 2. Для любого ряда Стильтьеса существует регуляр- регулярная С-дробь СО iii 2 с{z1 = —+п~+ "!"+•••• О-18) где а', > 0 при всех /^ 1, имеющая то же формальное разложение, что и ряд. Этот результат объясняет название «S-дробь» (см. D.5.5)) и демонстрирует связь между такими дробями и рядами Стильтьеса. Доказательство. Из теорем 4.4.4 и 5.1.2 вытекает, что ряд Стильтьеса можно представить в виде регулярной С-дроби вида D.4.21), причем а2М+2 > 0, агЛ1+1 < 0 и sign Ьш+2 = sign 62/И+] = (— 1)* С помощью простого эквивалентного преобразования вида D.16) можно привести непрерывную дробь к представлению A.18) с положительными элементами а-, ?= 1, 2,... . Имеем, например, а\ = с0 > 0, «2 = — Cj/c,, > 0 и т. д. Приведенные ниже исторические ссылки на работы о рядах Стильтьеса носят общий характер и относятся не только к насто- настоящему параграфу: Стильтьес [Stieltjes, 1889, 1894], П. Л. Чебы- шев [Tchebycheff, 1858] и Ван Флек [Van Vleck, 1903J1). Пре- Превосходный обзор на эту тему сделан Перроном [Perron, 1957], а материал, связанный с непрерывными дробями, изложен Уол- лом [Wall, 1948]. Упражнение 1. Используя определения A.3), A.12), A.11) и A.4.8), доказать, что D(m, n) = (—l)m С С С D (/п, п)=\ d(p (u0) j dcp (ut)... ] dq> (un) x ип ... ы"„ Jim Uo Un ... Unn x) См. также работы А. А. Маркова, приведенные в списке литературы.- Прим. перев.
166 Гл. 5. Ряды Стильтьеса и ряды Попа Переставляя переменные интегрирования и суммируя результаты, доказать формулу 0D 00 00 (n-|-l)!D(m, л) = S rfq> (и,) $ dq> (at) ... $dq>(an)x Наконец, доказать, что D (m> ") = 0 и D(m, n)>0 [Bessis, 1979]. Ilm IIm I lm 1 «J 1 B. )x 1-1 II П («/-«/)* 1=0/=0 § 5.2. Сходимость рядов Стильтьеса Результаты о сходимости аппроксимаций Паде для рядов Стильтьеса основаны на том, что все аппроксимации [М -\- J/М\ (где J ~^—1) имеют только вещественные отрицательные полюсы с положительными вычетами. Если функция ф(и) имеет в точ- точности т точек роста, то (см. A.4)) /(г) — рациональная функция, имеющая т полюсов на отрицательной вещественной полуоси с положительными вычетами. В этом частном случае при J ^ — 1 и М^т все аппроксимации Паде [Л1 + У/УИ] функции /(г) сов- совпадают с ней. В общем случае справедлива следующая важная теорема. Теорема 5.2.1. Если f(z)—ряд Стильтьеса, то при J~^ — 1 все полюсы аппроксимаций Паде [М + J/M] ряда f(z) являются простыми, лежат на отрицательной вещественной полуоси и имеют положительные вычеты. Замечание. При доказательстве используются только детерми- нантные неравенства из теоремы 5.1.2 для коэффициентов fj. Представление A.2), основанное на существовании ф(и), не тре- требуется.
5.2. Сходимость рядов Стильтьеса 167 Доказательство. При J ^—1 положим Ло(*)=1, fi+j-\~xft+j U /2+./ + */s+j /s Im+j+i -i "b xi 2M+j B.1) для М= 1, 2, 3, .... С точностью до знака эти величины совпа- совпадают со знаменателями диагональных аппроксимаций Паде (см. § 1.3): дшмли 1Л(У д<^ ) B.2) Отметим, что А^'(л;) — вещественнозначная функция веществен- вещественной переменной х. Рассматривая последовательность {A'xJ' (лг), /И = 0, 1, 2,...} при фиксированном J, мы обычно опускаем верхний индекс J. Покажем прежде всего, что функции Ао (х), А, (х), А2 (*), ... B.3) образуют последовательность Штурма. Это означает, что если при некотором х А,(х) = 0, то Ау_х(л:) и А/+1 (х) имеют разные знаки. Применим детерминантное тождество Сильвестра к опре- определителю A=Aj+i(x), заданному формулой B.1). Имеем А X AM_it м; м-1, М^Ам.М Ам-\; М-1 —Ам; М-\ Ам-l; М, где нижние индексы обозначают вычеркнутые строки и столбцы. В силу симметрии Ам;М-1 Ам-\;М~{АМ. М-\)* > 0. Так как Ам-1,м-,м-1,м =А/_1(х) и AMtM = Aj(x), то ViWA/+iW<°- если Ау(*) = О. B.4) Последнее неравенство выполняется также и при /=1, если по- положить Ао (х) = 1. Случай равенства исключается при помощи (**И!)-тождества Фробениуса. В силу этого тождества мы получили бы, что Ду(х) = 0 для всех /, если
168 Гл. 5. Ряды Стилыпьеса и ряды Пойа Рис. 1. Чередование знаков первых четырех знаменателей Паде ряда Стильтье- са при х<.0- два последовательных определителя Ду обратились в нуль в од- одной и той же точке х. Таким образом, B.3) — последовательность Штурма. Для изучения свойств нулей полиномов &м(х)> которые сов- совпадают с полюсами аппроксимаций Паде [М -{- J/M], воспользу- воспользуемся тем, что B.3)—последовательность Штурма и /, > 0. Не- Несколько первых членов последовательности имеют вид Д2 (х) =. А, (х) (fs Из представления B.1) вытекает, что М°>>0' 1 при всех/. B.5) (оо) Aуоо[ ( ' Пусть Xj?k—k-n нуль полинома Ау(х) (рис. 1). Имеем А,(л:) = 0 в точке x — xt ] = —т-^-. Гг + J В силу B.3) A2(xb i)<0, а в силу B.5) А2@)>0; поэтому А2(д:) = 0 в точке х = х2< (€ (х1у х, 0). Из B.3) и B.5) получаем A,(^i, i)<° и Да( — оо) = +.оо, поэтому Д2(х) = 0 в точке х = хг<2?( — оо, xu t). Полное доказательство того, что нули полинома Ду (д:) разде- разделяются нулями Ду_! (х), проводится по индукции. Таким образом, уравнение А/(дг) = О имеем корни х = х!ук, k=\, 2, ... , /, лежа- лежащие на отрицательной вещественной полуоси и отличные друг от друга, так как в каждом интервале (xJt k+l, xJt к) лежит по
5.2. Сходимость рядов Стильтьеса 169 нулю полинома AJ_1(x). Следовательно, полюсы аппроксимации Паде простые и лежат на отрицательной вещественной полуоси. Для доказательства положительности вычетов рассмотрим тож- тождество Положим для краткости PlM+Jlm(x) = TM(x). Из B.6) вытекает ГЛ+1 (х) Ам (х) = Гм (х) Ам+1 (х) > 0 при х < 0. Если Ад,+1(дс) = О, то signГм+1(х) = signAM(x), поэтому Так как Ам+1(х)— полином степени М + 1, то Лм+iM имеет в точности один нуль на интервале (хк+и k, xM+li k+1). Отсюда с учетом того, что Ам+1 @) > 0, получаем следовательно, Таким образом, вычеты в полюсах аппроксимаций Паде положи- положительны, и теорема доказана. Перейдем к изучению свойств диагональной и первой под- диагональной последовательностей аппроксимаций Паде ряда Стильтьеса при х > 0. со Теорема 5.2.2. Пусть 2//(zK—ряд Стильтьеса. Для вещест- /=о венного положительного значения z аппроксимации Паде этого ря- ряда удовлетворяют неравенствам С), B.7) (%), B.8) [М-\/М]>[М/М— 1] (.*) B.9) l/M-l] (/), B.10) — 1/MJ (..), B.11) [М/УИ]'>[УИ —1/М]' (..). B.12) Замечание. В основе доказательства теоремы лежат детерми- нантные неравенства для коэффициентов f/, по этим коэффици- коэффициентам строятся аппроксимации Паде. Так же как и в других теоремах настоящего параграфа, представление A.2) не исполь- используется.
170 Гл. 5. Ряды Стильтьеса и ряды Пойа Доказательство. Из (*»)-тождества C.5.18) получаем B-13) Из доказательства теоремы 5.2.1 следует, что функции Д'м (х) и Д^+1 (х) положительны при х^О. Благодаря этому факту и соот- соотношению B.2) неравенства B.7) и B.8) вытекают из B.13) соот- соответственно при У = — 1 и J = 0. Из (»*)-тождества C.5.20) получаем B.9) и B.10) вытекают из B.14) соответственно при J = — 1 и У = 0. В силу (* *)-тождества C.5.20) имеем -^^ь;-», BЛ5, откуда следует B.11). Положим теперь 2М « (х) = х-2^ Д'й (л:) Д«й» (х) = 2 г,х-'. ,= i Так как коэффициенты при всех степенях х у полиномов &(м(х) и Дм"(х) положительны (см. упражнение), то и все лу > 0; поэтому R' (х) < 0 при х > 0. Следовательно, [M//W]' —[М—1/MJ'>0 при х>0. Следствие. В условиях теоремы имеем (- I)'*1 {[М + J + 1/М + \]—[М + J/M}} > 0, (— \y+i \[М + J/M] — [M + J+1/M— 1]}>0, и эти неравенства сохраняются после однократного дифференци- дифференцирования Доказательство основано на тех же соотношениях, что и до- казательаво георемы. Наиболее существенный результат георемы 5.2.2, который используется в дальнейшем, состоит в том, что при фиксирован- фиксированном х > 0 аппроксимации Паде [М — 1/М] образуют строго воз- возрастающую последовательность. Этот факт после серии проме- промежуточных утверждений приведет к геореме о сходимости. Такие неравенства (например, B.11)) можно распространить и в комплексную плоскость; при этом возникают вложенные области, соответствующие аппроксимациям более высокого поряд- порядка Этот результат можно получить, опираясь на теорему 5.6.9 и близкие результаты. Вложенные области являются выпуклыми
5.2. Сходимость рядов Стилыпьеса 171 Рис. 2. Области вложения для лестничной последовательности аппроксимаций Паде ряда Стильтьеса. и имеют вид линз. Две вершины границы области соответствуют аппроксимациям [М/УИ] и [М — 1/УИ]. Каждая следующая линзо- видная область касается границы предыдущей только в двух точках (см. рис. 2). Более подробно эта тема рассмотрена в ЕРА, а также в работах [Henrici and Pfluger, 1966], [Gargantini and Henrici, 1967] и [Baker, 1969]. Теорема 5.2.З. Последовательность аппроксимаций Паде [М—1/УИ] ряда Стилыпьеса равномерно ограничена при М—>¦ оо в области iZ>(A)—произвольной ограниченной области комплексной плоскости, находящейся на расстоянии не меньше А от разреза — оо < z<;0 по отрицательной вещественной полуоси. Доказательство. В силу теоремы 5.2.1 м BЛ6> где Р{ > 0, у{ > О для J=l, 2, ... , М. Для каждой аппрокси- аппроксимации Паде справедлива оценка поэтому м Р,-, если B.17) B.18)
172 Гл. 5. Ряды Стильтьеса и ряды Пойа . Imz Рис. 3. Ограниченная область 0. Если Re г < 0, то в силу ограниченности ?D (А) можно считать, что S>(A)c\z'.\z\ < Ятах}. Тогда AI (=1 AI 1+Y.2 С помощью простых вычислений получаем, что минимум дости- достигается для у = — (Re г)/\ г |2 и Sft. B.20) Тем самым теорема доказана.
5.2. Сходимость рядов Стильтьеса 173 Следствие. Все парадиагональные последовательности аппро- аппроксимаций Паде [M + J/M] (при /!>-—1) ряда Стильтьеса равно- равномерно ограничены в области @) (А). j Доказательство. Для 7^0 полином /(г) = 2 //(—г)' Рав' номерно ограничен в ®(Л), а аппроксимации Паде [М — \/М] функции (z)-J~1 [f (г)—/(г)] могут быть представлены в виде B.16). Завершается доказательство очевидным образом. Итак, мы установили, что последовательность аппроксима- аппроксимаций Паде [М — 1/Л4] ряда Стильтьеса строго возрастает и огра- ограничена в любой точке положительной вещественной полуоси. Таким образом, эта последовательность сходится. На самом деле полученные результаты позволяют доказать более сильное утвер- утверждение, чем поточечная сходимость. Для того чтобы сформули- сформулировать это утверждение, нам понадобится понятие равностепен- равностепенной непрерывности последовательности функций [Courant and Hilbert, 1953, гл. 2]. Определение. Последовательность функций fm (г), т = 0, 1, ..., определенных в области ®, равностепенно непрерывна, если для всякого е > 0 найдется б > 0, зависящее только от е, 1акое, что при zlt z2?eD и |г, — гг | < б 1/т(г1)—fm (гг) I < е Для всех /га = 0. 1, 2, ... . B.21) Наиболее существенным в последнем определении является то, что 6 = 6 (е) не зависит от т, гг и г2. Тем самым равносте- равностепенная непрерывность фактически означает, что свойство равно- равномерной непрерывности каждого элемента последовательности выполняется равномерно по всем элементам. Теорема 5.2.4. Последовательность аппроксимаций Паде \М — 1/М] ряда Стильтьеса равностепенно непрерывна в-@)(А). Доказательство. В силу теоремы 5.2.1 м " " р, > 0, у, > 0 при / = 1, 2, ..., М. Поэтому м м Из B.16) находим, что 2 P/Yi =/i- Подобно B.20), получаем отсюда
174 Гл. 5. Ряды Стильтьеса и ряды Пойа при ги 226Й>(Л). Таким образом, последовательность аппрок- аппроксимаций Паде [М — 1/М] равностепенно непрерывна в ?D(A). Следствие. Все парадиагональные последовательности аппрок- аппроксимаций Паде [М-{ J/M\ (при J^—1) ряда Стильтьеса равно- равностепенно непрерывны в &)(А). Доказательство аналогично доказательству теоремы. Свойство равностепенной непрерывности используется в сле- следующей теореме Арцела. Теорема 5.2.5. Для любой последовательности функций, равно- равномерно ограниченной и равностепенно непрерывной в Й>, найдется подпоследовательность, которая равномерно сходится в Й> к не- непрерывной функции. Доказательство. Выберем в &> счетное всюду плотное мно- множество точек Р = {г,, г2, ...}. Для этого воспользуемся тем, что счетное множество рациональных чисел \г/\ всюду плотно на интервале (—оо, оо) и образуем счетное множество \zjk—rf-\-irk\. Тогда его подмножество, содержащееся в ®, обладает нужными свойствами. Пусть Pj = \Z{, /=1, 2, ..., J)—множество первых J точек множества Р, S = ]/n(z), п = 0, 1, 2, ...} — заданная последовательность функций. Так как последова- последовательность S равномерно ограничена в ?й, то найдется St — подпо- подпоследовательность S, сходящаяся в точке Zj, S2—подпоследова- S2—подпоследовательность S,, сходящаяся в точке г2 и т. д. Таким образом, по построению S,—бесконечная подпоследо- подпоследовательность S, которая сходится в точках гг, г2, ..., zv Для любого е>0 определим б = б(е) в соответствии с B.21), так что »(«)—М*')|< в при л = 0, 1, 2, ....если г, г' 6® и \г—г'\<Ь\ в силу равностепенной непрерывности б не зависит от п. Выберем J настолько большим, что объединение б-окрестно- стей точек множества Pj покрывает ®: ®<= и {г: \г,—г\<Ц. Такой выбор возможен, так как множество точек \zy\ всюду плотно в ®. Тогда для любого г€® найдется Zj, такая, что j^.J и | Zj — г | < б. Последовательность Sj сходится в каждой точке Zj, j^J, поэтому найдется помер N, такой, что
5.2. Сходимость рядов Стильтьеса 175 для всех fm, fn?Sj, т, n> N и / = 1, 2, ..., J. В силу рав- равностепенной непрерывности следовательно, 1/«(г)—ЫгI<3е Для всех fm, fn?Sj, т, n>N. Построим последовательность функций, состоящую из У-х эле- элементов последовательностей SJt J~l, 2, ... . Тем самым най- найдена подпоследовательность заданной последовательности, кото- которая удовлетворяет критерию Коши равномерной сходимости, и теорема Арцела доказана. В теореме 5.2.3 установлена равномерная ограниченность в Й>(А) последовательности аппроксимаций Паде [М-\- J/M'\ ряда Стиль- гьеса, а в теореме 5.2.4 — равностепенная непрерывность этой последовательности. Таким образом, по теореме Арцела некото- некоторая подпоследовательность последовательности аппроксимаций Паде [М -\- J/M] ряда Стильтьеса равномерно сходится в ®(А) к непрерывной функции /(г). Теперь нам понадобится следующая известная теорема о рав- равномерной сходимости последовательности аналитических функций. Теорема Вейерштрасса [Tichmarsh, 1939, стр. 95J. Пусть все элементы последовательности функций gt (г), g2 (г), gH (г), ... аналитичны в области ®,, и эта последовательность равномерно сходится в произвольной внутренней подобласти @J области ?Dt к функции g(z). Тогда g(z) аналитична в ?D2. Непосредственно из теоремы Вейерштрасса вытекает, что функция f176 Гл. 5. Ряды Стильтьеса и ряды Пойа После доказательства сходимости парадиагональных последова- последовательностей [М-\- J/M] (при J ^—1) естественно возникают во- вопросы: что представляет собой предельная функция f[J) (г) и каков характер сходимости? Мы сначала дадим ответ на второй вопрос, а именно установим некоторые неравенства для коэффи- коэффициентов при степенях (— z)J в разложении аппроксимаций Паде в степенной ряд. Теорема 5.2.7. Пусть /(г)—формальный ряд Стильтьеса П*) = 2//(-*)'. 1 = 0 и пусть при L^M — 1 его аппроксимация Паде [L/M] имеет разложение [L/M]= if\L/M](-z)'. B.22) i = 0 Тогда ^ ti для всех L ^ ti Доказательство. При L^M — 1 существует каждая аппро- аппроксимация Паде [L/M] ряда /(г), поэтому разложение B.22) кор- корректно определено и имеет ненулевой радиус сходимости при фиксированных L и М. Если t'^L + M, то из определения аппроксимаций Паде и A.2) вытекает, что В противном случае, т. е. при i>L-{-M, ft _ f\L'M 1 = (flL + ИМ +11 _ B.24) При условии 2/С^г—L—М последнее слагаемое в B.24) обра- обращается в нуль в силу свойств аппроксимаций Паде. Рассмотрим теперь равенство B.6): B.25) Все нули полиномов A^+, (г) и &м(г) лежат на отрицательной вещественной полуоси; в точке г = О эти полиномы положительны.
5.3. Проблема моментов и ортогональные полиномы 177 Поэтому м = ао'П A+а/2)= где а0, ccj, .... ал>0 i = i П )— гJ+---, где а^, а;, а,, . Аналогично, [Дл (г) Лм+1 (г)] = «; + «I (- г) + о;(—г)« + • • •. где а'о, otf, а'г, ... > 0. Следовательно, в разложении B.25) по степеням (—z)f все ко- коэффициенты оказываются положительными. Значит, каждая скобка в B.24) положительна и h-f\L/M]>o. Теорема доказана. В качестве общей ссылки по теме настоящего параграфа при- приведем [ЕРА, гл. 15], а также [Baker, 1970], [Common, 1968], [Wynn, 1968J и [Brezinski, 1977, с. 82]. Упражнение. Используя доказательство теоремы 5.2.1, пока- показать, что все коэффициенты полиномов А 5Й'(дс) и &(мх'(х) положи- положительны. § 5.3. Проблема моментов и ортогональные полиномы В предыдущем параграфе остался невыясненным принципиаль- принципиальный вопрос о том, к чему сходятся аппроксимации Паде [М -f J/M] ряда Стильтьеса. Этот вопрос является частью более общей за- задачи, так называемой проблемы моментов: в какой степени ко- коэффициенты fj определяют меру dcp(u)? Если для некоторой по- положительной меры dq> (и), заданной для — оо < и < оо, все ко- коэффициенты ее /7= J иМф(и), / = 0, 1, 2, ..., C.1) — со конечны, то естественно назвать /у моментами, ассоциированными с этой мерой. Такая терминология имеет историческую основу.' под функцией ф' (и) понималась линейная плотность распределе- распределения массы, например, в балке. Тем самым функция ср' (и) необ-
178 Гл. 5. Ряды Стильтьеса и ряды Пойа ходимо оказывается положительной. Если балка имеет перемен- переменную плотность, то ф'(и) отлична от постоянной; если балка имеет массу, сосредоточенную в точке их, то в этой точке ср(«) имеет положительный скачок. Пределы интегрирования в C.1) указываются в соответствии с размерами балки. Математические вопросы, возникающие на основе физической интерпретации функции ф'(и), носят название проблемы моментов. Точнее, пусть заданы положительные величины//, / = 0, 1, 2, ... . Возникают вопросы: (i) Существование. Найдется ли положительная мера dq>(u), для которой f/ представляются по формуле C.1)? (И) Определенность. Является ли Лр {и) определенной одно- однозначно? (iii) Природа. Являются ли [fj\ моментами Стильтьеса или моментами Гамбургера? Ответы на все эти вопросы зависят от различных условий на моменты. В дальнейшем мы приведем решения указанных проб- проблем в зависимости от таких условий. Стильтьес дал четкий ответ на один из основных вопросов в виде следующей теоремы. Теорема 5.3.1. Если коэффициенты \jj, / = 0, 1, 2, ...} при всех я = 0, 1, 2, ... удовлетворяют детерминантным условиям D (О, п) > 0 и D A, п) > 0, то существует мера Стильтьеса dq> (и), такая, что со S). C.2) Кроме того, величины ff являются коэффициентами формального разложения в ряд функции Г J Доказательство. С помощью формулы Сильвестра получаем по индукции, что при условии D@, п) > 0 и D(l, п) > 0 опре- определители D (т, п) > 0 для всех т, п > 0. Рассмотрим последовательность аппроксимаций Паде[тМ — 1/М] формального степенного ряда 2//(-гу. C.4) i ™ о Теоремы 5.2.1—5.2.7 о свойствах аппроксимаций Паде основаны только на том, что все определители D(m, n) положительны. Следовательно, по теореме 5.2.6 аппроксимации Паде [М— 1/М] ряда C.4) равномерно сходятся к аналитической функции /1~иB)
5.3. Проблема моментов и ортогональные полиномы 179 / i \ V J ^— с с ImCO X\ Y 1 э- J 1 ^ / Рис. 1. Контур С—граница области ® (Д). Р/ в области ® (А) (см. рис. 3 из § 5.2). Из теоремы 5.2.1 вытекает м при i = 1, 2, C.5) i = i Из C.5) получаем 1т[УИ — 1/М](г) <0 при 1т г > 0, 1т[/М— 1/М](г) >0 при1тг<0, Re [М — 1/УИ] (г) = Re {[М — 1/М] (г)}*, = —Imp* —l/MJ(z)}*. C.6) C.7) C.8) C.9) Применим формулу Коши к функции [М— 1/М] и контуру С— границе области ®(А), в которой эта функция аналитична (см. рис. 1). Имеем В этом равенстве перейдем к пределу при R' —* оо. Так как ин- интеграл по окружности радиуса R' стремится к нулю, то с учетом
180 Гл. 5. Ряды Стильтьеса и ряды Пойа C.8) и C.9) получаем — СО Для фиксированного А > 0 при М —> оо имеем 1т **-" я J ш—г ^(ттЫтпт^ (ЗЛ1) о Для любого открытого интервала (и, v) на положительной ве- вещественной полуоси выберем А<^.и—и, e<^.v—и и положим v —) — ф(м+)= при условии, что предел существует; подробнее по поводу этой конструкции см. § 5.6. Формула C.12) приводит к мере Стиль- тьеса, для которой соотношение C.11) принимает вид lim [M — 1/М](г) = /(-1)(г)= \^~ C-13) ~* т о для г, не лежащих на отрицательной вещественной полуоси. Вопрос о величине функции ф(«) в точке разрыва не обсуждается, так как обычно эта величина не важна; таким образом, форму- формулой C.12) функция ф(и), по существу, определена. Аналогично, не теряя общности, можно положить ф@) = 0. Тем самым теорема доказана. Необходимо отметить, что эта теорема дает ответ на вопрос о существовании и природе моментов, но не решает проблему единственности. Доказательство единственности основано на до- дополнительном предположении и будет обсуждаться в § 5.4 и 5.5. Сделаем теперь замену переменных w = — г, которая поз- позволит нам установить замечательную связь между аппроксима- аппроксимациями Паде и ортогональными полиномами. Исторически орто- ортогональные полиномы возникли именно таким образом. Рассмотрим первоначальное представление
5.3. Проблема моментов и ортогональные полиномы и определим функцию F (ш) по формуле w— и w таким образом, F(w) имеет формальное разложение со F(w) = y -4^— = -^-+4 + --- • C-16) 1 = 0 Для построения множества полиномов \пт (и), т = 0, 1,2, ...}, ортогональных по мере dcp(u), воспользуемся соотношениями ^ яш («) «*с(ф (и) = 0, & = 0, 1, 2, ..., m—1. C.17) о Соотношения C.17) эквивалентны условию взаимной ортогональ- ортогональности полиномов \nm(u) nk(u)d182 Гл. 5. Ряды Стильтьеса и ряды Пойа Следствием такого подхода является ортогональность поли- полиномов п?(и) = ип'(Рт + лтЦ— и'1) C.21) относительно распределения uJ+1 d

5.3. Проблема моментов и ортогональные полиномы 183 слагаемое в C.24) равно <326) при преобразованиях здесь было использовано свойство ортого- ортогональности C.17). Из C.23) получаем яга (w) ^ пт (w) Используя символ О в формальном смысле, из C.20) и C.26) находим Следовательно, в силу C.24) -8OT), C.29) "in \—/ где Щ>т№ _« _ , -,-, . лт(ш) w-mnm(w) (—г)тлт(—\/г) * напомним, что pm(w) и лт (w) — полиномы от w степеней т — 1 и т соответственно. Следуя C.20), положим г)т Рт(—гХ)> C.30) V \е) = \—г) лт(—Z 1), где пт находится по формуле C.19), а рт — по формуле C.25). Из C.29) вытекает plm-1/m] (г) -№-.WM- C-31)
184 Гл. 5. Ряды Стильтьеса и ряды Попа ТаКИМ ОбраЗОМ, С ТОЧНОСТЬЮ ДО НОрМИрОВКИ ПОЛИНОМЫ p[m-Um] (г) и Q[m-'/m](z) являются числителем и знаменателем аппроксимации Паде. Кроме того, из C.24), C.26) и C.31) вытекает явная фор- формула для остатка L J яя(—г-1) J 1+ о 1+ги Другие формулы такого рода приведены в ч. 2, § 3.1. Соотношения C.14) — C.31) указывают другой подход к пост- построению аппроксимаций Паде. При таком подходе непосредственно из C.25) и условия ортогональности C.17) вытекает, что поли- полиномы рт (w) удовлетворяют тому же рекуррентному соотношению, что и лт (w). Для более подробного знакомства с темой настоящего пара- параграфа мы отсылаем читателя к работам [Allen et al., 1975] и [Karlsson and von Sydow, 1976|, в которых показано, что многие результаты из § 5.1—5.5 могут быть получены с помощью свойств, вытекающих из ортогональности. Упражнение 1. Полиномы Лагерра Ln(u) удовлетворяют усло- условиям ортогональности типа C.18). Доказать, что для соответ ствующей функции Стильтьеса справедливо равенство где Е1(г) определяется по формуле D.6.8) при |argz| /i> •••> !гм Для плотности Стильтьеса (см. A-2)). Используя формальные разложения / (г) = 2 fj (- г)' и [М/М], = 2 /Г1Щ (- г)>, / = о / = о доказать, что для остальных моментов справедлива оценка fj>f)MIM\ i>2M + \. Какую оценку лучше использовать, если заданы первые 2М-\ 2 моментов? Упражнение 3. Доказать свойство ортогональности C.17), используя метод упражнения 3 из § 5.1.
5.4. Ряды Стильтьеса, сходящиеся в круге |г|< R 185 § 5.4. Ряды Стильтьеса, сходящиеся в круге |z| /W, каждая аппроксимация Паде [М + JJM] имеет полюс на интервале (г0, 0). Пусть г — г1—предел полюсов г[М), ближайших к точке г = 0. Тогда |zj|<|zo| и из теоремы 5.2.7 вытекает, что для всех М > М, R'1 = lim sup fUm > Hm sup (/l?1 + -/«/*lI/m = | zl,M> I. Следовательно, |го| > \z1\^R, что противоречит нашей гипотезе. Таким образом, полюсы аппроксимаций Паде лежат в открытом интервале (—оо, R). Второй метод. Если f(z) аналитична в круге |г|<#, то ее интегральное представление Стильтьеса не имеет особенностей в этом круге, поэтому "" Пг)= ^- D.1) Можно считать также, что d 0 нулей пт(и) не принадлежат интервалу О < и < R~l; обозначим их через ии и2, ..., umi. Тогда зтя(и)
186 Гл. 5. Ряды Стильтьеса и ряды Пойа представляется в виде т, т Пт(и) = К 11 (U — U{) П (U—Uj), 1=1 l = m, + i где к — нормирующая постоянная. Рассмотрим интеграл /=Yj jj (н_идя {и)и Подынтегральное выражение обращается в нуль в точках мт1+], ..., ит, однако знака не меняет. Следовательно, величина / строго положительна. В то же время по свойству ортогональности / = 0. Полученное противоречие означает, что т, = 0, т. е. все нули лт(и) лежат в интервале @, R'1). Таким образом, все полюсы аппроксимации Паде [M + J/M] лежат на разрезе —оо < R В следующей теореме устанавливается, что при каждом J^z—1 предел fU)(z) последовательности аппроксимаций Паде [М +.///И] ряда Стильтьеса /(г) совпадает с /(г). Вновь приводятся два метода доказательства этого утверждения, основанные соответ- соответственно на интегральном представлении и свойствах ортогональ ных полиномов. Теорема 5.4.2. Пусть fu\z) — предел последовательности аппрок симаций Наде [М -(- J/M\ (J >— 1), аналитических в области S) (Л,. для ряда Стильтьеса f(z). Если f(г) сходится в круге |г|< /?, то /1У)(г) = /'(г) для всех У>—1. Первый метод. В силу предположения теоремы (область аналитичности функции f(z) показана на рис. 1). Из георемы 5.2.6 вытекает, что fU) (г) и /(г) имеют одно и то же разложение в ряд Тейлора. Следовательно, /<У) (г) = / (г) для каждого J ^—1. Второй метод. Воспользуемся явной формулой C.26) для остатка. Рассмотрим сначала случай J = —l. После обычной замены переменных w = — z-\ F{w) = — zf{z) в силу C.26) и C.27) имеем R-1 С ""d J |1-
5.4. Ряды Стильтьеса, сходящиеся в круге \г\ < R 187 , lmz -R Рис. 1. Область аналитичности функции /(г). По теореме 5.4.1 нули полинома пт(и), щ, щ, ...,ми, лежат на интервале (О, R'1). Поэтому R-' F(w) риИ <—i— С dlP(") fr *""' яя(ю) *** |Ы?|« J |ю_и|.Ц О 1=1 И— и; О) — Пусть — произвольная постоянная; тогда при \w\> kR~l D.2) Отсюда вытекает сходимость аппроксимаций Паде [т—l/т] при \w\y2R~1 к функции f(z). В случае произвольного ./> — 1 вопрос о сходимости аппроксимаций Паде [M + J/УИ] функции /(г) сводится к сходимости аппроксимаций Паде [М—1/М] функции ,J+l Из второго метода доказательства вытекает, что скорость схо- сходимости геометрическая, как и следовало ожидать из. условий порядка аппроксимации. Более тонкий результат, содержащийся в теореме 5.4.4, получается при помощи леммы Шварца в сочета- сочетании с первым методом. Однако наиболее точный результат (см. стр. 191) устанавливается после усовершенствования второго метода. Теорема 5.4.3 (лемма Шварца). Пусть f(z) аполитична в круге \z\188 Гл. 5. Ряды Стильтьеса и ряды Пойа .Jmz Рис. 2. Область Тогда в+1 при |г|<Я. Доказательство. Применим теорему о максимуме модуля функции ff(z) = z-(»+1V(z), аналитической в круге |г|^/?. Так как |g(z)| ^ R-"~lM при | г I = R, то по этой теореме Следовательно, для п+1 R М для и теорема доказана. На самом деле аппроксимации Паде сходятся к ряду Стильть- Стильтьеса гораздо быстрее, чем можно было предположить, опираясь на формулу D.2). В следующей ниже теореме устанавливается инте- интересный результат о скорости сходимости аппроксимаций Паде, из которого становится ясно, чего можно ожидать от метода Пале в общем случае. В этой теореме впервые в настоящей гларе рассматривается сходимость произвольной последовательное i у
5.4. Ряды Стильтьеса, сходящиеся в круге \г\< R 189 вида [Мк-\- JK/MK]. Это стало возможным после того, как уста- установлена сходимость всех пара диагональных последовательностей к общему пределу. Сходимость доказывается в ограниченной области i§>+ (А), которая больше области 3) (А) и изображена па рис. 2. Точнее, @+(А), множество точек круга |г|<./?тах, уда- удаленных от луча —оо < г <—R на расстояние, большее А. Теорема 5.4.4 [Baker, EPA, стр. 220]. Пусть f(z) — pnd Стильтьеса с радиусом сходимости R > 0, {Pk(z)}—произвольная последовательность аппроксимаций Паде вида [Mk -\- Jk/Mk] ряда /(г), Jk^—1. Положим p — R — А > 0. Тогда скорость сходимости последовательности {Pk (г)} в области S>+ (А) задается неравен- неравенством \Pk (г) -f{z) | \Гр+г+\Г Р Следствие 1. Для последовательности [M фиксировано, имеем •const. J/M], где ¦iM • const. D.3) —1 D.4) Следствие 2. Для лучевой последовательности аппроксимаций Паде [L/M], L — kM и Я^1, имеем г р" \Р„ B)-/ (*) К •const. D.5) Доказательство. В силу результатов § 5.2 7 Л1 (=0 ^ const D.6) D.7) для г € ® (А) и всех М, J ^ 0. Легко видеть, что D.7) справед- справедливо и в области S>+ (А). Используя лемму Шварца, получаем -?/,(-*)' i=0 ¦ const для | z | < р и всех М, J^0. Ясно, что последнее неравенство справедливо и для z€®+(A). Далее, для г?й>+(А) г К + 1 , — • const,
190 Гл. 5. Ряды Стильтьеса и ряды Пойа поэтому J/M]-[(Z)\< Рассмотрим отображение Jpw г - A а • const. -Ур vv D.8) D.9) Найдем образ при таком отображении единичного круга в до-пло- до-плоскости: т = ё%, 0<9^2л. Имеем или |/"p+7=(=1. Представим D.8) в виде [M + J/M](z(w))-f(z(w)) <Р -j-i с, где с>0 не зависит от z(w), J и М, а г?й)+(А). При г —>¦ 0 левая часть последнего неравенства стремится к нулю как z2M, а значит, и как w2M. Следовательно, по лемме Шварца \[М + J/M] (г (w)) — f(z (w)) | Отсюда, наконец, получаем для г?® \[M + J/M]-f(z)\< w "с. С. D.10) Случай У = —1 проще общего случая ./^0, так как отпадает необходимость вычитать первые 5.4. Ряды Стилыпьеса, сходящиеся в круге \г\ < R 191 •• 4.0 ** ao ••' г. 1 \ -3,0 -20 / \ ^ • • . -4,0 -5.0 Imz - - - - - ill! 1.0 2,01 3,0 4,0 / » Rez Рис. 3. Сердцевидная кривая — граница области D.11). Точками обозначены нули аппроксимаций Паде [4Л//Л/], Л/ = 1, 2, 3, 4, 5. с расположением их полюсов и нулей. Все полюсы и часть ну- нулей аппроксимаций лежат на разрезе, где, таким образом, обя- обязательно имеет место расходимость. Остальные нули располагаются вдоль границы некоторой области, вне которой расходимоаь аппроксимаций Паде установлена вычислительными методами. Такие нули для аппроксимаций Паде [20/5J, [16/4], [12/3J, [8/2] и [4/1] показаны на рис. 3. Ясно, что теоретическая область сходимости D.11) меньше эмпирической области. Замечательным является то, что обе области имеют сердцевидную границу и сравнимые размеры. На самом деле при каждом h~^\ нули чис- числителей лучевой последовательности аппроксимаций Паде [WW/./W] функции г~ЧпA-; г) намечают контуры области, внутри кото- которой сходится аналогичная последовательность аппроксимаций
192 Гл. 5. Ряды Стильтьеса и ряды Пойа Паде любого ряда Стильтьеса с единичным радиусом сходимости [Graves-Morris, 1981]. Наша следующая теорема—о рядах Стильтьеса с ненулевым радиусом сходимости R; в ней утверждается определенность проблемы моментов. Это означает, что коэффициенты /у имеют единственное представление я-1 /,= $ и/dtp (и). D.12) о Такой результат является следствием следующей простой теоремы. Теорема 5.4.5. Проблема моментов для конечного интервала определена. Доказательство. Предположим, что существуют две различ- различные меры d(f1 (и) и d% (и), для которых ь ь fJ=lu'd
!— Ф2) = О для любого полинома р(и). Из тео- а b ремы Вейерштрасса вытекает, что j i|:(«)d(cpT — ф2) = 0 для любой а непрерывной функции г|)(«). Так как разность ср, (и) — ср2 (и) имеет ограниченную вариацию, то ф, («) — Ф2(и)=соп51 всюду, за воз- возможным исключением общих точек разрыва функций ф! и ф2. Итак, в этом параграфе мы доказали, что если /(г) — сходя- сходящийся ряд Стильтьеса, то парадиагональные последовательности [M + J/M], J ^—1, сходятся к одному и тому же пределу и определяют единственное решение проблемы моментов. § 5.4.1. Хаусдорфова проблема моментов Если ряд Стильтьеса имеет радиус сходимости R = 1, то соот- соответствующая проблема моментов называется хаусдорфовой. В дей- действительности с помощью простой замены переменной г в пред- представлении D.1) можно всегда сделать R равным единице. Поэтому, не теряя общности, будем считать, что функция Стильтьеса имеет вид = ? fji—гУ, D.13а)
5.4. Ряды Стильтьеса, сходящиеся в круге \z\ < R 193 где 1 fj*=]u*dv{u), / = 0,1,2,...; D.13b) о ф(ы)—ограниченная неубывающая функция на 0^м^1. Мо- Моменты D.13) называются хаусдорфовыми, а хаусдорфова проблема моментов состоит в построении функции Ф (и) по данной после- последовательности /0, /j, /2, .... Выше эта задача была решена с помощью аппроксимаций Паде (см. C.12)). Установим связь между хаусдорфовой проблемой моментов и понятием вполне мо- монотонной последовательности. С этой целью определим разност- разностный оператор А по формуле Л// = ^+1—//. / = 0,1,2,...; аналогично определяются разности более высокого порядка (см. § 3.1). Определение. Последовательность {//} называется вполне мо- монотонной, если (—1)*Л*^>0 для всех /, /г>0. D.14) Из определения немедленно вытекает, что вполне монотонная последовательность является положительной и монотонно убы- убывающей. Теорема 5.4.6. Последовательность D.13Ь) вполне монотонна. Доказательство. Из D.13) получаем, что при всех /, 1 (—1)*Д*/У = J (I —и)*и/ dcp (и) о и теорема доказана. Имеет место и обратный результат* если последовательность {/у} вполне монотонна, то справедливо интегральное представле- представление D.13). Лучшее из доказательств этого утверждения не ис- использует аппроксимаций Паде, за доказательствами мы отсылаем читателя к книгам [Wall, 1948, стр. 267] и [Widder, 1972, стр. 109]. Подробнее о хаусдорфовой проблеме моментов см. [Brezinski, 1978а], [Gragg, 1968] и [Wynn, 1966b]. § 5.4.2. Целочисленная проблема моментов Если заданные моменты л ), / = 0,1,2,..., D.15)
194 Гл. 5. Ряды Стильтьеса и ряды Попа являются целыми числами, то задача построения функции Стиль- Стильтьеса носит название целочисленной проблемы моментов [Barnsley et al., 1979]. В качестве примеров рассмотрим простейшие случаи Л = 1 и Л = 2. Пример 1 (Л = 1). Из D.15) вытекает, что в этом случае мо- моменты {fj, 1 = 0, 1, 2, ...} образуют положительную убывающую последовательность. Поэтому //—>/„, где /„—целое число. Сле- Следовательно, найдется номер п, такой, что // = /„ для всех j~^n. Отсюда получаем о значит, dq> (и) =[Лб (и) + Вб («— l)]du и fj = /, для всех / > 1. Таким образом, функция / (г) совпадает со своей аппроксима- аппроксимацией Паде [1/1]: Пример 2 (Л = 2). В этом случае по моментам D.15) по- построим последовательность целых чисел 2 тЛ=$«*B-и)*<*ф(и), ? = 0, 1,2, ... ; о {тк} — положительная убывающая последовательность. Поэтому существует т„, такое, что тк —*¦ тК; тем самым найдется номер п, такой, что т/ = т„ при всех j^n. Отсюда получаем г тп-тп+, = $ и* B-й)* A -и)*dtp (и) =0, о dtp (и) = [Аб (и) + Вб (и — 1) + Сб (и — 2)] du f/ = f1B—2/-l) + ftB^-i — \) для всех />1. Таким образом, как и в предыдущем примере, /(г) совпадает с одной из своих аппроксимаций Паде. Точнее,
5.5. Расходящиеся ряды Стильтьеса 195 Отметим, что в случае целочисленной проблемы моментов выбо- выбором Л = 2 полюсы функций f (г) определяются однозначно. Решение целочисленной проблемы моментов известно для Л ^ ^4. Для каждого Л<4 решение /(г) совпадает со своей ап- аппроксимацией Паде конечного порядка, г. е. является рациональ- рациональной функцией. Для Л = 4 возникает новый тип решения } (г) = т A +4г) ~!/2, т—целое число. Известно также, что проблема моментов D.15) для произволь- произвольного Л сводится к случаю Л^б [Barnsley et al., 1979]. В заключение отметим, что ответ на вопрос из § 5.3 о при- природе заданной последовательности моментов не сводится к вы- выяснению того, являются они моментами Стилыъеса или моментами Гамбургера. Полный ответ включает более точное нахождение носителя меры d 0, то /„ = 0 для всех я>0. § 5.5. Расходящиеся ряды Стильтьеса Начнем с примера функции, имеющей расходящийся ряд Стильтьеса. Пусть при а > 0 03 /(г)=,/0(а, i.-z^^J^da; E.1) /(г)—функция Стильтьеса, представленная в обычной форме: о где и vM=s7M§e-'ta~ld!- E-3) о Имеем 03 / (г) = S f/ (—гO = 1 — аг + а (а + 1) гг + ..., E.4) где \d
196 Гл. 5. Ряды Стилыпьеса и ряды Попа Трудность заключается в том, что ряд E.4) расходится для всех 2, за исключением г = 0, так как его общий член не стремится к нулю. Однако, как известно из § 5.3, парадиагональная по- последовательность аппроксимаций Паде [М + ^/М] формального разложения E.4) сходится в ограниченной области Й>(Д), не содержащей начала координат. В этом параграфе будет показано, каким образом аппроксимации Паде используются для восста- восстановления функции по расходящемуся степенному ряду. Мы огра- ограничимся здесь рядами Стильтьеса, для которых можно доказать теоремы о сходимости. Отправной точкой метода аппроксимаций Паде является функ- функция f (г), которая определяется своим рядом Тейлора. Однако, вообще говоря, произвольная функция не определяется своим рядом Тейлора. Проиллюстрируем этот факт следующим при- примером. Пример 1. g(x) — ехр (—1/*), О^лг^оо. Функция g(x) определена вместе со всеми своими (правосторон- (правосторонними) производными для вещественных i^O и di g (x) = 0 при / = 0, 1,2, .... Таким образом, каждая функция / (х) имеет то же самое раз- разложение в ряд Тейлора в точке х — 0, что и функция / (х) -\- g(x). Ясно, что нужно ограничиться рассмотрением таких функций, которые однозначно определяются своим степенным рядом. Если мы предположим, что /(г) аналитична в точке г = 0, то ряд Тейлора для /(г) имеет ненулевой радиус сходимости и одно- однозначно определяет ее аналитическое продолжение в звезду Мит- таг-Леффлера. Аналитичность функции /(г) в точке г = 0 лежала в основе всех результатов § 5.4, однако это ограничительное предположение не соответствует целям настоящего параграфа. Мы подчиним функцию /(г) более слабому условию, благодаря которому f (г) будет определяться своим рядом Тейлора. Вторая трудность, с которой мы сталкиваемся, заключается в том, что в случае расходящегося ряда Стильтьеса представле- представление E.2), вообще говоря, не единственно. В связи с этим и возникает проблема единственности, упомянутая в § 5.3. При- Приведем теперь пример нетривиальных мер d%(u), соответствующих функциям ограниченной вариации фо(«). для которых \икс1ц>0(и)=-0, /г = 0,1,2 о
5.5. Расходящиеся ряды Стилыпьеса 197 Пример 2 (Реннисон). d(Po(") = X Bя+1I б(Г~ 2*"+'>d"- Это распределение соответствует кусочно-непрерывной функции, скачки которой имеют чередующиеся знаки; Ф„ (м)—функция ограниченной вариации, и ик dB(и) = ± ехр [(^J] J e-'fsin2nrf/ = Таким образом, чтобы обеспечить единственность функции I (г) и меры rfcp(M), необходимо наложить некоторые дополни- дополнительные условия на моменты {ff}. Эти условия слабее условия аналитичности f (г) в точке г = 0. Начнем с разложения в ряд 03 СО 2^-2//(—гУ. E.6) ;=о /=о Этот степенной ряд сходится в обычном смысле к функции / (г) в точке г = г0, если Ига 2 с,го = /(г„). E.7) п -* х j = 0 Из существования предела E.7) вытекает сходимость ряда E.6) для всех таких г, что |г|<|г„|, и таким образом возникает круг сходимости. Вместо этого в настоящем параграфе нам по- понадобится асимптотическая сходимость. со Определение. Степенной ряд 2 cjz' асимптотически сходится 1 = 0 к функции / (г), если Г п \ = 0 E.8) Ига г-* с [/(г)-2 L /=°
198 Гл. 5. Ряды Стилыпьеса и ряды Попа ЦП I Рис. I. Клиновидная область асимптотической сходимости. п-ри —a5.5. Расходящиеся ряды Стильтьеса 199 няется асимптотические равенство 2 /,(-z)'~Mz). (На самом деле это равенство выполняегся также в любом круге W, изображенном на рис. 2 из § 5.6.) Возвратимся к примеру 4, в котором функция Е (г)—част- (г)—частный случай функции E.4) при а=\. Ряд Эйлера E.9) является рядом Стильтьеса, поэтому он удовлетворяет детерминантным условиям из теоремы 5.1.2. По формуле Стирлинга — /1 ~ ( — J 1/л/ при / —* оо 2/> ~ ( 4- V 2 Bя/)~!/D'' при / —у оо. Так как Bл/)-1/D'> —>¦ 1, то ряд 2 //~|/B/) расходится, и теорема Карлемана утверждает единственность функции Стильтьеса ?Ldu. E.11) определенной при —n— 1 сходятся к функции / (г) в области S) (А). Доказательство. По теореме Карлемана, существует только одна функция Стильтьеса /(г), аналитическая при Re г > 0 и такая, что имеет место асимптотическое равенство /() 2о,() Случай />0 выделением первых J-\-l членов ряда /(г) (так же как в следствии теоремы 5.2.3) сводится к случаю J = —1. По теореме 5.3.1 существует предел /(""(г) последовательности аппроксимаций Паде [М—-1//WJ; функция /1"п(г) апалитична в со ®(Д), и в силу C.3) /(-"B)~ 2 f/i-гУ- Поэтому /'-1' (г) = = /(г) при Нсг>0, а значит, и для всех г из области S> (A).
200 Гл. 5. Ряды Стшьтьеса и ряды Попа Интересно применить разработанную в этом параграфе тех- технику в теории, связанной с формулой Стирлинга. Для этого нам понадобится вторая формула Бине 1пГ(г) = (г—Mlnz —г + ^\п2п +J(z), E.12) где 03 / /*ч_9 rarotg(//g) dt /С 1Qo\ J exp Bл/) — 1 ' n ОС —e );гг7г- E.13b) Доказательство [Ford, 1960, гл. 1; Hardy, 1956, стр. 339]. Положим n " /?(n) = ^ In/ — у Inn— Cln^djc. E.14) /¦= 1 1 Выведем формулу для /? (/г) с помощью контурного интеграла л $ ^-|/^ In z с(г = V In /—2"ln гг. E.15) Контуры С, и С2 изображены на рис. 2, интеграл понимается в смысле главного значения, а формула E.15) получена с по- помощью теоремы о вычетах. Так как In г вещественно-симметрич- вещественно-симметричная функция, то п \\nxdx = -x-\ Inzdz — -н- \ \nzdz. E.16) I 0, с; Подставляя E.15) и E.16) в E.14), находим /? (п) = V \|), In г dz + \ \|J In z dz, 8, i где ctg лг i I т 1 \ ) о/ " i7\ л (-1 - ctgпг | ' - ' lPllZ)~ 2( ^ 2 ~ 1 -ехр ( —2гог)- Устремим теперь К к оо (см. рис. 2), тогда получим arctgWn) ., о Р arctg f ,
5.5. Расходящиеся ряды Стильтьеса 201 *-Rez -У Рис. 2. Контуры Cj и Са в комплексно» плоскости. Вычисляя интеграл в E.14), находим R (п) = In (я!) —i in n— [x In *—*]?. E.18) Из E.17), E.18) и определения E.13) вытекает, что 1пГ(я) = (я —-g")ln« — n + J(n) + C, где С—постоянная, не завиеящая от п. Величина С определя- определяется с помощью формулы Стерлинга (см. [Titchmarsh, 1939, стр. 150J) и равенства J(-\ оо) = 0. Таким образом, формула E.12) установлена для всех положительных целых г = 1,2,3, .... В теореме единственности Карлсона (см. [Titchmarsh, 1939, стр. 186J) утверждается, что если некоторая функция /(г) ана- литична при Rez>0, при Rez > 0 растет не быстрее ехр(&|г|), k < я, и удовлетворяет равенству /"(г) = 0для г = 0, 1, 2, ..., то она обращается в нуль тождественно: /(г) = 0 при Rez>0. Тем самым формула E.12) доказана. Для того чтобы сравнить E.12) с формулой Стирлинга [Titchmarsh, 1939J Г(г) = гге"г/2яг{1+О(г~1)} при | argг[ < зх, |г|—»оо, перепишем E.12) в виде Re г > U.
202 Гл. 5, Ряды Стильтьеса и ряды Пойа Пользуясь определением E.13а) и разложением (—1)" С и2" du "z"^1" J u2 + z2 о находим асимптотическое разложение функции J (г) 21 \\J f 7-B/ + l> /К |Q\ \— / /У ' \ / 1 = 0 где /, = — Г u'i In A — е-2л") d«, / = 0, 1, 2 E.20) о Отметим, что функция J (z) аналитична при Re?>0. Поэтому можно сделать замену переменных в E.13) и E.19). Положим J — z~2 и К [у) = zJ (z). Тогда 1 = 0 <5-21» Из соотношения E.21) вытекает, что К (у) — расходящийся ряд Стильтьеса. Из формулы E.20) получаем / W ? _1_, /=я0.1,2 E.22) Нетрудно доказать, что ряд 2 fj1"'2" расходится и выполняется критерий Карлемана. Следовательно, функция К {у) однозначно определяется последовательностью аппроксимаций Паде [М— \/М] и своим разложением в непрерывную дробь при |argy|0. Используя числа Бернулли, за- запишем асимптотическое разложение функции J (г) в следующем виде (см. [Abramowitz and Stegun, 1964, гл. 23] и [Wall, 1948, с. 364]): V- B.V + » J (г) ^ LB/j-i)B/J-2)^<2/+1> = 12 360 ' 12С0 1080 ' 1188
5.5. Расходящиеся ряды Стильтьеса 203 Отсюда получаем разложение J (г) в непрерывную дробь (см. [Char, 1980]): J_ j_ _53_ [95 у(г)_1* JO M Ш ., E.23) сходящееся при Rez>0. Непрерывная дробь быстро сходится лишь для первых восьми подходящих дробей, дальше сходимость ухудшается Причина такого явления становится понятной, если привлечь теорию областей включения (подробнее см. [Henrici and Pfhiger, 1966] или I; PA). Этот пример приводит нас к изучению связи между S-дробями D.5.5) и рядами Стильтьеса A.1)—A.3). В 1еореме 5.5.1 даны достаточные условия, при которых по- последовательности аппроксимаций Паде {[/И—1/М]\ и {[УИ/УИ]} ряда Стильтьеса сходятся к f (г). Используя формулы D.4.25), представим эти аппроксимации как подходящие дроби непрерывной дроби где 0@, coc, ~D@, O)DA, 0)' E.25) __ C{M/M)C (Л1—2/М — 1) __D A, M— 1) D @, M — 2) a2,W — — С(Л/- 1/Л1 - 1)С(/И — 1//И) = /5 A, /W—2) /5 @, M — 1)' = C(M/M + l)C(M — l/M — \)_ D@, M)DA, M—2) fl2AHi— С(/И-1//И)С(/И//И) ~"D@, M— 1)DA, M — I)' Заметим теперь, что а{ > 0 при t = l, 2, 3, .... Таким образом, доказан следующий результат. Теорема 5.5.2. Если f (z)— функция Стильтьеса, то непрерыв- непрерывная дробь E.24), построенная по соответствующему ряду Стильтьеса, является ^-дробью Обратное утверждение вытекает из теоремы, доказанной в книге Перрона [Perron, 1957, стр. 208]. Мы приведем это утверждение в следующем виде. Пусть дробь zfc (z), построенная по дроби E.24), является сходящейся S-дробью. Тогда последо- последовательность ее подходящих дробей сходится к функции Стильтьеса
204 Гл. 5. Ряды Стильтьеса и ряды Пойа /(г) с представлением A.1), где функция ср (и) определена по существу однозначно. Не доказывая этого результата, отметим, что условие а,- > 0 является достаточным для положительности определителей D{m, n) при всех т, п > 0. Отметим также, что предположение о сходимости S-дроби существенно для доказа- доказательства единственности функции ф(«). В заключение этого параграфа отметим, что существуют раз- различные типы условий на вещественную функцию S(co), опреде- определенную при O^w^oo, необходимые и достаточные для того, чтобы S(to) имела представление Стильтьеса вида D.5.8). В ка- качестве примера приведем один из них. Теорема 5.5.3. Для того чтобы функция S (а) имела интег- интегральное представление $?# E.26) с ограниченной и неубывающей функцией ср (и), необходимо и до- достаточно, чтобы выполнялись условия: S (со) ^ О )}>0, ?=1, 2 0<со<оо, и существует конечный предел coS (со) при со—s--f-°°- Доказательство этой теоремы дано в книге [Widder, 1972, с. 364]; подчеркнем, что это только один из подобных резуль- результатов, характеризующих функции Стильтьеса [Widder, 1972, гл. 8]. Мы не приводим никаких деталей доказательства, так как ни в формулировке, ни в доказательстве не используются аппрокси- аппроксимации Паде. Из представления A.1) для функций Стильтьеса вытекает, что они являются вполне монотонными функциями, определен- определенными на полуоси [0, оо]. Значит, они принадлежат классу абсо- абсолютно непрерывных функций [Widder, 1972, гл. 4]. Упражнение. Пусть /(г) — ряд Стильтьеса, a g(z) определя- определяется соотношением Используя формулу Адамара (см. теорему 1.6.1), доказать, что коэффициенты разложения
5.6. Ряды Гамбургера 205 удовле[воряюг неравепс гвам ,-, , . Sm + 1 S/n + 2 Dg(m, n) = >o rn + n Qm+n+i ' ' ' &й+!л для всех т, n^O. Как еще можно получить этот результат? § 5.6. Ряды Гамбургера и проблема моментов Гамбургера Функция Гамбургера определяется интегральным представле- представлением - J 1+иг' функция ф (и) возрастает, а моменты f,= ^иЫц>(и), / = 0, 1, 2, ..... F.1) F.2) конечны [Hamburger, 1920, 1921]. Рядом Гамбургера называется ряд /= О 1 = 0 где //—моменты F.2), этот ряд получается формальным разло- разложением функции F.1). Так же как и для ряда Стильтьеса, из рассмотрения исключается случай, когда ср(ы) — кусочно-постоян- кусочно-постоянная функция с конечным числом скачков, т. е. функция f (г) рациональна. Характерной особенностью ряда Гамбургера явля- является интегрирование по всей оси (— оо, оо). Обратная задача нахождения функции f (г) по моментам называется проблемой моментов Гамбургера. Иногда ряды, функции, моменты Гамбур- Гамбургера называют соответственно обобщенными рядами, функциями, моментами Стильгьеса. Ряд Гамбургера является более общим понятием, чем ряд Стильтьеса, поэтому моменты Гамбургера удовлетворяю! более слабым условиям, чем моменты Стильтьеса. Как и выше (см. A.12)), положим I т I /я+1 ' ' • I т+п D {т., п) = I m + 1 ' I т+п+1 /т+п / т + п+1 • ' ' ha + in F.3)
206 Гл. 5. Ряды Стильтьеса и ряды Пойа Теорема 5.6.1. Если \ff, / = 0, 1, ...}—моменты Гамбургера F.2), то определители DBm, п) > 0 для всех т, п > 0. Доказательство. Точно так же, как и в доказательстве тео- теоремы 5.1.2, используется неравенство игт (х0 + ххи и) > 0. Отметим, что если не выполняется условие DBm-j-l> n) > О для всех т, п^О, то соответствующий ряд не является рядом Стильтьеса. В следующей теореме утверждается, что все полюсы аппроксимаций Паде ряда Гамбургера лежат на вещественной оси и отличны от нуля, а сами аппроксимации имеют положительные вычеты в отрицательных полюсах и отрицательные вычеты в по- положительных полюсах. Теорема 5.6.2. Если коэффициенты \ff\ удовлетворяют нера- неравенствам D@, п) > 0 для всех п > 0, то аппроксимации Паде [М—1/УИ] формального степенного ряда 2 f/ (—гУ представ- представляются в виде м F.4) М. где f>[ > 0, уi вещественны при /=1,2, . Доказательство. Опираясь на тождество Сильвестра и нера- неравенство D (О, п) > 0, получаем по индукции, что D Bт, п) > О для всех т, п > 0. Сделаем теперь замену переменных ш*=—г~х и воспользуемся методом доказательства теоремы 5.2.1. Знаме- Знаменатель Паде равен o— /i + г//И+1 ••• /2Al-2"~b2/s f. — Л ... wjM-lm F.5) Следуя методу 2 доказательства теоремы 5.4.1, рассмотрим по- полином
5.5. Ряды Гамбургера 207 Его старший коэффициент равен D@, М — 1) > 0, следовательно, и сам полином пм (w) положителен при достаточно больших по- положительных значениях w. Из тождества Сильвестра вытекает, что лм-1 И Яд,+, (w) < 0, если лм (w) = 0. Отсюда с помощью соотношений ло(до)=1 и n1(w) = wf0—/, по- получаем по индукции свойство чередования нулей полиномов пм (w). Рассмотрим теперь возможность обращения в нуль в точке w — 0. Этот случай соответствует тому, что QlM~ ]/мЦг) имеет степень М — 1 вместо М, что противоречит условиям Гамбур- Гамбургера. Знаки вычетов определяются с помощью метода теоремы 5.2.1 Таким образом, теорема доказана. Идея использования переменной w = { — г) заимствована из теории ортогональных полиномов. Так же, как в § 5.3, устанав- устанавливается, что полиномы nM(w) ортогональны по положительной мере, нули лм (w) лежат на вещественной сси, нули последова- последовательных полиномов чередуются между собой. Изменяя ход изложения материала § 5.2, мы исключаем ана- анализ сходимости последовательности аппроксимаций Паде при х > 0, к данному случаю не имеющий отношения, и переходим к теореме 5.2.3 о равномерной ограниченности парадиагональных последовательностей в S> (Л). Аналогом этой теоремы является Теорема 5.6.3. Последовательность аппроксимаций Паде [М — 1 /М ] ряда Гамбургера равномерно ограничена при М —>• оо в ограниченной двухкомпонентной области ED1 (А) комплексной г-плоскости, отстоящей от вещественной оси не меньше, чем на А. Замечание. Компоненты S)' (А) показаны на рис. 1. Доказательство аналогично доказательству теоремы 5.2.3. Аналогом теоремы 5.2.4 является Теорема 5.6.4. Последовательность аппроксимаций Паде [М — 1/М] ряда Гамбургера равностепенно непрерывна в &>' (А). Доказательство аналогично доказательству теоремы 5.2.4. Теперь к последовательности \М — 1/М] применима теорема Арцела, и мы получаем следующий результат. Теорема 5.6.5. Существует бесконечная последовательность аппроксимаций Паде \М — 1/М] ряда Гамбургера, которая равно- равномерно сходится в &)' (А) к аналитической функции f(z). Теорема 5.6.5 отвечает не на все вопросы. Однако если коэф- коэффициенты \fj\ таковы, что f(z) аналнтична в круге |z|208 Гл. 5. Ряды Стильтьеса и ряды Пойа Рис. 1. Область §?>' (А). Теорема 5.6.6. Пусть коэффициенты \ff\ таковы, что D @, п) > О ОО для всех п и ряд 2 fj( — zY сходится в круге \z\(и), / = 0, 1,2, ...; 1 (и) мера d
0, то по теореме 5.3.1 справедливо представление - im - i Методами доказательства теоремы 5.4.1 устанавливается, что по- полюсы аппроксимаций Паде [М—1/УИ] ряда 2 I/ (— А' лежат на /= о
5.5. Ряды Гамбургера 209 разрезах —оо < z < — l/R и l/# 0 для всех п = 0, 1, 2, .... Пусть /(г)— предел сходящейся подпоследовательности аппрокси- i 00 маций Паде \М — \/М] формального ряда 2//( — гУ ¦ Тогда функ- i=0 ция /(z) вещественно-симметрична, аналитична в полуплоскостях Imz>0 и 1тг<0 и имеет асимптотическое разложение 00 /(г)^ 2/у ( — «К при г-* 0, z€#, F.7) /=о где "ё — произвольный круг радиуса г с центром в точке z — ir или в точке z= —ir (рис. 2). Замечание. Существование но крайней мере одной сходящейся подпоследовательности аппроксимаций Паде [М — 1/М] гаранти- гарантировано теоремой 5.6.5. Доказательство. Покажем сначала, что для каждого целого 2k \ _ V f (_,\М 2 / = 0 z)'}->0 при г — 0, ?•€#, F.8) равномерно по М > k.
210 Гл. 5. Ряды Стилыпьеса и ряды Попа i Imz ¦Rez Рис. 2. Круг % радиусом г с центром в точке z=ir. Для аппроксимаций Паде справедливо представление F.4), поэтому М М оо Pd-T^; F.9) i=I /=0 разложение сходится в круге |г|< RM, Разложение F.9) совпадает с заданным степенным рядом до сте- степени z'2M~' включительно; следовательно, 2k M оо [м— 1/м]— 2 //(— z)J= 2в 2 (—< 2 /=0 2, 2 i-1 /ш2*+1 для й < М и | г | < /?л!. Поэтому F.8) справедливо при каждом фиксированном M>bi |z|< RM, г€%. Далее, имеем ¦2 k [m_i/m]-2//(-« (=0 м 1= 1 М оо 2 Р, 2 (-гу,- М оо У У в (— г 4=1 . F.10)
5.6. Ряды Гамбургера 211 Если z€#. то Im z^s|Rez|*/Br). Рассуждая так же, как и в теореме 5.2.3, получаем sup V Следовательно, величина \гA +yiz)~1\ равномерно ограничена для z 6 # по всем М. По предположению k < М — 1, поэтому Л) /2/S+2- Таким образом, равномерно по /И > ,-гк 2к [Л1-1/М]—2 /,(—«к /=0 О при z—-О, Рассмотрим теперь подпоследовательность М —>¦ оо, такую, что последовательность [М — 1/УИ] сходится к функции f (г) в области <3)'(А). Тогда из последнего соотношения получаем Следовательно, ;=о 1=0 О при О при z — 0, z € %, F.11) для всех целых k > 0. Таким образом, установлено асимптоти- асимптотическое разложение f(*) =* S М-г)Л Z-.0, г€*. ,-=о По теореме 5.6.5 функция f(z) — равномерный предел последова- последовательности аппроксимаций Паде — вещественно-симметричных функ- функций, аналитических при Imz^O. Значит, f (г) вещественно-сим- вещественно-симметрична и, по теореме Вейерштрасса (см. § 5.2), аналитична при Itn г =ФО. Чтобы получить интегральное представление функции / (w), удобнее воспользоваться переменной w= — z~x. Положим F.12) После сделанной замены последовательность аппроксимаций Паде м [М — 1/М] = Х,ГТ~, М = 1, 2, 3, ...,
212 Гл. 5. Ряды Стилыпьеса и ряды Попа формального ряда 2 fj(—гУ принимает вид /= О М ff-;, M=l, 2, 3, .... F.13) Из теоремы 5.6.5 вытекает, что последовательность F.13) сходится на множестве в до-плоскости, соответствующем множеству ЗУ' (Д). Можно доказать, что имеет место Теорема 5.6.8. Пусть коэффициенты {fj} удовлетворяют детер- минантным условиям D (О, п) > О для всех п = 0, 1, 2 Пусть ?DW (б) = {w: | Im w | > 6} — двухкомпонентная область в w-плоскости. Тогда для w ? S)w (б) существует предел F(w) некоторой подпоследовательности после- последовательности аппроксимаций Паде {~JM(w), M = 0, 1,2, . . .} фор- 00 мального ряда 2 f/W'^'1- Функция F(w) вещественно-симмет- рична, аналитична при 1тдо=^=0 и имеет асимптотическое раз- разложение 00 F (w) ~ 2 \]^о~'~г при w —> с», | Im w | > б, F.14) где б > 0 произвольно мало. Имеем также {ImF(w)} Imw < 0 при imw^O. F.15) Доказательство. Множество w\ Im до > б соответствует кругу Чё радиуса B6) ( см. рис. 2). Таким образом, теорема 5.6.8 пред- представляет собой переформулировку теоремы 5.6.7 в терминах переменной w = —г. Обозначим через Ш множество тех М, по которым подпосле- подпоследовательность JM(w) сходится в области й>ш(б). Теорема 5.6.9. Для аппроксимаций JM(w), определенных со- соотношением F.13), выполняется неравенство /о w V /о U j„(а))—Ц- < \.ш\ . F.16) м \ > w ^ w\\mw\ v ' w\\mw\ Предельная функция F(w), определенная в теореме 5.6.8,удовлет- 5.6.8,удовлетворяет неравенству
5.6. Ряды Гамбургера 213 Доказательство. Используя F.13), находим м /о Км И — Im Соотношение F.16) вытекает теперь из неравенства Коши —Шварца / М \ / М \ Vi= 1 /\(=1 / если положить a{ = yr{i{, b, = ]/r^i\y1\2; F.17) получается из F.16) предельным переходом по М —> оо, М^ЗЛ. После того как установлены теоремы 5.6.8 и 5.6.9, мы мо- можем приступить к нашей основной цели — построению интеграль- интегрального представления функции F(w). Нам понадобятся некоторые предварительные результаты. Лемма 1. Для каждого б > О Im F (и -f- id) du =—nf0. F.18) Доказательство. Так как ? (ш) аналитична в верхней полу- полуплоскости, то где С—контур ABCD, изображенный на рис. 3. Точке А соответ- соответствует комплексное число wA = d2 -f t, аналогично имеем wB = d2 + id, wc=— , wD= — Дуга ВС—дуга круга С с центром в точке w = 0 радиуса dV&-\-\. Используя F.17), оценим интеграл по АВ; \ F (w) dw J Подобным образом оценивается интеграл по дуге BCi
214 Гл. 5. Ряды Стильтьеса и ряды Пойа I -d2 } с IniW -id . t ] i A 1 *- d' Рис. 3. Контур С в ш-плоскости. Вычислим интеграл Отсюда прямо получаем, что lim ^ F (w)dw — — mf0. Соотношение F.18) вытекает из равенства мнимых частей в по- последней формуле. В соответствии с леммой 1 положим it <рF, «)=— - f ib)dt. F.19) Из теоремы 5.6.8 и леммы 1 вытекает, что АР F, Ц) ^ _^_ Im р {и + .б) > Таким образом, dq>F, w) —ограниченная мера Гамбургера.
5.6. Ряды Гамбургера 215 Лемма 2. При Im до > б > О ~ _. г l-f(« + ^=r *> (Д. ») . F.20) Доказательство. Пусть w — внутренняя точка контура С (см. рис. 3). Тогда Ъ i s I С F (w') dw' F (w) = о-т \ —V-1— . с Используя предыдущие рассуждения и полагая d—»• с», получаем 2яг — се Если точка да лежит внутри С, то точка w' =w*-\-2ib лежит во внешности С; поэтому по теореме Коши n 2л» — СО Применяя операцию комплексного сопряжения, находим 0 ' Г {Р^ГЧи • 2 Вычтем теперь F.22) из F.21) и получим у ' я J и-{-to — w — со Второе из равенств F.20) вытекает из определения F.19). Лемма 3. Пусть <р(8, и)—семейство функций, ограниченных и неубывающих по и, определенных для —оо<и<оо и б>0. Тогда существует последовательность {6f, i= 1, 2, 3, ...}, такая, что Ь{ -+ 0 и
(и, б), заданное формулой F.19), удовлетворяет условиям леммы 3. Доказательство. Выберем множество точек U = {uk\, всюду плотное на интервале (— оо, оо). Положим Do = [\/i, i = 1, 2, 3,...}. Последовательность чисел {ф(б, ux), 6?D0} ограничена, поэтому найдется Dx, подпоследовательность Do, такая, что последовательность {фF, иг), 6^Dj| сходится.
216 Гл. 5. Ряды Стилыпьеса и ряды Пойа Положим Игл ф(б, «,) = 6->- 0, Лб 0, Точно так же из D, выбираем подпоследовательность D2, для которой Продолжая этот процесс, для каждого целого k > 0 найдем под- подпоследовательность Dft, DkczDk_xcz . . . cD,, такую, что {Ф(б, «ft), 8eDft} -y Существует не более чем счетное множество точек разрыва функ- функции ф: найдется не более двух точек, в которых Дф!>/0/2; не более четырех точек, в которых fo/4 ^ Дф < /0/2; не более восьми точек, таких, что /0/8 <: Дф < /0/4, и т.д. Точки разрыва могут быть всюду плотны па вещественной прямой; [ем не менее ука- указанным в лемме 3 способом функция ф(«) определяется и в этих точках.Во всех остальных точках функция ф (и) непрерывна; естественно назвать их точками непрерывности Ф(«). Итак, мы подготовили все необходимое для доказательства следующего сильного результата. Теорема 5.6.10. /7усть коэффициенты {//} удовлетворяют де- терминантным условиям D@, n) > 0 для всех п = 0, 1, 2, .... Пусть F(w)—предел сходящейся подпоследовательности последо- последовательности {JM(w), М = 0, 1, 2, ...} аппроксимаций Паде фор- формального ряда i / /=0
5.6. Ряды Гамбургера 217 Тогда F (w) имеет интегральное представление Гамбургера функция ф(«) ограничена и не убывает при — оо < « < с». Доказательство. Так как семейство функций F.19) удовлет- удовлетворяет условиям леммы 3, то можно построить функцию ф(«). Представление F.23) получается из F.20) предельным переходом при 6^0. Так как функция F (w) вещественно-симметрична, то представление F.23) справедливо для всех w, Irrii2>=^0. Воспользуемся подходящим моментом и приведем формулу обращения Стильтьеса, которая является простым следствием лемм 2 и 3. Эта формула выражает функцию <р(«) через функ- функцию Гамбургера F (w): Ф«+>-Ф«-)=1Нт С \mP(u + ib)du. — ее После того как получено представление F.23), удобно вер- вернуться к обычной переменной г= — 1/до. В условиях тео- теоремы 5.6.7 мы доказали, что се со Шп [М- 1/М]-Г(г) = j ^ - ? /, (-г)/. F.24) Mew -00 '"" Докажем теперь интегральную формулу для коэффициентов \h которая является следствием следующей теоремы Гамбургера. Теорема 5.6.11. Пусть функция / (г) определена интегральным представлением Гамбургера ft F.25) Тогда для того, чтобы моменты со /,= 5 utdviu) F.26) — 00 были конечны, необходимо и достаточно, чтобы / (г) имела асимп- асимптотическое разложение /(г) с- 2М-гУ. F-27) /=о
218 Гл. 5. Ряды Стилыпыха_и ряды Попа определенное в секторах г ^ | arg z \ ^ л — г для произвольно ма- малого s > 0. Замечание. Благодаря этой теореме становится ясно, почему мы различали функцию и ряд Стильтьеса и функцию и ряд Гам- Гамбургера. Функция Гамбургера определяется формулой F.25) при дополнительном условии, что все моменты F.26) конечны. Ряд Гамбургера определяется правой частью F.27) также при усло- условии конечности всех моментов. В теореме Гамбургера утверж- утверждается, что функции F.25) соответствует однозначно определен- определенный ряд F.26) —F.27). В свою очередь ряду F.27), коэффициен- коэффициенты которого имеют вид F.26), соответствует по крайней мере одна функция Гамбургера F.25). Доказательство. Из представления F.25) и определения F.26) вытекает, что Я* (г) /(S L ;= о F.28) -co J Следовательно, если k нечетно, то и\л + Чц (и) ^ — X |2 i. Таким образом, если k нечетно, то Rk (г) —»¦ 0 при г —+ 0 в сек- секторе <У+ (е) или <У~ (г). Если же k четно, то, записывая F.28) в виде получаем |/?*B)|<|2|.|/» Тем самым разложение F.27) доказано. Предположим теперь, что функция /(г) имеет асимптотиче- асимптотическое разложение. Так же, как и выше, устанавливаются оценки для величин, аналогичных \Rk(z)\, откуда вытекает конечность моментов F.26). Докажем теперь следующий принципиальный результат.
5.6. Ряды Гамбургера 219 Imz Рис. 4. Секторы - (e): — я-ff- < argz < — 8, Теорема 5.6.12. Пусть коэффициенты {{j} удовлетворяют де- терминантным условиям D@, п) > 0 для всех // = 0, I, 2, .... Пусть SD' (Д)—ограниченная область, отстоящая от веществен- вещественной оси не меньше чем на Д (см. рис. 1). Тогда последователь- последовательность аппроксимаций Паде [М — 1/М], М = 1, 2,3, ...,формаль- со ного ряда 2f/(—2Усодержит подпоследовательность, соответст- /=о вующую М ? ЗЛ, которая сходится в ?bl (Д) /с функции f (г). Функция } (г) вещественно-симметрична, аналитична в &)' (Д) и имеет представления F.29) асимптотическое разложение справедливо в секторах, показанных на рис. 4; се lj= \ иЫц>{и), F.30) — 00 Ф (и) ограничена и не убывает при — оо < и < с». Доказательство. Заметим, что для любого заданного Д > О всегда найдется б > 0, такое, что k>'(Д)с{г: z'1 =w? 3>w (б)}; см. также упражнение 5. В таком случае георема 5.6.12 выте- вытекает из теорем 5.6.5, 5.6.7, 5.6.11 и соотношений F.24). В теореме 5.6.12 ничего не утверждается о единственности представления функции J (г) в виде F.29) — F.30). В предыдущем параграфе приведены примеры, показывающие, что даже в случае ряда Стильтьеса условий теоремы не достаточно для однознач- однозначного определения ф(«) и /(г). Следующий критерий Карлемана
220 Гл. 5. Ряды Стилыпьеса и ряды Пойа для рядов Гамбургера представляет собой достаточное условие единственности. Критерий Карлемана. Если коэффициенты {/у} вещественны, удовлетворяют детерминантным неравенствам D@, n) > 0 для всех п^О, а также условию ряд 2 /г/'2" расходится, F.31) то существует единственная функция Гамбургера f (г) с асимп- асимптотическим разложением /() 2Ыу / = о Если выполняется условие Карлемана F.31), то представле- представления F.29) и F.30) однозначно определены. В таком случае гово- говорят, что проблема моментов определена. Случай, когда критерий Карлемана не выполняется, подробно рассмотрен в книгах Ахие- зера [Akhiezer, 1965J и Уолла [Wall, 1948]. Связь между последовательностью аппроксимаций Паде [М — 1/М], сходящейся к f(z), и .'-дробью D.5.9) устанав- устанавливается при помощи замены переменной co = z~l. Следуя F.29), положим ] ?$. F.32) Тогда 7 (со)-предел подходящих дробей ]J (г), Ме непрерывной дроби J (со). Для рядов Гамбургера, так же как и для рядов Стильтьеса, формулы D.5.9) и D.5.10) имеют алгебраи- алгебраический характер (так как дроби всегда определены). Используя D.4.23) —D.4.25), D.5.1) —D.5.4) и A.12), получаем где ft, = a, =/o, U = at = hlh F-ЗЗа) ^а = a2a3 = р (@' 0)г , F.33b) l, 0) ' D(\, 0)D@,
5.6. Ряды Гамбургера 221 и для / = 3, 4, 5, ... i _Р@, /—3)Р@, /—1) J~ Р@, / — 2J . Р @,/-1HA, /-3) 0A, /-1H@, /-2) I 0@, / — 2)ОA, / — 2) + 0A, / —2)Р(О, /—1) ' Воспользуемся формулами F.33) для доказательства следую- следующего результата. Теорема 5.6.13. Пусть дана вещественная J-дробь J((o) = 7^l__7A__7A_ __..., F.34) где k{ > 0 и lt вещественны для всех i ^ 1. Тогда последователь- последовательность подходящих дробей дроби J (со) содержит сходящуюся под- подпоследовательность, такую, что со lirn Jm (со) = J (со) = \ —|—; F.35) м s ад - =° <р(ы) ограничена и не убывает при —оо < и < оо. ?сли J-дробь F.34) сходится, то для нее справедливо пред- представление Гамбургера У(со) = Доказательство. Из F.34) вытекает, что J (ю) имеет формаль- формальное разложение @ *¦" '¦' / =0 Используя формулы F.33), получаем по индукции, что коэффи- коэффициент fj удовлетворяют детерминантным условиям D@, n) > О и D(l, n) вещественно. Поэтому коэффициенты fj вещественны и удовлетворяют условиям для коэффициентов ряда Гамбургера. По теореме 5.6.12 найдется сходящаяся подпоследовательность подходящих дробей дроби J (со). Если дробь J (со) сходится, то все подпоследовательности сходятся к тому же пределу. В связи с последним результатом интересно отметить, что условие сходимости дроби F.34) заменяет критерий Карлемана и является условием единственности. С рядами Гамбургера тесно связаны так называемые функции Герглотца. Дадим определение функции Герглотца и в заключение этого параграфа приведем основной результат, касающийся этих Функций.
222 Гл. 5. Ряды Стильтьеса и ряды Попа Определение. h(z) называется функцией Герглотца, если (i) h(z) аналитична при 1тг=й=0; (ii) h (г) вещественно-симметрична; (iii) \mh(z) и Im г имеют одинаковые знаки для всех г. Мы приведем теорему Герглотца в следующем виде [Stone, 1932, стр. 573]. Теорема 5.6.14. Функция Герглотца имеет представление 00 h (г) = аг + р + j ^*do(и), F.37) — 00 где функция а (и) ограничена и не убывает при — оо < ы < оо, Р вещественно и а^О. Представление F.37) единственно. Следствие. При условии, что первый момент 00 (i!= J и da {и) - СО конечен, h(z) имеет представление Р(, { {)() Подробнее о применении функций Герглотца см. [Narcowich and Allen, 1975] и [Allen and Narcowich, 1975]. По поводу построения функции плотности ф(«) мы отсылаем читателя к книгам Перрона [Perron, 1957] и Рисса и Надя [Riesz and Nagy, 1955]. Известны также некоторые результаты и методы для рядов, представимых в виде разности двух рядов Стильтьеса [Baker, and Gammel, 1971, Barnsley, 1976]. Упражнение 1. Пусть функции /(г) соответствует формальный степенной ряд / =0 в котором коэффициенты /у удовлетворяют условиям D@, n) > 0 для всех п>0. Определим g(z) с помощью тождества /о так что формально 1С gB)=2
5.7. Частотные ряды Пойа 223 Используя формулу Адамара A.6.9), показать, что коэффи- коэффициенты gj удовлетворяют условиям Dg{0, n) = go gi Sn, gm Упражнение 2. Пусть /(г)—функция Герглотца F.25). Положим а> = — г и Z7 (да) = — г/(г). Доказать, что —/(г) и — F (w) — функции Герглотца. Упражнение 3. Доказать, что функция ср(«) из леммы 3 не- непрерывна в своих точках непрерывности. Упражнение 4. Построить функцию плотности Стильтьеса со свойствами: (i) cp(«) постоянна вне интервала 0^и^1, (ii) множество точек разрыва ф(«) плотно на интервале 0<«<1. Упражнение 5. Показать, что теорема Гамбургера остается справедливой, если условие: г лежит в секторе ?f+ (e) или ?f~ (e) заменить на условие: г лежит в круге #, изображенном на рис. 2. 00 Упражнение 6. Пусть 2 //(—гУ — РЯД Гамбургера. Положим ю = г~1 и в соответствии с F.4) Доказать, что для М = 1, 2, 3, ... (i) полюсы JM (со) имеют положительные вычеты, (ii) нули JM (а) вещественны, (iii) полюсы и нули JM(a) чередуются между собой. § 5.7. Частотные ряды Пойа Мы уже обнаружили, что существуют явные формулы для числителя А1им1 (г) и знаменателя ВГ'-/Л*] (г) аппроксимации Паде функции ехр г; см. A.2.12), D.6.1), а также B.3.3.21). Формулу A.2.12) для аппроксимации Паде экспоненты можно получить из детерминантных представлений A.1.8) и A.1.9), если восполь-
224 Гл. 5. Ряды Стильтьеса и ряды Пойа зоваться методом § 5.2 и тем, что в соответствии с A.2.6) м С(ПМ) — ( \\MiM-\)/'j TT i MWJJ-l 1) II ft(ft+1)...(ft_M,_1) при L, M!>1. Знак С(L/M) совпадает со знаком величины (—1)м <м-п/> и тем самЫм не зависит от L. Если /И = 1, 2, 3, ... , то знак меняется следующим образом: +, —, —, +, +, —, —, .. . • Такой переменой знака характеризуются функции, известные как частотные ряды Пойа (их называют также вполне положи- положительными рядами, см. упражнение). Функции этого класса имеют представление руг)-1, G-1) / = i где ао>О, y>0, ау>0, Р,>0 и ряд 2 (а/ + Р/) сходится. Интересно, что для таких функций сходятся не только сами аппроксимации Паде, но и их числители и знаменатели, причем это имеет место для любой лучевой последовательности в таб- таблице Паде. Теорема 5.7.1 [Arms and Edrei, 1970]. Если f(z) — частотный ряд Пойа G.1) и Lk—> оо, Mk —* оо так, что {Mk/Lk) —»¦ со при k —> оо, то равномерно на компактных подмножествах комплексной г-пло- скости. Следствие 1. Если {(г)=еуг, то Следствие 2. Конечное число at и fif могут быть комплексными, если а{Ф—Ру при любых i, j. Следствие 1—частный случай теоремы, следствие 2—ее обоб- обобщение. Доказательства этих утверждений даны в ЕРА и в ра- работе [Arms and Edrei, 1970]. Превосходное изложение основ теории частотных рядов дано в [Edrei, 1953] и [Karlin, 1968].
5.7. Частотные ряды Пойа 225 Из-за того что известны явные формулы для аппроксимаций Паде экспоненциальной функции, а также в связи с ролью этой функции как решения наиболее простого обыкновенного диффе- дифференциального уравнения dy/dx — y, значительное внимание при- привлекало расположение полюсов и нулей аппроксимаций Паде функции ехрг. Если аппроксимация Паде [L/M] функции ехрг имеет полюс в левой полуплоскости, то определенно известно, что эта аппроксимация Паде не дает Л-устойчивого метода ре- решения обыкновенных дифференциальных уравнений (см. ч. 2, §3.4). Так как ехр(—г) = (ехрг), то но теореме о двойственности (теорема 1.5.1) каждый нуль аппроксимации Паде [L/M] функции ехрг является полюсом аппроксимации Паде [M/L] функции ехр (— г). Таким образом, обычно ограничиваются только изуче- изучением расположения нулей аппроксимаций Паде функции ехрг. Так как exp(-f °°) = + со и ехр(—со) = 0, то естественно ожидать, что полюсы аппроксимаций Паде при увеличении по- порядка аппроксимации накапливаются к точке х~-\- со, а нули — к точке х = — оо. Если Lt > L2, то функция [Lj/M] имеет больше нулей, чем [LjM\, поэтому у [Ц/М] область, свободная от нулей, должна быть меньше. Эти простые соображения подтверждаются следующими теоремами. Теорема 5.7.2. (теорема о секторе) [Saff and Varga, 1975]. Пусть z = rem. При М>2 аппроксимация Паде [L/M] функции ехр г не имеет нулей в секторе L—M—2 L+M • Пример 1. Если L = 3M + 2, то аппроксимации Паде [3M-J-2/7W] не имеют нулей в области cos9>l/2, т.е. при |0|^6О°. Ясно, что при L^3M + 2 все аппроксимации Паде [?/М] также не имеют нулей в этой области (рис. 1). Теорема 5.7.3. (теорема о параболе) [Saff and Varga, 1976]. Пусть z — x^-iy. Аппроксимация Паде [L/M] функции ехрг не имеет нулей внутри параболы Замечание. В теореме утверждается, что все аппроксимации Паде (М + 1)-й строки не имеют нулей в области G.2). Для пер- первой строки аппроксимации Паде совпадают с частными суммами ряда Тейлора функции ехр г, которые, очевидно, положительны при х^О. Тем самым область, свободная от нулей, содержит положительную вещественную полуось. Из теоремы вытекает, что эта область содержит внутренность параболы г/2^4(лг-)- 1). Для аппроксимаций Паде [L/3] параболическая область, не содержа-
226 Гл. 5. Ряды Стильтьеса и ряды Попа 30.0 20.0 10.0 10.0 20.0 30.0 Imz - - 1 -30.0 - - - Рис. 1. Расположение нулей аппроксимаций Паде [L/M] функции ехр г при [A1 и L-1, 2, 3, ..., 36. щая нулей, больше, она определяется неравенством у2^ 16(х + 4) (рис. 2). Если сделать сжатие координатной плоскости в (М+1) раз, то теорема 5.7.3 приводит к следующему результату. Следствие. Аппроксимация Паде [L/M] функции ехр{(М+ 1)г} не имеет нулей в области Расположение нулей аппроксимаций Паде [L/M] для ^ и М^25 показано на рис. 3, демонстрирующем оптимальность области G.2) из теоремы 5.7.3. Замечательные траектории рас- расположения нулей до сих пор еще полностью не объяснены. Теорема 5.7.4. (Теорема о кольце; [Saff and Varga, 1977]). При L~^\ и М^0 все нули аппроксимации Паде [L/M] функции ехр г лежат в кольце (L-\-M)\i < |г| < L + M + 4/3, где \и =
5.7. Частотные ряды Пойа 227 Область, не содержащая нулей Рис. 2. Область, не содержащая нулей аппроксимаций Паде [L/3]. = 0,278465—(единственный) положительный' корень уравнения tet+1 = 1. Теорема 5.7.5. [Saff and Varga, 1975, 1977]. При L228 Гл. 5. Ряды Стилыпьеса и ряды Попа -2Л0 -1,00 0,00 Рис. 3. Область, не содержащая нулей аппроксимаций Паде [L/M] функции ехр {(/И+ 1) г}. Теорема 5.7.6. [Saff, Varga and Ni, 1976]. Пусть {Lk/Mk)-+ при k—> oo, где 0<со<1. Тогда Следствие. Минимум функции g{a>) при Ог^сог^ 1 достигается в точке @ = 1/3 и равен g(l/3) = -g-. Лучевая последовательность аппроксимаций Паде [L/3L] функции ехр г имеет наилучшую ско- скорость сходимости на отрицательной вещественной полуоси
5.7. Частотные ряды Пойа 229 Подробнее с приведенными результатами и их доказательст- доказательствами можно познакомиться в цитированных работах. Все доказа- доказательства опираются на явные формулы и соотношения между числителем и знаменателем Паде. Этим мы заканчиваем обсуждение поведения нулей и полюсов аппроксимаций Паде функции ехрг. Рассмотрим теперь тригонометрические полиномы с веществен- вещественными корнями. В основе всех результатов лежат следующие формулы; (Й0 G.4) G.5) cos г—cos а = A - cos а)Д[1- {2J+ aJ ] , 0<а<я. G.6) Каждый вещественный косинус-полином С (г) = со + с1 cos г + с2cos 2г + ... + cNcos Nz G.7) чли вещественный синус-полином S (z) = st sinz -\- s2 sin2z+ ... +sNsinNz, G.8) ямеющий только вещественные нули, можно представить в виде G.6). Для полинома С (г) имеем C(z) = /C(cosz— \y j|X(cosz—cosafc)pft. G.9) k = i где р, рк — неотрицательные целые числа. Полином S(z) можно представить в виде S(z) = C(z) sin г. G.10) Следовательно, достаточно рассмотреть представления G.6), G.7) и G.9). Имеем . G.11) Благодаря соотношению G.11) можно воспользоваться теоремой Армса—Эдрея, получаем следующий результат. Теорема 5.7.7 [Edrei, 1975]. Знаменатели аппроксимаций Паде [Lk/Mk] нормированного косинус-полинома С (г) г~г?, имеющего только вещественные нули, стремятся к единице (равномерно на компактных подмножествах комплексной z-плоскости), если только
230 Гл. 5. Ряды Стильтьеса и ряды Пойа Lk —*- oo и Мк-*<х> при k—i-oo. Аналогичный результат спра- справедлив и для синус-полинома S (г) г~*Р~1. Для функции Т (г) =г~2 tg2z при тех же условиях имеем A[Lk/Mk\ _*. 2~2sin2z и 5[L*^M*J —•¦ cos2 г. В этом параграфе мы привели некоторые теоремы для функций специального вида. Прежде всего по этой причине они даны без доказательств. Однако заманчивая мысль о том, что и в общем случае теория сходимости аппроксимаций Паде так же совершенна, как и для рядов Стильтьеса, будет в какой-то степени подтверж- подтверждена в дальнейшем. При этом возникнут и более общие методы доказательства. Упражнение. Показать, что определители Теплица с? + 1 ••• CL+M-i .-I CL ••• CL+M-2 1-Л5 + 1 LL-M+2 ' • ' Ь1 где с,—коэффициенты частотного ряда Пойа, удовлетворяют не- неравенству Т (L/M) ^ 0 для всех L, М^О.
Глава 6 ТЕОРИЯ СХОДИМОСТИ § 6.1. Введение Эта глава посвящена известным результатам о сходимости последовательностей аппроксимаций Паде комплексной функции. В случае строк таблицы Паде теорема Монтессу утверждает сходимость для функций, мероморфных в круге (см. § 6.2). Диагональные последовательности естественно выбирать при отсутствии какой-либо дополнительной информации о мероморфных функциях. В пользу такого симметричного выбора аппроксимаций говорит тот факт, что для мероморфной функции / (г) функция 1//(г) также мероморфна и имеет место теорема о двойственности. Парадиагональные последовательности вида [M + J/M], где J фиксировано, а М —*¦ оо,х являются очевидным обобщением диаго- диагональных; такое обобщение вызвано необходимостью аппроксими- аппроксимировать функции, которые ведут себя как zJ при г—* оо. Лучевые последовательности аппроксимаций Паде [L/M], где L = KM, К фиксировано, используются в некоторых частных слу- случаях. Иногда имеет смысл рассматривать и параболические после- последовательности вида [М2/М]. Таким образом, в зависимости от потребностей выбирается та или иная последовательность общего вида [Lk/Mk]. Наиболее естественные теоремы о сходимости последовательностей аппрокси- аппроксимаций Паде общего вида привлекают понятие емкости. Вместо доказательства поточечной сходимости для некоторого класса функций в георемах дается доказательство утверждения, что область, где имеет место плохая аппроксимация, произвольно мала. Никоим образом из этих теорем не вытекает поточечная сходимость; однако в них доказывается сходимость аппроксимаций Паде для очень широких классов функций в некотором естествен- естественном смысле. Аппроксимации Паде—это рациональные функции, поэтому другим естественным обобщением понятия сходимости является сходимость на сфере Римана (см. § 6.4). Такое обобщение позво- позволяет применять для бесконечных значений функции те же рас- рассуждения, что и для остальных.
232 Гл. 6. Теория сходимости Приводимые ниже контрпримеры Перрона и Гаммеля предо- предостерегают нас от необоснованных гипотез о сходимости аппрок- аппроксимаций Паде для целых функций. В то же время так назы- называемая Паде-гипотеза, принадлежащая Бейкеру, Гаммелю и Уиллсу, широко признана и служит основой для многих вычис- вычислений. В ней утверждается сходимость подпоследовательности; подробнее см. § 6.7. Интересно рассмотреть несколько результатов о строках таб- таблицы Паде; хотя их доказательство основано на явных формулах для аппроксимаций Паде, они все-таки важны для общей теории. Обсуждая сходимость строк, мы сможем лучше понять, какого рода результаты можно ожидать в общем случае. Первая строка таблицы Паде состоит из частных сумм ряда Тейлора, которые сходятся внутри (но вовсе не обязательно на границе) круга аналитичности; радиус этого круга может быть нулевым, конечным или бесконечным. Для второй строки [L/1] справедлива теорема Бирдона [Bear- don, 1968b]. Теорема 6.1.1. Пусть функция /(г) аполитична в замкнутом круге \z\^.R. Тогда некоторая бесконечная последовательность аппроксимаций Паде [L/1] сходится к f (г) равномерно в круге Доказательство. По предположению /(г) аналитична в замк- замкнутом круге |г|^^, следовательно, она аналитична и в неко- некотором большем круге |г|<р, р>р'>7?. Пусть fB)=2c,2', C, = O((p')-'). A.1) (=0 Для второй строки аппроксимаций Паде имеем ^' + i^. A-2) Если по некоторой подпоследовательности коэффициенты {cl ., / = 1, 2, ...} обращаются в пуль, то аппроксимации Паде [Lj—1/1] совпадают с частными суммами ряда Тейлора, кото- которые сходятся к f(z) равномерно в круге |г|^/?<р'. Предполо- Предположим теперь, что все cL, начиная с некоторого, отличны от нуля. Так как то аппроксимации Паде [L/1], заданные формулой A.2), равно- равномерно сходятся при | г | ^ R по той последовательности номе- номеров L, для которой 1—cL+lz/cL=^=0 для всех |г|<р'. Таким
6.1. Введение 233 образом, либо некоторая подпоследовательность второй строки схо- сходится, либо для всех L^Lg, \cL/cL+l | < р'. В последнем случае имеем L- 1 гт 1= La < (p')L-L°, что противоречит A.1). Таким образом, теорема доказана. Контрпример Перрона [Perron, 1957, гл. 4]. Выберем произ- произвольную последовательность точек \гп, п=\, 2, ...} в комп- со лексной плоскости и определим функцию /B) = 2сг2' следую- i=0 щим образом: сЯ|1 = 2„/(Зп + 2)! , если \гп |^ 1, ?.-ав+1= l/C/i+ 2)! и с,„+| = 1/(Зл+ 2) ! [, если |г„|>1. J Так как |с, |<сГ(г'!)~1, то / (г) — целая функция. Поскольку -^ = г„, если |2„|<1, и ^±1 = г„, если |г„|>1, то из A.2) вытекает, что либо аппроксимация [Зп/1], либо аппрок симация [Зл+1/1] имеет полюс в точке г„. Выберем теперь мно- множество {г„} всюду плотным в комплексной плоскости, повторяя при необходимости некоторые точки. Тем самым мы построили целую функцию /(г), для которой последовательность аппрокси- аппроксимаций Паде [/-/1] не может сходиться ни в каком открытом мно- множестве комплексной г-плоскости. Контрпример Перрона показывает оптимальный характер тео- теоремы Бирдона. Следующая гипотеза для общего случая принад- принадлежит авторам данной книги [Baker and Graves-Morris, 1977]1). Гипотеза. Пусть /(г)—мероморфная функция, аналитическая в начале координат, и в круге \ г \ ^ R содержится не более М полюсов функции f (г). Тогда некоторая бесконечная подпоследова- подпоследовательность строки [L/M] таблицы Паде сходится к / (г) равно- равномерно в круге \z\^R, исключая произвольно малые окрестности полюсов /(г). х) В работе Буслаева В. И., Гончара А. Л., Суетина С. П. [1983] пока- показано, что гипотеза справедлива только при /? = оо. — Прим. перев.
234 Гл. 6. Теория сходимости Эта гипотеза пока еще не доказана, за исключением частных случаев типа теоремы Бирдона. Контрпример Перрона, который легко можно обобщить на произвольную строку, показывает, что аналогичное утверждение для всей строки неверно. Вот почему в гипотезе утверждается сходимость только по подпоследова- подпоследовательности. В предположениях гипотезы аппроксимации Паде имеют достаточно много полюсов для того, чтобы представить полюсы /(г) в круге |z|^/?; полюсы аппроксимаций либо при- притягиваются к полюсам /(г), либо лежат вне круга |г|^/?. Интересно сравнить эту гипотезу с теоремой Монтессу из следующего параграфа, а теорему Бирдона с теоремой Монтессу для второй строки. В качестве общих ссылок приведем [ЕРА, гл. 11], [Graves-Morris, 1975] и [Wallin, 1972]. Упражнение 1. Найти явный вид аппроксимаций Паде [?/1] функции /(г) = 1/((г — а)(г—Ь)), где о, Ъ—комплексные числа. Доказать, что [L/l]—>/(z) в круге |г|<|Ь|, если |а[<|Ь|; найти область равномерной сходимости. Что произойдет при \а\ = \Ъ\> Упражнение 2, Обобщить контрпример Перрона на случай произвольной строки в таблице Паде. § 6.2. Теорема Монтессу Прежде чем доказывать теорему Монтессу, выведем формулу Коши — Бине для определителя произведения двух матриц. Впей объединяется ряд общеизвестных результатов (см. [Gragg, 1972J), которые мы приводим в виде примеров. Пусть 5*[^ ) — класс мультииндексов а = ((*!, а2, .. ., ак) из k элементов а,-, которые принадлежат множеству {1, 2, ..., т\ и удовлетворяют условию 1 <; at < а2 <... < ак <; т. Через А (а, Р) обозначим подматрицу матрицы Л, полученную выделением строк с номерами {а{} и столбцов с номерами ЦЗ,}. Пусть Ш(тхп) — класс матриц с т строками и «столбцами. Если '.Ре: то Л (а, |3) — / х /-матрица из класса Ш{1х1).
6.2. Теорема Монтессу 235 Теорема Коши — Бине. Пусть А?Ш(тхп), В?Ш(пх1г), С^ЩЦкхп), А=ВС, Тогда А (а, Р), В (а, у) и С (у, C) являются I х l-матрицами и det Л (а, р) = 2 detfl(a, v)detC(v, P). ( Пример 1. Пусть А, В, С суть mxm-матрицы, a, P, суть полные m-мерные мультииндексы. Тогда формула Коши — Бине сводится к равенству det A = det В det С. Пример 2. Пусть А, В, С суть квадратные mxm-матрицы и /=1, так что a, P, у—обычные числа. Тогда формула при- принимает вид это известное правило умножения матриц. Пример 3. Если />&, то множество 54 ¦ ) пусто и det Л (а, Р) = 0. Это соответствует такому свойству: если строки матрицы линей- линейно зависимы, то ее определитель равен нулю. Пример 4. Пусть Л, В, С^Ш C, 3), А = ВС, а = A, 2) и р = A, 3). Тогда и det ^2 \эг п ап 22 = det 712 Ь22 '13 ^23 3 b2l , D31 ' '12 >22 '32 *13 L «33 32 ^3 1 С21 ,С31 .с 13 С23 F32 С33 j [c\i |l2 f det Кгт- \с: 31 13 **23 С33 [j-я строка] й столбец] Формулой Коши — Бине мы воспользуемся при доказательстве теоремы Монтессу. Теорема Монтессу применяется к функции /(г), которая меро- морфна в круге и имеет М полюсов внутри этого круга. Прак-
236 Гл. 6. Теория сходимости тическое применение этой теоремы возможно, если заранее из- известно М—число полюсов функции. В таком случае теорема Монтессу утверждает, что строка аппроксимаций Паде [L/M] сходится в круге. Если же число полюсов /(z) a priori не из- известно, что теорема обычно оказывается бесполезной. Полное утверждение теоремы Монтессу [de Montessus, 1902J в случае простых полюсов таково. Теорема 6.2.1. Пувть функция f (z) мероморфна в круге |z|^ ^.R и имеет в нем ровно М простых полюсов zt, zit ..., zM, Тогда lira [L/M] = /(z) B.1) L-»-oo равномерно на компактных подмножествах множества @>M*={z: |2|<Л, гфгг, г = 1, 2, ..., М}. B.2) Доказательство. Так как |zj|>0 и / (г) аналитична в круге |z|<|zi|, то справедливо разложение в степенной ряд B.3) Положим В(г)*= 2 5/2'«=ПA— -)• B.4) Тогда ряд А (г), определенный соотношением М \ / ю \ «о 2 В1*' ) 2 ctzl )- 2 V = ^ (г), B.5) сходится в круге |z|^/?, и функция /(z) представима в виде / (,z; — л (Z)/o (г), где o0=i. ^.DJ Приравнивая коэффициенты при г' для t = L+l, L-\-2, ... ..., L + M, L^M, получаем м 2 й/с,_/ = Л„ (=L+1, Z.+2, ..., l. + M. B.7) Рассмотрим теперь аппроксимации Паде 2-1 ^ 2
6.2. Теорема Монтессу 237 для коэффициентов b)L/M] имеем уравнения l, L + 2 L + M, B.8) bl0L/M] = 1 Покажем что b)L/M] где bl0L/M] = 1. Покажем, что b)L/M] —>¦ Bf при L —> оо; вывод этих соотношений является основной частью доказательства теоремы Монтессу. Положим Af = Bj—Ь)чм\ / = 0, 1, .... M; B.9) отметим, что А0 = 0. Из B.7) и B.8) получаем М уравнений для величин А,, А2, ..., Аж: м 2А/с,_/ = Л,, / = L+ I, L + 2, ..., L + M. B.10) Пусть : . -(: V .- : , ,,„ .. eL / \АЖ/ \AL+M/ тогда B.10) принимает вид СА = А. Таким образом, А = С~1А, если матрица С невырождена. Отсюда получаем м м 2 с (/> 0 Ai .& det С (*-,«) /0 |ОХ д _ (\ A =*— где С(/, /) — алгебраическое дополнение элемента, стоящего в i-й строке и ;-м столбце, а С (г—>¦ Л) означает матрицу, полученную из С заменой г-ro столбца на А. Для доказательства соотноше- соотношения А, —*- 0 изучим поведение миноров С (j, i) и определителя detC при L — oo [Hadamard, 1892]. Так как функция /(г) имеет ровно М простых полюсов в круге | г \ < R, то, учитывая вклад этих полюсов в коэффи- коэффициенты Тейлора, получаем со М <ю ,-=о оо где ряд 2 с'гг' сходится в замкнутом круге j г \ ^ R и с] = О(/?"'). Разлагая в ряд функции A—г/гк)~1, получаем из B.13) ¦). B-14)
238 Гл. 6. Теория сходимости где Af 4=2/***' B-15J — главная часть коэффициента сг. Определим матрицу D по фор- формуле м Dii==dL+{_j= 2 rkZbL-i+i, i, / = 1, 2, .... М; B.16) таким образом, D — главная часть матрицы С. Пример. Для М = 2 -L~\\rz-L-l r Z~L '¦ Г Z~L ,-L Если определить матрицы Вандермонда V, V и диагональную матрицу D' по формулам у /==(ziI~i, V'i=(Zr)J~1, D', = r,zj'L6lf (i, / = 1, 2, ...,M), B.17) то D можно записать в виде D = VD'V, B.18) а detD = detVdetD'dety. B.19) Нам понадобятся следующие хорошо известные разложения для определителей Вандермонда: м 1 det V = II П (zr1 — zr1) B.20) /= 2 ,•= 1 И Л1 1 detV" = II II (zi — 2y)- B.21) 1=2;=1 Важно то, что эти определители отличны от нуля и не зависят от L. Следовательно, м det О = AT II (zt)~L, B.22) где постоянная К отлична от нуля.
6.2. Теорема Монтессу 239 Займемся теперь определителем detC. Его главная часть дается ниже формулой B.23); в то же время из формулы B.14) видно, что имеется также конечное число членов, полученных заменой dt на величину О(/?"'). Обозначим через р = \г,м\ модуль полюса, самого далекого от начала координат; тогда м detC = /C Д (г/) A+0 (?)"). B.23) Аналогично, используя факторизационное представление B.18) и теорему Коши — Бине, получаем П Ufl-'J-O^ П|г«Г]. B.24) Так как ряд B.5) сходится в замкнутом круге |г|^/?, тоЛ,= = 0G?-'). Следовательно, из B.12), B.23) и B.24) получаем , = 0 (-?)', «=1, 2, .... М; B.25) откуда вытекает, что \t —* 0 при Z, —¦»-оо. Рассмотрим теперь разность ' lZ) LL//WJ ~ S (г) Имеем J 2 Л,г''У 2 V о / \/ о V 2 , 2 = о / \/«г о М п Используя формальное тождество, определяющее аппроксимации Паде, и замечая, что B(z) А[[-/мЦг) — полином степени L-\-M, получаем М и Л (г) В1*-/«](г) = 2 ,¦=0 Следовательно, М \А ( 2 Так как Ду —s- 0, то величины bjM] ограничены при L—>-oo. Функция Л (г) аналитична в замкнутом круге |z|^)?, поэтому для некоторого R' > R | Л (z) В^/М] (г) —В (г) AWW (г)\ = 0 ({z/R')L); B.27)
240 Гл. 6. Теория сходимости таким образом, числитель правой части B.26) стремится к нулю при L —>¦ оо для |z|^/?. Займемся теперь знаменателем правой части B.26). Имеем м 2 \В,—Ь)Ш1\-\г'\. B.28) Правая часть B.28) стремится к нулю для |г|^/? при L —<- оо. Пусть г принадлежит подмножеству круга |z|^/?, на котором |B(z)|>2e для некоторого заданного е > 0. Тогда найдется номер L(e), такой, что |BfL/MJ|>e для всех L>L(e). Следова- Следовательно, модуль знаменателя правой части B.26) ограничен снизу величиной 2е2 для всех L>L(e). Отсюда и из B.27) вытекает, что f (г)—[L/M]—s-0 при L—>¦ оо равномерно на компактных подмножествах множества 3>л. Теорема доказана. Приведем теперь общую теорему Монтессу, в которой до- допускаются кратные полюсы. Доказательство для этого случая технически усложняется. Теорема 6.2.2 [de Montessus, 1902]. Пусть функция f (г) меро- морфна в замкнутом круге \ г | ^ R и имеет внутри него т раз- различных полюсов г1г г3, ..., гт, т Пусть кратность полюса zk равна \ik и 2 №k — M. Тогда 2 = lira [L/M] равномерно на компактах, принадлежащих множеству @>m = {z: |z|6.2. Теорема Монтесеу 241 Для биномиальных коэффициентов / — х\ (-т)(-т-1)...(-т-»+1) __ (t+D (t-f-2) •-• (f+т—1) (_w \ i) 1X2X...XI 1 X2X ... X(T-1) l ' выполняется тождество ([Riordan, 1966, с. 9], см. также упраж- упражнение 2) V i + x—1 S ,40, Следовательно, элементы dL+i_j(i, j = I, 2 М) матрицы D равны это равенство можно переписать в виде матричного произведения индекс строки ( индекс строки (к, о) индекс столбца {к, а) индекс столбца / Кроме того, V a AT_i_a-o t=o+l o'=0 ч ' ч т=о'+о+1 o'* индекс строки I индекс столбца о' н индекс строки а' индекс столбца (ft, a)
242 Гл. 6. Теория сходимости Отсюда вытекает следующее разложение D: 2j 2j (fc'.O'l (ft. O) где , о') (ft, о) = °ftft' t=e'+c + i B.32a) B.32b) Матрицы V и У — по существу матрицы Вандермонда; можно проверить, что их определители отличны от нуля (см. упражне- упражнение 1). Наличие сомножителя 6№ означает, что матрица D' имеет блочно-диагональную форму; из наличия функции Хевисайда 9(н*—о—о' — 1) вытекает, что каждый блок матрицы D' имеет треугольный вид. Следовательно, B.33) где К — ненулевая постоянная. Отметим, что в приведенных рас- рассуждениях требовалось только, чтобы вычеты г^фО; на вели- величины остальных вычетов никаких ограничений не накладывается. Соотношение B.33) эквивалентно соотношению B.22) в теореме для простых полюсов. Завершается доказательство так же, как и в предыдущей теореме. Пример. Пусть /(г) имеет полюс тройной кратности в точке г = г1 и полюс двойной кратности в точке г = гг. Тогда ^ = 3, щ = 2, и индекс (к1, о') принимает значения A,0), A,1), A,2), B,0), B,1). Получаем [L + 2) (L + 3) гГ2 z L1 -t 5JГ' I-6J7" гГ (LT С2 . B.34) J
6.2. Теорема Монтессу 243 Блок A, а')хA, а) матрицы ?><*<, О') <*, а) имеет вид а=1 а' = [ + 2/i]r ^ О его треугольная структура очевидна. Подчеркнем теперь некоторые особенности теоремы Монтессу. Во-первых, мы предполагали, что функция мероморфна в замк- замкнутом круге |г|^/?, а все полюсы лежат в открытом круге |г|1, все аппроксимации Паде [L/2] совпадают с /(г). Аппроксимация Паде [^/1] совпадает с частной суммой Тейлора, если L нечетно, и не существует, если L четно. На самом деле аппроксимации [?/1] используются реже, чем какая-либо другая строка; в общем в том случае, когда функция имеет полюсы, равноудаленные от начала коор- координат, выбор строки должен быть продуман. Отметим, наконец, что мы привели одно из конструктивных доказательств теоремы Монтессу. Этим же методом получается формула для остаточного члена [Gragg, 1972J. Существует также тесная связь между таким методом доказательства и симметри- симметрическими полиномами [ЕРА, стр. 135]. Приведенное доказатель- доказательство распространено и на случай нескольких переменных [Chi- sholm and Graves-Morris, 1975; Graves-Morris, 1977]. По этим причинам такой метод имеет важное значение; в следующем параграфе мы дадим более простое доказательство, не исполь- использующее явных формул.
244 Гл. 6. Теория сходимости Упражнение 1. Доказать, что определитель обобщенной мат- матрицы Вандермонда B.34) отличен от нуля и найти его величину. Такие определители иногда называются кратными определителями Вандермонда. Некоторые примеры этих определителей даны в ра- работе [Aitken, 1964, стр. 120], см. также [Chisholm and Graves- Morris, 1977]. Упражнение 2. Доказать соотношение B.31) g помощью тож- тождества Обратить внимание на неявные ограничения, имеющиеся в фор муле B.31): /', а, т—1 и L-\-i — / суть неотрицательные целые числа. § 6.3. Формула Эрмита и теорема Монтессу В этом параграфе доказывается формула Эрмита для разло- разложения в ряд Тейлора; из нее вытекает формула остатка для аппроксимаций Паде. Этот результат затем используется в эле- элегантном доказательстве Саффа теоремы Монтесеу. Формула Эрмита. Если /(г) аналитична внутри контура Г, охватывающего начало координат, и непрерывна на Г, то для аппроксимации Паде [Q0] справедлива формула Замечание. Эта формула—частный случай более общей фор- формулы Эрмита (т. 2, теорема 1.1.1); именно этот случай и понадо- понадобится в настоящем параграфе. Доказательство. Так как то правая часть C.1) есть полином от г степени L, равный /¦о г /=о ' Тем самым формула C.1) доказана. Следствие. При тех же предположениях относительно функ- функции /(г) (аналитичность внутри Г и непрерывность на Г) имеет
6.8. Формула Эрмита и теорема Монтессу 245 место следующая формула остатка для аппроксимаций Паде\ (z) RM (г) J ^м(г)— произвольный полином степени не выше М, отличный от тождественного нуля (можно выбрать RM (г) = 1 или другим удобным образом). Первый метод. С помощью формулы Эрмита запишем поли- полином, интерполирующий функцию f(z)QlL/Mi(z) RM(z) до порядка L + M 1 f» f(v)QlLW(v)RM(v) ^ГТГ dv- В то же время по теореме Коши имеем f (г) Q^m {г) Rm (г)=_L_ J _J_ f {v) qtuMj {v) Rm (o) dv Г Вычитая одно равенство из другого, получаем ш j ( г Из уравнений Паде вытекает, что / B) Qti/M 1 B) /?Л B) = {РШМ = Р№/Л] (г) /?д (г следовательно, B) = PW1 B) / так как /?Л1(г) — полином степени не выше М. Из (З.З1) полу- получаем C.2). Второй метод. Мы приводим второй метод для того, чтобы объяснить некоторый произвол, имеющийся в равенстве C.2). Применим теорему Коши к функции Ф B) = RM (г) {f (г) Qf^/^l (z)—Я^'«1 (г)} г"*-*. Из уравнения Паде вытекает, что ф(г) аналитична в окрест- окрестности начала координат, поэтому (РB)=о!- — г
246 Гл. 6. Теория сходимости где Г —произвольный простой замкнутый контур, охватывающий начало координат. Следовательно, X J (в—z)t/ + «+i + Е(г)\> C-4) (г v ' ) где Подынтегральное выражение в формуле для ?(z) аналитично при | v | > | г |, поэтому контур Г можно «стянуть» в точку у= оо. Так как /?ж (и) — полином степени не выше М, то подынтеграль- подынтегральное выражение есть 0(v~2). Значит, ?(г) = 0, что объясняет и доказывает формулу C.2). Используем теперь этот результат для доказательства теоремы Монтессу другим способом. Доказательство (метод Саффа). По предположению теоремы Монтессу функция /(г) мероморфна в круге |г|<7? и имеет в нем полюсы общей кратности М. Поэтому удобно выбрать полином RM{z) с нулями в полюсах функции /(г). Рассмотрим сначала случай, когда все полюсы /(г) простые; обозначим их через а^, а2, .... ам. Образуем полиномы Я0(г)=1, ^(г) = (г—ах)(г—а2) ... (г—ak) для fc=l, 2, ..., М. Тогда функция RM(z)f(z) аналитична в круге |г|^/?. Нам понадобится также полином м степень которого равна М; коэффициенты <4'- М) будут фиксиро- фиксированы позднее. Воспользуемся формулой Эрмита и построим поли- полином Тейлора степени L-\M для функции t'u М) (г) RM(z) f (г). Так как эта функция аналнтична в круге |г|^/?, то e_j_ С 2га J 11 ¦j—г XRM(v)[(v)dv. C.5)
6.3. Формула Эрмита и теорема Монтессу 247 Выберем теперь коэффициенты a{kLl т так, чтобы Ям (г) являлся множителем полинома nL+M (г). Это будет достигнуто, если Ль+м(ai) = О ДЛЯ ' = 1. 2, .... М. Тем самым мы пришли к си- системе линейных уравнений относительно величии ah ' '; S f diL-M\ C.6) * = о где '(tt"'i-w<'"w/w В формулах C.7) и C.8) можно перейти к пределу при L—> оо: ^¦«)_dy = _^. f !M» = 0 по теореме Коши, ML, М) _^ - _ 1 Г #ft (») /?Д| W / (») ^ ,о ОЧ Если / < ?, то c/ft = 0; величина Cjj^O и зависит только от расположения Л1 полюсов функции /(г) и вычетов в них. Полу- Получаем, во-первых, что для достаточно больших L система урав- уравнений C.6) относительно а%' м' не вырождена; во-вторых, ф, М) _+ о при L —+ оо. Следовательно, найдутся такие коэффи- коэффициенты \a{hL- M)\, что полином RM (г) является множителем Я? из C.5) получаем я^ж(г)//?А1(г) _ P'tM1J (г) _ / ы , п р, Ж) (г) Q\LiNI\ (г) — ' \г) + и \Z >> кроме того, /а> М) (г) —<• /?ж (г) при L —>¦ оо. Завершается доказа- доказательство с помощью формулы для остатка: из которой вытекает, что остаток стремится к нулю при \z\248 Гл. 6. Теория сходимости то (г—а,)/"—множитель полинома nL+M(z) из C.5). Полиномы \Rk(z), k = 0,1,- • -,Щ определяются с учетом кратностей полюсов; например, Rk(z)={z—а^)к, k = 0,\,..., р. Вместо C.9) имеем Если у < ?, то Cjk = O. Величина Cjj=?O. Кратность других по- полюсов учитывается аналогично; в остальном доказательство проводится так же, как и для случая простых полюсов. Особое значение приведенного способа заключается в том, что по такой схеме можно доказать теорему Саффа — обобщение теоремы Монтессу. В теореме Саффа устанавливается сходимость строки многоточечных аппроксимаций Паде (см. т. 2; § 1.1) для односвязного множества точек ? при условии, что точки интерполяции выбраны подходящим образом внутри области аналитичности заданной функции. Теорема 6.3.1 [Saff, 1972]. Пусть ?—замкнутое ограничен- ограниченное множество в комплексной z-плоскости со связным дополнением Й? (°° 6 Э?). Предположим, что задана последовательность точек интерполяции ЯШ Rd) °1 Рг C.10) i Рг • • -Pn+i» не имеющая предельных точек в Ж и такая, что lim n- п+1 II (*- 1=1 1/Л = cap^expG(z) C.11) равномерно по г на компактных подмножествах Ж; сар$ опре- определена в § 6.6. Для каждого а> 1 положим Га — линия уровня GB) = lna, a So—внутренность Г,. Пусть функция /(г) анали- тична на S, мероморфна в ?р для некоторого р > 1 и имеет в Sp ровно М полюсов о учетом их кратностей. Тогда для всех достаточно больших L существует единственная рациональная функция rlL'M*(z), интерполирующая f(z) в точках $\L+M), Р(/-+м>, ..., Р?км+,: Функция rWMi{z) имеет ровно М конечных полюсов, которые спгремятся к полюсам / (г) в $р. Кроме того, ri'-'Mi(z) —>¦ f(z) равномерно на компактных подмноокествах ?р, не содержащих полюсов /(г), и lim /sup п-* » \геё
6.3. Формула Эрмита и теорема Монтессу 249 Замечание. Теорема Монтессу (теорема 6.2.2) оказывайся следствием теоремы Саффа, если в качестве $ взять круг анали- аналитичности функции /(г). Понятия, используемые в теореме Саффа, вводятся в § 6.6 и т. 2, § 1.1. Мы отсылаем к работе [Warner, 1976] для обсуждения вопроса о последовательном выборе точек fJ(/" внутри ?, изучения различных обобщений теоремы Саффа и ее связи с теоремой Рунге о полиномиальной аппроксимации. Отметим, что функция G (г) определяется соотношением C.11), если в качестве {Р'/1', i=l, 2, ..., п) взять нули полинома Чебышева степени п для множества ?. Доказательство теоре- теоремы 6.3.1 проводится описанным выше методом. Используя контурные интегралы, можно без привлечения общей теории установить ортогональность полиномов C.12), ас- ассоциированных с рядом Стильтьеса или рядом Гамбургера с ну- нулевым радиусом сходимости. Рассмотрим функцию Гамбургера f(z) = -~R пусть Qtm-l/»i] (г) — знаменатель ее аппроксимации Паде [т— 1/т]. Определим полином т-й степени лт {и) по формуле ят («) = «""Qt'"-1/'"] (— 1/м), т=1, 2, ..., C.12) яо(«) = 1. Полиномы \пт (и), т=0, 1,2,...} взаимно ортогональны: Imk = \ пт (") лк (w) ^Ф (") = ^ Для /пфк. C.13) -R Доказательство [Zinn-Justin, 1970]. Так же, как и в § 5.3, положим w = —l/z и -R -R Используя теорему Коши, получаем R 1 Г С -х-т- \ пт (w) nk (w) F (w) aw— \ nm (u) nk (u) d
k. Так как
250 Гл. 6. Теория сходимости то контур интегрирования в C.15) можно стянуть в начало ко- координат и найти, что /mft = 0. Тем самым соотношение C.13) установлено. § 6.4. Единственность предела Характерной чертой аппроксимации Паде является то, что это рациональная функция. Поэтому если существует предел последовательности аппроксимаций Паде, то этот предел должен быть мероморфной (или даже голоморфной) функцией в некото- некоторой области комплексной плоскости. Естественно ожидать, что полюсы и вычеты аппроксимаций Паде стремятся к соответствую- соответствующим характеристикам предельной функции. Однако, так как ве- величина аппроксимации Паде в окрестности полюса предельной функции становится как угодно большой, сходимость в обычном смысле в окрестности полюса невозможна. Простейший техниче- технический прием, позволяющий преодолеть это затруднение, состоит в использовании сферической метрики. Обычная сходимость за- заменяется на сходимость на сфере. Многие теоремы о сходимости аппроксимаций Паде к мероморфным функциям более элегантно формулируются в терминах сходимости на сфере, при этом по- полюсы уже не принадлежат исключительному множеству [Baker, 1974]. Например, теорема Монтессу принимает вид: Если функция I (г) мероморфна в замкнутом круге \z\^R, имеет в круге \ z | < R полюсы общи кратности М и аналитична в начале координат, то строка [L/M] сходится к f{z) в сфери- сферической метрике {равномерно в круге \ z\^.R). Приведем определение сферической метрики [Ostrowski, 1925; Hille, 1959, с. 42]. Пусть fj и vt—два комплексных числа; они могут быть значениями v1 — f(z1), уа = /(г2) некоторой мероморф- мероморфной функции. Тогда расстояние x(yi> ys) B сферической метрике между vt и и2 определяется как длина хорды между точками Ру и Рг на сфере Римана (см. рис. 1). Точки Р, и Рг—точки пере- пересечения единичной сферы с центром в начале координат и прямой, проведенной из «северного» полюса N соответственно в точки ух и v2, лежащие в экваториальной плоскости. Начало координат 2 = 0 переходит в «южный» полюс S, а точка г=оо переходит в единственную точку ЛЛ Геометрическим методом получаем, что D.1) Доказательство. На рис. 2 показан вертикальный разрез сферы плоскостью, проведенной через «северный» и «южный» по-
6.4. Единственность предела 251 Рио. 1. Риманова сфера. люсы и точку Uj комплексной плоскости. Легко видеть, что NVi = 8scait a NPi = 2cosa1; поэтому NVi-NPi = 2. На рис. 3 показана плоскость, образованная прямыми линиями NV.P, и NV2P2. N О Рис. 2. Разрез Ри- маиовой сферы. То- Точка Vi соответству- соответствует точке vf в комп- комплексной плоскости. Так как NVil 2Pt подобны; поэтому Рнс. 3. Треугольник Л/Р^. Точки Vi и К2 соответствуют точкам B,H5jB комплексной плоскости. = 2, то треугольники NP2 ~ NP,.
252 Гл. 6. Теория сходимости Таким образом, РхРг = VjV^cos ax B cos а2), откуда немедленно вытекает формула D.1). Переход от комплексной плоскости к сфере Римана особенно полезен, когда г—>¦ то, так как на римановой сфере это соот- соответствует г —у ON. Для сферической метрики справедливо следующее неравенство, которое вытекает непосредственно из D.1): Х(»1. v*)< 2\v1—vi\. D.2) Этим математически выражается тот факт, что близким точкам в комплексной плоскости соответствуют близкие точки на сфере. С помощью элементарной геометрии нетрудно показать, что (оо, »)= , 2 — D.3) D.4) для всех vЛ и у2. Неравенство D.4) геометрически очевидно из рис. 1. Определение сферической метрики приводит к следующему результату. Теорема 6.4.1. Любая мероморфная функция непрерывна в сфе- сферической метрике. Доказательство. Пусть /(г) — мероморфная функция. Если г0— регулярная точка /(г), то при некотором р>0 f(г) аналитична в круге \г — zo|
0 можно найти б > 0, такое, что |e при |2-го|<6. Отсюда в силу D.2) получаем \г — го|<б, таким образом, для регулярной точки непрерывность в сфериче- сферической метрике доказана. Если г0 не является регулярной точкой, то это полюс /(г). В этом случае найдется целое т ^ 1, такое, что функция ср(г)= = (г — zoy f (г) аналитична в точке г0 и cp(zo)=^=O. Для любого заданного е > 0 имеем |/B)| > 2/в и х(/(г), оо)<е для всех таких г, что
6.4. Единственность предела 253 I Ф B) — фB0) |<-2 |фB0)|. Функция ф (г) непрерывна в точке г = г0, тем самым в некоторой окрестности этой точки х(/B). то) < е; это доказывает непре- непрерывность в полюсе. Иначе говоря, отображение z—+f(z) непре- непрерывно в сферической метрике. Следствие. Любая мероморфная функция, определенная в ком- компактной области, равномерно непрерывна на сфере. Доказательство. Отображение г —* Р {f (г)), где Р (/(г)) — точка Р на сфере Римана, соответствующая комплексному числу f(z), непрерывно на компакте. Поэтому оно равномерно непре- непрерывно. Установим теперь три теоремы, которые применимы, когда г принадлежит компактной области и можно использовать свойство равномерной непрерывности. Теорема 6.4.2. Пусть {Р„ (г)}—произвольная последовательность мероморфных функций, которая равномерно сходится в сфериче- сферической метрике в некоторой компактной области Э1 Тогда (i) предельная функция равномерно непрерывна в Э1 в сферичес- сферической метрике; (п) семейство {Рп (г)} равностепенно непрерывно в 5? в сфери- сферической метрике; (iii) предельная функция мероморфна внутри Э1. Доказательство. Пусть /(г) —предел последовательности {Рп(г)}. Докажем непрерывность /(г) в точке z = z0 в сфериче- сферической метрике. Так как для сферической метрики выполняется неравенство треугольника, то X (/ (г), / (*„)) < X (/ B), Рк B)) + % (PN (г), PN (г0)) + х (PN (г0), / (г,)). Фиксируем произвольное е > 0; тогда из равномерной сходимости Р„(г) к /(г) в сферической метрике вытекает существование та- такого номера N, что х(/B), Р„(г))<в/3, „г для всех n^-N и всех г, гй?сЯ. е/о) Свойство равномерной непрерывности функции PN(z) в сфери- сферической метрике дает число б > 0, для которого х (Pn (z), Pn (z0)) < < e/3 для всех г, г^Ш, \г — zo|<6. Следовательно, %(f(z), /B0))<е, т.е. f(z) равномерно непрерывна в &1 в сферической метрике. Свойство (i) доказано. Для доказательства (и), свойства равностепенной непрерыв- непрерывности, рассмотрим неравенство %(Р»(г)> Р»(го))<*- D.5)
254 Гл. 6. Теория сходимости Неравенство треугольника показывает, что D.5) справедливо, если X (/>„(*)> /B))<е/3, D.6) X (/(*). /(*.))< в/3 D.7) и X(/(*.), />„(*.))< в/3. D.8) Неравенства D.6) и D.8) выполняются для всех n>N(e) и лю- любых г, zo?5?; неравенство D.7) справедливо для всех таких г, zo?5?, что \г—20|<б(е). Следовательно, D.5) имеет место для всех п>Лг(е) при условии, что \г—20|<б(е), г, zo?9l. Так как при фиксированном k функция Рк (г) равномерно не- непрерывна в сферической метрике для г?91, то Х(ЛкB), ^ («.))< в При |2 —20|<в*(в). Выберем smin (е) = min {8f, 6j, ..., 8Л, б(е)}; тогда х(Рп(г), />„(г0))<е при тех г, го?5?, для которых \г—zo|<6min. Тем самым (П) доказано. Для того чтобы доказать мероморфность f (г) внутри Э{, рас- рассмотрим произвольную точку г0 внутри 5?. Если величина /(г„) конечна, то найдется замкнутая окрестность |г—zoj^6, в кото- которой / (г) является равномерным пределом последовательности аналитических функций. Поэтому по теореме Вейерштрасса /(г) аналитична внутри этой области. Если величина /(г0) бесконечна, рассмотрим функции (Рп(г))~1, которые аналитичны в точке г = г0 для достаточно больших п. Следовательно, по теореме Вейер- Вейерштрасса (/(г)) аналитична в точке г = г0. Поэтому f (г) меро- морфна внутри 5?. Воспользуемся теперь теоремой Арцела для выделения под- подпоследовательности, к которой применима теорема 6.4.2. Теорема 6.4.3 [Hille, 1962, с. 241]. Пусть {Рп (г)}—бесконеч- (г)}—бесконечная последовательность мероморфных функций, равностепенно не- непрерывная в сферической метрике для г, принадлежащих компакт- компактной области 5$. Тогда найдется бесконечная подпоследовательность последовательности {Рп (г)}, равномерно сходящаяся к функции /(г), которая равномерно непрерывна на сфере для г?Э1 и меро- морфна внутри Э1. Доказательство. Воспользуемся методом доказательства тео- теоремы Арцела (теорема 5.2.5) для того, чтобы из последователь- последовательности {Рп(г)} выделить подпоследовательность, равномерно схо- сходящуюся на 5?. Тем самым, будут выполнены условия теоремы 6.4.2, откуда и вытекает нужный результат. Этой теоремой завершается подготовка к доказательству тео- теоремы о единственности предела. Как и в случае рядов Стиль-
6.4. Единственность предела 255 гьеса, теорема Арцела приводит к сходящейся подпоследователь- подпоследовательности. Этот результат вместе со сходимостью всей последователь- последовательности в окрестности начала координат дает сходимость всей по- последовательности и в большей области. Теорема 6.4.4. Пусть Pk(z) = [Lk/Mk]—последовательность ап- аппроксимаций Паде функции f(z), регулярной в начале координат, причем Lk -f- Mk —> оо при k —»• оо. Если последовательность {Pk (г)} равностепенно непрерывна в сферической метрике в одно- связной компактной области 91, содержащей начало координат в качестве внутренней точки-, то область определения функции f (г) можно расширить так, что /(г) будет мероморфна внутри 5$, и [Lk/Mk] сходится к f (г) в сферической метрике для всех г g 5$. Доказательство. По теореме 6.4.3 существует по крайней мере одна предельная функция [(г), мероморфная внутри 91 и такая, что /@)^/@). Следовательно, найдется р, такое, что f(z) и f(z) аналитичны в круге | г \ < р. Рассмотрим теперь всю последова- последовательность {Pk (z), k=\, 2, 3,...}. Из равностепенной непрерыв- непрерывности этой последовательности в сферической метрике вытекает, что для любого е > 0 найдется б == б (е) > 0, такое, что е при |z|<6256 Гл. 6. Теория сходимости Теорема 6.4.5 [Baker, 1965J. Пусть Pk(z) = [Lk/Mk}—последо- [Lk/Mk}—последовательность аппроксимаций Паде функции / (г), аналитической вначале координат, и последовательность |Pfe(z)| равномерно ог- ограничена в односвязной ограниченной области SD, содержащей на- начало координат. Если Lh-\-Mk—> оо при k—»-оо, то Pk(z)—>-/(z) равномерно в каждой области 5?, компактно принадлежащей SD, и функция f(z) аналитически продолжается в Э1. Доказательство. Покажем прежде всего, что последователь- последовательность {Pk (г)} равностепенно непрерывна в &>. Если функция | Pk (г) | ограничена в ?Е>, то Pk(z) аналитична в <2>, так как он;< является ряпиональной функцией. Следовательно, ^*_ = _!_ С pk И dw dz 2я[ J (z—шJ ' где С—круг радиуса б с центром в точке г, причем 6 выбрано одним и тем же для всех z ? 9L. Тем самым последовательность ) P'k (z) | равномерно ограничена в ?А. Отсюда вытекает, что {Pk(z)} — равностепенно непрерывная последовательность. Тогда в силу теоремы 6.4.4 {Pk (г)} —> f (г) равномерно в сферической метрике, и функция f(z) как равномерный предел ограниченной последовательности не просто мероморфна, а аналитична в Я. Теорема доказана. В теореме 6.4.4 утверждается, что предельная функция меро- мероморфна в Я. Следовательно, если заданная функция не являет- является таковой, а остальные условия теоремы выполняются, то по- последовательность аппроксимаций Паде не может быть равносте- равностепенно непрерывной в сферической метрике. Аналогично, если функция f (г) не является аналитической, но имеют место другие условия теоремы, то последовательность аппроксимаций Паде для /(г) не может быть равномерно ограниченной. Результаты, подобные приведенным, имеются в работе [Jones and Thron, 1975]: в работе [Jones and Thron, 1979] получены обобщения на случай рядов Лорана с конечной главной частью. Другие важные резуль- результаты о сходимости аппроксимаций Паде для функций, аналити- аналитических в начале координат, получены в работах [Chisholm, 1966], [Beardon, 1968a] и [Baker, 1970]. Упражнение 1. Найти три точки v, vt и v$ в комплексной плоскости, такие, что \v,—у|<|у2—v\, но %(vt, v)>x(vi> v)- Упражнение 2. Доказать, что для сферической метрики выпол- выполняется неравенство треугольника. Упражнение 3. Представить результаты последнего раздела настоящего параграфа в виде двух самостоятельных теорем.
6.5. Сходимость по мере 257 § 6.5. Сходимость по мере Мы будем неоднократно использовать формулу остатка C.2) для аппроксимаций Наде: /civ E-1) Основное соображение заключается в том, чтобы оценить в E.1) величину \QU/m(z)\~l, используя такую оценку, которая изве- известна для любого полинома степени М. Эта оценка дается нера- неравенством k-B)|>Ti- E.2) где полином qm (z) имеет единичный старший коэффициент; она справедлива всюду в г-плоскости, за исключением множества ?, мера которого не превосходит ntf. Обычно о расположении этого исключительного множества нам ничего неизвестно, однако для его площади справедлива указанная оценка. Теоремы, которые мы докажем ниже, справедливы для г, лежащих вне множеств произвольно малой меры. Это означает, что в этом параграфе не содержится никаких утверждений о поточечной сходимости в г-плоскости. Все результаты основаны на том, что площадь исключительного множества, содержащего нежелательные комбинации полюс — нуль аппроксимации, произ- произвольно мала. В качестве примера E.2) рассмотрим случай, когда qm(z) == = (г—а)т; этот полином имеет степень т и единичный старший коэффициент. Тогда ) qm (г) | ^ х\т всюду вне круга \z—а|<т], площадь которого равна щг. Этот пример является крайним случаем: все корни полинома qm(z) расположены в точке z = a. Из него видно также, что теорему нельзя улучшить. Если корпи qm (г) достаточно далеки друг от друга, то оценка measc^ < лг|2 оказывается слишком грубой оценкой площади многокомпонент- многокомпонентного множества, на котором | qm (z)| < цт. Непосредственно из соотношения E.1) вытекает оценка для |/(г) — [L/M] |, если вос- воспользоваться неравенством E.2). Этот подход (см. [Zinn—Justin, 1971]) приводит к интересным теоремам о сходимости последова- последовательностей аппроксимаций Паде. В настоящее время они счита- считаются наиболее естественными теоремами общего характера о схо- сходимости аппроксимаций Паде аналитических функций. Всюду в этом параграфе предполагается, что нужные аппро- аппроксимации Паде существуют. Теоремы необходимо понимать имен- именно в этом смысле. Правая часть E.1) не обязательно приводит к существованию аппроксимации Паде. Так как, например, в каждой строке существует бесконечная подпоследовательность
258 Гл. 6. Теория сходимости аппроксимаций Паде, то теорему о сходимости строки по мере можно было бы сформулировать как теорему о сходимости беско- бесконечной подпоследовательности существующих аппроксимаций Паде. Во избежание излишней громоздкости формулировок мы четко оговариваем, что результаты этого параграфа относятся только к существующим аппроксимациям Паде. Ни одну из тео- теорем нельзя понимать как утверждение о существовании аппро- аппроксимаций Паде. Первая теорема аналогична теореме Монтессу; затем мы перей- перейдем к последовательностям, аналогичным диагональным. В самом доказательстве представляет интерес то, что площади исключи- исключительных множеств для аппроксимаций Паде [Lk/Mk] можно огра- 00 СО ничить величинами б4, такими, что 2 \ < °° и 2 ^>* < б, где 6>0—произвольное заранее выбранное число. Отсюда вытекает сходимость по мере последовательности [Lk/Mk], k=\, 2,'..., при условии, что аппроксимации Паде существуют. Важно раз- различать теоремы, в которых утверждается сходимость всей после- последовательности существующих аппроксимаций Паде, и теоремы о сходимости только некоторой подпоследовательности. В первой теореме устанавливается сходимость по мере строки аппроксимаций Паде для мероморфной функции. Такая более слабая форма теоремы Монтессу применима в случае, когда из- известно, что степень знаменателя не меньше (вместо точного сов- совпадения) числа полюсов внутри круга сходимости строки. Теорема 6.5.1. Пусть функция / (г) аналитична в начале коор- координат, а также в круге \z\^.R, за исключением т полюсов, под- подсчитываемых с учетом кратностей. Рассмотрим строку аппрокси- аппроксимаций Паде [L/M] функции f(z), где М фиксировано, М^т, и L—юо. Предположим, что заданы произвольно малые положитель- положительные числа е и б. Тогда найдется номер Lo, такой, что |/(г) — — [Z.//W] | < е при всех L > Lo и всех | г | < /?, за исключением z(z&u где <&i—множество точек в z-плоскости, мера которого меньше б. Доказательство. Пусть ait щ, ... , ат — полюсы /(г) в круге |г|<Я и #.B) = (г—ai)(z—о,) • • • (г—ат), так что функция Rm(z)f(z) аналитична при |г|6.5. Сходимость по мере 259 где QM(z)^Qa'm(z). При \z\ оо |/(z) —[L/MJI —О
260 Гл. 6. Теория сходимости для |г| k0 и | z | < R, исключая г ?$k, где meas^fe < б, при условии, что (i) Lk/Mk —*¦ оо при k—*oo (МкФ0), и (и) Mk^M для всех &>&„. Доказательство. Уменьшение величины г| приводит к более сильному результату, поэтому, не теряя общности, можно считать, что R/ц > 1. Поскольку Mk^M, то справедливо E.8); так как /И' 0 найдется номер k0, такой, что хг1п R при всех k > k0. Следовательно, L'{f ) M h Выберем теперь e' = min{l, (e/K) (r)/2R)m}, эта величина положи- положительна; тогда \f(z)-[Lk/Mk]\ k0. Следствие 2. В предположениях теоремы относительно функ- функции f (г) и величин е, б и М найдется Lo, такое, что \f(z)-[L/M]\L0 и всех |г|6.5. Сходимость по мере 261 Доказательство. Для аппроксимации Паде [/ + LjM] получаем из E.8) l^*»^*^™*] E.9) вне множества $t, мера которого не больше щ}. Не уменьшая общности, можно считать, что R/r\t>l. Учитывая, что M'sglM, выберем L, так, чтобы гда е>0 — некоторое заранее выбранное малое число. Пусть число г|г удовлетворяет условию 2 [/ / | \М+т II! (i) «Ь E.10) благодаря которому из E.9) вытекает, что вне множества <§t, мера которого не больше лт]|. Уравнение E.10) можно переписать в виде Z таким образом, Z^ = 2n^/R{tm+m). E.11) Выберем теперь /' так, чтобы S. Это неравенство означает, что общая мера всех индивидуальных множеств для аппроксимаций Паде [l + L/M], I > /', произвольно мала. Таким образом, сходимость строки по мере доказана. Теорема 6.5.2. Пусть f (г) аполитична в начале координат, а также в круге | г | ^ R, за исключением т полюсов, подсчитываемых с учетом кратностей. Рассмотрим последовательность аппрокси- аппроксимаций Паде [Lk/Mk] функции /(г), где Mk^m и LkIMk—+ oo при k~*oo (МкФ0). Пусть е и б—произвольно малые положитель- положительные числа. Тогда найдется номер k0, такой, что при k > k0 \f(z)-[Lh/Mk]\262 Гл. 6. Теория сходимости Теорема 6.5.2 объясняет утверждения предыдущей теоремы и ее следствий. Доказательство аналогично приведенным выше. Следствие 2 теоремы 6.5.1 о сходимости строк представляет собой сильный результат. Напомним, что исключительные мно- множества содержат полюсы аппроксимаций из круга | г | < R в качестве внутренних точек. Сходимость, строки естественно ожи- ожидать в круге |г| Мо аппроксимации Паде [М/М] удовлетворяют неравенству \f B) -[/И/Ж] |< 8 на любом компакте в г-плоскости, исключая множество $м, мера которого меньше б. Доказательство. Из произвола в выборе масштаба в г-пло- г-плоскости вытекает, что в качестве компакта достаточно рассмотреть круг |г| < 1. Положим Л = у Кб/л; не теряя в общности, можно считать, что 0<т)<1. Пусть = C/-П)8. Для некоторого достаточно малого А, 0 < А < 1, найдется число R, такое, что (i) f(z) аналитична в кольце R—А < | г| < # +А, (ii) R>Rmir), (Hi) в круге |z|<# функция /(г) имеет m = m(R) полюсов в точках z = ult i = 1, 2 т.
5.5. Сходимость по мере 263 Воспользуемся теперь интерполяционной формулой Эрмита f(z) \м/м\ - где М^т, QM(z)ssQlM'MHz) и Я» (*) = Й ( Так как | г | < 1, R > #min > 2, то sup 11 где Л^= sup |/@l- Из E.6) при некотором УИ'^М получаем sup |РЛ@/?«@1 /? Ш^ < _ . E.13) I Qm [г) Rm B) I |Я«(г)|П |*-«// Знамеггатель правой части E.13)—модуль полинома с единичным старшим коэффициентом; для него справедлива оценка |Я„B)|П \г-г{\>цм'™ E.14) вне множества <^>Д], мера которого меньше лт]2 = б. Объединяя E.12), E.13) и E.14), получаем Пусть М > 2m; так как R > (З/riK, то для всех М, больших некоторого Мо, и г, не принадлежащих множеству ?м, мгра которого меньше б. Как уже отмечалось, теорема 6.5.3 представляет собой наибо- наиболее слабый из известных результатов о сходимости по мере луче- лучевых последовательное гей. Тем не менее эта теорема дает основу для дальнейшего развития. Во-первых, вместо диагональной можно рассмотреть последова- последовательность вида [Lk/Mk], k=l, 2, ..., где 264 Гл. 6. Теория сходимости Рис. 1. Область в таблице Паде, соответствующая неравенству E.15). условии, что Lk-\-Mk—»¦ оо, этого ограничения достаточно для сходимости по мере. Во-вторых, функция /(г) не обязательно должна быть меро- морфна; она может иметь 1акже счетное число изолирован- изолированных существенно особых точек Это означает, что функции ехр[—A —г)] и ехр[гГ(г)] —допустимые, а функции, особые точки которых имеют в конечной г-плоскости предельную точку, таковыми не являются. Теорема 6.5.4 [Pommerenke, 1973]. Пусть функция I (г) анали- тична в начале координат, а также во всей г-плоскости, за исклю- исключением счетного числа полюсов и существенно особых точек Пред- Предположим, что заданы е > О и б > 0. Тогда найдется М„, такое, что при М~^Мп аппроксимации Паде \L/M\ лучевой последователь- последовательности, соответствующей L = ХМ (к Ф 0, Хфоо), удовлетворяют неравенству \f(z)-[L/M]\ 0 и Я > #min таковы, что (i) /(г) аналитична в кольце R—А < |г| < + (ii) f (г) имеет m — m{R) полюсов г = и{, г=1, 2 круге |г|<Я; E.16) т, в
6.5. Сходимость по мере 265 (iii) /(г) имеет \i = ix(R) существенно особых точек z = wt, /=1, 2 ц, в круге |z|¦ оо и /?—*оо, но держать степень полинома 7? л (г) достаточно низкой. В любом случае полином RM (г) имеет единичный старший коэффициент и степень меньше, чем М. Воспользуемся теперь формулой Эрмита f (г\ -\LIM\ - *L+M+1 S ЧмЮЬмМЮ dt где Qm(z) ^Q[Z-/M1 (z), а замкнутый контур С охватывает начало координат и не содержит особых точек функции Qm(z)f(z). Отсюда, заменяя контур С на окружность, содержащую внутри себя существенно особые точки, находим { i т^!?4 EЛ9) где /(г)= С ММШд. E.20) Интеграл E.20) — контурный интеграл по окружности радиуса 6ft с центром в существенно особой точке z — wk. Оценим Ik(z) при |г—wk\>2bk. Применяя теорему о максимуме модуля к поли- полиному QM(l) /?m@ У—®к)~р> имеем 1 гл в (Лп sup IQ- СО «я @1 ?и @ Rm@ II / |<|=я (i-wk)P |/|=/ Следовательно, при |г —шь|>2бй ^p |/гл@<гя@1.. t e l/(')|6? |/*B)|<^ Д? - L+M+i • E.21)
266 Гл. 6. Теория сходимости Положим теперь E-22) Тогда в силу E.16) круги \г—а°к\<26к, покрывающие сущест- существенные особенности функции в круге |г| < 1, имеют малую общую меру. Из E.22) имеем \ R j Положим sup 1/@1=/С», I '-«* 1=бй где /Cft не зависит от М; тогда sup |/гм @ (З/rj)' + -Л и Л] достаточно велико, имеем |/(г) — [L/M]| < е вне множесмва $м и малых
6.6. Лемнискаты, емкость и мера 26? кружков, покрывающих существенные особенности функции /(г) в круге |г| < 1. Следствие 1. Эту теорему можно обобщить на случай произ- произвольных последовательностей, расположенных в той части таб- таблицы Наде, которая указана на рис. 1. Следствие 2 [Zinn-Justin, 1971J. Пусть функция f (z) меро- морфна в круге \z\^.R и qM—число нулей полинома QM (г) в круге |г| < R. Если ом In M n , , ¦^-tj *0 при М—>-оо, то аппроксимации Паде [М/М] сходятся по мере к функции f (г) в круге | г |< R/V~3. Следствие 3 [Zinn-Justin, 1971]. Если f (г) — целая функция порядка меньше чем 2/%, то подпоследовательность ее аппрокси- аппроксимаций Паде [КМ/М] сходится на каждом компактном подмно- подмножестве комплексной г-плоскости, за исключением множества произ- произвольно малой меры. Мы приводим эти следствия без доказательств. Второе и третье из них интересны с той точки зрения, что они показывают, как большие ограничения на класс рассматриваемых функций при- приводят к более сильным результатам о сходимости. Однако если известна только мероморфность функции f (г) в круге |г|<7?, то никаких теорем о сходимости по мере в этом круге ее диаго- диагональных аппроксимаций Паде до сих пор не получено. Мы отсы- отсылаем читателя к работе [Edrei, 1975], в которой допускается в качестве особенности предельная точка полюсов в отличие от изо- изолированных особенностей в теореме Поммеренке. § 6.6. Лемнискаты, емкость и мера Детальное и строгое изложение основ теории емкости и меры не является целью этого параграфа. Скорее нам хотелось пока- показать, почему результаты предыдущего параграфа становятся гораздо более сильными, если их переформулировать в терминах емкости и меры Хаусдорфа. В основе § 6.5 лежит результат, связанный с леммой Кар- тана [Cartan, 1928; Nuttall, 1970 b], о том, что для полинома qm (г) с единичным старшим коэффициентом неравенство | цт (г)| > г|а выполняется всюду вне множества <§, мера которого не превос- превосходит лг|2. Граница этого множества, задаваемая равенством \qm(z)\—'\\tn, называется лемнискатой; тем самым все результаты
268 Гл. 6. Теория сходимости § 6.5 справедливы вне произвольно малых областей, ограничен- ограниченных лемнискатами. Мы увидим, что естественной мерой величины таких областей является их емкость. Напомним сначала известный результат Чебышева о полиноме, минимизирующем максимум модуля па интервале —l^x^l. Задача заключается в том, чтобы в классе Рп всех полиномов р„(х) степени п с единичным старшим коэффициентом найти по- полином Т„ (х), для которого достигается величина inf sup \pa(x)\. Рп (х) 6 Р„ -1 < х < 1 Решение этой задачи хорошо известно. При п ^ 1 Тп (х) = дд,| cos (n arccosx) — полиномы степени п с единичным старшим коэффициентом, а inf suj Рп(х)бР„ -I <; Линейная замена переменных inf sup \рп(х)\ = -2п-=х • (б-1) приводит к такому результату: inf sup |,nW|==(l=i)-(^). F.3) На случай произвольного компакта в г-плоскости эти идеи обобщает следующая теорема. Теорема 6.6.1. Пусть ?—компакт в комплексной плоскости {содержащей бесконечно много точек). Тогда существует единст- единственный полином—полином Чебышева, для которого достигается величина Мп= inf sup[/?n(z)|. F.4) Рп (г)бРп *€g Минимаксный полином 7\,(г)==ПB-**) F-5) имеет все нули zt в выпуклой оболочке ?, а максимум Мп вели- величины | Тп (г)| достигается по крайней мере п раз на <§. Обсуждение. Мы не будем доказывать эту важную теорему (см. [Hille, 1962, с. 265]); ограничимся некоторыми пояснениями. Нетрудно увидеть, что все точки zt лежат внутри выпуклой оболочки ЗС множества ?. Предположим противное; пусть точка
6.6. Лемнискаты, емкость it мера 2G9 Рис. 1. Множество (^5 = (^5iU г- Объединение заштрихованной области и мно- множества <§ составляет выпуклую оболочку $. г, лежит вне выпуклой оболочки множества Ж и точек г2, г,, ... ...,2„. Рассмотрим надлежащим образом выбранную точку г[ и точку г', в которой достигается имеем sup |z zeg \ „ = SUP n|2- й 1=1 ?=2 2'-2.| III 2 I ,' »' I ТТ I г I т' г,-1 — m что противоречит свойству минимальности величины М„. Таким образом, все нули полинома Тп (г) лежат в выпуклой оболочке (?\ Доказательство существования минимаксного полинома осно- основано на том, что вместо класса всех полиномов достаточно рас- рассмотреть полиномы с нулями, лежащими в замыкании выпуклой оболочки. Доказательство существования и единственноеги поли- полинома Тп (х) в общем случае мы опускаем. Так как ?'— компакт, то очевидно, что максимум ^„(z)! достигается па /V такой полином определен не однозначно, что делает естественным исключение этого вырожденного случая. Следствие. Полином Чебышева Тп (г) для множества ?" опреде- определяет лемнискату \Тп(г)\ — Мп и соответствующую лемнискатную область J?'„: М„ для всех z
270 Гл. 6. Теория сходимости Тогда ?czJ?n, и граница 3/„ имеет по крайней мере п точек, общих с ?. Обсуждение. Важный результат следствия заключается в том, что множество ? превращается в подмножество лемпискатной области J?n, заданной неравенством \Тп(г)\^Мп. Доказатель- Доказательство немедленно вытекает из теоремы о максимуме модуля и из основной теоремы. Следующие три теоремы мы приведем с доказательствами, так как эти доказательства иллюстрируют структуру лемнискат и сущность понятия емкости. При этом неоднократно будет исполь- использоваться теорема о максимуме модуля, утверждающая, что макси- максимум модуля функции^ аналитической в комплексной области, достигается на границе этой области. Теорема 6.6.2. Пусть ? —компакт в комплексной г-плоскости (содержащий бесконечно много точек). Пусть Тп (г) — полиномы Чебышева для ? и М (" = сар?. F.7) Доказательство. Единственное, что требуется установить, это существование предела F.7). Для этого положим 0 можно найти N, такое, что \TN(z)\ < (a + 8)^ для всех При любых положительных целых m и k, m <. N, имеем \zm[TN(z)]k\6.6. Лемнискаты, емкость и мера 271 не зависит от k. Так как zm[TN(z)]k—полином степени m-j-kN, то +Nk) (а + е); переходя к пределу при k—>¦ оо, получаем F.8) Соотношение F.8) справедливо для всех положительных т < N и любого е > 0. Следовательно, р = я и определение F.7) кор- корректно. Емкость сар 0 найдется
272 Гл. б. Теория сходимости biz ^Rez Рис. 2. Отображение кривых К1 точки ветвления в ^-плоскости. К2 на окружность ]?|=р; показаны две достаточно большое п, такое, что |Гп(г)|<[сар6.6. Лемнискаты, емкость и мера 273 значим через \ik. Если точка z движется вдоль Kk, то точка п ? = /?(z) = Д (z— Z{) обходит \xk раз окружность |?[ = Р> а точка 1 обХОдИТ один раз окружность | ^' | == p1/jxfe Рассмотрим теперь отображения г —>¦ /?(z) = ? —>¦ ?1/ц* = ?' и обратное отображение ?'—->-z =/(?'). Ясно, что р(г) — однознач- однозначная функция от г, но обратное отображение z = z(Q таковым не является и имеет п—1 точек ветвления там, где p'(z) = 0. Однако если па окружности | | — р нет точек ветвления, то одна из ветвей функции z = /(?') регулярна на |?'| = р1/ц* и имеет разложение в ряд Лорана /=-00 т. е. z= 2 а^'С'7"*. F.12) /=- сю Найдем площадь множества, ограниченного кривой Kk: meas Kh =-j ф {x dy—у dx) =-^ ^ Re ^— = F.13) V of p'^ = я 2 /K'Pp2'7^. /=-00 Поэтому m m Г a» « 2 meas Kk = 2 n 2 /1 «f' Г p2'7^- 2 /1 <&) |2 P'7"* • A=l /(=1 L/ = I / = 1 J Равенство F.13) показывает, что наше утверждение достаточно доказать для достаточно больших р. Для таких р кривая Кх со- содержит все п корней полинома p(z), поэтому (Xj = n, m=l. Так как ?, = р(z) = z" + clz"-1+ ... +сп, то г = /(?') = ^/я + ао + ^?-1/л+..., F.14) и для достаточно больших р F.13) принимает вид 2 measKk = np"-'n— 2 / |й-/|2Р~2//". F.15) *=1 / = 1 Следовательно, meas^n ^ яц2, если т] = р1'.
274 Гл. 6. Теория сходимости Теорема доказана, однако интересно отметить, что F.10) пре- превращается в равенство, если в F.15) а„ = а,= ...=0 В этом случае из F.14) вытекает, что лемниската — это окружность \z\" = p". Обратимся теперь к некоторым примерам. Пример 1. Емкость интервала a^LxsZZb равна (b—a)/i. Обсуждение. Воспользуемся результатом F.1) [Cheney, 1966, стр. 61; Rivlin, 1969, гл. 1J. Тогда с помощью подстановки F.2) получаем формулу F.3), а из F.7) вытекает, что cap {—1 <л:< 1) = у, и утверждение доказано. Пример 2. Емкости круга | г К R и окружности | z | = R равны R. Доказательство. Окружность |г[ = ^ — это лемниската, задан- заданная уравнением \zm\ = Rm. Таким образом, утверждение следует из теоремы 6.6.3 (а тгкже из доказательства теоремы 6.6.4). Пример 3. Если <§—счетное множество, то сар<^ = 0. Доказательство оставляем читателю в качестве упражнения. Приведем теперь без доказательства две важные теоремы о емкости. Каждая из них способствует более глубокому проник- проникновению в существо этого важного понятия. Теорема 6.6.5 [НШе, 1962, стр. 268—273]. Пусть <§—компакт. Тогда = lim Г max Ц |г,— л-+» [ ZjZg 1а?, то cap 3) ?
6.6. Лемнискатьи емкость и мера 275 Следствие 2 (однородность). Если г' =az + b—отображение на <§', то ^' ||^> Теорема 6.6.6 [HiНе, 1962, стр. 280—289]." Пусть \i {г) —нор- —нормированная мера, определенная на <8\ положим Пусть = $ [ In (| 2Х—z.l) 0 полином ри (г) = J J (z — z,) удовлетворяет неравенству \Р«(г)\>{№а F-16)
276 Гл. 6. Теория сходимости всюду в комплексной г-плоскости, за исключением не более п кру- кругов, для радиусов г{ которых справедлива оценка 2 i=\ Доказательство этой теоремы мы здесь не приводим, а для выяснения роли меры Хаусдорфа в теории сходимости аппрокси- аппроксимаций Наде отсылаем читателя к ЕРА (гл. 14). Отметим, что не- неравенства типа F.16) являются основными при исследованиях по этой тематике. Кроме того, отметим, что многие из этих резуль- результатов с необходимыми изменениями распространяются также на случай рациональной интерполяции [Walsh, 1969, 1970; Karl- sson, 1976]. В заключение этого параграфа подчеркнем еще раз, что, про- проследив за ходом доказательства теорем из § 6.5, мы убеждаемся в том, что в них доказывается сходимость по емкости; такие ре- результаты существенно сильнее, чем сходимость по мере. В част- частности , интервал имеет нулевую плоскую меру, но ненулевую емкость (и ненулевую 1-меру Хаусдорфа); поэтому конечный интервал, а так- также любое множество, содержащее конечный интервал, не могут быть исключительным множеством в теоремах § 6.5. Наконец, привле- привлечем внимание читателя к результату Натолла о том, что для некоторых функций с точками ветвления аппроксимации Паде сходятся по емкости в комплексной г-плоскости с разрезом, де- делающим функцию однозначной и имеющим минимальную емкость среди таких разрезов в г~1-илоскости [Nuttall, 1977; Nuttall and Singh, 1977]; возможно, этот результат будет обобщен. Такую теорему интересно было бы сравнить с гипотезой Бейкера, Гам- мел я и Уиллса. § 6.7. Паде-гипотеза Слегка перефразированная гипотеза Бейкера, Гаммеля и Уилл- Уиллса общеизвестна как Паде-гипотеза, в которой речь идет о схо- сходимости диагональных аппроксимаций Паде функции, аналити- аналитической в круге. Эта гипотеза дала значительный импульс иссле- исследованию сходимости диагональной последовательности и привела к уверенности в том, что использование такой последовательности дает хорошие результаты. Прежде чем формулировать гипотезу, приведем контрпример Гаммеля [Baker, 1973b], из которого становится ясно, почему гипотеза дана именно в такой, а не в более сильной форме.
6.7. Паде-гипотеза 277 Контрпример Гаммеля. Пусть ^— I й + 2 где индексы nk определены соотношениями и, = 1, nk+1 = 2nk-\- \, а cu = akZb", если nk^.n278 Гл. 6. Теория сходимости Рассмотренный контрпример объясняет, почему приводимая ниже Паде-гипотеза пользуется доверием как верное и сильное утверждение. Гипотеза [Baker и др., 1961]. Пусть f (г) аналитична в круге j г | < R, исключая т полюсов z,, г2, ..., гт, гдеО < | zl | ^ | г21 ^... ... ^ | гт | < R, и одну точку"г„ на окружности \г\ = R. Далее, пусть для каждого е>0 найдется окрестность \г—го|<6, в которой |/(г) — /(го)|<Е, если \z\^R, что означает непрерывность f(z)e точке г0 по кругу \z\^LR. Тогда по крайней мере некоторая под- подпоследовательность аппроксимаций Паде [М/М] равномерно схо- сходится к / (z) на компактных подмножествах множества 3) = {z: |z| пусть f(z)=g(w). Окружность |до] = 1 является образом окруж- окружности l}\. G.3) Для этой окружности начало координат О является внутренней точкой (если \c\6.7. Паде-гипотеэа 279 Imz *- Rez Рис. 1. Окружность Г с центром в точке с и радиусом R. Этот результат объясняет выбор отображения G.2). Если /(г) мероморфна внутри Г, то g(w) мероморфна в круге |да|<1 и из Паде-гипотезы вытекает, что подпоследовательность диагональной последовательности аппроксимаций Паде сходится к функции g(w) в круге |и'|<11 (исключая полюсы). В этой условной теореме ут- утверждается, что та же самая подпоследовательность диагональной последовательности сходится к /'(г) для г, лежащих внутри Г. Приложение. Рассмотрим функцию f(z) = (z — aKh (z — Ь)~3^, где а, Ъ—произвольные точки в комплексной плоскости, отличные от начала координат. Паде-гипотеза утверждает сходимость под- подпоследовательности аппроксимаций Паде внутри окружности Г4, изображенной на рис.2. В этом примере г = оо — регулярная точка; поэтому некоторая подпоследовательность сходится и вне окруж- окружности Fj. Это наводит на мысль о том, что полюсы диагональных аппрок- аппроксимаций Паде функции f(z) лежат на дуге окружности, проходя- проходящей через точки О, а и Ь. Действительно, при отображении t — z (а — b)l[{z—a)b] точка г —а переходит в точку I = оо, г — b—в точку / = —1, а функция h(t) = f(z) является функцией Стиль- тьеса. Отсюда вытекает, что полюсы диагональных аппроксимаций лежат на дуге. Можно рассмотреть и другое отображение u = z~x, переводящее точки г —а и г = Ь соответственно в и = а~1 и и = Ь~1. Исключи- Исключительное множество для диагональных аппроксимаций Паде функ- функции F(u) = j{z) имеет минимальную емкость среди разрезов в
280 Гл. 6, Теория сходимости lmz Рис. 2. Окружности Ti и Га в г-плоскости. «-плоскости. Поэтому это множество—отрезок прямой, проведен- проведенный из точки а'1 в точку Ь'1. Этот отрезок есть образ дуги ок- окружности, проходящей через точки г = 0, г —а и г — Ъ. Значение Паде-гипотезы и ее связь с открытыми проблемами теории рациональных аппроксимаций рассмотрены Уолшем [Walsh, 1970].
Приложение ПРОГРАММА НА ФОРТРАНЕ 1. Спецификация. Программа PADE (С, 1С, A, IA, В, IB, L, М, X, W, Wl, W2, IK, IW) — это программа на языке Фортран-IV для вычисления аппроксимаций Паде. 2. Метод программы основан на решении линейных уравнений A.1.6.7). При успешном обращении к программе вычисляются коэффициенты числителя и зиаменачеля аппроксимации Паде и выдается значение аппроксимации в некоторой заранее заданной точке X. Неудачное обращение означает, что не выполняется простой эмпирический тест, основанный на методе исключений Гаусса—Жордаиа. Метод программы требует определенной точ- точности задания коэффициентов исходной функции. Часто требуется и более высокая точность задания; в этом случае соответственно должна измениться и схема вычислений. 3. Параметры. С — вещественный массив длины 1С; на входе С содержиi заданные коэффициенты и не изменя- изменяется на выходе. А — вещественный массив длины IA; на выходе ячей- ячейки АA), АB), ..., A(L-fl) содержат соответ- соответственно коэффициенты числителя ао,а ,, ..., а,. В — вещественный массив длины IB; па выходе ячейки ВA), В B), ... В(М+ 1) содержат соответствен- соответственно коэффициенты знаменателя b0, blt ..., Ьм. L — целое число, определяющее степень числи геля. М — целое число, определяющее степень знаменателя. W — двумерный «рабочий» массив с размерами (IW, IW), вычисляемый с двойной точность^. Wl, W2 —«рабочие» массивы длины IW, вычисляемые с двойной точностью. IK — «рабочий» массив целых чисел длины IW. 1С, IA, IB, 1W —целые числа, определяющие размеры массивов; задаются на входе и не изменяются на выходе. X — вещественная переменная, соответствующая за-
282 Приложение данному степенному ряду; X присваивается не- некоторая величина на входе, которая не изме- изменяется на выходе. 4. Указатели ошибок. Если целые числа 1С, IA, IB и IW выб- выбраны не верно (требуется, чтобы L^O, Ai^O, IW^M, IB > М, IA > L и 1С > L + M) или имеет место вырождение, то печатается сообщение об этом, а программа возвращается в исходное состоя- состояние. В случае если вычисления проводятся в полюсе аппроксима- аппроксимации, то об этом печатается сообщение; массивы А, В строятся правильно и делается искусственное присвоение PADE = 0. 5. Пример. Следующая программа вычисляет аппроксимацию Паде [4/4] функции ехр г для нахождения приближенного значе- значения числа е (е = 2.71828182...). Канал 7 используется для ввода. а канал 2—для вывода.
Программа на Фортране 283 PROGRAM BOOKPROG DIMENSION CCA0),AAE),BBE),WWA0,10),WXA0),WYA0),IKA0) DOUBLE PRECISION WW.WX.WY CCA) = 1.0 DO1 1 = 1,8 1 CC(lf1) = CC(l)/l 2 FORMATA X.33HTHE GIVEN SERIES COEFFICIENTS ARE/9F13,8) WRITEB,2)(CC(I),I = 1,9) 3 FORMAT BI3.F13.5) READ G,3) ЦМ.Х LP1=L + 1 MP1=M + 1 4 FORMATAX,//11H FORM THE [,I4,1H/,I4,13H] PADE AT X =,F13,8//) WRITE B,4) L,M,X Y = PADE(CC,10,AA,5,BB,5,L,M,X,WW,WX,WY,IK,10) 5 FORMATAX,30HTHE NUMERATOR COEFFICIENTS ARE//9F13.8) WRITEB,5)(AA(I),I = 1,LP1) 6 FORMATA X/33H THE DENOMINATOR COEFFICIENTS ARE//9F13.8) WRITEB,6)(BB(I),I = 1,MP1) 7 FORMATAX/42H THE VALUE OF THE PADE APPROXIMANT AT X IS.F13.8) WRITEB,7)Y STOP END FUNCTION PADE (C.ICAIA.BJB.L.M.X.W.WI.Wa.lK.IW) С С ВЕЩЕСТВЕННАЯ ФУНКЦИЯ PADE ВЫЧИСЛЯЕТ ВЕЛИЧИНУ АППРОКСИМАЦИИ С ПАДЕ [L/M].B ТОЧКЕ X. КОЭФФИЦИЕНТЫ ЧИСЛИТЕЛЯ НАКАПЛИВАЮТСЯ В С ПЕРВЫХ L+1 ЯЧЕЙКАХ МАССИВА А. КОЭФФИЦИЕНТЫ ЗНАМЕНАТЕЛЯ С НАКАПЛИВАЮТСЯ В ПЕРВЫХ N+1 ЯЧЕЙКАХ МАССИВА В. С МАССИВЫ W(iw,IW),W1(IW;,W2(IW), ОПИСАННЫЕ КАК МАССИВЫ С С ДВОЙНОЙ ТОЧНОСТЬЮ, И ЦЕЛЫЙ МАССИВ IK (IW) ИСПОЛЬЗУЮТСЯ С В КАЧЕСТВЕ РАБОЧИХ МАССИВОВ. СТРОГИЕ НЕРАВЕНСТВА IW>0 С И IW.GE.M,IB>M,IA>L,IC>L + M НЕОБХОДИМЫ ДЛЯ ВЫПОЛНЕНИЯ С УСЛОВИЙ НАКОПЛЕНИЯ НА ВХОДЕ, С DIMENSION C(IC),B(IB),A(IA),W(IW,IW),W1(IW),W2(IWIIK(IW) DOUBLE PRECISION W.W1.W2 DOUBLE PRECISION ONE,OUGHT,DET,T DATA ONE,OUGHT/0.1D 01,0.0D 00/ С СЛЕДУЮЩЕЕ ПРИСВАИВАНИЕ ДЕЛАЕТСЯ В ТОМ СЛУЧАЕ, ЕСЛИ ВОЗМОЖНО О ВЫЧИСЛЕНИЕ С ТОЧНОСТЬЮ ДО К ЗНАКОВ EPS=0,1E-1Q LP1=L + 1 ВA)=1.0 JF(L) 40,1,1 1 ]F(M) 40,6,2 2 IF(IW-M) 40,3,3
284 Приложение 24 FORMATAX,5HTHE[,M,1H/,I4, М5Н] PADE APPROXIMANT APPARENTLY.IS REDUCIBLE OR/ •49H DOES NOT EXIST. IF THIS IS SO, TRY USING A LOWER/ •50H ORDER APPROXIMANT. OTHERWISE TRY HIGHER PRECISION/ •41H THROUGHOUT OR THE NAG LIBRARY ALGORITHM.) WRITEB,24) L,M RETURN 25 DET=DET*W2(I) W(ICOL,ICOL) = ONE DO26N = 1,M .26 W(ICOL,N)=W(ICOL,N)/W2(I) W1(IC0L)=W1(IC0L)/W2(l) DO29LI = 1,M IF(LI-ICOL) 27,29,27 27 T=W(LI,ICOL) W(LI,ICOL) = OUGHT DO 28 N = 1,M 28 W(LI,N)=W(LI,N)-W(ICOL,N)*T W1 (LI) = W1 (Ll)-W1 (ICOL)*T 29 CONTINUE 30 CONTINUE С НАХОЖДЕНИЕ ВЕЛИЧИНЫ ЗНАМЕНАТЕЛЯ DO 31 I = 1,M 31 B(I + 1)=W1(I) D = B(M + 1) DO32I = 1,M I1=M + 1-I 32 D=X*D + B(I1) С НАХОЖДЕНИЕ ВЕЛИЧИНЫ ЧИСЛИТЕЛЯ DO34I = 1,LP1 К=М+'1 IFПрограмма на Фортране 285 3 4 Б 6 7 С о 8 9 10 11 12 13 С с с 14 15 16 17 18 19 20 21 22 23 IF(IB-M) 40,40,4 IF(IA-l) 40,40,5 IF(IC-L-M) 40,40,8 DO 7 I = 1.LP1 GO TO 35 DO13I = 1,M DO12J = 1,M IF (L + l-J) 11,10,10 I1 = L+I-J + 1- GOTO 12 W(I,J)=OUGHT CONTINUE H — 1 i 1 .1 Л Л —LtIti W1(I)=-C(H) CONTINUE РЕШИТЬ УРАВНЕНИЕ ДЛЯ ЗНАМЕНАТЕЛЯ, ИСПОЛЬЗУЯ МЕТОД ИСКЛЮ- ИСКЛЮЧЕНИЯ ГАУССА-ЖОРДАНА, С ПОЛНЫМ ОБРАЩЕНИЕМ И С ДВОЙНОЙ ТОЧНОСТЬЮ DET=ONE DO 14 J = 1,M IK(J)=O DO30l=1,M T=OUGHT DO19J=1,M IF(IK(J)-1) 15,19,15 DO18K=1;M IF(IK(K)-1) 16,18,30 IF(DABS(T)-DABS(W(J,K))) 17.17,18 IROW=J ICOL=K T=W(J,K) CONTINUE CONTINUE IK(ICOL) = IK(ICOL)+1 IF(IROW-ICOL) 20,22,20 DET=-DET DO 21 N = 1,M T=W(IROW,N) W(IROW,N)=W(IC0L,N) W(ICOL,N)=T T=W1(IROW) W1(IROW)=W1(ICOL) W1(ICOL)=T W2(I)=W(ICOL.1COL) 1M1 =1-1 IF(I.EQ.1) GO TO 25 T=DEXP(DLOG(DABS(DET))/DBLE(FLOAT(!M1))) IF(DABS(W2(i))-T'DBUE(FLOAT(l))*EP5j 23,25,25 DET=OUGHT
286 Приложение 40 WRITEB,39) IC,IA,IB,L,M,IW PADE^O.O RETURN 41 FORMATAX,E16.8,40H APPARENTLY IS A POLE OF THE APPROXIMANT) 42 WRITEB,41)X PADE = 0.0 RETURN END На выход программы BOOKPROG выдается следующая инфор- информация: ЗАДАННЫЕ КОЭФФИЦИЕНТЫ РЯДА РАВНЫ 1.00000000 1.00000000 0.50000000 0.16666667 0.04166667 ДЛЯ АППРОКСИМАЦИИ ПАДЕ [4/4] ПРИ X =1.00000000 ИМЕЕМ'. КОЭФФИЦИЕНТЫ ЧИСЛИТЕЛЯ РАВНЫ 1.00000000 0.50000000 0.10714286 0.01190476 0.0О059524 КОЭФФИЦИЕНТЫ ЗНАМЕНАТЕЛЯ РАВНЫ 1.00000000 -0.50000000 0.10714286 -0.01190476 0.00059524 ВЕЛИЧИНА АППРОКСИМАЦИИ ПАДЕ В ТОЧКЕ X РАВНА 2.71828172
Часть 2 ОБОБЩЕНИЯ И ПРИЛОЖЕНИЯ Глава 1. ОБОБЩЕНИЯ АППРОКСИМАЦИЙ ПАДЕ § 1.1. Многоточечные аппроксимации Паде Рациональная функция, значения которой в ряде точек совпада- совпадают со значениями данной функции, называется многоточечной ап- аппроксимацией Паде. Соответствующая общая задача интерполяции рациональными функциями называется задачей Коши — Якоби. Многоточечные аппроксимации Паде называют также рациональ- рациональными интерполяциями, ^-точечными аппроксимациями, ЛЛточеч- ными аппроксимациями Паде или аппроксимациями Ньютона — Паде в зависимости от контекста. В случае кратных точек (узлов) интерполяции иногда говорят об осцилляторной интерполяции. На- Например, рациональную функцию вида [N/N] можно определять ./V условиями интерполяции в точке z=0 и N—1 условиями интерпо- интерполяции в точке г=оо. В качестве конкретного примера рассмотрим функцию | (г2)= при г-н. О, A.1) = 1 + О(г-1) приг-*оо. A.2) Легко видеть, что соответствующая аппроксимация [1/1] имеет вид ) ^ эта функция удовлетворяет условиям «точности порядка аппрокси- аппроксимации», которые выражены соотношениями A.1), A.2). В точке 2=1 погрешность аппроксимации составляет 1%; это примерно та же погрешность, какую дает аппроксимация Паде [1/1]; см. ч. 1, § 1.1. Анализ этого конкретного случая указывает подход к общей задаче рациональной интерполяции в узлами zOl zu гг, . . . . Пре-
288 Гл. 1. Обобщения аппроксимаций Паде дыдущий пример соответствует 3-точечной аппроксимации с го = =г1=0, 22~оо. Мы переходим к анализу общего случая, предпо- предполагая для простоты, чтс все узлы интерполяции конечны. Объем книги не позволяет подрооно рассматривать все относящиеся сюда апироксимациопные проблемы; мы начнем с общего введения к за- задачам интерполяции полиномами и рациональными функциями, обращая особое внимание на методы, допускающие кратные узлы. Прежде всего нам необходимы основные факты теории, относящей- относящейся к ньютоновской интерполяции полиномами. Раздельные разности. Пусть функция /(г) обладает всеми необхо- необходимыми для дальнейшего свойствами непрерывности и гладкости. Разделенные разности определяются последовательно согласно следующим формулам: A-зь) ,г, 1.___ f lzo< 2Ь ¦¦¦< zr_j, *r\ — f\za, zj, .... zr_f, гг.ц] ' t2»' Zi> '••' г' + 1^ гГ-гг+1 ' /" = 1, 2, ... . A.4) Формула Эрмита. Пусть функция /(г) аналитична внутри и непре- непрерывна на контуре Г, который содержит точки г0, ги . . ., zh внутри себя. Тогда /[*„, ги .... г,}-^-^ dS. A.5) 11 П Й-г») Доказательство. Формула получается из A.3), A.4) по ин- индукции. Для совпадающих гачек го = 21=...=гй естественно опре- определить /[г., г0 г.НтгРЧго). A-6) Формулу Эрмита легко распространить на случай частичных совпадений. Следствие. Функция /[г0, г1( ..., гГ] симметрична (не меняется при любых перестановках аргументов). Формула Ньютона п 1-1 /(*)= 2 /[2о. 2i г,] Ц (г — zh) i=o k=a n + /[г„ г1? .... г„, г]Ц(г-гл). A.7) А 0
§ 1.1. Многоточечные аппроксимации Паде 289 При м>0 тождество A.7) представляет функцию /(г) в виде суммы полинома Ньютона и остаточного члена. Отсюда можно «вывести» формальное тождество /(г) = /[г.] + (г-гв)/[г0, г1] + (г-г,)(г-г1)/[г0, г,, г8] + ... . A.8) Равенство здесь действительно имеет место во всех случаях, когда остаточный член в A.7) стремится к нулю. Доказательство формулы A.7) проводится но индукции. В важном частном случае 20=2! = =. . .=2г = . . . формулы A.7), A.8) принимают вид г0)Пг) + -Ц^П2.)+... A-9) ¦¦..У (г-гвI ,„¦,,- (г-г,)"*1 С Щ t. A.11) В этих терминах формальное разложение Ньютона A.8) имеет вид //(+/(/ Перейдем теперь к рассмотрению интерполяции данной функции посредством рациональных дробей. Основная задача состоит в том, чтобы найти рациональную дробь rlL/M] (г) = ишм] (zyv[L/M] B)i (! л 2) такую, что и^1/мЦг), vlL/M^(z) — полиномы степени не выше L и М соответственно, и справедливы равенства ^/л*]Bг) = /B,-), ,- = 0, 1, 2, .... L + M. A.13) Предположим, что при данных L и М решение L М ц[*-/м]B)= 2 vl.-zI, dL'M4z)= 2 Щг» A.14) /=0 /.'=0 этой основной задачи существует. Предположим также, что нор- нормировка и„=1 является допустимой. Подставляя A.12) и A.14) в A.13), получим L + M + 1 линейных уравнений относительно L + M + 1 неизвестных коэффициентов иа, ut, ..., «?, Uj, . .., и^,.
290 Гл. 1. Обобщения аппроксимаций Паде Обычно такая система имеет единственное решение, которое оп- определяет коэффициенты числителя и знаменателя A.12) однозначно с точностью до общего числового множителя. В противном, слу- случае говорят, что система является вырожденной. Если система уравнений вырождена, но совместна, и dLlMi (z) ф 0, то поли- полиномы uf-L/Ml(z) и и?/-/М'(г) имеют нетривиальный общий множи- множитель. Из A.19) с /(z) = r[Z-/Mi (г) вытекает, что этот общий мно- множитель может содержать только скобки вида (г—г{), i = 0, 1, 2, ..., L + M. Если скобка (г—г() действительно входит в общий множитель, то справедливость соотношения A.13) в точке г = г,- требует отдельной проверки. Если рассматриваемая система ли- линейных уравнений несовместна, то рациональной дроби типа [L/M], интерполирующей данные значения, не существует. В качестве примера покажем, что не существует рациональной дроби типа [1/1], удовлетворяющей следующим условиям интерполяции: ) = 1, /A)==3. A.15) Уравнения A.12), A.13), A.14) в данном случае имеют вид и0—ы,=1»0—о*, A.16а) A.16с) Из A.16а, Ь) вытекает, что«0=и0, ut=Vi и с учетом этого из A.16с) следует, что uo—vo=u1=v1=O. Система уравнений A.16) вырожде- вырождена; сделать эту систему совместной можно, заменяя последнее ус- условие интерполяции в A.15) на новое условие /A) = 1 и только в этом случае существует (вырожденная) рациональная функция типа [1/1], интерполирующая данные A.15). Полный анализ возможных вырождений приведен в работе [Maehly and Witzgall, I960]. Аппроксимации Паде относятся к рассматриваемому типу ра- рациональных аппроксимаций и соответствуют случаю совпадения всех узлов интерполяции, поэтому приведенный выше анализ имеет очевидное сходство с анализом вопросов существования аппрок- аппроксимаций Паде, содержащимся в § 1.4 ч. 1. Закончив краткий обзор некоторых требующих внимания моментов, связанных с интерпо- интерполяцией рациональными функциями, приведем теорему, которая дает стандартное решение задачи об интерполяции в невырожден- невырожденном случае. Теорема 1.1.1. В невырожденном случае N-точечная аппрокси- аппроксимация Паде типа [L/M], соответствующая узлам интерполяции г0, г1) ..., 2/4М (среди которых, возможно, есть совпадающие), определяется следующими формулами: _ U[L/M]
§ 1.1. Многоточечные аппроксимации Паде 291 где ¦=м fin,/ L1 B !-1,/.+2 ••• 2 /*-,.,П(*-; i = M- 1 fc=O /о, Л L /-1 2 /o./II< /И- i II /=0 M-l /Л1-1./. + 1 Im-1,L+2 ¦¦¦ IM-l.L + M 11 (z /о, л+i /о, i + s • • • 'о. L + M 1 , A.17) , A.18) (используется обозначение A.11)). Формула для остатка имеет вид X /M-l, i -1, t + 2 l. + M : JLJ *.г — zk)X- • Iм. i +м 11ZM< ¦ • •' г] 'Л1-1, /+М '1гМ-1> •••'2(. + ,'И> г] fo, L+i '0, 'О, /l2oi •••> г1. + М> 2] . A.19) Чтобы полностью определить все символы в формулах A.17), A.18), A-19) следует дополнительно принять, что при j < i имеем fi,/=o, 2(*ь=о, П(•)*«!• k=t В случае вырождения достаточным условием справедливости ра- равенств u[L/M](z;)/v[L M](zi) = I (г,-) являются соотношения С^лц(о, ( = 0, 1, 2, .... / +М. Доказательство. Формулы A.17) и A.18) определяют многочлены степени не выше L и М соответственно. Из формулы Ньютона A.17)
292 Гл. 1. Обобщения аппроксимаций Паде вытекает, что X IM,L + l IM,l. + t ••• hi, I. + M l[zM< ••¦> z!.' Z] /ai-i,z.+ i /ai-i,/.+ 2 ••• fiu-i, i. + m IIzm-i> • • ¦> zu z\ /О, Л + 1 /o, i + 2 ••• lo,L + M < lZt» •••> z!.> Z] .A.20) Производя вычитание /-го столбца A.20) из последнего при /—1, 2, ..., М с учетом определений A.4) и A.11), получим A.19). Ясно, что правая часть A.19) обращается в нуль в точках z0, zlt ..., zL+M. При условии, что iA^/m] B/) ф о, i = 0, 1, ..., L + M, отсюда вытекает нужный результат. Следствие. Формулы A.12), A.18), A17) с учетом A.6) пока- показывают, что при 20 = г, = ... =г1ЛМ функция г11/мЦг) стано- становится аппроксимацией Паде; см. A.1.1.8, 9, И). Замечание. Формулы A.17), A.18), A.19) могут быть обобщены на случай биградиентов (§ 1.6, 4.1) с интерполяцией в различных узлах [Warner, 1974], [Householder and Stewart, 1969]. Формулы A.17), A.18), определяющие Af-точечную аппрокси- аппроксимацию Паде, весьма громоздки и мало пригодны для решения вы- вычислительных задач. Обсудим коротко те требования, которые предъявляются к вычислительному алгоритму. Численные алгоритмы для рациональных аппроксимаций можно разделить на те, с помощью которых решают проблему коэффициен- коэффициентов и те, с помощью которых решают проблему значений. Проблема коэффициентов состоит в определении значений коэффициентов {«о, «1, • • •, uL; v0, vit . . ., ум} в A.14), что в свою очередь позво- позволяет найти функцию Д^М1. Проблема значений заключается в вы- вычислении значения функции rtLIM~\ (z) в указанной заранее точке г, когда не требуется промежуточного вычисления коэффициентов в A.14). Например, е-алгоритм есть метод решения проблемы значе- значений для аппроксимаций Паде, поскольку он не связан с промежуточ- промежуточным вычислением коэффициентов. Q.D.-алгоритм, представляю- представляющий рациональную аппроксимацию в виде непрерывной дроби (см. §4.4, ч. 1), дает решение проблемы коэффициентов. Если требуется найти некоторую таблицу значений интерполиру- интерполирующей рациональной функции, то обычно выгоднее решить сначала проблему коэффициентов и затем вычислять значения аппроксима- аппроксимации в различных точках г. Если требуется вычислить одно значение, то иногда удобнее не обращаться к промежуточной задаче определе-
§ 1.1. Многоточечные аппроксимации Паде 293 ния коэффициентов. На самом деле вычисление значений полино- полиномов и непрерывных дробей является сравнительно быстрой про- процедурой и поэтому проблема коэффициентов особенно важна. От- Отметим, что представление интерполирующей функции ALiM\ (г) в виде непрерывной дроби повышает эффективность вычислений но сравнению с использованием полиномиальных соотношений вида A.12). Важно и желательно, чтобы применяемые методы допускали сов- совпадение некоторых или всех узлов интерполяции. Методы, основан- основанные непосредственно на разделенных разностях A.3), A.4), этим качеством, по существу, не обладают. Другим желательным качеством численных методов рациональ- рациональной аппроксимации является надежность. Как мы видели выше, не существует рациональной функции типа [1/1], удовлетворяющей условиям интерполяции A.15); надежный метод аппроксимации должен указать, что эта задача неразрешима. Численный алгоритм должен различать разрешимые и неразрешимые задачи с учетом на- наличия ошибок представления и округления. Анализ этого вопроса приводит нас к понятию устойчивости алгоритма, которое тесно связано с понятием надежности. Алгоритм устойчив, если малые изменения начальных данных приводят к небольшим изменениям результата. Хороший алгоритм рациональной интерполяции должен быть в состоянии выделить те случаи, когда начальные данные приводят к неустойчивому результату. Заметим, что рекуррентные методы нахождения интерполирую- интерполирующей рациональной функции могут быть связаны с предположением о существовании промежуточных аппроксимаций. В случае суще- существования интересующей интерполяции надежный алгоритм дол- должен срабатывать, даже если какие-либо промежуточные аппрокси- аппроксимации вырождены или не существуют. Все эти качественные характеристики хорошего алгоритма вряд ли полностью совместимы, так что собрание «наилучших алгорит- алгоритмов» ниже подразумевает наличие тех или иных компромиссов. В любом случае для каждой из множества задач рациональной ин- интерполяции мы хотим иметь алгоритм, который (i) эффективен, (ir) допускает совпадение узлов интерполяции, (iii) надежен и устойчив. Рассмотрим теперь некоторые из алгоритмов, которые являются наилучшими из имеющихся. Алгоритм Кронекера [Kxoneker, 1881]. В качестве начальных данных в алгоритме используются коэффициенты интерполяционного полинома Ньютона A.8) порядка L+A1 =т(см. A.4), A.7)); положим /,[т/о](г)= 2 /[г., г, г,] П (г-гк), A.21а) i=0 k=0
294 Гл. 1. Обобщения аппроксимаций Паде и дополнительно П ft=0 A.22Ь) Рекуррентные соотношения, которые мы позже докажем, анало- аналогичны соотношениям A.3.6.12) и имеют вид A.23а) A.23b) Постоянные a,j и ру определяются из условия, что степень мно- многочлена в правой части A.23а) не выше т—/. После этого мно- многочлены A.23а), A.23) интерпретируются как числитель и зна- знаменатель следующей (/-и) аппроксимации. Проверка. Предположим, что алгоритм является невырожден- невырожденным, т.е. степень многочлена p^m-klk^{z) равна т—k при всех k. Тогда остается показать, что рациональная функция, определяемая соотношениями A.23), интерполирует в узлах z0, г1У ..., гт зна- значения, соответствующие A.21). Из A.23) следует, что Следовательно, D не зависит от /' и из A.21), A.22) вытекает, что Таким образом, в предположении невырожденности алгоритма имеем и, значит, все рассматриваемые аппроксимации обладают нуж- нужными интерполяционными свойствами. Отметим, что совпадение каких-либо двух последовательных аппроксимаций препятствует дальнейшей работе процедуры алгоритма. Важным преимуществом алгоритма Кронекера является то, чю после незначительной модификации он превращается в на-
§ 1.1. Многоточечные аппроксимации Паде 295 дежный алгоритм. Если для некоторого значения / многочлен р["'-///1 (г) в A.23а) имеет степень, меньшую чем т—/, то соот- соответствующая аппроксимация [т—///] вырождена. В таком слу- случае следующая аппроксимация должна определяться соотноше- соотношениями ] B), A.23с) ](z), A.23d) где Jift(z) — многочлен степени не вышей, такой, что правая часть A.23) имеет степень, равную т—/—k. Нетрудно показать, что соот- соотношения A.23с), A.23) действительно определяют следующую не- невырожденную интерполяционную функцию в антидиагональной последовательности [Graves-Morris, 1979]. По-видимому, алгоритм Кронекера особенно полезен в случаях, когда применима точная арифметика и любой тест должен однозначно решать вопрос о вы- вырожденности. Метод обратных разностей Тиле [Thiele, 1909, гл. 3; Hildebrand, 1956]. Этот метод дает представление Л^-точечной аппроксимации Паде в виде непрерывной дроби. В основном варианте алгоритма узлы интерполяции должны быть различны; элементы дроби, соот- соответствующей случаю кратных узлов, могут быть получены по не- непрерывности. Обратные разности определяются следующими равен- равенствами: Ро^Р [*„]=/(*„), A.24а) Pi«P[*«, Zi] = (*o-Zi) {/(*„)-/(г!)}. (Ь24Ь) р[г, го] = (г-го){/(г)-/(го)}-\ A.24с) и в общем случае (для п > 1) Р» = Р[го> г? г„_1, г„], A.24d) р[г„ zj, .... г„_?, г„] = -^ )[г„, .... г„_!]-( + p[zlt .... zn_t]. A.24e) Интерполяционная функция, соответствующая узлам г„, zt, ..., гп, представима в виде гп{г) = Ра + г-:::^ , —— , Z—^1- , ••• z~z"-i . A.25) Pi +Рг — Ро + Рз — pi+ +Pn — Ри-г Отметим, что если и=2М( т. е. используется нечетное число узлов интерполяции, то A.25 определяет аппроксимацию типа \MlM\\ если я=2М + 1, т. е. используется четное число узлов, то дробь A.25) дает аппроксимацию типа Ш + 1/М]. Проверка. Докажем сначала по индукции следующее тождество: г~г° z~ i +pg_po+ps_pi+---+p[Z) го
296 Гл. 1. ОбоГчцтия аппроксимаций Ладе При п = 0 соотношение A.26) имеет вид это эквивалентно A.24). При м>0 преобразуем последний зна- знаменатель в A.26) с помощью тождества рГг' Z° 2~Ря-|=Р«+| Р«-1+ р[г> го, ...,г+ которое после простых преобразований принимает вид эквивалентный A.24е). Этим тождество A.26) доказано. Полагая в A.26) псчу?едовательно z=z0, zlt . . ., zn, убеждаемся, что при от- отсутствии случайных сокращений функция A.25) интерполирует нужные значения в м +1 узлах г0, zt гп и, следовательно, является (п-Н)-точечной аппроксимацией Паде. Метод аппроксимации Тиле более интересен с аналитической точки зрения. С вычислительных позиций следующая схема не ме- менее эффективна, чем любая другая. Модифицированный алгоритм Тэчера — Тьюки [Thacher and Tuke, 1960; Graves-Morris and Hopkins, 1981]. Преобразуем непре- непрерывную дробь A.25) следующим образом: /v>_ г/- ч 1 ai (г~ zo) «2B—гр Q3(z —гг) ¦ а«(г- ?я-|) A-27» Исходное множество (различных) узлов интерполяции обозначим через •Ьо = {го, Zi, . . ., zn}; порядок использования этих узлов г0, г\, г'ъ . . ., г'п будет опреде- определен процедурой алгоритма. Для пояснения этой процедуры рас- рассмотрим функцию /(г), определенную на интерполяционном мно- множестве So, и предположим, что функция гп(г), представленная в ви- виде A.27), интерполирует f(z) в узлах So. Определим функции go(z), gi(z) gn(z) следующими рекуррентными соотношениями: f(z)=/Bb)+go(z), A.28а) « = 0,1,2,..., я. A.28Ь) Частный случай f(z) = rn(z) соответствует gn(z) = Q. Согласно A.28) должно выполняться равенство gl_l (г,'_,) = 0 и с учетом этого из A-28) вытекает, что
§ 1.1. Многоточечные аппроксимации Паде 297 В преобразованной форме A.29) эти равенства используются для вычисления коэффициентов аи а2, . . ., ап, которые должны быть конечны и отличны от нуля. Эти итерации составляют «нормальную» часть алгоритма, которая называется состоянием (а). Если в неко- некоторый момент (с /=/+1) оказывается, что#((г)=0 для всех z?St+1, где Sf + , — остаточное интерполяционное множество, то алгоритм переходит в состояние (Ь); в этом случае интерполяционная функция rt(z), возможно, существует, но вырождена. Во всех остальных слу- случаях, соответствующих состоянию (с) алгоритма, можно определенно утверждать, что интересующей нас аппроксимации не существует. Закончив построение предполагаемой интерполирующей функции A.27), необходимо проверить, что ее знаменатель, определяемый по формулам A.30), не обращается в нуль в узлах интерполяции; если это не так, то можно показать, что интересующей аппроксима- аппроксимации не существует. Отметим, что этот алгоритм является надежным в том смысле, что если аппроксимация, соответствующая началь- начальным данным, существует, то алгоритм находит ее; если этой аппрок- аппроксимации не существует, то алгоритм обнаруживает это обстоятель- обстоятельство и дает на выходе сигнал об ошибке. Исходные данные. Определяем множество S1 = {z1, 22, . . ., гп) и значения функции f(z0) при 2g St. Итерация. Итерации по параметру / = 1,2, . . . начинаются в состоянии (а) и в невырожденном случае проводятся до окончания. В случае вырождения происходит переход к (Ь) или (с). Состояние (а). Выбираем, если возможно, z) из Sj так, что gj-ЛгдФО, оо и далее полагаем af= A.29) Если j — n, полагаем t = n и переходим к окончанию; в против- противном случае повторяем итерацию с /: = / + 1. Если выбор г) из Sj с условием невозможен, то переходим в состояние (Ь). Состояние (Ь). Если gy-!B) = 0 при всех z^
298 Гл. 1. Обобщения аппроксимаций Паде то параметру t присваивается значение /—1 в соответствии с теку- текущим значением / и происходит переход к окончанию для проверки знаменателя. Состояние (с). Переход в это состояние происходит тогда и толь- только тогда, когда g/_i(z)=0, оо при всех zgSy, но g>_i(z)#O при некотором z?Sj. В состоянии (с) процедура алгоритма обрывается и дается сигнал ошибки, означающий, что нужная интерполяция неосуществима. Окончание. Если переход к окончанию произошел при / = 0, то г (z) = /0 — нужная нам аппроксимация. Если переход произо- произошел при /=1, 2, ..., п, то полагаем 9,B)=!, q,(z) = l+at(z—z[) A.30а) и <7i+iB) = ?iB) + flt+iB—2't)qt-i(z) A.30b) при t=2, 3, . . ., ^—1; если qt(z)=?O при всех zgS0, то полученный результат является корректным. В противном случае, когда qt (zj)=O при некотором /, О^С/^я, полученный результат некорректен и да- дается сигнал, указывающий, что нужной нам аппроксимации не существует. Обобщенный Q.D-алгоритм [Wuytack, 1973; Graves-Morris, 1980]. Q.D-алгоритм дает представление аппроксимации Паде в виде непрерывной дроби на основе известных коэффициентов ряда Тейлора (см. т. 1, § 4.4). Мы рассмотрим обобщение этого алгорит- алгоритма на случай, когда узлы интерполяции могут быть различны. Пусть _. /,ч со g?(z — ?о) е\ (г—zt) ?г(г — г2) el (г—г3) n oi\ ?!\Лг) = — _ j _ j _ j _ j _••• U-dl) — непрерывная дробь типа Тиле. Коэффициенты ее п-й подходя- подходящей дроби могут быть определены исходя из данных коэффици- коэффициентов интерполяционного полинома Ньютона я» B) = со + сх{г—г0) + с2(г — гй)(z—гг) + ... + с„ Ц (г—г,) с помощью следующего алгоритма. Исходные данные. При J = 0, 1, 2, ..., /г—1 полагаем 2/ = zy+1-zv, A.32а) е„у+1 = 0, A.32b) ^И + ^Г' (Ь32С) ei = -^-qi+l{§ 1.1. Многоточечные аппроксимации Паде 299 мулами: i-1 1) A.33a) A.33b) A -33c) (предполагается, что все эти величины конечны). Отметим, что ал- алгоритм допускает совпадение узлов интерполяции; в этом случае он сводится к основному варианту Q. D.-алгоритма A; 4.4.31, 32). Обобщенный е-алгоритм [Claessens, 1978c]. Этот алгоритм удобен для вычисления значений интерполяционных функций; он основан на тождестве Классенса, которое в обозначениях A.12), A.13), A.14) имеет вид A.34) предполагается, что все входящие сюда аппроксимации существу- существуют и не вырождены. При совпадении всех узлов интерполяции тож- тождество Классенса превращается в тождество Винна. Схема доказательства A.34). Следуя методу § 3.4, ч. 1, положим IM, L+1 /м, L + 2 /M-I.L+l IM-U L + г , L + M A.35) /I, ? + 1 /I, t + 2 • • • /I, ЛН и заметим, что F[L/l*JM — С (L/M) в предельном случае совпадения узлов интерполяции. Форма записи FV-ijWu содержит указание на индексы 1, 2, ..., L + M узлов интерполяции, использован- использованных в конструкции. Следуя рассуждениям § 3.4, ч. 1, находим, что формула, аналогичная A; 3.4.4), в данном случае имеет вид /¦IL+l/M] (г\ p-lL/M] tg) = G 7\ (, ,. л p\.L+i/M + i]plL+i/Ml = VIL+1/M](Z)V[UM](Z) ' 1ЬЛ>) а прямым обобщением A.3.4.6) является формула (г-го).. .(z-zL+M+l) A.37)
300 Гл. 1. Обобщения аппроксимаций Паде Изменяя порядок нумерации узлов, формулу A.18) можно пере- переписать в виде /ж, L flA-i, L IM, L + 1 'Л1-1, I. + 1 L+M+\ ¦¦¦ Ll II (г-г») k=L+i L+M+l ••• /o.i+i II (г— Ч) /м, Д + Л1И flu-\, L + lA + i ••• fo, L + M+i 1 Отсюда, применяя тождество Сильвестра, находим, что ). A.38) Эта формула является обобщением A; 3.4.2). Теперь из A.36), A.37), A.38) получаем соотношение 0, L+M ^0, L+M которое обобщает A; 3.4.8). Тождество A.34) получается отсюда с помощью аналогичных преобразований правой части. Обобщенный е-алгоритм представляет собой формальное тожде- тождество К + 1)-8П=1, 0.39а) которое справедливо при k = 0, 1, 2,... и /^— -т- . Дополни- Дополнительно вводятся условия и 9 = 0, /г==0, 2 A.39в) Начальные условия задаются интерполяционными полиномами A.39с) Элементы соответствующей е-таблицы (см. ч, 1,§ 3.3, табл. 1 и ч. 1, § 3.6, табл. 2 выше диагонали) идентифицируются со значениями
§ 1.1. Многоточечные аппроксимации Паде 301 рациональных аппроксимаций согласно формуле еЙ = г [* + '•¦'*! (г), *=0, 1, 2, ...,/>—*. A.39A) Доказательство соотношений A.39а) — A.39d) основывается на тождестве A.34) и в нем используются рассуждения, близкие к тем, которые применяются в §3.4, ч. 1. В приведенном выше обзоре мы отдавали предпочтение тем ме- методам интерполяции, которые в предельном случае совпадения всех узлов сводятся к аппроксимациям Паде. Из алгоритмов, дающих представление аппроксимации в виде непрерывной дроби, наибо- наиболее показательным в этом смысле является, вероятно, (t—^-ал- (t—^-алгоритм Классенса [Classens, 1976]. Ряд преимуществ имеет недавний алгоритм Вернера [Werner, 1979], приводящий к интерполяцион- интерполяционным функциям типа Тиле — Вернера; этот алгоритм основан на принципах, близких к тем, которые лежат в основе обобщенного ал- алгоритма Висковатова (см. ч. 1, §4,5). Это надежный алгоритм, допускающий совпадение узлов интерполяции, и его легко адапти- адаптировать применительно к требованиям вычислительной устойчивости [Graves-Morris, 1980a]. В оригинальных статьях [Cauchy, 1821; Jacobi, 1846; Tacher and Tukey, 1960; Stoer, 1961; Wetterling, 1963; Larkin, 1967], посвященных проблемам интерполяции раци- рациональными функциями, содержится ряд методов, которые получили развитие в обзоре [Werner and Schaback, 1972]. Обзор проблем, связанных с нормальностью и вырожденностью, можно найти в [Meinguet, 1970]; за деталями, касающимися этих вопросов в контексте таблиц Ньютона — Паде, мы отсылаем к ра- работам [Gallucci and Jones, 1976; Claessens, 1978 a, b]. Обсуждение вопросов, связанных с интерполяцией в общем контексте рациональ- рациональной аппроксимации, можно найти в работах [Walsh, 1964 а, Ь, 1965 a, b; Saff, 1972; Karlsson, 1976; Gonchar and Guillermo Lopez, 1978]. Оценка рациональных аппроксимаций для рядов Стильтье- са рассматриваются в [Baker, 1969; Barns]ey, 1973]. Что касается приложений методов рациональной аппроксима- аппроксимации, то они весьма многочисленны, и мы отметим здесь только две важные области. Методы типа аппроксимаций Паде всегда вызыва- вызывали большой интерес в связи с алгоритмами вычисления нулей функ- функций. Построение аппроксимаций высокого порядка не вызывает трудностей [Merz, 1968; Zinn-Justin, 1970; Larkin, 1981]; принци- принципиальные трудности в этих задачах связаны с минимизацией числа операций в наиболее медленной части алгоритма, а также с тем, чтобы избежать неоднозначных решений, связанных с шумом [Gar- side et al., 1968; Dekker, 1969; Jarratt, 1970; Bus and Dekker, 1975]. Рациональные аппроксимации являются распространенным ме- методом предельного перехода при /i-Я) в задачах численного решения обыкновенных дифференциальных уравнений с помощью сеточных
302 Гл. 1. Обобщения аппроксимаций Паде методов с шагом h. Эта техника была первоначально развита в ра- работах [Bulirsch and Stoer, 1964; Gragg, 1965]. Методы рациональных аппроксимаций в этой связи были использованы в работах [Lambert and Shaw 1965, 1966; Luke et al., 1975]. Этим мы завершаем обзор основных алгоритмов для N-точечных аппроксимаций Паде. Еще одно простое приложение, относяще- относящееся к ускорению сходимости, рассмотрено в § 1.3. Далее мы обра- обратимся к специальному случаю N=2, с которым связаны соотноше- соотношения A.1), A.2), A.3). Этот случай был подробно изучен в связи с непрерывными дробями специального вида — так называемыми 7-дробями [Thron, 1948]. Предположим, что заданы два формальных степенных ряда, соответствующих функции /(г): с0 + схг + с2г2 + . • • , A -40а) г-?+... , A.40в) 2 1=0 здесь 3? — ряд Лорана для / с центром в точке г=оо и конеч- конечной главной частью. В общем положении разложения A.40) оп- определяют коэффициенты {е{, d{, i = 0, I, ...} соответствующей обобщенной 7"-дроби A.41) где е{ф0, dj^O для i = \, 2, 3, .... Пример приведен в§ 4.5, ч. 1, упражнение 2. Теорема Джонса —Трона показывает ха- характер интерполяции, доставляемой обобщенными Г-дробями. Теорема 1.1.2 [Jones, 1977]. Пусть заданы два формальных ряда Лорана $ = 2 c»z* и J? = 2 ckzk к=-ч к— — со с данными v > 0 и ц > 0. Определим величины Дп, Фп формулами ^п... б0 б. •¦• «< ...в. \ = ck—ck, Если Дв, Фп =jt 6, mo существует обобщенная 7'-дробь
§ 1.1. Многоточечные аппроксимации Паде 303 (ср. A.30), A.31)) Т ±~ ^ ^ ^... A.42) с Fn, Gn^0 такая, что разложения ее n-й подходящей дроби Тп (г) имеют вид T,i(z) = C_vZ-v + 6'_v+,z-v+1+ .. . -\ cnz"+ ... в точке г = 0, Tn(z) = t)iz" + cM._1z^-1 -|- ... Ч-с_„.цг-л+1+ ... б точке г=оо. зтол для коэффициентов дроби справедливы представления р ф F — д"-1ф"-1 За доказательством мы отсылаем читателя к монографии Джон- Джонса и Трона из этой серии, посвященной непрерывным дробям. По существу эта теорема устанавливает необходимые условия для су- существования некоторого класса двухточечных аппроксимаций Паде. Вопросы сходимости при этом не затрагиваются. Если ряды S и 3? представляют одну и ту же функцию /(г), то есть основания ожидать, что с помощью соответствующей Т-дроби можно в определенных пре- пределах эффективно аппроксимировать /(г). Если ряды & и S пред- представляют разные функции, то конструкция «ассоциированной» Г-дроби может оказаться бессмысленной. Это легко обнаруживает- обнаруживается на примере Трона Используя рекуррентные соотношения A; 4.4.4), можно показать (см. ч. 1, §4.4, пример 1), что Т(г) = 1 при |г|<1, Т(г)=— г при |г|>1. Все полюсы и нули подходящих дробей лежат на единичной окруж- окружности. Это показывает, что происходит, когда метод Г-дробей при- применяется к искусственной задаче совместной аппроксимации рядов J^=l и J2=—z. Следующий результат является хорошим примером разложения в Г-дробь 1; z)_ Ь гф + l—a) z(b + n—a) _ 1F1 (a, b; г) Ь+z— 6-f-l+z — ""•— Ь-\-п+г —'"* где а, 6>0 и z>0 [Dijkstra, 1977; Wynn, 1962a]. Эта дробь дает аппроксимацию ряда Тейлора левой части в нуле и ее
304 Гл. 1. Обобщения аппроксимаций Паде т-2/2 m-1/l т/0 1 м Рис. 1. Элементы Л'-точечной таблицы Паде, которые используются в алгоритме Кроиекера. асимптотического разложения в бесконечности. В частном случае а = Ь имеем iF-i (а, а -- 1; г) _ а г пг ez а + г — а -г 1 -|- г — '' ' a-\-n-\-z— • • • • С помощью преобразования Куммера отсюда получаем ..... A.43) Перворшчальрюе ограничение г^О теперь снимается, поскольку не- непрерывная дробь A.43) сходится во всей комплексной плоскости [Jones et al., 1979]. Эта важная формула позволяет получить раз- разложение в Т-дробь функции ошибок, неполной гамма-функции, обобщенного интеграла Доусона. Пусть [Dijkstra, 1977] F(P, х) = 1 e'pdt, — обобщенный интеграл /loycoFia; интеграл Доусона D{x) = F B, х) связан с функцией ошибок соотношением *rt{z) = jLre-"D(-lz). С учетом этого имеем (см. т. 1, § 4.6) у (a, z) = zae~za-1xFi(\, l+a; г), A.44) A.45а) A.45Ь)
§ 1.2. Аппроксимации Бейкера — Гаммеля 305 1Л(Ь 3/2. -г2), A.45с) erf(z) = ^ze-*\Fl(\, 3/2; г2). A.45d) Используя A.43), можно получить разложения в Т-дроби функций A.45 а—d), которые сходятся во всей комплексной плоскости. Дальнейшие детали, относящиеся к Т-дробям, можно найти в работах [Murphy, 1971; McCabe, 1974, 1975; McCabe and Murphy, 1976; Drew and Murphy, 1977; Waadeland, 1979; Sidi, 1980a; Jones Thron and Waadeland, 19801. Упражнение. Доказать, что последовательности Fj, G^ в A.42) порождаются следующим Q.D-алгоритмом [McCabe, 19751: на- начальные данные Q.D.-алгоритма для Т-дробей определяются равен- равенствами —5|±!, * = 0, 1, -1, 2, -2, .... Остальные элементы определяются рекуррентно по & = 0, 1, —1, 2, —2, ... и /= 1, 2, 3, ... согласно следующим правилам ромба Величины F{, G{ в A.42) определяются равенствами Fj=Ff\ Gj = Gf, / = 2, 3, 4 Q. D.-таблица в данном случае имеет вид /w» qco. f?co» G<°> F<°> . . . главная строка Ечп /}ш pay ¦ Qd) pa Первые два столбца соответствуют начальным данным; Q.D.-ал- Q.D.-алгоритм позволяет определить элементы главной строки, которые совпадают с коэффициентами дроби A.42). § 1.2. Аппроксимации Бейкера — Гаммеля Ряды Паде—Лежандра имеют вид 2vn(J/,A(-2), B.1) п=0 и=0
306 Гл. 1. Обобщения аппроксимаций Паде где Р„(г), я=0, 1, 2, . . .— полиномы Лежандра и /„=(—1) псп. В § 1.6 мы рассмотрим рациональные аппроксимации таких родов; в этом параграфе обсуждается другой класс аппроксимирующих функций, применимый для рядов вида B.1) и аналогичных им. В не- невырожденном случае коэффициенты сп можно представить в виде м с„-2«*А?. « = 0,1,2 2М — 1. B.2) Если мы предположим, что представление B.2) приближенно спра- справедливо и при n=2M, 2M+1, . . . , другими словами, если предпо- предположить, что коэффициенты с„ имеют обобщенно геометрическое поведение, то в качестве аппроксимации для функции g(z) мы по- получаем выражение вида м _i_ )= 2 а,A — 2h{z + hj)~K B.3) i Формула B.3) получается с помощью производящей функции для многочленов Лежандра и представляет нетривиальную аппрокси- аппроксимацию для g(z). Чтобы найти параметры ait ht, t = l, 2, . . ., М, фигурирующие в B.3), заметим, что из B.2) вытекает соотношение к, М f (*) ^ L CnZ» = ? ГГЬ так что/iy1—это полюсы аппроксимации Паде [М—1/М] для функ- функции /(г), а — ccj/ftj—соответствующие вычеты. Таким образом, аппроксимации B.3) легко определяются, если существует аппрокси- аппроксимация Паде Ш—ММ] для функции /(г). Идеи, лежащие в основе этого подхода, берут начало с работ [Gammel et al., 1967; Baker, 1967; Common, 1969 a, b]. Несколько иной подход, основанный на теории положительных функционалов, и в иных, чем здесь, предположениях предложен М. Риссом [М. Riesz, 19231; он также приводит к неравенствам теоремы 1.2.2. Шохат рас- распространил подход Рисса на случай рядов Стильтьеса [Ahiezer, 1965]. Некоторые оценки, которые будут получены в этом параграфе, можно сравнить с соответствующими результатами § 3.2. Метод аппроксимаций Бейкера — Гаммеля основан на приведен- приведенных выше соображениях и обобщает их путем введения формальных разложений вида g(z)= 2 /«*»(*) т = 0 (что соответствует B.1)) и интегральных представлений g (z) =$"*(«, u)dq>(и), B.5)
§ 1.2. Аппроксимации Бейкера — Гаммеля 307 где k (г, и) — ядро, свойства которого обсуждаются ниже, и dq> (и) — мера Стильтьеса. В частом случае k(г, и)=A+мг)~1 интеграл B.5) представляет функцию стильтьесовского типа и в этом случае применимы методы гл. 5, ч. 1. Мы начнем с рассмотрения аппроксимаций Паде для ряда Стильтьеса $^ ). B.6) n-0 Аппроксимации Бейкера — Гаммеля для функции g(z) из B.5) имеют вид j м Сцм +J/M] G\ 'V r и /7\ \ "V ~ и (у и \ (9 7\ и \г>— ?л VjK \z)~r ?i «/«1,2, ut), \*-i) i=0 i=l где 'ц=о, / = 0, 1, 2, ... B.8) и значения величин ру, / = 0, 1, .... J и и{, at, i=l, 2, ..., М еще предстоит определить. Если / = —1, то «полиномиальный» член в B.7) отсутствует. Отвлекаясь пока от вопросов сходимости рядов B.9), B.10), из B.8), получаем k(z, «) = J2o«4»(z)- B-9) Теперь из B.5), B.6), B.9) находим разложение для g(z) ее «f («)-Jlo/«*«(«). B-10) где m = 0, I B.11) Из B.10), B.7), B.9) вытекает, что коэффициенты разложений g(z) и GlM+J/Ml(z) по функциям km(z) совпадают при т = 0, 1, ..., 2M-\-J, если справедливы равенства м /.-Р.,4 2«/«f. m-0,1, .... У B.12) /= 2 «,<, m = / + l, J + 2, ..., 2УИ + 7. B.13)
308 Гл. 1. Обобщения аппроксимаций Паде Иг 2.12), B.13) вытекает формальное соотношение м Таким образом, мы показали, что величины fJy, at, и{, фигури- фигурирующие в B.7), определяются разложением [M + 7/M]/(z) = tp/(-zK + g-r-2i_ B.15) аппроксимаций Паде, фигурирующих в B.6). Этим установлено, что существование аппроксимации Паде (M-\-J/M] для функции /(г) достаточ-но, чтобы формально определить соответствующую ап- аппроксимацию Бейкера — Гаммеля для функции g{z) вида B.5). Обоснование этой конструкции дает следующая теорема. Теорема 1.2.1. Пусть ядро k(z, и) аналитично по и в /^.-ок- /^.-окрестности вещественной положительной и-оси при всех г, при- принадлежащих компактной области % в z-плоскости. Далее, пусть функция \k(z, u)\ равномерно ограничена при и —»¦ оо, гб^ ве- величиной (logtt)~A + |i) с (д, > 0. Тогда GW+Jim(z)-+g(z), при z?%, М—оо. Доказательство. Представляя функцию k (г, и) в B.5) по фор- формуле Коши, получим где 1\—окружность радиуса А с центром в точке и. Поскольку функция k (г, w) аналитична по w в Д-окрестности положитель- положительной вещественной оси ш>, это представление можно переписать в виде где Г — граничный контур указанной Д-окрестности, показанный на рис. 1. Отсюда получаем dm Ш) i , - и 1 - u,-/o> , . I С k(z, да) , Р s v ' 2ш J w J и i)^ B.16,
§ 1.2. Аппроксимации Бейкера — Гаммеля 309 lm Re vj Рис. 1. Контур Г в комплексной анплоскости. Аппроксимация Бейкера — Гаммеля получается заменой функции /(г) в B.16) на ее аппроксимацию Паде Г J м 1 ) = ^$k(z, W) Ep^-Z + S-j-S- ?. B.17) r L/ = о i=i J Поскольку / (z) представима рядом Стильтьеса, то полюс B.17) в точке w = u-, лежит внутри Г и из B.8) следует, что j м qim +J/M} B) _ 2 $,kj (г) -\- 2 а{к B. и{). 1=0 i=l Таким образом, в предположениях теоремы эвристические рассужде- рассуждения, связанные с соотношениями B.6), B.7), B.15), получают стро- строгое обоснование. Из B.16), B.17) вытекает формула для погрешности аппроксимаций Из теорем 1; 5.2.6 и 1; 5.3.1 следует, что выражение в фигурных скоб- скобках в B.18) стремится к нулю равномерно по ю^Г при М->оо и, кроме того, эта величина имеет порядок O(w~l) при ш->оо. Тем самым сходимость аппроксимаций Бейкера — Гаммеля доказана. В следующей теореме мы покажем, что при более сильных огра- ограничениях на ядро k (г, и) эти аппроксимации дают верхнюю и ниж- нижнюю оценки для g(z). Установим предварительно следующую лемму. Лемма. В указанных выше предположениях и обозначениях имеем lM + J/M},(--L)f(--L)}dw=0npum=0, I, 2 2M + J. B.19)
310 Гл. 1. Обобщения аппроксимаций Паде Доказательство. Отметим сначала, что условие точности порядка аппроксимации обеспечивает сходимость этого интеграла около точки да=оо. Поэтому контур Г можно деформировать в конечный контур Г, охватывающий точку да=0 и полюсы аппроксимаций Паде. Из B.12), B.13), B.14) при т~-0, 1, 2, . . ., 2M+J находим ( J М \ = Ш Jr. wm~l { 2 №" + S uffes} *» = /-• B-20) Второе слагаемое в B.19) рассматривается аналогично, и лемма доказана. Теорема 1.2.2. Неравенства )}> 0, B.21) x)}^0, B.22) B.23) справедливы при всех вещественных положительных х, всех и J ^—1 тогда и только тогда, когда ядро k(x, и) при всех ве- вещественных неотрицательных х и всех / = 0, 1, 2, ... удовлет- удовлетворяет условию Доказательство. Покажем сначала, что из B.24) следует B.21). Пусть функция K{w) аналитична в А-окрестности положительной вещественной оси w и B.25) Поскольку f(z)—стильтьесовская функция, то нули выражения W2M+1Q[M+J+1/M +1] / L\ QIM + J/M] ( IS] лежат в точках w = w,, i = l,2, ..., 2М + 1 вещественной оси w. Представим функцию K(w) по формуле Ньютона A.7) 2Л1 + 1 = 2 2М+ 1 П
§ 1.2. Аппроксимации Бейкера — Гаммеля 311 Подставляя это выражение в B.25) и используя лемму, получим 2М + 1 П (w-w Вместе с A; 3.5.18) это дает 2/W+l п X ' W-2M-J-? Д (w — Wtl)K[Wi f — 7 Г^ J q[M+J + i/M+i} I ___}_\ q - V w) 7Г qLM+j/M\/ J_ \ w i C(M + J/M) 2M + I J~< Д (l_^ )K[wi, Wz, ..., l/M + i] I |_ \ BIM+J/M\ I _J_ \ \ w) \ wj Поскольку /(г)—стильтьесовская функция, то величина С(М + + J-\- l/M-f 1)-C(M + J/M) положительна при нечетных / и от- отрицательна при четных J (см. упражнение 3, ч. 1, § 5.1). Ис- Используя A.5), A.7) и теорему Ролля, получаем 1I y г где да лежит на вещественной оси ш>. Учитывая B.17), B.25), на- находим, что где р положительно. Таким образом, мы видим, что условие B.24) достаточно для справедливости неравенства B.21). Неравенства B.22), B.23) доказываются аналогично; теорема 1.2.1 обосновы- обосновывает появление в B.23) функции g(z). Доказательство обратного утверждения основано на линейности B.25) по dcp (и); детали можно найти в работе [Baker, 1970]. Пример 1. Ь B-26)
312 Гл. 1. Обобщения аппроксимаций Паде Условия теоремы 1.2.1 и соотношения B.24) выполняются. Соглас- Согласно B.7) аппроксимации Бейкера — Гаммеля имеют вид м Таким образом, в случае B.26) аппроксимации Бейкера — Гаммеля сводятся к аппроксимациям Паде стильтьесовской функции g(z), определяемой равенством B.5). Пример 2. k(z, u) = e-™. B.27) Условия теоремы 1.2.1 и соотношения B.4) выполняются. Ап- Аппроксимации Бейкера—Гаммеля B.7) имеют вид j м Эти аппроксимации особенно полезны, когда рассматриваемая функция экспоненциально затухает. Пример 3. * [^р. B.28) Условия теоремы 1.2.1 и соотношения B.4) выполняются при л>0. Этот класс аппроксимаций занимает промежуточное положение между примером 1 {п=\) и примером 2 (ге=оо). Пример 4. /г (г, ы) = A+2 uz + u*) \ B.29) Условия теоремы 1.2.1 выполняются. Проверим справедливость соотношений B.24), полагая х>\, ы>0. В этом случае корни ии и2 уравнения 1+2«х+и2=0 удовлетворяют условию —со <Си10 и из теоремы Коши вытекает интегральное представление , U) — — \ гг= Условия B.24) легко проверяются с помощью этого представления и, таким образом, равенство B.29) определяет ядро Бейкера — Гаммеля. Соответствующие аппроксимации -т GIM+у/л1] (х) = ^ р/у (х) + 2 аД1 + 2Uix -|- uj) /=0 (=1
§ 1.2. Аппроксимации Бейкера — Гаммеля 313 дают асимптотически точные двусторонние оценки при х>1 (см. теорему 5.2.2). Ясно, что анализ, относящийся к рядам Лежандра B.1) и ос- основанный на производящей функции B.29), обобщается на более широкие классы ортогональных многочленов, однако общих резуль- результатов в этом направлении пока не получено. Пример 5 (аппроксимации Паде — Бореля). Рассмотрим ядро о которое имеет асимптотическое разложение вида со k(z, u)~2(-uzy(piV- i = 0 и удовлетворяет условиям теоремы 1.2.1 и соотношениям B.4). Разложение B.10) в данном случае имеет вид со = 2 c,(pi)lzf, 0 2 ;=0 поэтому в схеме рассуждений будут участвовать аппроксимации Паде для функции / = 0 Разница между степенными разложениями g(г) и /(г) заключается в том, что в последнем случае появляются «множители сходимости» 1/(/I. Аппроксимации Паде— Бореля для g(z) имеют вид со (г) = J е-фИ + J/M],(zlP) dt = М ,-=о Этот метод впервые был использован в работе [Graffi et al., 19701 в связи с изучением ангармонического осциллятора; подход, при- приведенный здесь, основывается на анализе, содержащемся в [ЕРА с. 287]. Изложенный выше подход получил недавно развитие, которое полезно, если требуется аппроксимировать ряд B.10) со ?(*)= 2/-^-(г) B.30)
314 Гл. 1, Обобщения аппроксимаций Паде и имеется априорная информация об асимптотическом поведении коэффициентов fm [Baker and Gubernatis, 1981]. Схема аппроксима- аппроксимаций Бейкера— Гаммеля легко может быть модифицирована с тем, чтобы использовать такую дополнительную информацию. Напри- Например, некоторое число коэффициентов ряда 8(г)= 2 LPm(z) B.31) т = 0 может быть известно и дополнительно может быть известна форма асимптотики fn~yn при п-^оо, B.32) где уп—данная последовательность. Как скоро станет ясно, не- необходимо знать только форму асимптотики отношения Rn = fn+Jn-Jfl B-33) Отметим аналогию предположения вида B.32) и предположений ме- метода Левина из § 1.4. Мы укажем метод определения асимптотики аппроксимаций Бей- Бейкера — Гаммеля, опуская все предварительные условия, связанные с существованием и сходимостью. При условии /^—1 соотношения B.12), B.13) заменяются предположением, что коэффициенты fn могут быть представлены в виде ' м \ ( 2 а/"?1), т = 0,1, ...,/, B.34) ( \ м 2M + J. B.35) Затем предполагаем, что равенства B.35) приближенно справедли- справедливы при 2Af+7+l, 2M+J+2, ... .В таком случае, мы видим, что умножение ут на ahm, т=0, 1, . . ., 2М—1 не меняет представле- представлений B.35); тем самым асимптотика отношения Rn в B.33) — един- единственное, что нужно знать для определения асимптотики аппрокси- аппроксимаций. Равенство B.9) заменяется следующим: *(e)(z. и) =2 "•?.*.(*)• B.36) т = 0 Понятно, что в случае необходимости функция k{a) (г, и) может быть найдена аналитическим продолжением по и. Затем мы находим, что аппроксимации для g(z), определенные по коэффициентам /m, m= =0, 1 2M+J в B.30), B.35) — B.37), имеют вид = 2 а&» (г, и,) + 2 V.P.*. (*)• B-37) t = 1 т = 0
§ 1.3. Анализ рядов 315 Использование информации, содержащейся в B.32), проводится здесь в духе метода Левина, § 1.4; имеется также сходство с методом работы [Common and Stacey, 1979a]. Пример. Предположим, что требуется найти аппроксимации для ряда и известно, что fn ~ 6(гг+ 1K", при п—>-оо. Мы полагаем уп — п + \, п = 0, 1, ... и из B.36) находим, что ядро аппроксимаций B.37) в данном случае имеет вид k(a) (г, и) = A — иг) A — 2«г f и1J. Упражнение. Функция Ле Руа определяется равенством Проверить, что ядро k(z, u) = L^(zu) удовлетворяет условиям теоремы 1.2.1 и соотношениям B.24) при ^^0. Исследовать частные случаи ? = 0 и ? = 1. § 1.3. Анализ рядов Основной целью изучения аппроксимаций Паде является получе- получение информации о функции на основе нескольких известных коэффи- коэффициентов ее степенного разложения. Прежде чем обратиться к при- приложениям аппроксимаций Паде в теоретической физике, рассмотрим несколько различных методов с коллективным наименованием ана- анализ рядов. Мы начнем с метода отношений, принимая аппроксима- аппроксимации Паде в качестве известной основы, и перейдем затем к рассмо- рассмотрению С37-аппроксимаций 1|. Далее рассмотрим квадратичные ап- аппроксимации и, наконец, еще не вполне завершенный метод Левина. Методы, которые мы собираемся обсудить, основаны на предпо- предположении о том, что заранее имеется информация либо о виде инте- интересующей пас функции (который достаточно прост), либо об общем характере поведения коэффициентов ее степенного разложения. Эти методы могут составить полезный элемент рабочей техники исследо- исследователей-прикладников; они применимы в различных ситуациях, и будет интересно рассмотреть очень коротко один пример, чтобы 11 Сокращение от фамилий ученых, почти одновременно исследовавших эти приближения (Gammel, Gaunt, Guttmann и Joyce).
316 Гл. 1. Обобщния аппроксимаций Паде увидеть, какого рода интуитивная информация может оказаться полезной. В статистической механике существует целый ряд задач, в ко- которых несколько первых коэффициентов интересующего нас сте- степенного ряда могут быть найдены точно (они являются целыми чис- числами), в то время как само точное решение получить не удается. Хорошим примером является трехмерная модель Изинга. Вычис- Вычисляются первые члены разложения какой-либо термодинамической величины, такой как магнитная восприимчивость, и затем получен- полученный ряд анализируется с тем, чтобы установить поведение интере- интересующей нас величины. Особый интерес в статистической механике представляют фазовые переходы — такие явления как скачкооб- скачкообразный переход из беспорядочного парамагнетического состояния в упорядоченное ферромагнетическое при критической температуре. Ожидается, что магнитная восприимчивость f(z) как функция от z=T~1 (T — температура) имеет вид f(z)&A(l-\LZ)-v, C.1) где 1/jj, — «критическая точка», у — «критический показатель» и символ « означает, что указанное представление справедливо с хорошей точностью около точки z=\l\i и ничего больше. Извест- Известно, что /(г)=с„+с1г+с2г3+с;)г3+. . ., C.2) и задача теперь состоит в том, чтобы наилучшим образом найти приближенные значения параметров A, \i, у, используя прибли- приближенные представления коэффициентов с. ~ Л в+'>-§ 1.3. Анализ рядов 317 мой функциональной форме интересующей нас функции и не огра- ограничивает способа аппроксимации; при разумном применении он прост и надежен (см. ч. 1, § 2.3). GV-аппроксимации возникают как некоторое обобщение метода отношений, основанное на том, что соотношение C.3) эквивалентно следующему рекуррентному соотношению для коэффициентов с;: псп—M или в другой форме Ло, iOCn+iA^ , (п—\)+Ак „1с„_,жО, где Ло, i = l, Д1,! =— fx и Аи 0=—МН-у)- Обобщением этой формулы является следующее рекуррентное соотношение М-го порядка [Guttman and Joyce, 1972] rain (M. n) *ш(са)= 2 M/,2(«-02 + ^,i(«-0 + ^,o}cn_f = 0, C4) t = 0 где п — 0, 1, 2, .... /lo,2=l, y40i0 = 0 и неизвестные коэффициенты {Ло, „ At, 2, Altl, ЛЛ0, / = 1,2, ...,М) C.5) определяются из системы ЗМ + 1 линейных уравнений *!*(*,,) = 0, л = 1, 2, .... ЗМ+1. C.6) Таким образом, система C.6) определяет коэффициенты C.5); в свою очередь C.5) определяет всю последовательность коэффи- коэффициентов ct (значения первых ЗМ + l коэффициентов этой последова- последовательности были заданы согласно C.2)). В результате мы получили аппроксимирующую функцию (г) = (=0 разложение которой совпадает с разложением C.2) до порядка ЗМ-\-1. Можно показать, что функция \|эм (г) удовлетворяет обык- обыкновенному однородному дифференциальному уравнению M{z) = 0, .C.7) где м м S^i..z', R{z)=2(Attl+At,1)z! i=0 1 = 0 М - I S(z)= 2 ^/+i,oz'. i 0
318 Гл. 1. Обобщения аппроксимаций Паде Если Q(z) имеет простой или двойной нуль в точке z=z0, т. е. Q(z)=Cl(z-Zo)+0((z-z0r), i или и S(zo)?=0, то г0 называется регулярной особой точкой дифферен- дифференциального уравнения. В зависимости от поведения R(z) в окрест- окрестности г0 возможны следующие типы особенностей решений: C.8а) C.8Ь) C.8с) 2), C.8d) где Ф^г), ф2 (г) и ф8(г) аналитичны в точке г=г0, р — целое поло- положительное число и р — нецелое число. Если QM (г^ФО, то гх— регу- регулярная точка дифференциального уравнения и функция Ум (г) аналитична в этой точке. Соотношения C.8 а—d) показывают типы особенностей, которые могут быть точно воспроизведены O3J -ап- -аппроксимациями, схема построения которых основана на формуле C.4). Ясно, что возможности этой схемы можно существенно рас- расширить, если использовать неоднородное уравнение О37-аппроксимации удовлетворяют критерию точности порядка, но не обязательно являются рациональными функциями. Их зна- значение состоит в том, что они позволяют учесть интуитивные сообра- соображения о предполагаемом характере особенностей рассматриваемой функции около критической точки с тем, чтобы включить в схему аппроксимации с такими особенностями. На практике редко бывает ясно, какими должны быть выбраны степени многочленов Q(z), R(z), S(z) и T(z). Однако имеется одно уравнение этого типа, для которого существует удовлетворительное решение этого вопроса [Hunter and Baker, 19791,— это уравнение вида где RN{z), SM(z) и TL(z)—полиномы степени N = М -\-2, М и L= M соответственно. Отметим, что случай RN = 0 соответствует диаго- диагональным аппроксимациям Паде, а при TL = 0 рассматриваемые аппроксимации являются D-log-аппроксимациями Паде. Важным свойством G3J аппроксимаций является то, что они сохраняют свойство инвариантности при дробно-линейных заменах перемен-
§ 1.3. Анализ рядов 319 ной. Предположим, что функция ify (г) является GV-аппроксима- цией, полученной с помощью 3M-J-4 коэффициентов данного сте- пенного ряда /(г) = 2 ciz'- Произведем замену z — wfta + bw) и i = 0 положим ) З ( = 0 Функции g(w) соответствует новая GV-аппроксимация tyg(w). Теорема инвариантности для СУ-аппроксимаций утверждает, что в этом случае мы имеем равенство Идеи, близкие к тем, что рассматривались выше, приводят также к понятию квадратичных аппроксимаций [Shafer, 1974]. Эти аппрок- аппроксимации тесно связаны с общей задачей Эрмита — Паде, которая заключается в определении полиномов Л^г), Л3(г), . . ., Ап (г) степеней не выше \ii, ц2, • • -, Мт» соответственно, удовлетворяющих соотношению Аг (г) h (г) + А2(г) f, (г) + •.. + Ап(г) /„(г) == О (г*+ где /,, /=1, 2, ..., п—данные функции; см. библиографию, относящуюся к аппроксимациям Эрмита—Паде. Пусть /(г)—за- /(г)—заданная функция и Q(z), R(z), S(z) — полиномы степени не выше q, r, s соответственно, удовлетворяющие соотношению Q(z)f(zy + 2R(z)f(z) + S(z) = 0(z*+r+s+*). C.9) Соответствующая квадратичная аппроксимация ф(г) для /(г) оп- определяется уравнением = 0 C.10) и тем самым представима в виде Ш=ШШ=Я C.11а) ) Поскольку Q(z), R{z) и S(z) — полиномы, то функция ф(г) анали- тична всюду, кроме конечного числа полюсов и точек ветвления квадратичного типа. Правильная ветвь функции г|)(г) еще должна быть указана; обычно способ выбора ветви ясен из контекста, как в следующем примере. Пример = Arctgz.
320 Гл. 1. Обобщения аппроксимаций Паде Поскольку эта функция нечетна и обращается в нуль при 2 = 0, то соотношение C.9) в данном случае имеет вид . C.12) Подставляя в C.12) разложения р(г)==г_|2 + получим для определения параметров а, р, у систему из трех линейных уравнений, решая которую, находим, что Теперь из C.11) получаем, что квадратичная аппроксимация типа [q, r, s\ = [2, 2, 2] имеет вид Отметим некоторые свойства полученной аппроксимации. Функ- Функция arctg(x) определена при всех вещественных х и arctg (оо)=^= = л/2= 1.57...; для аппроксимации имеем \|;(оо)=81^3/80= 1.549... . При чисто мнимых z = iy справедливо представление arctg (ц/) = 1 In }±| = t arth((/), следовательно, arctg (у) = ± In j±| = \ + О М .i-\-1 га—- у 1 \ ° / и точки ветвления квадратичной аппроксимации определяются ра- равенством г/2=15/16. Из сказанного выше следует, что мы получили достаточно точную аппроксимацию на всей вещественной оси и до- достаточно точную информацию о расположении точек ветвления функ- функции на мнимой оси. Конечно, arctg (г) относится к функциям стиль- тьесовского типа и обычные аппроксимации Паде для нее также об- обладают хорошими свойствами сходимости; см. A; 4.6.5). Существуют ряды, для которых аппроксимации Паде являются не лучшим способом приближения. Различные примеры в этом на- направлении, такие как «шумовые» ряды и ряды, основанные на слу- случайных числах, уже приводились выше. Другой, более естественный
§ 1.3. Анализ рядов 321 пример дают ряды вида Ус(, где функция/ (г)=У. ctz' имеет при 1 = 0 (=0 г=1 точку ветвления, но значение /A) может быть определено. Следует ожидать, что в этом случае полюсы аппроксимаций Паде будут накапливаться к точке г=1 и сходимость аппроксимаций будет медленной. Прибегая к грубому упрощению, метод суммирования ряда, основанный на аппроксимациях Паде, можно рассматривать как гипотезу о том, что ряд состоит из N геометрических компонент Л с„= 2,агг'!, п-0, 1, 2, .... '= 1 где |г;|<1 и последовательность частичных сумм ряда имеет, таким образом, вид В таком случае применение аппроксимации Паде \ЫМ] дало бы точный ответ при L, M^N. Если эта гипотеза неприменима, то се можно рассмотреть G3J-аппроксимации для функции /(г)=Усгг'' и вычислить их значения при г=1; это предпочтительно в случае, когда известно расположение особенностей функции. Совершенно иной подход основан на предположении, что Sn является гладкой функцией otw= - на отрезке O^a^l. Тогда можно решать задачу интерполяции значений Sn в окрестности точки п—оо. Стандартный подход состоит в использовании рациональных интерполяций (iV- точечных аппроксимаций Паде); любые надежные методы из тех, что описаны в § 1.1, дают в этой ситуации удовлетворительный ре- результат. Интересный метод, указанный в работе [Levin, 1973] и получивший дальнейшее развитие в работах [Sidi, 1979, 1980а], основан на предположении, что Sn = Sa + R(n) 2т»п-'.п=«1.2,..., C.13) { =0 где R(n)—некоторая функция достаточно простого вида, ко- которая выбирается так, чтобы последовательности Sx -(- R (п) и Sn были по возможности близки; можно рекомендовать выбор /?(/¦)= }j"cndrt. Параметры yh г = 0, 1, ..., N, определяются си- системой /V-f 1 линейных уравнений и затем 5 определяется прямо из C.13). По существу этот анализ не требует ничего большего, чем обращение матрицы Вандермонда (см. ч. 1, §6.2, упражне- упражнение 1).
322 Гл. 1. Обобщения аппроксимаций Паде Таблица 1. ПРИБЛИЖЕННЫЕ ВЫЧИСЛЕНИЯ СУММЫ РЯДА C.14) И I 3 5 7 9 5, 1.0 I.36JI1I 1.463611 1,511797 1.539768 Метод I е-алгоритм (аппроксима- (аппроксимации Пале Cf/iJJ 1.0 1.45 1.551617 1.590305 1.609087 Метод 2 Итерированный е-алгоритм 1.0 1.581258 1.629670 Метод 3 Рациональные интерполяции C/V-точечные аппроксимации Паде) 1.0 1.65 1.644895 1.644934 1.644934 Метод 4 Метод интер- интерполяции Левина 1.0 1.625 1.644965 1.644935 1.644934 Пример. Вычислить сумму ряда По аналогии с методом Паде рассмотрим ассоциированную функцию C.15) Подынтегральное выражение имеет логарифмическую точку вет- ветвления при у=1, так что интеграл имеет логарифмическую особен- особенность при 2=1. Заменяя интеграл в C.15) контурным интегралом, можно без особых затруднений получить, что /A)=я2/6 и мы ис- используем теперь ряд C.14) в качестве теста для наших численных методов. По существу, мы должны вычислить значение суммы сте- степенного ряда в особой точке функции. Поэтому можно ожидать, что простое применение метода Паде в форме е-алгоритма столкнет- столкнется с трудностями. Метод GV-аппроксимаций в принципе должен дать удовлетворительный ответ. Мы сравниваем четыре метода: е-алгоритм, его первую итерацию, метод рациональной интерполя- интерполяции Тиле и метод асимптотического разложения Левина. В табл. 1 приведены приближенные значения Sx, полученные с помощью пер- первых л=2/+1 членов ряда C.14). Можно видеть, что рациональная интерполяция с использованием переменной w=* - дает геометриче- геометрическую скорость сходимости, что является вполне удовлетворительным результатом. Метод Паде по указанным выше причинам сходится неприемлемо медленно и итерирование едва ли дает достаточное улучшение скорости сходимости. В заключение этого параграфа обратим внимание на то, что рассматриваемые здесь методы являются частными (мы надеемся, что не слишком), и подчеркнем, что каждый из них имеет свою есте- естественную область применимости. Дальнейшие детали, касающиеся GV-аппроксимаций, можно иайти в работах [Gammel, 1973; Joyce
§ 1.4. Аппроксимация функций нескольких переменных 323 and Guttmann, 1973; Guttmann, 1975 а, Ы. Подробности, относящие- относящиеся к методам анализа рядов, можно найти в работах [Gray, Atchin- son and Me Williams, 1971; Smith and Ford 1979; Brezinski, 1980]. Упражнение 1. Проверить, что элементы второй строки (я=3) табл. 1 вычислены правильно. Упражнение 2. Доказать, что Указание. Вычислить сначала интеграл \ , 2 dw с помощью — со теоремы о вычетах. § 1.4. Аппроксимация функций нескольких переменных Естественной задачей является обобщение аппроксимаций Паде на случай функций, зависящих более чем от одной переменной. Оказывается, что характер проблем, связанных с многомерными аппроксимациями, отчетливо проявляется уже в двумерном случае, и мы для простоты изложения сосредоточим внимание именно на нем. Сначала мы рассмотрим различные схемы определения двумерных аппроксимаций Паде, а затем перейдем к более общим классам ап- аппроксимирующих функций. Предположим, что заданы коэффициен- коэффициенты степенного разложения ас х f(x, y)=2 Ъч,;Х1У"- D 1) Задача состоит в том, чтобы определить области о)\Г и S> на дву- двумерной целочисленной решетке и полиномы А(х, у)= 2 аи,х?у1 D.2) и В(х, у)= 2 bt, мы требуем,
324 Гл. 1. Обобщения аппроксимаций Поде J Рис. 1. Область решетки Чисхолма. Области



Достарыңызбен бөлісу:
  1   2   3   4




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет