Курсовая работа: Дослідження методу ортогоналізації й методу сполучених градієнтів

Курсова робота

На тему:

"Дослідження методу ортогоналізації й методу сполучених градієнтів"

Введення

До рішення систем лінійних алгебраїчних рівнянь приводяться багато задач чисельного аналізу.

Відоме з курсу вищої алгебри правило Крамера для рішення систем лінійних алгебраїчних рівнянь практично невигідно, тому що вимагає занадто великої кількості арифметичних операцій і записів. Тому було запропоновано багато різних способів, більше придатних для практики.

Використовувані практично методи рішення систем лінійних алгебраїчних рівнянь можна розділити на дві більші групи: так звані точні методи й методи послідовних наближень. Точні методи характеризуються тим, що з їхньою допомогою принципово можливо, проробивши кінцеве число операцій, одержати точні значення невідомих. При цьому, звичайно, передбачається, що коефіцієнти й праві частини системи відомі точно, а всі обчислення виробляються без округлень. Найчастіше вони здійснюються у два етапи. На першому етапі перетворять систему до того або іншого простого виду. На другому етапі вирішують спрощену систему й одержують значення невідомих.

Методи послідовних наближень характеризуються тим, що із самого початку задаються якимись наближеними значеннями невідомих. Із цих наближених значень тим або іншому способу одержують нові «поліпшені» наближені значення. З новими наближеними значеннями надходять точно також і т.д. Розглянемо два точних методи: метод ортогоналізації й метод сполучених градієнтів.

Метод ортогоналізації

1.1 Метод ортогоналізації у випадку симетричної матриці

Нехай дана система

(1)

порядку n. Щоб уникнути надалі плутанини, над векторами поставимо риски. Рішення системи будемо розшукувати у вигляді

Дослідження методу ортогоналізації й методу сполучених градієнтів , (2)

де – n векторів, що задовольняють умовам

при (3)

Тут розглядається звичайний скалярний добуток векторів в n-мірному векторному просторі, тобто якщо й , те Дослідження методу ортогоналізації й методу сполучених градієнтів . Нехай такі вектори знайдені. Як це робиться, буде показано нижче. Розглянемо скалярний добуток обох частин системи (1) з

(4)

Використовуючи (2) одержимо:

Дослідження методу ортогоналізації й методу сполучених градієнтів (5)

або, у силу вибору векторів ,

Дослідження методу ортогоналізації й методу сполучених градієнтів . (6)

Отже, для визначення коефіцієнтів одержали систему із трикутною матрицею. Визначник цієї системи дорівнює

. (7)

Отже, якщо , те можливо знайти й перебувають вони без праці.

Особливо легко визначаться , якщо матриця А симетрична. У цьому випадку, мабуть,

(8)

і, отже,

=0 при . (9)

Тоді система для визначення прийме вид

(10)

Дослідження методу ортогоналізації й методу сполучених градієнтів . (11)

Метод можна узагальнити. Нехай якимсь образом удалося знайти систему 2n векторів так, що

=0 при . (12)

Множачи обидві частини рівності (1) на й використовуючи подання через , як і раніше, одержимо:

Дослідження методу ортогоналізації й методу сполучених градієнтів . (13)

Знову вийшла система лінійних алгебраїчних рівнянь із трикутною матрицею для визначення . Трохи ускладнивши обчислення можна одержати систему діагонального виду. Для цього побудуємо три системи векторів , так що мають місце рівності:

Дослідження методу ортогоналізації й методу сполучених градієнтів (14)

Дослідження методу ортогоналізації й методу сполучених градієнтів (15)

(16)

Тоді

, (17)

тому що при i<r

Дослідження методу ортогоналізації й методу сполучених градієнтів (18)

і при i>r

Дослідження методу ортогоналізації й методу сполучених градієнтів (19)

Таким чином,

Дослідження методу ортогоналізації й методу сполучених градієнтів (20)

Зупинимося докладніше на першому з описаних методів. Розглянемо випадок, коли матриця А симетрична й позитивно певна. Останнє означає, що для будь-якого вектора квадратична форма його компонент більше або дорівнює нулю, причому рівність нулю можливо в тім і тільки тім випадку, якщо вектор нульової. Як ми бачили раніше, потрібно побудувати систему векторів , що задовольняють умовам

=0 . (21)

Це побудова можна здійснити в такий спосіб. Виходимо з якоїсь системи лінійно незалежних векторів , наприклад із системи одиничних векторів, спрямованих по координатних осях:

Дослідження методу ортогоналізації й методу сполучених градієнтів (22)

Далі проводимо «ортогоналізацію». Приймаємо й шукаємо у вигляді

. (23)

З умови знаходимо:

Дослідження методу ортогоналізації й методу сполучених градієнтів (24)

Шукаємо у вигляді

. (25)

Умови спричиняють

Дослідження методу ортогоналізації й методу сполучених градієнтів (26)

Далі надходимо також.

Процес буде здійсненний, тому що все . Це ж забезпечить нам можливість розв'язання системи для визначення коефіцієнтів . Помітимо, що в нашім випадку це буде процес справжньої ортогоналізації, якщо в просторі векторів увести новий скалярний добуток за допомогою співвідношення

. (26)

Неважко перевірити, що уведене таким способом скалярний добуток буде задовольняти всім вимогам, які до нього пред'являються.

При рішенні системи n рівнянь за справжньою схемою потрібно зробити

Дослідження методу ортогоналізації й методу сполучених градієнтів (28)

операцій множення й ділення.

Метод ортогоналізації у випадку несиметричної матриці

У випадку несиметричної матриці процес ортогоналізації проводиться точно також. Нехай вектори вже побудовані. Тоді шукається у вигляді

Дослідження методу ортогоналізації й методу сполучених градієнтів (29)

Коефіцієнти визначаються із системи

Дослідження методу ортогоналізації й методу сполучених градієнтів (30)

Система у випадку несиметричної матриці буде трикутною.

Аналогічно будується система «біортогональних» векторів, тобто система 2n векторів, що задовольняють умові (12). При цьому – n довільних лінійно незалежних векторів, а вектори будуються послідовно у вигляді

Дослідження методу ортогоналізації й методу сполучених градієнтів (31)

Коефіцієнти перебувають із системи

Дослідження методу ортогоналізації й методу сполучених градієнтів (32)

Також надходимо, відшукуючи коефіцієнти й , при побудові систем векторів (14) і (15), що задовольняють умовам (16).

При цьому одержимо дві системи:

Дослідження методу ортогоналізації й методу сполучених градієнтів (33)

з яких і визначаємо й .

Зупинимося ще на одному методі ортогоналізації. Будемо розглядати рядки матриці А як вектори:

(34)

Перше рівняння системи ділимо на Дослідження методу ортогоналізації й методу сполучених градієнтів . При цьому одержимо

(35)

де

Дослідження методу ортогоналізації й методу сполучених градієнтів (36)

Друге рівняння системи заміниться на

(37)

де

Дослідження методу ортогоналізації й методу сполучених градієнтів (38)

Аналогічно надходимо далі. Рівняння з номером i прийме вид

(39)

де

Дослідження методу ортогоналізації й методу сполучених градієнтів

Дослідження методу ортогоналізації й методу сполучених градієнтів (40)

Процес буде здійсненний, якщо система рівнянь лінійно незалежна. У результаті ми прийдемо до нової системи , де матриця З буде ортогональної, тобто має властивість ССў=I.

Таким чином, рішення системи можна записати у вигляді

. (41)

Практично, внаслідок помилок округлення, ССў буде відмінна від одиничної матриці й може виявитися доцільним зробити кілька ітерацій для системи .

Метод сполучених градієнтів

2.1 Перший алгоритм методу

Нехай потрібно вирішити систему лінійних алгебраїчних рівнянь

(1)

с позитивно певною матрицею A порядку n.

Розглянемо функціонала

, (2)

багаточлен, що представляє, другого порядку відносно x1, x2…, xn,… Позначимо через рішення системи (1), тобто . У силу симетричності й позитивної визначеності матриці, маємо:

Дослідження методу ортогоналізації й методу сполучених градієнтів

При цьому знак рівності можливий лише при . Таким чином, задача рішення рівняння (1) зводиться до задачі відшукання вектора , що обертає в мінімум функціонал (2).

Для відшукання такого вектора застосуємо наступний метод.

Нехай – довільний початковий вектор, а

(4)

– вектор не в'язань системи. Покажемо, що вектор не в'язань має напрямок нормалі до поверхні в крапці . Справді, напрямок нормалі збігається з напрямком найшвидшої зміни функції в крапці . Це напрямок ми знайдемо, якщо знайдемо серед векторів , для яких , такий вектор, що

Дослідження методу ортогоналізації й методу сполучених градієнтів

має найбільше значення. Але

Дослідження методу ортогоналізації й методу сполучених градієнтів

Але серед векторів постійний довжини досягає максимального значення, якщо має напрямок вектора або йому протилежне. Твердження доведене. Будемо рухатися із крапки в напрямку вектора доти, поки функція досягає мінімального значення. Це буде при Дослідження методу ортогоналізації й методу сполучених градієнтів , тобто при

Дослідження методу ортогоналізації й методу сполучених градієнтів . (5)

Вектор

(6)

і приймаємо за нове наближення до рішення.

У методі сполучених градієнтів наступне наближення перебуває так. Через крапку проведемо гіперплощину (n-1) – го виміру

(7)

і через позначимо нове не в'язання системи

. (8)

Вектор спрямований по нормалі до поверхні в крапці , а вектор паралельний дотичної площини в цій крапці. Тому

. (9)

Гіперплощина (7) проходить через крапку , тому що

При кожному вектор паралельний деякої нормальної площини до поверхні в крапці . Знайдемо серед них той, котрий лежить у гіперплощині (7), тобто ортогональний к. З умови ортогональності маємо:

або

Дослідження методу ортогоналізації й методу сполучених градієнтів . (10)

Вектор

(11)

має напрямок нормалі до перетину поверхні гіперплощини (7) у крапці . Будемо рухатися із крапки в напрямку вектора доти, поки функція досягне мінімуму. Це буде при

Дослідження методу ортогоналізації й методу сполучених градієнтів . (12)

Вектор

приймемо за нове наближення до рішення системи. Вектор не в'язань

(13)

має напрямок нормалі до поверхні в крапці . Покажемо, що він буде ортогональний до і . Справді, використовуючи (9), (11), (12), (13), маємо:

Дослідження методу ортогоналізації й методу сполучених градієнтів

Розглянемо гіперплощину (n-2) – х вимірів

, (14)

минаючу через крапку . Ця гіперплощина містить і , тому що ми раніше бачили, що , а

Вектор при кожному паралельний гіперплощини (7), тому що

Дослідження методу ортогоналізації й методу сполучених градієнтів .

Підберемо так, щоб він був паралельний і гіперплощини (14), тобто зажадаємо ортогональності до вектора . Будемо мати:

або

Дослідження методу ортогоналізації й методу сполучених градієнтів (15)

Вектор

(16)

буде мати напрямок нормалі до перетину поверхні гіперплощиною (14) у крапці . Із крапки змістимося в напрямку цього вектора так, щоб функція досягла мінімального значення. Це буде при

Дослідження методу ортогоналізації й методу сполучених градієнтів , (17)

(18)

приймемо за нове наближення к. Новий вектор не в'язань буде:

. (19)

Продовжуючи процес, одержимо послідовності векторів , , , обумовлені рекурентними співвідношеннями:

Дослідження методу ортогоналізації й методу сполучених градієнтів (20)

Для цих векторів мають місце наступні співвідношення:

(21)

(22)

Справді, у силу самої побудови при i (j

Далі, при i>j

Якщо i=j+1, то права частина дорівнює нулю, у силу визначення , якщо ж i>j+1, те, по доведеному, і

Продовжуючи зниження індексу у вектора , через кілька кроків прийдемо до скалярного добутку (по визначенню ). Таким чином, співвідношення (21) доведені. Для доказу (22), у силу рівноправності індексів i і j, припустимо, що i>j. Тоді

Тому що в n-мірному векторному простори не може бути більше n взаємно ортогональних векторів, то на деякому кроці одержимо , тобто буде рішенням системи (1).

На мал. 1 показана геометрична картина нашої побудови при n=3.

Дослідження методу ортогоналізації й методу сполучених градієнтів

Мал. 1

2.2 Другий алгоритм методу

Приведемо інший алгоритм методу. Будемо позначати послідовні наближення до рішення через і введемо позначення:

. (23)

Перші два наближення й візьмемо так, щоб

. (24)

Припустимо, що вже відомо наближення (iі1), обчислена й справедливо рівність

. (25)

Будемо шукати мінімум функціонала (2) на множині векторів

. (26)

Дорівнюючи до нуля частки похідні від по й для визначення й , одержимо систему:

Дослідження методу ортогоналізації й методу сполучених градієнтів (27)

або, з огляду на (25),

Дослідження методу ортогоналізації й методу сполучених градієнтів (28)

Позначимо через рішення цієї системи:

Дослідження методу ортогоналізації й методу сполучених градієнтів (29)

і за (i+1) – е наближення до рішення приймемо:

(30)

Із системи (27) треба, що

, (31)

а тому що

те з (31) треба:

(32)

Доведемо, що якщо

(33)

те при всіх i

(34)

що буде доводити й збіжність, і кінцівка другого алгоритму.

Справді, при умовах (33)

т.ч. умова (24) виконано. Припустимо, що вже доведено рівності

(35)

і доведемо рівність

При припущенні (35) і, отже,

Дослідження методу ортогоналізації й методу сполучених градієнтів

Але зі співвідношень (20) маємо:

Дослідження методу ортогоналізації й методу сполучених градієнтів

Доведемо коллінеарність векторів

Дослідження методу ортогоналізації й методу сполучених градієнтів і (36)

З (20) і (29) маємо:

Дослідження методу ортогоналізації й методу сполучених градієнтів

а це й доводить коллінеарність векторів (36).

Вектор дає мінімум функціонала в площині, що проходить через і на вектори й , а ми показали, що цей мінімум лежить на прямій, що проходить через у напрямку вектора . Але на цієї прямий мінімум функціонала досягається на векторі . Це й означає, що

Це й доводить справедливість (34) при всіх i.

На перший погляд здається, що перший алгоритм краще, тому що на кожному кроці він вимагає лише одного множення матриці А на вектор , а в другому алгоритмі потрібно два множення матриці А на вектор і , але досвід показав, що застосування першого алгоритму приводить до швидкого нагромадження помилок округлення, так що для матриць великого порядку можливо істотне відхилення від точного рішення. Другий алгоритм менш чутливий до помилок округлення й тому вимагає меншого кількість кроків для одержання гарного наближеного рішення.

Метод сполучених градієнтів доцільно використовувати для рішення систем рівнянь, у яких матриця А має багато нульових елементів. При рішенні системи по цьому методі елементи матриці беруть участь в арифметичних операціях лише при множенні матриці на вектор, а множення матриці на вектор можна організувати так, щоб в арифметичних операціях брали участь тільки ненульові елементи.

Висновок

У даній роботі були розглянуті метод ортогоналізації й метод сполучених градієнтів, а також представлена програма мовою програмування С++, що реалізує метод ортогоналізації на ЕОМ, і її результати роботи.

Список літератури

1. Березин І.С. і Жидков Н.П. Методи обчислень. – К., 2003

2. Воєводін В.В. Чисельні методи алгебри (теорія й алгоритми). – К., 2004

3. Подбельський В.В. і Фомін С.С. Програмування мовою С ++. – К., 2002

4. Каліткін М.М. Чисельні методи. – К., 2003

Курсовая работа: Дослідження методу ортогоналізації й методу сполучених градієнтів

Похожие работы: