Від дій над матрицями до розуміння їхньої суті.
Дуже поважаю людей, які мають сміливість сказати, що вони щось не розуміють. Сам такий. Те, що не розумію, обов'язково має вивчити, осмислити, зрозуміти. Стаття "Математика на пальцях", і особливо матричний запис формул, змусили мене поділитися своїм невеликим, але, здається, важливим досвідом роботи з матрицями.
Років приблизно 20 тому довелося мені вивчати вищу математику у ВНЗ, і починали ми з матриць (мабуть, як і всі студенти того часу). Чомусь вважається, що матриці – найлегша тема в курсі вищої математики. Можливо тому, що всі дії з матрицями зводяться до знання способів розрахунку визначника і кількох формул, побудованих знову ж таки, на визначнику. Здавалося б, просто. Але… Спробуйте відповісти на елементарне питання — що таке визначник, що означає число, яке ви отримуєте при його розрахунку? (Підказка: варіант типу «визначник - це число, яке знаходиться за певними правилами» не є правильною відповіддю, оскільки говорить про метод отримання, а не про саму сутність визначника). Здаєтеся? - Тоді читаємо далі.
Відразу хочу сказати, що я не математик ні з освіти, ні з посади. Хіба мені цікава суть речей, і я часом намагаюся до них «докопатися». Так само було і з визначником: потрібно було розібратися з множинною регресією, а в цьому розділі економетрики практично все робиться через матриці, якби вони були негаразди. Ось і довелося мені самому провести невелике дослідження, оскільки жоден із знайомих математиків не дав виразної відповіді на поставлене запитання, яке спочатку звучало як «що таке визначник». Усі стверджували, що визначник — це таке число, яке особливим чином пораховано, і якщо воно дорівнює нулю, то… Загалом, як у будь-якому підручнику з лінійної алгебри.Дякую, проходили.
Якщо якусь ідею вигадала одна людина, то інша людина має бути в змозі її зрозуміти (щоправда, для цього часом доводиться озброюватися додатковими знаннями). Звернення до «великого і могутнього» пошукача показало, що "площа паралелограма дорівнює модулю визначника матриці, утвореної векторами - сторонами паралелограма". Говорячи простою мовою, якщо матриця це спосіб запису системи рівнянь, то кожне рівняння окремо описує вектор. Побудувавши з точки початку координат вектори, задані в матриці, ми таким чином поставимо у просторі деяку фігуру. Якщо наш простір одномірний, то фігура це відрізок; якщо двовимірне - то постать - паралелограм, і так далі.
Виходить, що для одновимірного простору визначник - це довжина відрізка, для площини - площа фігури, для тривимірної фігури - її обсяг ... далі йдуть n-мірні простори, які нам не дано уявити. Якщо обсяг фігури (тобто визначник для матриці 3*3) дорівнює нулю, це означає, що сама фігура не є тривимірною (вона може бути при цьому двовимірною, одномірною або взагалі являти собою точку). Ранг матриці - це справжня (максимальна) розмірність простору, для якого визначник не дорівнює нулю.
Так, з визначником майже все зрозуміло: він визначає «об'ємність» фігури, утвореної описаними системою рівнянь векторами (хоча незрозуміло, чому його значення не залежить від того, чи маємо ми справу з вихідною матрицею, чи з транспонованою — можливо, транспонування — це вид афінного). перетворення?). Тепер потрібно розібратися з діями над матрицями.
Якщо матриця — це система рівнянь (інакше навіщо нам таблиця якихось цифр, які не мають до реальності жодного відношення?), то ми можемо з неюробити різні речі. Наприклад, можемо скласти два рядки однієї і тієї ж матриці, або помножити рядок на число (тобто кожен коефіцієнт рядка множимо на те саме число). Якщо ми маємо дві матриці з однаковими розмірностями, то ми їх можемо скласти (головне, щоб при цьому ми не склали бульдога з носорогом — але хіба математики, розробляючи теорію матриць, думали про такий варіант розвитку подій?). Інтуїтивно зрозуміло, тим більше, що в лінійній алгебрі ілюстраціями подібних операцій є системи рівнянь.
Однак у чому сенс множення матриць? Як я можу помножити одну систему рівнянь на іншу? Який сенс матиме те, що я отримаю у цьому випадку? Чому для множення матриць не застосовується переміщувальне правило (тобто добуток матриць В*А не те що не дорівнює добутку А*В, але й не завжди можна здійснити)? Чому, якщо ми перемножимо матрицю на вектор-стовпець, то отримаємо вектор-стовпець, а якщо перемножимо вектор-рядок на матрицю, то отримаємо вектор-рядок?
Ну, тут уже не те що Вікіпедія, — навіть сучасні підручники з лінійної алгебри безсилі дати якесь виразне пояснення. Оскільки вивчення чогось за принципом «ви спочатку повірте — а зрозумієте потім» — не для мене, копаю в глибину століть (точніше — читаю підручники першої половини XX століття) і знаходжу цікаву фразу…
Якщо сукупність традиційних векторів, тобто. спрямованих геометричних відрізків, є тривимірним простором, частина цього простору, що складається з векторів, паралельних деякої площини, є двовимірним простором, а всі вектори, паралельні деякої прямої, утворюють одновимірне векторне простір.
У книгах про це прямо не йдеться, але виходить, що векторам, паралельним до деякої площини, необов'язково лежати на ційплощині. Тобто вони можуть перебувати в тривимірному просторі де завгодно, але якщо вони паралельні саме цій площині, то вони утворюють двовимірний простір... З аналогій, що приходять мені на думку, — фотографія: тривимірний світ представлений на площині, при цьому вектору, паралельному матриці (або плівці) фотоапарата, відповідатиме такий самий вектор на картинці (за умови дотримання масштабу 1:1). Відображення тривимірного світу на площині «прибирає» один вимір («глибину» картинки). Якщо я правильно зрозумів складні математичні концепції, перемноження двох матриць якраз і є подібним відображенням одного простору в іншому. Тому якщо відображення простору А в просторі В можливо, то допустимість відображення простору В в просторі А — не гарантується.