ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 08.11.2023
Просмотров: 509
Скачиваний: 4
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
11.5.3. Вычисление определителей. Затруднительно вычислять определите- ли, используя только определение. Рассмотрим определитель для матрицы A поряд- ка n вида (11.5.2). Для натурального числа k, удовлетворяющего условию 1 6 k 6
n − 1, выбираем в определителе (11.5.5) произвольные k строк и k столбцов. Элемен- ты, стоящие на пересечении этих строк и столбцов, составляют, очевидно, матрицу порядка k. Определитель этой матрицы называется минором порядка k нашего опре- делителя.
Определение 11.5.9. Рассмотрим в определителе некоторый минор M поряд- ка k. Если мы вычеркнем те строки и столбцы, на пересечении которых стоит этот минор, то останется минор M
′
порядка n − k, который называется допол- нительным минором для минора M .
Определение 11.5.10. Если минор M расположен в строках с номерами i
1
, i
2
,
. . . , i k
и в столбцах с номерами j
1
, j
2
, . . . , j k
, то назовем алгебраическим дополне- нием минора M его дополнительный минор M
′
, взятый со знаком "+" или "−" в зависимости от того, четна или нечетна сумма номеров всех строк и столбцов,
в которых расположен минор M , т.е. сумма s
M
= i
1
+ i
2
+ · · · + i k
+ j
1
+ j
2
+ · · · + j k
Иными словами, алгебраическим дополнением для минора M будет число (−1)
s
M
M
′
Теорема 11.5.5. Произведение любого минора M k-го порядка на его алгебра- ическое дополнение в определителе для матрицы A является алгебраической сум- мой, слагаемые которой, получающиеся от умножения членов минора M на взятые со знаком (−1)
s
M
члены дополнительного минора M
′
, будут некоторыми членами определителя, причем их знаки в этой сумме совпадают с теми знаками, с кото- рыми они входят в определитель.
Этот результат позволяет привести новое правило для вычисления определителя.
Если a ij
— элемент определителя, то через M
ij обозначим дополнительный минор этого элемента. Через A
ij обозначим алгебраическое дополнение элемента a ij
, т.е.
A
ij
= (−1)
i+j
M
ij
Теорема 11.5.6. Определитель для матрицы A равен d, где d = a i1
A
i1
+ a i2
A
i2
+ · · · + a in
A
in
Таким образом, определитель равен сумме произведений всех элементов произ- вольной его строки на их алгебраические дополнения. Аналогичное разложение спра- ведливо и для столбцов определителя.
Обобщая полученные разложения определителя по строке или столбцу, можно доказать теорему, говорящую о разложении определителя по нескольким строкам или столбцам.
Теорема 11.5.7 (правило Лапласа). Пусть в определителе порядка n произволь- но выбраны k строк (или k столбцов), 1 6 k 6 n −1. Тогда сумма произведений всех миноров k-го порядка, содержащихся в выбранных строках, на их алгебраические дополнения равна определителю d.
– 399 –
11.6. Системы линейных уравнений
Пусть задана система из s линейных уравнений с n неизвестными. Неизвестные мы будем обозначать символами x
1
, x
2
, . . . , x n
, уравнения будем считать перенумеро- ванными — первое, второе, ..., s-е, коэффициент из i-го уравнения при неизвестном x
j обозначим через a ij
, наконец, свободный член i-го уравнения обозначим через b i
Тогда наша система запишется в следующем виде:
a
11
x
1
+ a
12
x
2
+ · · · + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ · · · + a
2n x
n
= b
2
,
a s1
x
1
+ a s2
x
2
+ · · · + a sn x
n
= b s
(11.6.1)
Определение 11.6.1. Коэффициенты при неизвестных составляют прямо- угольную таблицу, которая называется (прямоугольной) матрицей порядка s × n,
состоящей из s строк и n столбцов
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
s1
a s2
. . . a sn
.
(11.6.2)
Если s = n, то матрица квадратная. Квадратная матрица называется единич- ной, если элементы, стоящие на главной диагонали, равны 1, а остальные элементы матрицы равны 0.
Определение 11.6.2. Решением системы (11.6.1) называется такой набор чи- сел c
1
, c
2
, . . .,c n
, что каждое из уравнений системы (11.6.1) обращается в тожде- ство после замены в нем неизвестных x i
, соответственно, числами c i
, i = 1, . . . , n.
Определение 11.6.3. Система (11.6.1) называется совместной, если она име- ет хотя бы одно решение. Система называется несовместной, если она не имеет решений.
Определение 11.6.4. Совместная система называется определенной, если она обладает единственным решением, и неопределенной, если решений больше, чем одно.
11.6.1. Метод Гаусса. Сначала рассмотрим метод исключения неизвестных,
или метод Гаусса, решения системы (11.6.1).
Мы будем делать следующие преобразования над системой. Обе части одного уравнения, умноженные на одно и то же число c, мы будем вычитать из соответству- ющих частей другого уравнения. При этом получим новую систему. Тогда данные системы эквивалентны, т.е. они обе совместны или несовместны и обладают одними и теми же решениями.
Может случиться так, что при проведении последовательно нескольких таких преобразований появится уравнение, все коэффициенты левой части которого равны нулю. Если при этом свободный член данного уравнения не равен 0, то полученная система (а значит, и первоначальная система) несовместна, если же свободный член равен нулю, то мы можем данное уравнение отбросить.
Метод Гаусса заключается в следующем. Рассмотрим первое уравнение в системе
(11.6.1). Если все коэффициенты и свободный член равны нулю, то мы его отбра- сываем. Тогда можно считать, что хотя бы один из коэффициентов уравнения не
– 400 –
равен 0. Изменяя порядок переменных (если нужно), можно считать, что a
11 6= 0.
Преобразуем систему (11.6.1), исключая неизвестное x
1
из всех уравнений, кроме первого. Для этого обе части первого уравнения умножаем на число a
21
a
11
и вычитаем из соответствующих частей второго уравнения. Затем обе части первого уравнения умножаем на a
31
a
11
и вычитаем из соответствующих частей третьего уравнения, и т.д.
Получим новую систему уравнений, эквивалентную первой, в которой все урав- нения, начиная со второго, не содержат неизвестного x
1
. С этими уравнениями мы поступаем точно так же, исключая x
2
, и т.д.
В конце концов придем к системе треугольного вида, в которой содержится урав- нение, имеющее ненулевой свободный член, а все коэффициенты которого равны
0. Тогда первоначальная система несовместна. В противном случае первоначальная система совместна.
Решая последнее уравнение в полученной системе, мы можем найти значение x n
(либо, если последнее уравнение состоит из более чем одного слагаемого, мы пе- ременному x n
придаем произвольное значение), затем переходим к предыдущему уравнению и т.д. В конце концов, мы найдем все решения системы (11.6.1).
11.6.2. Правило Крамера. Для квадратных систем можно рассмотреть дру- гой метод решения, так называемое правило Крамера.
11 6= 0.
Преобразуем систему (11.6.1), исключая неизвестное x
1
из всех уравнений, кроме первого. Для этого обе части первого уравнения умножаем на число a
21
a
11
и вычитаем из соответствующих частей второго уравнения. Затем обе части первого уравнения умножаем на a
31
a
11
и вычитаем из соответствующих частей третьего уравнения, и т.д.
Получим новую систему уравнений, эквивалентную первой, в которой все урав- нения, начиная со второго, не содержат неизвестного x
1
. С этими уравнениями мы поступаем точно так же, исключая x
2
, и т.д.
В конце концов придем к системе треугольного вида, в которой содержится урав- нение, имеющее ненулевой свободный член, а все коэффициенты которого равны
0. Тогда первоначальная система несовместна. В противном случае первоначальная система совместна.
Решая последнее уравнение в полученной системе, мы можем найти значение x n
(либо, если последнее уравнение состоит из более чем одного слагаемого, мы пе- ременному x n
придаем произвольное значение), затем переходим к предыдущему уравнению и т.д. В конце концов, мы найдем все решения системы (11.6.1).
11.6.2. Правило Крамера. Для квадратных систем можно рассмотреть дру- гой метод решения, так называемое правило Крамера.
1 ... 32 33 34 35 36 37 38 39 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Пусть в системе (11.6.1) число уравнений совпадает с числом неизвестных, т.е.
n = s. Рассмотрим матрицу A для этого случая и обозначим через d определитель этой матрицы.
Теорема 11.6.1 (правило Крамера). Если d 6= 0, то система (11.6.1) имеет единственное решение c
1
, c
2
, . . . , c n
, определяемое по формулам c
j
=
d j
d
,
j = 1, . . . , n,
где d j
— определитель матрицы, получающейся из матрицы A заменой j-го столб- ца столбцом из свободных членов b
1
, . . . , b n
Если d = 0, а хотя бы один из определителей d j
не равен нулю, то система
(11.6.1) несовместна.
11.7. Операции над матрицами
Напомним, что матрицей A порядка m × n называется прямоугольная таблица чисел
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
Элементы матрицы a ik являются вещественными или комплексными числами. Мат- рицу A мы будем обозначать также ka ik k, где i указывает номер столбца, а k — номер строки.
Если m = n, т.е. матрица A квадратная, то определитель матрицы A мы будем обозначать |A| или det A.
Определение 11.7.1. Квадратная матрица, у которой все элементы, располо- женные вне главной диагонали, равны 0, называется диагональной.
– 401 –
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
то скалярное произведение этих векторов примет вид ab = x
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
x − x
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
и расширенную матрицу системы (11.9.6)
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
то aϕ =
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
11.7.1. Сумма матриц. Определим основные операции над матрицами: сложе- ние матриц, умножение матрицы на число и умножение матриц.
Пусть величины y
1
, y
2
, . . . , y m
выражаются через величины x
1
, x
2
, . . . , x n
при по- мощи преобразования y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , m,
(11.7.1)
а величины z
1
, z
2
, . . . , z m
выражаются через x
1
, x
2
, . . . , x n
с помощью преобразования z
i
=
n
X
k=1
b ik x
k
,
i = 1, 2, . . . , m.
Тогда очевидно, что y
i
+ z i
=
n
X
k=1
(a ik
+ b ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим вводится
Определение 11.7.2. Суммой двух прямоугольных матриц A = ka ik k и B =
kb ik k одинаковых размеров m×n называется матрица C = kc ik k, элементы которой равны c
ik
= a ik
+ b ik
,
i = 1, 2, . . . , m; k = 1, 2, . . . , n,
и обозначается так:
C = A + B.
Из свойств чисел получаем, что сложение матриц обладает следующими свой- ствами:
1) A + B = B + A — коммутативность;
2) (A + B) + C = A + (B + C) — ассоциативность;
3) нулевым элементом является матрица O, целиком составленная из нулей, A +
O = O + A = A;
4) противоположной матрицей −A для матрицы A является матрица k − a ik k,
тогда A + (−A) = O.
Так что обычным образом можно определить вычитание матриц A − B = A +
(−B).
11.7.2. Умножение матрицы на число. Умножим в преобразовании (11.7.1)
все величины y
1
, y
2
, . . . , y m
на некоторое число α, тогда
αy i
=
n
X
k=1
(αa ik
)x k
,
i = 1, 2, . . . , m.
В соответствии с этим имеем
Определение 11.7.3. Произведением матрицы A = ka ik k на число α называет- ся матрица C = kc ik k, элементы которой имеют вид c
ik
= αa ik
,
i = 1, 2, . . . , m, k = 1, 2, . . . , n.
Обозначается это так: C = αA.
– 402 –
Из свойств произведения чисел получаем следующие свойства произведения мат- рицы на число:
1) α(A + B) = αA + αB;
2) (α + β)A = αA + βA;
3) (αβ)A = α(βA);
4) αO = O.
11.7.3. Произведение матриц. Пусть теперь величины z
1
, z
2
, . . . , z q
выража- ются через величины y
1
, y
2
, . . . , y m
с помощью преобразования z
j
=
m
X
i=1
b ji y
i
,
j = 1, 2, . . . , q,
а величины y
1
, y
2
, . . . , y m
выражаются через x
1
, x
2
, . . . , x n
преобразованием (11.7.1).
Тогда z
j
=
m
X
i=1
b ji n
X
k=1
a ik
!
=
=
n
X
k=1
m
X
i=1
b ji a
ik
!
x k
,
j = 1, 2, . . . , q.
В соответствии с этим имеет место
Определение 11.7.4. Произведением двух матриц
B =
b
11
b
12
. . . b
1m b
21
b
22
. . . b
2m b
q1
b q2
. . . b qm
,
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
называется матрица
C =
c
11
c
12
. . . c
1n c
21
c
22
. . . c
2n c
q1
c q2
. . . c qn
,
элементы которой равны c
jk
=
m
X
i=1
b ji a
ik
,
j = 1, 2, . . . , q, k = 1, 2, . . . , n.
Обозначается это произведение как
C = BA.
Таким образом, произведение матриц определено, если число столбцов первого множителя равно числу строк второго множителя. В частности, если матрицы квад- ратные, то их размеры должны совпадать.
Нетрудно проверить справедливость следующих свойств произведения матриц:
1) (AB)C = A(BC) — ассоциативность умножения;
2) A(B +C) = AB +BC, (A+B)C = AC +BC — дистрибутивность умножения.
В общем, операция умножения некоммутативна даже для квадратных матриц.
Пример 11.7.1. Найти произведение матриц
1 2 3 4
2 0
3 −1
,
2 0
3 −1
1 2 3 4
– 403 –
Решение. Имеем
1 2 3 4
2 0
3 −1
=
8
−2 18 −4
,
2 0
3 −1
1 2 3 4
=
2 4 0 2
Если же выполняется равенство AB = BA, то матрицы A и B называются пере- становочными или коммутирующими.
11.7.4. Обратная матрица. Рассмотрим теперь класс квадратных матриц по- рядка n × n и определим понятия единичной матрицы и обратной матрицы.
Определение 11.7.5. Единичной матрицей E называется диагональная мат- рица, у которой все элементы, стоящие на главной диагонали, равны 1, т.е.
E =
1 0 . . . 0 0 1 . . . 0 0 0 . . . 1
.
Очевидно, что для любой квадратной матрицы A выполнено равенство AE =
EA = A.
Определение 11.7.6. Квадратная матрица A называется особенной или вы- рожденной, если |A| = 0. Если же определитель |A| 6= 0, то матрица A называется неособенной или невырожденной.
Пусть матрица A = ka ik k, i, k = 1, 2, . . . , n, является невырожденной. Введем преобразование y
i
=
n
X
k=1
a ik x
k
,
i = 1, 2, . . . , n.
(11.7.2)
Рассматривая равенства (11.7.2) как уравнения относительно x
1
, x
2
, . . . , x n
и за- мечая, что по условию определитель этой системы отличен от нуля, мы (по правилу
Крамера) можем однозначно выразить величины x i
через величины y k
, а именно:
x i
=
1
|A|
a
11
. . . a
1,i−1
y
1
a
1,i+1
. . . a
1n a
21
. . . a
2,i−1
y
2
a
2,i+1
. . . a
2n a
n1
. . . a n,i−1
y n
a n,i+1
. . . a nn
=
=
n
X
k=1
a
(−1)
ik y
k
,
i = 1, 2, . . . , n.
Таким образом, мы получили "обратное" преобразование для преобразования
(11.7.2).
Определение 11.7.7. Матрица из коэффициентов этого преобразования
A
−1
= ka
(−1)
ik k
называется обратной матрицей для матрицы A.
– 404 –
Коэффициенты обратной матрицы легко выписываются:
a
(−1)
ik
=
A
ki
|A|
,
i, k = 1, 2, . . . , n,
где A
ki
— алгебраические дополнения элементов a ki в матрице A.
Пользуясь свойствами определителя, получим, что
A
−1
A = A A
−1
= E.
Теорема 11.7.1. Если A и B — квадратные матрицы одного порядка, то
|AB| = |A| |B|.
В частности, определители взаимно обратных матриц есть взаимно обратные числа.
11.8. Прямые на плоскости и в пространстве
11.8.1. Векторная алгебра в R
3
. Напомним некоторые понятия векторной ал- гебры в R
3
. Во множестве векторов введены операции суммы векторов и умножения на (вещественное) число.
Определение 11.8.1. Линейной комбинацией векторов a
1
, . . . , a n
называется выражение вида
α
1
a
1
+ · · · + α
n a
n
,
(11.8.1)
где α
1
, . . . , α
n
— произвольные вещественные числа.
Определение 11.8.2. Векторы a
1
, . . . , a n
называются линейно зависимыми, ес- ли найдутся вещественные числа α
1
, . . . , α
n
, из которых хотя бы одно отлично от нуля, такие, что линейная комбинация этих векторов (вида (11.8.1)) является нулевым вектором.
Векторы, не являющиеся линейно зависимыми, называются линейно независи- мыми.
Если в набор векторов входит нулевой вектор 0, то такой набор является линейно зависимым.
Необходимым и достаточным условием линейной зависимости двух векторов слу- жит их колинеарность.
Необходимое и достаточное условие линейной зависимости трех векторов — их компланарность.
Напомним, что скалярным произведением двух векторов a, b считается число,
равное произведению их длин и косинуса угла ϕ между ними:
a · b = ab = |a| · |b| · cos ϕ.
Можно дать другое, эквивалентное данному, определение скалярного произведе- ния.
Определение 11.8.3. Скалярное произведение двух векторов — это число, рав- ное произведению длины одного из этих векторов на проекцию другого на ось, опре- деляемую первым вектором.
Если векторы a, b заданы своими координатами a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
},
– 405 –
1
x
2
+ y
1
y
2
+ z
1
z
2
Важным свойством скалярного произведения является следующее тождество:
aa = |a|
2
, показывающее, что скалярный квадрат есть квадрат длины вектора. По- этому скалярный квадрат положителен, если вектор a ненулевой.
Необходимым и достаточным условием ортогональности двух векторов служит условие равенства нулю их скалярного произведения.
Рассмотрим теперь векторное произведение двух векторов.
Определение 11.8.4. Тройка трех некомпланарных векторов a, b, c называ- ется правой, если выполнено одно из трех следующих условий:
1) будучи приведены к общему началу, эти векторы располагаются так, как могут быть расположены, соответственно, большой, несогнутый указательный и средний пальцы правой руки;
2) если, находясь внутри телесного угла, образованного приведенными к общему началу векторами a, b, c, поворот от a к b и от него к c совершается против часовой стрелки;
3) если после приведения к общему началу вектор c располагается по ту сторону от плоскости, определяемой векторами a и b, откуда кратчайший поворот от a к b кажется совершающимся против часовой стрелки.
Аналогично дается определение левой тройки векторов.
Наша система координат правая, т.е. базисные векторы i, j, k образуют правую тройку.
Определение 11.8.5. Векторным произведением вектора a на вектор b назы- вается вектор c, обозначаемый a × b или [a, b] и удовлетворяющий следующим тре- бованиям:
1) длина вектора c равна произведению длин векторов a и b и синуса угла ϕ
между ними, т.е.
|c| = |a| · |b| · sin ϕ;
2) вектор c ортогонален к каждому из векторов a и b;
3) вектор c направлен так, что тройка векторов a, b, c — правая.
Если векторы a, b колинеарны, то вектор c = a × b равен нулю.
Из определения 11.8.5 следует, что длина векторного произведения равна площа- ди параллелограмма, построенного на векторах a и b, если они приведены к общему началу.
Отметим также, что при перестановке сомножителей в векторном произведении знак этого произведения меняется на противоположный.
Определение 11.8.6. Смешанным произведением трех векторов a, b, c назы- вается число (a ×b)c, другими словами, это число, равное скалярному произведению вектора a × b на вектор c.
Основным свойством смешанного произведения является то, что оно есть объ- ем параллелепипеда, который построен на векторах a, b, c, приведенных к общему началу. Этот объем берется со знаком "+" , если векторы a, b, c образуют правую тройку, и со знаком "−" , если векторы a, b, c образуют левую тройку. Если векторы a, b, c компланарны, то их смешанное произведение равно нулю.
– 406 –
Полезны формулы, выражающие векторное и смешанное произведения в декар- товых координатах.
Пусть a = {x
1
, y
1
, z
1
}, b = {x
2
, y
2
, z
2
}, c = {x
3
, y
3
, z
3
},
тогда a × b = {y
1
z
2
− y
2
z
1
, z
1
x
2
− z
2
x
1
, x
1
y
2
− x
2
y
1
} =
=
i j
k x
1
y
1
z
1
x
2
y
2
z
2
,
а
(a × b)c =
x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
Как следствия из этих формул получаем, что векторы a и b колинеарны тогда и только тогда, когда их координаты пропорциональны, т.е.
x
1
x
2
=
y
1
y
2
=
z
1
z
2
В свою очередь три вектора — a, b, c — компланарны тогда и только тогда, когда определитель x
1
y
1
z
1
x
2
y
2
z
2
x
3
y
3
z
3
= 0.
11.8.2. Прямые на плоскости. Рассмотрим теперь различные способы зада- ния прямой на плоскости.
Общее уравнение прямой имеет вид ax + by + c = 0.
Здесь вектор {a, b} является вектором, ортогональным к этой прямой.
Как частные случаи получаем при c = 0 уравнение прямой, проходящей через начало координат,
ax + by = 0,
при a = 0 — уравнение прямой, параллельной оси OX,
by + c = 0,
при b = 0 — уравнение прямой, параллельной оси OY ,
ax + c = 0.
Уравнение прямой в отрезках x
a
+
y b
= 1.
Здесь a и b равны величине отрезков, отсекаемых данной прямой на осях координат.
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {a, b},
ортогональный прямой, то уравнение прямой примет вид a(x − x
0
) + b(y − y
0
) = 0.
– 407 –
Если известны точка (x
0
, y
0
), через которую проходит прямая, и вектор {l, m},
параллельный прямой, то уравнение прямой примет вид x − x
0
l
=
y − y
0
m
(11.8.2)
Уравнение (11.8.2) называется каноническим уравнением прямой.
Из канонического уравнения легко получается параметрическое уравнение пря- мой:
x = x
0
+ lt,
y = y
0
+ mt,
t ∈ (−∞, +∞).
Рассмотрим прямую, не параллельную оси OX, тогда ее уравнение можно запи- сать как y = kx + b,
где k — угловой коэффициент, численно равный тангенсу угла наклона этой прямой к оси OX.
И наконец, уравнение прямой, проходящей через данную точку (x
0
, y
0
) с данным угловым коэффициентом k, имеет вид y − y
0
= k(x − x
0
).
Различные способы задания прямых используются при решении различных задач на прямую линию. Рассмотрим некоторые из них.
Нахождение угла между прямыми. Если две прямые L
1
и L
2
заданы общими уравнениями a
1
x + b
1
y + c
1
= 0,
a
2
x + b
2
y + c
2
= 0
соответственно, то из свойств скалярного произведения следует, что косинус угла ϕ
между прямыми равен cos ϕ =
a
1
a
2
+ b
1
b
2
p a
2 1
+ b
2 1
·
p a
2 2
+ b
2 2
В частности, условие параллельности этих прямых примет вид a
1
a
2
=
b
1
b
2
,
а условие перпендикулярности —
a
1
a
2
+ b
1
b
2
= 0.
Расстояние d от точки (x
1
, y
1
) до прямой ax + by + c = 0
вычисляется по формуле d =
|ax
1
+ by
1
+ c|
√
a
2
+ b
2
– 408 –
11.8.3. Плоскости и прямые в пространстве. По аналогии с уравнением прямой на плоскости мы можем классифицировать уравнения плоскости в простран- стве следующим образом.
Общее уравнение плоскости имеет вид ax + by + cz + d = 0,
где вектор {a, b, c} ортогонален этой плоскости.
Уравнение плоскости, проходящей через заданную точку (x
0
, y
0
, z
0
) и перпенди- кулярной заданному вектору {a, b, c}, примет вид a(x − x
0
) + b(y − y
0
) + c(z − z
0
) = 0.
Уравнение плоскости в отрезках дается формулой x
a
+
y b
+
z c
= 1,
здесь a, b, c — величины отрезков, отсекаемых этой плоскостью на осях координат.
Прямая линия в пространстве задается двумя линейными уравнениями a
1
x + b
1
y + c
1
z + d
1
= 0,
a
2
x + b
2
y + c
2
z + d
2
= 0,
причем векторы {a
1
, b
1
, c
1
} и {a
2
, b
2
, c
2
} должны быть линейно независимыми для того, чтобы плоскости, определяемые данными уравнениями, пересекались.
Отсюда нетрудно получить канонические уравнения прямой x − x
0
l
=
y − y
0
m
=
z − z
0
n
,
где (x
0
, y
0
, z
0
) — точка, через которую данная прямая проходит, а вектор {l, m, n} —
вектор, параллельный прямой.
Параметрические уравнения прямой (при тех же обозначениях) имеют вид x = x
0
+ lt,
y = y
0
+ mt,
z = z
0
+ nt,
t ∈ (−∞, +∞).
Важными уравнениями являются уравнения прямой, проходящей через две за- данных точки (x
0
, y
0
, z
0
) и (x
1
, y
1
, z
1
) :
x − x
0
x
1
− x
0
=
y − y
0
y
1
− y
0
=
z − z
0
z
1
− z
0
С помощью различных типов уравнений можно решать различные задачи на пря- мые и плоскости в пространстве. Рассмотрим некоторые из них.
Расстояние p от точки (x
0
, y
0
, z
0
) до плоскости ax + by + cz + d = 0
определяется формулой p =
|ax
0
+ by
0
+ cz
0
+ d|
√
a
2
+ b
2
+ c
2
Угол ϕ между прямыми, заданными каноническими уравнениями x − x
1
l
1
=
y − y
1
m
1
=
z − z
1
n
1
,
– 409 –
2
l
2
=
y − y
2
m
2
=
z − z
2
n
2
,
находят по формуле cos ϕ =
l
1
l
2
+ m
1
m
2
+ n
1
n
2
p l
2 1
+ m
2 1
+ n
2 1
·
p l
2 2
+ m
2 2
+ n
2 2
Как следствие, получаем, что условие параллельности прямых примет вид l
1
l
2
=
m
1
m
2
=
n
1
n
2
,
а условие перпендикулярности —
l
1
l
2
+ m
1
m
2
+ n
1
n
2
= 0.
11.9. Ранг матрицы. Теорема Кронекера-Капелли
11.9.1. Векторное пространство R
n
. В школьном курсе математики обычно имеют дело с векторами, заданными или на плоскости, или в пространстве. Рассмот- рим векторы, заданные в R
n
По определению, это пространство состоит из упорядоченных наборов n веще- ственных чисел a = (a
1
, a
2
, . . . , a n
),
a
1
, a
2
, . . . , a n
∈ R.
(11.9.1)
Выражение (11.9.1) называется n-мерным вектором. Определим операции над векторами. Если a — вектор вида (11.9.1), а b = (b
1
, b
2
, . . . , b n
),
то суммой векторов a и b называется вектор c вида c = a + b = (a
1
+ b
1
, a
2
+ b
2
, . . . , a n
+ b n
).
Произведение вектора a на число λ ∈ R определяется так:
λa = (λa
1
, λa
2
, . . . , λa n
).
Из свойств вещественных чисел нетрудно получить следующие свойства операций над векторами:
1) a + b = b + a — коммутативность сложения;
2) (a + b) + c = a + (b + c) — ассоциативность сложения;
3) вектор 0 = (0, 0, . . . , 0) является нулевым вектором, т.е. a + 0 = 0 + a = a;
4) для данного вектора a вида (11.9.1) вектор −a = (−1)a является противопо- ложным вектором, т.е. a + (−a) = (−a) + a = 0;
5) λ(a + b) = λa + λb;
6) (λ + µ)a = λa + µa;
7) 1 · a = a;
8) λ · 0 = 0.
Совокупность n-мерных векторов с введенными операциями сложения и умноже- ния на число образует n–мерное векторное пространство R
n
В дальнейшем мы рассмотрим более общие линейные (векторные) пространства,
чем R
n
Введем важные понятия линейной зависимости и линейной независимости векто- ров из R
n
– 410 –
Определение 11.9.1. Система векторов a
1
, a
2
, . . . , a m
называется линейно за- висимой, если существуют такие вещественные числа λ
1
, λ
2
, . . . , λ
m
, не равные од- новременно нулю, что
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0.
(11.9.2)
Выражение, стоящее в левой части формулы (11.9.2), называется линейной ком- бинацией векторов.
Определение 11.9.2. Система векторов a
1
, a
2
, . . . , a m
называется линейно независимой, если из того, что линейная комбинация этих векторов обращается в нуль
λ
1
a
1
+ λ
2
a
2
+ . . . + λ
m a
m
= 0,
следует, что все числа λ
1
, λ
2
, . . . , λ
m обращаются в 0.
Другое, эквивалентное данному, определение линейной зависимости векторов можно дать так. Система векторов a
1
, a
2
, . . . , a m
линейно зависима, если хотя бы один вектор из этой системы является линейной комбинацией остальных векторов.
Если в систему векторов входит нулевой вектор, то такая система векторов всегда линейно зависима.
В пространстве R
n существует система из n линейно независимых векторов. На- пример,
e
1
= (1, 0, 0, . . . , 0),
e
2
= (0, 1, 0, . . . , 0),
e
3
= (0, 0, 1, . . . , 0),
e n
= (0, 0, 0, . . . , 1).
Теорема 11.9.1. В пространстве R
n всякая система из m векторов при m > n линейно зависима. Любая линейно независимая система содержит не более чем n векторов.
Определение 11.9.3. Система линейно независимых векторов называется максимальной, если добавление к ней любого другого вектора делает систему ли- нейно зависимой.
Система векторов e
1
, e
2
, . . . , e n
является максимальной линейно независимой си- стемой.
Всякая линейно независимая система векторов в R
n может быть дополнена до максимальной линейно независимой системы. Более того, справедливо следующее утверждение.
Теорема 11.9.2. Если в R
n даны две системы векторов a
1
, a
2
, . . . , a m
(11.9.3)
и b
1
, b
2
, . . . , b s
,
(11.9.4)
причем система (11.9.3) линейно независима, а каждый вектор из (11.9.4) явля- ется линейной комбинацией векторов системы (11.9.3), то выполнено неравенство m 6 s.
Следствие 11.9.1. Максимальные линейно независимые системы векторов в
R
n имеют одинаковое число векторов n, и любой другой вектор является линейной комбинацией векторов максимальной системы.
– 411 –
Определение 11.9.4. Максимальная линейно независимая система векторов называется базисом пространства R
n
Определение 11.9.5. Пусть дана некоторая система векторов вида (11.9.3).
Рангом системы (11.9.3) называется число векторов, образующих максимальную линейно независимую подсистему системы (11.9.3).
Из теоремы 11.9.2 следует, что ранг системы векторов определяется однозначно,
так как все максимальные линейно независимые подсистемы данной системы имеют одинаковую размерность.
11.9.2. Ранг матрицы. Дадим определение ранга произвольной прямоуголь- ной матрицы A вида
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
.
(11.9.5)
Столбцы этой матрицы могут рассматриваться как m-мерные векторы в R
m
Определение 11.9.6. Ранг системы векторов, состоящей из столбцов матри- цы A, называется рангом матрицы A.
Конечно, такую же процедуру нахождения ранга системы можно проделать и со строчками матрицы A. Справедливы утверждения.
Теорема 11.9.3. Ранг матрицы A вида (11.9.5) равен рангу системы векторов,
составленной из строчек A.
Теорема 11.9.4 (о ранге матрицы). Ранг матрицы A равен порядку наибольшего по размерности минора A, отличного от нуля.
Как следствие, для квадратной матрицы получаем, что если определитель этой матрицы равен нулю, то между столбцами (и между строками) существует линейная зависимость.
11.9.3. Теорема Кронекера-Капелли. Теорема о ранге позволяет полностью исследовать вопрос о решении системы линейных уравнений. Рассмотрим следую- щую систему уравнений:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= b
1
,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= b
2
,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= b m
(11.9.6)
Здесь x
1
, x
2
, . . . , x n
— неизвестные, все остальные числа даны. Рассмотрим мат- рицу A, составленную их коэффициентов системы (11.9.6), т.е.
A =
a
11
a
12
. . . a
1n a
21
a
22
. . . a
2n a
m1
a m2
. . . a mn
,
– 412 –
A =
a
11
a
12
. . . a
1n b
1
a
21
a
22
. . . a
2n b
2
a m1
a m2
. . . a mn b
m
.
Размерность матрицы A равна m×n, а размерность матрицы A равна m×(n+1).
Теорема 11.9.5 (Кронекер-Капелли). Система уравнений вида (11.9.6) сов- местна тогда и только тогда, когда ранг матрицы A равен рангу расширенной матрицы A.
Как следствие, получаем утверждение.
Следствие 11.9.2. Совместная система уравнений вида (11.9.6) тогда и толь- ко тогда имеет единственное решение, когда ранг матрицы A равен числу неиз- вестных.
Пример 11.9.1. Решить систему уравнений:
5x
1
− x
2
+ 2x
3
+
x
4
= 7,
2x
1
+
x
2
+ 4x
3
− 2x
4
= 1,
x
1
− 3x
2
− 6x
3
+ 5x
4
= 0.
Решение. Ранг матрицы из коэффициентов равен 2: минор второго порядка, сто- ящий в левом верхнем углу этой матрицы, отличен от нуля, а все миноры третьего порядка равны нулю (если мы из первой строки данной матрицы вычтем вторую,
умноженную на 2, то получим третью строку).
Ранг расширенной матрицы равен 3, так как минор вида
5 −1 7 2
1 1
1 −3 0
= −35 6= 0.
Следовательно, система несовместна.
Применим теорему Кронекера–Капелли для исследования однородной системы линейных уравнений
a
11
x
1
+ a
12
x
2
+ . . . + a
1n x
n
= 0,
a
21
x
1
+ a
22
x
2
+ . . . + a
2n x
n
= 0,
a m1
x
1
+ a m2
x
2
+ . . . + a mn x
n
= 0.
(11.9.7)
Пусть матрица A из коэффициентов системы (11.9.7) имеет ранг r. Если r = n, то система (11.9.7) имеет единственное нулевое решение. Если r < n, то система имеет решения, отличные от нулевого.
Обозначим множество решений однородной системы через N. Это множество об- ладает следующими свойствами:
1) если вектора x и y принадлежат N, то и вектор x + y принадлежит N;
2) если вектор x принадлежит N, то для любого числа λ вектор λx тоже принад- лежит N.
Таким образом, N является подпространством пространства R
n
Определение 11.9.7. Максимальная линейно независимая система векторов из N называется фундаментальной системой решений системы (11.9.7).
– 413 –
Ее размерность (т.е. размерность подпространства N) равна n − r.
Наконец, чтобы найти все решения неоднородной системы (11.9.6), нужно про- делать следующее: найти фундаментальную систему векторов подпространства N
решений однородной системы (11.9.7) и хотя бы одно решение x неоднородной си- стемы. Тогда любое другое решение неоднородной системы (11.9.6) является суммой вектора x и линейной комбинации векторов из фундаментальной системы решений однородного уравнения (11.9.7).
11.10. Кривые второго порядка
11.10.1. Эллипс. Рассмотрим классические кривые второго порядка.
Определение 11.10.1. Эллипсом называется геометрическое место точек плоскости, для которых сумма расстояний до двух фиксированных точек F
1
и F
2
этой плоскости, называемых фокусами, есть величина постоянная.
O
a b
F
1
F
2
M
Рис 11.10.1. Эллипс
Очевидно, что если фокусы совпадают, то эллипс представляет собой окружность.
Для вывода канонического уравнения эллипса выберем начало координат в се- редине отрезка F
1
F
2
, ось OX направим по отрезку F
1
F
2
. Пусть координаты точек
F
1
, F
2
будут, соответственно, (−c, 0) и (c, 0), c > 0. Обозначим через 2a расстояние,
о котором говорится в определении, тогда a > c. Пусть точка M(x, y) — текущая точка эллипса, тогда по условию
F
1
M + F
2
M = 2a.
– 414 –
Отсюда получаем p
(x + c)
2
+ y
2
+
p
(x − c)
2
+ y
2
= 2a.
Возводя данное равенство в квадрат и преобразуя его, получим каноническое уравнение эллипса x
2
a
2
+
y
2
b
2
= 1,
(11.10.1)
где b
2
= a
2
− c
2
Нетрудно также показать, что любая точка M(x, y), координаты которой удовле- творяют уравнению (11.10.1), лежит на эллипсе (рис. 11.10.1).
Отметим некоторые свойства эллипса. Эллипс имеет две взаимно перпендику- лярные оси симметрии (называемые главными осями эллипса) и центр симметрии.
В случае канонического задания главными осями служат оси координат, а центром эллипса — начало координат.
Весь эллипс содержится внутри прямоугольника |x| 6 a, |y| 6 b.
Эллипс может быть получен путем равномерного сжатия окружности.
Определение 11.10.2. Эксцентриситетом эллипса называется величина e,
равная c
a
Для эллипса его эксцентриситет меньше 1 (для окружности он равен нулю).
Определение 11.10.3. Директрисой D
i эллипса, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.2. Гипербола. Аналогичным образом определяется гипербола.
Определение 11.10.4. Гиперболой называется геометрическое место точек плоскости, для которых абсолютная величина разности расстояний до двух фик- сированных точек F
1
и F
2
, называемых фокусами, есть величина постоянная.
Введем такую же систему координат, как в случае эллипса, для вывода канони- ческого уравнения гиперболы. Обозначим через 2a постоянную, о которой говорится в определении гиперболы, тогда a < c. Пусть M(x, y) — текущая точка гиперболы.
Имеем
|F
1
M − F
2
M | = 2a.
Отсюда p
(x + c)
2
+ y
2
−
p
(x − c)
2
+ y
2
= 2a.
Преобразуя данное уравнение, получаем каноническое уравнение гиперболы x
2
a
2
−
y
2
b
2
= 1,
где b
2
= c
2
− a
2
(рис. 11.10.2).
Свойства гиперболы таковы. Гипербола имеет две взаимно перпендикулярные оси симметрии (называемые главными осями гиперболы) и центр симметрии. При этом одна из этих осей пересекается с гиперболой в двух точках, называемых вершина- ми гиперболы. Эта ось называется действительной осью гиперболы. Другая ось не имеет общих точек с гиперболой и поэтому называется мнимой осью.
Таким образом, мнимая ось делит плоскость на две части, в которых располага- ются симметрично этой оси правая и левая ветви гиперболы.
– 415 –
Если гипербола задана своим каноническим уравнением, то действительная ось
— это ось OX, а мнимая — OY .
Фокусы гиперболы располагаются на ее действительной оси.
Гипербола имеет две наклонные асимптоты. В случае канонического задания это прямые y =
b a
x,
y = −
b a
x.
Определение 11.10.5. Эксцентриситетом гиперболы называется величина e,
равная c
a
O
F
1
F
2
M
Рис 11.10.2. Гипербола
Для гиперболы эксцентриситет больше 1.
Определение 11.10.6. Директрисой D
i гиперболы, отвечающей фокусу F
i
, i =
1, 2, называется прямая, проведенная перпендикулярно большей оси на расстоянии a
e от его центра.
11.10.3. Парабола. Тетья классическая кривая — это парабола.
Определение 11.10.7. Параболой называется геометрическое место точек плоскости, для которых расстояние до некоторой фиксированной точки F этой плоскости равно расстоянию до некоторой фиксированной прямой, также располо- женной в рассматриваемой плоскости.
Указанная в определении точка F называется фокусом параболы, а фиксирован- ная прямая — директрисой параболы.
– 416 –
Для вывода канонического уравнения параболы выберем начало координат в се- редине перпендикуляра F D, опущенного из фокуса на директрису, ось OX проведем по отрезку F D. Координаты точки F обозначим через (p/2, 0), а координаты точки
D — через (−p/2, 0), p > 0.
Если M(x, y) — текущая точка параболы, то из определения имеем r
x −
p
2
2
+ y
2
=
p
2
+ x.
Преобразуя данное уравнение, получаем каноническое уравнение параболы y
2
= 2px
(рис. 11.10.3).
O
D
F
M
Рис 11.10.3. Парабола
Парабола имеет ось симметрии, называемую осью параболы. Точка пересечения параболы с осью называется вершиной параболы.
В случае канонического задания осью параболы служит ось OX, а вершиной —
начало координат.
Вся парабола расположена в правой полуплоскости, директриса имеет уравнение y = −
p
2 11.10.4. Классификация кривых второго порядка. Рассмотрим теперь произвольное уравнение второго порядка на плоскости a
11
x
2
+ 2a
12
xy + a
22
y
2
+ 2a
13
x + 2a
23
y + a
33
= 0.
(11.10.2)
– 417 –
Прежде всего, параллельным переносом можно добиться того, что коэффициен- ты при x и y обратятся в нуль. При этом коэффициенты при старших степенях не изменятся. Изменится только свободный член. Итак, имеем уравнение a
11
x
2
+ 2a
12
xy + a
22
y
2
+ a
33
= 0.
(11.10.3)
Инвариантом уравнения (11.10.2) называется такая функция от коэффициентов уравнения, которая не меняется при переходе к другой декартовой системе коорди- нат.
Теорема 11.10.1. Величины
I
1
= a
11
+ a
22
,
I
2
=
a
11
a
12
a
12
a
22
,
I
3
=
a
11
a
12
a
13
a
12
a
22
a
23
a
13
a
23
a
33
являются инвариантами уравнения (11.10.2) относительно преобразования декар- товой системы координат.
В зависимости от знака инварианта I
2
кривые второго порядка делятся на сле- дующие типы:
1) эллиптический, если I
2
> 0;
2) гиперболический, если I
2
< 0;
3) параболический, если I
2
= 0.
Для кривой (11.10.3) начало координат служит центром симметрии. Таким обра- зом, кривая второго порядка всегда центрально симметрична. Этот центр симметрии называется центром кривой.
Он может быть один, тогда кривая называется центральной.
Можно показать, что кривые эллиптического и гиперболического типов и только они являются центральными.
В дальнейшем будем считать, что инвариант I
1
>
0. Этого всегда можно добиться умножением уравнения (11.10.2) на −1.
Теорема 11.10.2. Пусть уравнение (11.10.2) есть уравнение эллиптического типа и I
1
>
0. Тогда если I
3
< 0, то уравнение (11.10.2) представляет собой эл- липс, если I
3
= 0, то уравнению (11.10.2) удовлетворяют координаты только одной точки (вырожденный эллипс), если I
3
> 0, то уравнение (11.10.2) не имеет реше- ний (мнимый эллипс).
Теорема 11.10.3. Если уравнение (11.10.2) есть уравнение гиперболического типа, то при I
3 6= 0 оно представляет собой гиперболу, а при I
3
= 0 — пару пере- секающихся прямых (вырожденный случай).
Теорема 11.10.4. Уравнение (11.10.2) параболического типа при I
3 6= 0 пред- ставляет собой параболу, а при I
3
= 0 — либо пару действительных параллельных прямых, либо пару мнимых параллельных прямых.
11.11. Элементы дифференциальной геометрии
Рассмотрим некоторые вопросы, связанные с кривой. Докажем предварительно две полезные леммы.
– 418 –
Лемма 11.11.1. Пусть векторная функция r = r(t) имеет производную в точ- ке t
0
. Если длина вектора r(t) постоянна в некоторой окрестности точки t
0
, то вектор r
′
(t
0
) ортогонален вектору r(t
0
), т.е.
r
′
(t
0
) · r(t
0
) = 0.
(11.11.1)
Доказательство леммы следует из соотношения r
2
(t) ≡ c и правила дифферен- цирования скалярного квадрата.
2
Физическая интерпретация этой леммы состоит в том, что у материальной точки,
движущейся так, что она все время остается на поверхности сферы, ее скорость направлена по касательной к сфере и, следовательно, перпендикулярна радиусу–
вектору.
Пусть теперь вектор–функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
, причем r(t) 6= 0 в этой окрестности. Пусть точка t = t
0
+ ∆t также принадлежит этой окрестности для всех достаточно малых ∆t. Угол ϕ = ϕ(t)
есть угол между векторами r(t
0
) и r(t), |ϕ| 6 π. Будем считать, что ϕ(t) > 0 для
∆t > 0 и ϕ(t) 6 0 при ∆t < 0. В точке t
0
для приращения ∆ϕ функции ϕ имеем
∆ϕ = ϕ(t) − ϕ(t
0
) = ϕ(t),
поэтому всегда
∆ϕ
∆t
>
0.
Определение 11.11.1. Производная dϕ(t
0
)
dt называется угловой скоростью вра- щения векторной функции r(t) в точке t
0
и обозначается ω = ω(t
0
) = ω(t
0
, r(t)).
Заметим, что если выбрать противоположный отсчет углов, т.е. определить угол
ϕ между векторами r(t) и r(t
0
) как угол ψ = −ϕ, то очевидно, что dψ
dt
6 0,
ω(t
0
) =
dϕ
dt
= −
dψ
dt
=
dψ
dt
Таким образом, всегда
ω(t
0
) =
dϕ
dt
Лемма 11.11.2. Пусть векторная функция r = r(t) определена и непрерывна в некоторой окрестности точки t
0
и r(t
0
) 6= 0. Тогда, если в точке t
0
существует производная r
′
(t
0
), в этой точке существует угловая скорость вращения ω = ω(t
0
),
и она равна
ω =
1
r
2
(t
0
)
|r(t
0
) × r
′
(t
0
)| .
(11.11.2)
Следствие 11.11.1. Если в дополнение к условиям леммы длина вектора r(t)
постоянна в некоторой окрестности точки t
0
, то
ω =
|r
′
(t)|
|r(t)|
Доказательство. Так как длина вектора r(t) постоянна и r(t) 6= 0, то по фор- муле (11.11.1) угол ψ между векторами r(t) и r
′
(t) равен ±
π
2
. Поэтому | sin ψ| = 1.
Следовательно,
|r(t) × r
′
(t)| = |r(t)| · |r
′
(t)|.
Отсюда и из формулы (11.11.2) получаем требуемое.
2
– 419 –
Рассмотрим дважды дифференцируемую кривую γ без особых точек. Такая кри- вая спрямляема, и у нее существует параметризация r = r(s), в которой за параметр принята переменная длина дуги s. Пусть s
0
∈ [0, S], ∆s = s−s
0
, S — длина кривой, а
α = α(s) — угол между касательными к кривой γ в точках r(s
0
) и r(s
0
+ ∆s). Причем будем считать, что α(s) > 0 для ∆s > 0 и α(s) 6 0 для ∆s < 0, |α| 6
π
2
Пусть теперь t(s) =
dr(s)
ds
. Как было показано в § 4.8 (следствие 4.8.1), t(s) служит единичным вектором, параллельным касательной к кривой в соответствующей точке.
Поэтому угол ∆α = α(s) − α(s
0
) = α(s) является и углом между векторами t(s
0
) и
t(s
0
+ ∆s).
Определение 11.11.2. Угловая скорость вращения касательного единичного вектора t =
dr ds в данной точке кривой называется кривизной k(s
0
) кривой в этой точке:
k(s
0
) = ω(s
0
, t(s)) =
dα(s
0
)
ds
Кривая дважды дифференцируема, поэтому существует производная dt ds
=
d
2
r ds
2
,
а так как вектор t — единичный, то из следствия 11.11.1 имеем k =
dt ds
=
d
2
r ds
2
(11.11.3)
Определение 11.11.3. Величина, обратная кривизне, называется радиусом кривизны в данной точке и обозначается R, т.е. R = 1/k.
Пример 11.11.1. Пусть γ — окружность радиуса R. Найти ее кривизну.
Решение. В этом случае угол ∆α между касательными равен углу, образованно- му радиусами, проведенными в точку касания, а для длины дуги ∆s между этими точками справедлива формула
∆s = R∆α.
Поэтому
∆α
∆s
=
1
R
. Тогда и k = lim
∆s→0
∆α
∆s
=
1
R
Таким образом, в случае окружности ее кривизна k постоянна и равна величине,
обратной радиусу. Отсюда и произошел термин "радиус кривизны".
Обозначим через n единичный вектор в направлении вектора dt ds
. Из формулы
(11.11.3) следует, что вектор n однозначно определен лишь в тех точках кривой, в которых кривизна не равна нулю. И в этих точках dt ds
= k n.
(11.11.4)
Вектор t — единичный, поэтому его производная, а следовательно, и вектор n перпендикулярны ему.
Определение 11.11.4. Вектор n называется вектором главной нормали (коро- че — главной нормалью) к кривой γ в данной ее точке.
– 420 –
Теорема 11.11.1. Пусть γ — дважды гладкая кривая (т.е. дважды непрерывно дифференцируемая кривая без особых точек) с произвольной параметризацией r =
r(t), t ∈ [a, b]. Тогда в каждой ее точке существует кривизна k и вычисляется по следующей формуле:
k =
|r
′
× r
′′
|
|r
′
|
3
(11.11.5)
От формулы (11.11.5) легко перейти к выражению для кривизны в координатной записи:
k =
p
(y
′
z
′′
− z
′
y
′′
)
2
+ (z
′
x
′′
− x
′
z
′′
)
2
+ (x
′
y
′′
− y
′
x
′′
)
2
((x
′
)
2
+ (y
′
)
2
+ (z
′
)
2
)
3/2
(11.11.6)
Рассмотрим некоторые свойства вектора главной нормали n.
Определение 11.11.5. Всякая прямая, проходящая через точку кривой и пер- пендикулярная касательной в этой точке, называется нормалью к кривой в данной точке. Нормаль к кривой, параллельная вектору n, называется главной нормалью.
Определение 11.11.6. Плоскость, проходящая через касательную и главную нормаль, называется соприкасающейся плоскостью.
Найдем уравнение этой плоскости для кривой, заданной с помощью произволь- ной параметризации (как в теореме 11.11.1). Дифференцируя r = r(t) как сложную функцию r = r(s), s = s(t), получим из (11.11.4)
r
′
=
dr ds s
′
= s
′
t,
r
′′
= (s
′
)
2
dt ds
+ s
′′
t = (s
′
)
2
k n + s
′′
t.
(11.11.7)
Отсюда следует, что векторы r
′
и r
′′
также параллельны соприкасающейся плоскости и при k 6= 0 произведение r
′
× r
′′
6= 0. Поэтому r
′
и r
′′
не колинеарны. Обозначая
r
0
= r(t
0
), r
′
0
= r
′
(t
0
), r
′′
0
= r
′′
(t
0
), а r — текущий вектор соприкасающейся плоскости,
имеем уравнение
((r − r
0
) × r
′
0
)r
′′
0
= 0.
Расписывая данное смешанное произведение покоординатно, получим x − x
0
y − y
0
z − z
0
x
′
0
y
′
0
z
′
0
x
′′
0
y
′′
0
z
′′
0
= 0.
(11.11.8)
Это и есть уравнение соприкасающейся плоскости.
Определение 11.11.7. Точка в пространстве, лежащая на главной нормали,
проведенной в данной точке к кривой, и находящаяся от этой точки кривой на рас- стоянии R в направлении вектора главной нормали n, называется центром кри- визны кривой в указанной ее точке.
Таким образом, если ρ — радиус–вектор центра кривизны, а r, как обычно,
радиус–вектор данной точки кривой, то
ρ = r + R n или
ρ = r +
1
k
2
·
d
2
r ds
2
(11.11.9)
– 421 –
Нетрудно также получить выражение для ρ через произвольную параметриза- цию кривой. Эту формулу можно также рассматривать как представление некото- рой кривой, точками которой являются центры кривизны данной кривой. Эта кривая называется эволютой данной кривой.
Все сказанное, конечно, справедливо и для плоских кривых. Нужно только заме- тить, что если кривая лежит на плоскости, то касательный вектор t и вектор главной нормали лежат в той же плоскости. Запишем некоторые формулы для случая плос- кой кривой γ с параметризацией r = r(t) = (x(t), y(t)), t ∈ [a, b].
Из формулы (11.11.6) получаем k =
1
R
=
|x
′
y
′′
− y
′
x
′′
|
((x
′
)
2
+ (y
′
)
2
)
3/2
Обозначая через (ξ, η) центр кривизны, из (11.11.9) имеем
ξ = x + R
2
d
2
x ds
2
,
η = y + R
2
d
2
y ds
2
Вычисляя производные по s через производные по t, получаем
ξ = x − y
′
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
,
η = y + x
(x
′
)
2
+ (y
′
)
2
x
′
y
′′
− y
′
x
′′
(11.11.10)
В случае, когда кривая является графиком функции y = y(x), из формул (11.11.9)
и (11.11.10) имеем k =
|y
′′
|
(1 + (y
′
)
2
)
3/2
,
(11.11.11)
ξ = x − y
′
1 + (y
′
)
2
y
′′
,
η = y +
1 + (y
′
)
2
y
′′
(11.11.12)
Пример 11.11.2. Найти кривизну и эволюту параболы y = ax
2
, a > 0
(рис. 11.11.1).
Решение. Из формулы (11.11.11) имеем k =
2a
(1 + 4a
2
x
2
)
3/2
,
а формула (11.11.12) дает
ξ = −4a
2
x
3
,
η =
6a
2
x
2
+ 1 2a
O
Рис 11.11.1. Эволюта и эвольвента
– 422 –
Эта кривая является полукубической параболой.
Определение 11.11.8. Если γ — плоская кривая с эволютой γ
1
, то сама кривая
γ по отношению к своей эволюте называется эвольвентой.
Отметим следующие свойства эволюты и эвольвенты:
1) нормаль к эвольвенте является касательной к эволюте;
2) приращение длины дуги эволюты равно приращению радиуса кривизны эволь- венты.
Эти свойства имеют изящную механическую интерпретацию. Представим себе,
что на кривую γ
1
от точки P
0
до точки P натянута гибкая нерастяжимая нить,
закрепленная в точке P
0
. Если сматывать ее с кривой γ
1
, то ее конец опишет кривую
γ.
Таким образом, эвольвента кривой γ
1
получается как бы развертыванием данной кривой, поэтому эвольвенту кривой называют также ее разверткой.
11.12. Линейные пространства
Понятие n-мерного пространства R
n
, данное в §11.9, начиналось с n-мерного век- тора как упорядоченной системы n вещественных чисел. Примерами векторов слу- жат направленные отрезки на плоскости или в трехмерном пространстве. Однако не обязательно задавать векторы их координатами, так как операции над векторами определяются геометрически. Целесообразно и в общем случае дать "бескоординат- ное" определение векторов. Сейчас оно будет дано аксиоматически: в нем ничего не будет сказано о свойствах отдельного вектора, но будут перечислены свойства,
которыми должны обладать операции над векторами. Также совсем не обязательно рассматривать конечно мерные пространства.
Пусть дано непустое множество V . Его элементы будем обозначать малыми ла- тинскими буквами a, b, c, . . . . Пусть в этом множестве V определены операция сло- жения, ставящая в соответствие каждой паре элементов a, b, однозначно опреде- ленный элемент a + b, называемый их суммой, и операция умножения на число,
ставящее в соответствие числу α и элементу a ∈ V элемент αa ∈ V , называемый произведением элемента a на число α.
Определение 11.12.1. Элементы множества V называются векторами, а са- мо множество V — линейным (или векторным, или аффинным) пространством,
если указанные операции обладают следующими свойствами:
1) сложение коммутативно, a + b = b + a для любых векторов a, b ∈ V ;
2) сложение ассоциативно, (a+b)+c = a+(b+c) для любых элементов a, b, c ∈ V ;
3) в V существует нулевой элемент 0, удовлетворяющий условию a+0 = 0+a =
a для любого a ∈ V ;
4) для всякого элемента a ∈ V существует противоположный элемент −a ∈ V ,
удовлетворяющий условию a + (−a) = (−a) + a = 0;
5) для любых векторов a, b ∈ V и любых чисел α, β имеют место свойства
α(a + b) = αa + αb;
6) (α + β)a = αa + βa;
7) (αβ)a = α(βa);
8) 1 · a = a.
Если в качестве множества чисел берется множество всех вещественных чисел, то V называется вещественным (действительным) линейным простран- ством.
– 423 –
Если в качестве множества чисел рассматривается множество всех комплекс- ных чисел, то V называется комплексным линейным пространством.
Можно определять линейные пространства над другими числовыми множествами
(например, рациональными числами).
Как правило, будем иметь дело с вещественными линейными пространствами,
но все дальнейшие рассуждения справедливы и для комплексных линейных про- странств.
Примером вещественного линейного пространства является пространство R
n
. Его размерность конечна и равна n.
Пример 11.12.1. Рассмотрим бесконечномерное пространство V . В качестве эле- ментов a этого пространства возьмем всевозможные последовательности веществен- ных чисел a = (α
1
, α
2
, . . . , α
n
, . . .).
Операции над последовательностями будем производить покомпонентно: если b = (β
1
, β
2
, . . . , β
n
, . . .),
то a + b = (α
1
+ β
1
, α
2
+ β
2
, . . . , α
n
+ β
n
, . . .),
а
γa = (γα
1
, γα
2
, . . . , γα
n
, . . .).
Очевидно, что введенные таким образом операции превращают V в векторное про- странство (выполнены все аксиомы 1)–8)).
Это пространство бесконечномерно, так как в нем можно указать бесконечную систему векторов, любая конечная подсистема которой линейно независима. Напри- мер,
e
1
= (1, 0, . . . , 0, . . .),
e
2
= (0, 1, . . . , 0, . . .),
e n
= (0, 0, . . . , 1, . . .),
Из аксиом 1)–8) нетрудно вывести следующие свойства: единственность нулевого элемента, единственность противоположного элемента, существование и единствен- ность разности двух векторов a и b и т.д.
Определим важное понятие изоморфизма двух линейных пространств V и V
′
Определение 11.12.2. Два действительных линейных пространства V и V
′
называются изоморфными, если между ними установлено взаимно однозначное со- ответствие — всякому вектору a ∈ V сопоставлен однозначно вектор a
′
∈ V
′
, при- чем разным векторам из V соответствуют разные векторы из V
′
, и всякий вектор из V
′
служит образом некоторого вектора из V . И это соответствие обладает следующими свойствами: образом суммы двух векторов служит сумма образов
(a + b)
′
= a
′
+ b
′
,
а образом произведения вектора на число служит произведение образа этого век- тора на то же число
(αa)
′
= αa
′
– 424 –
Понятия линейной комбинации векторов, линейной зависимости и линейной неза- висимости системы векторов дословно переносятся со случая R
n
(см. §11.9) на общий случай.
Отметим следующее свойство: если линейные пространства V и V
′
изоморфны,
то система векторов a
1
, a
2
, . . . , a m
из V линейно зависима тогда и только тогда, когда линейно зависима система их образов a
′
1
, a
′
2
, . . . , a
′
n
Определение 11.12.3. Если в линейном пространстве нет максимальной ли- нейно независимой системы векторов, тогда пространство V называется беско- нечномерным.
Определение 11.12.4. Если в V существует максимальная линейно независи- мая система векторов, то такое пространство называется конечномерным, раз- мерностью пространства называется число векторов в этой максимально линейно независимой системе, а сама такая система называется базисом (или базой) про- странства V .
В дальнейшем в этом параграфе будем рассматривать конечномерные простран- ства, для изучения бесконечномерных пространств обычно привлекаются средства анализа (сходимость последовательностей элементов, топология этих пространств)
(см. параграф ниже).
Пусть линейное пространство V имеет базу e
1
, e
2
, . . . , e n
. Тогда любой вектор a ∈
V является линейной комбинацией векторов базы, т.е.
a = α
1
e
1
+ α
2
e
2
+ . . . + α
n e
n
(11.12.1)
для некоторых вещественных чисел α
1
, α
2
, . . . , α
n
В силу линейной независимости векторов базы, разложение (11.12.1) — однознач- но.
Поставим в соответствие каждому вектору a ∈ V элемент пространства R
n
, опре- деляемый разложением (11.12.1), т.е.
a → (α
1
, α
2
, . . . , α
n
).
Нетрудно показать, что это соответствие определяет изоморфизм пространств V
и R
n
. Тогда свойства пространства R
n переносятся на V . Сформулируем их.
Теорема 11.12.1. Все базы конечномерного пространства V состоят из оди- накового числа векторов, обозначим его n. Всякая система из n + 1 вектора в V
линейно зависима. Всякая линейно независимая система векторов из V может быть дополнена до некоторой базы этого пространства.
Посмотрим сейчас, как связаны между собой различные базы пространства V .
Пусть заданы две базы в V :
e
1
, e
2
, . . . , e n
(11.12.2)
и e
′
1
, e
′
2
, . . . , e
′
n
(11.12.3)
Каждый вектор базы (11.12.3) однозначно разлагается по элементам (11.12.2):
e
′
i
=
n
X
j=1
τ
ij e
j
,
i = 1, 2, . . . , n.
– 425 –
Квадратная матрица
T =
τ
11
τ
12
. . . τ
1n
τ
21
τ
22
. . . τ
2n
τ
n1
τ
n2
. . . τ
nn
,
строками которой служат коэффициенты разложения элементов базы (11.12.3) через базу (11.12.2), называется матрицей перехода от базы (11.12.2) к базе (11.12.3).
Связь между базами можно записать в матричной форме e
′
= T e,
где e (соответственно, e
′
) — вектор–столбец, составленный из элементов базы
(11.12.2) (соответственно, из элементов базы (11.12.3)).
С другой стороны, можно написать матрицу перехода от базы (11.12.3) к базе
(11.12.2):
e = T
′
e
′
Тогда получим e = (T
′
T )e и
e
′
= (T T
′
)e
′
Отсюда (в силу линейной независимости элементов базы) имеем
T T
′
= T
′
T = E,
где E, как обычно, единичная матрица.
Таким образом,
T
′
= T
−1
,
следовательно, матрица перехода невырождена.
Нетрудно показать и обратное: всякая невырожденная матрица задает матри- цу перехода от базиса (11.12.2) к новой системе векторов, которая также является базисом.
Рассмотрим базы (11.12.2) и (11.12.3), тогда произвольный вектор a ∈ V разлага- ется по элементам этих баз. Найдем связь между его разложениями в разных базах.
Пусть a =
n
X
j=1
α
j e
j и
a =
n
X
i=1
α
′
i e
′
i
Подставляя вместо e
′
i его разложение через базу (11.12.2), получим матричное ра- венство
(α
1
, α
2
, . . . , α
n
) = (α
′
1
, α
′
2
, . . . , α
′
n
)T.
Таким образом, справедливо свойство: строка координат вектора a в базе (11.12.2)
равна строке координат этого вектора в базе (11.12.3), умноженного справа на мат- рицу перехода T .
– 426 –
11.13. Линейные преобразования
Пусть задано преобразование ϕ линейного пространства V , т.е. отображение, пе- реводящее каждый вектор a из V в некоторый вектор a
′
этого же пространства:
ϕ : V → V.
Образ вектора a при отображении ϕ будем обозначать не как обычно ϕ(a) или
ϕa, а через aϕ.
Определение 11.13.1. Преобразование ϕ называется линейным, если
(a + b)ϕ = aϕ + bϕ,
a, b ∈ V
и
(αa)ϕ = α(aϕ),
α ∈ R, a ∈ V.
Из определения сразу получаем, что линейное преобразование переводит линей- ную комбинацию векторов в линейную комбинацию их образов с теми же числовыми коэффициентами.
Теорема 11.13.1. Для любого линейного преобразования ϕ нулевой вектор оста- ется неподвижным, т.е.
0ϕ = 0,
а образом противоположного вектора a служит вектор, противоположный образу,
т.е.
(−a)ϕ = −(aϕ).
Тождественное преобразование ε определяется так:
aε = a,
a ∈ V.
Нулевое преобразование ω есть следующее:
aω = 0,
a ∈ V.
Посмотрим, как можно представить произвольное линейное преобразование в некотором базисе e
1
, e
2
, . . . , e n
конечномерного действительного линейного простран- ства V
n
Так как всякий вектор a однозначно представим в виде линейной комбинации базисных векторов, то, в силу свойств линейного преобразования, образ вектора a с теми же коэффициентами выражается через образы базисных векторов. Иными сло- вами, всякое линейное преобразование ϕ однозначно определяется заданием образов e
1
ϕ, e
2
ϕ, . . . , e n
ϕ базисных векторов.
Теорема 11.13.2. Какова бы ни была упорядоченная система векторов c
1
, c
2
, . . . , c n
в пространстве V
n
, существует и притом единственное линейное преобразование
ϕ, такое, что e
i
ϕ = c i
,
i = 1, 2, . . . , n.
Доказательство. Это преобразование ϕ строится очень просто: если вектор a =
n
X
i=1
α
i e
i
,
– 427 –
n
X
i=1
α
i c
i
Нетрудно показать единственность этого преобразования и его линейность.
2
Всякий вектор c i
обладает определенным разложением по базисным векторам c
i
=
n
X
j=1
α
ij e
j
,
i = 1, 2, . . . , n.
Из координат векторов c i
можно составить матрицу
A =
α
11
α
12
. . . α
1n
α
21
α
22
. . . α
2n
α
n1
α
n2
. . . α
nn
.
(11.13.1)
Так как система векторов c
1
, c
2
, . . . , c n
была произвольной, то и матрица A будет произвольной.
Итак, из теоремы 11.13.2 получаем, что между квадратными матрицами порядка n и линейными преобразованиями пространства V
n существует взаимно однозначное соответствие.
Определение 11.13.2. Будем говорить, что матрица A вида (11.13.1) явля- ется матрицей линейного преобразования ϕ в базе e
1
, e
2
, . . . , e n
Матрица нулевого преобразования ω есть нулевая матрица O в любом базисе.
Матрица тождественного преобразования ε есть единичная матрица E в любом ба- зисе.
Если через e обозначить вектор–столбец из базисных векторов, а через eϕ —
вектор–столбец из их образов, то имеем матричное равенство eϕ = Ae.
(11.13.2)
Пусть вектор a имеет следующее разложение по базисным векторам:
a =
n
X
i=1
α
i e
i
,
тогда его образ примет вид aϕ =
n
X
i=1
α
i
(e i
ϕ).
Используя (11.13.2), получим aϕ = [(α
1
, α
2
, . . . .α
n
)A] e.
Таким образом, строка координат вектора aϕ равна строке координат вектора a,
умноженной справа на матрицу A линейного преобразования ϕ.
Посмотрим, как связаны матрицы линейного преобразования в разных базах.
Пусть даны две базы e и e
′
с матрицей перехода T :
e
′
= T e,
(11.13.3)
а линейное преобразование ϕ задается в этих базах матрицами A и A
′
, т.е.
eϕ = Ae,
e
′
ϕ = A
′
e
′
– 428 –
Подставляя (11.13.3) во второе из этих равенств, получим
(T e)ϕ = A
′
(T e).
С другой стороны,
(T e)ϕ = T (eϕ),
поэтому
(T e)ϕ = T (eϕ) = T (Ae) = (T A)e,
A
′
(T e) = (A
′
T )e.
Сравнивая последние равенства и используя свойство единственности разложения по базе, получаем
T A = A
′
T,
отсюда
A
′
= T AT
−1
,
A = T
−1
A
′
T.
Определение 11.13.3. Квадратные матрицы B и C одного порядка называют- ся подобными, если они связаны равенством
C = Q
−1
BQ,
где Q — некоторая невырожденная матрица.
Нами доказано утверждение.
Теорема 11.13.3. Матрицы, задающие одно и то же линейное преобразование в разных базах, подобны между собой.
Зафиксируем в пространстве V
n некоторую базу e. Нами было получено взаим- но однозначное соответствие между линейными преобразованиями и квадратными матрицами. Посмотрим, как связаны операции над матрицами и над линейными пре- образованиями.
Пусть заданы два линейных преобразования ϕ и ψ. Назовем суммой этих преоб- разований преобразование ϕ + ψ, определяемое следующим образом:
a(ϕ + ψ) = aϕ + aψ,
a ∈ V
n
Очевидно, что ϕ + ψ — линейное преобразование.
Назовем произведением линейных преобразований преобразование ϕψ:
a(ϕψ) = (aϕ)ψ.
Таким образом, произведение — это композиция отображений ϕ и ψ. Оно также является линейным преобразованием.
Наконец, назовем произведением линейного преобразования ϕ на число λ линейное преобразование λϕ следующего вида:
a(λϕ) = λ(aϕ),
a ∈ V
n
Нетрудно понять, что оно также линейно.
Теорема 11.13.4. Матрица суммы линейных преобразований равна сумме мат- риц этих преобразований. Матрица произведения линейных преобразований равна произведению матриц данных преобразований. Матрица произведения линейного преобразования на число равна матрице этого преобразования, умноженной на дан- ное число.
– 429 –
11.14. Собственные числа и собственные значения
11.14.1. Линейные подпространства. Подмножество L векторов из линейно- го пространства V называется линейным подпространством этого пространства,
если оно само является линейным пространством относительно операций, введенных в V .
Для того чтобы L было линейным подпространством V , достаточно выполнения следующих условий:
1) если векторы a и b лежат в L, то их сумма a + b также лежит в L;
2) если вектор a принадлежит L, то для любого числа α вектор αa принадлежит
L.
Примерами линейных подпространств служат: само пространство V , нулевое под- пространство, т.е. подмножество, состоящее из одного нулевого элемента.
Более интересен следующий пример: берем в V произвольную конечную систему векторов a
1
, a
2
, . . . , a k
(11.14.1)
и обозначаем через L всевозможные линейные комбинации этих векторов. Тогда L
— подпространство V . В этом случае говорят, что L порождено системой (11.14.1).
Размерность этого подпространства равна числу линейно независимых векторов системы (11.14.1), в частности, оно конечномерно.
В конечномерном пространстве V любое его подпространство конечномерно, т.е.
порождено конечной системой векторов вида (11.14.1). Причем для любого числа k, меньшего размерности пространства, найдется подпространство L размерности k.
Для этого достаточно рассмотреть подпространство, порожденное k линейно неза- висимыми векторами.
Пусть в V заданы два подпространства L
1
и L
2
. Тогда их пересечение L
1
∩ L
2
само образует подпространство. Для объединения это, вообще говоря, не так. Вместо объединения обычно рассматривают сумму подпространств L
1
+ L
2
По определению, сумма подпространств L
1
+ L
2
состоит из всех векторов вида a + b,
a ∈ L
1
, b ∈ L
2
1 ... 33 34 35 36 37 38 39 40 ... 43
Что можно сказать о размерности этих подпространств?
Теорема 11.14.1. Пусть L
1
и L
2
— конечномерные подпространства V размер- ности, соответственно, d
1
и d
2
. Тогда подпространства L
1
∩ L
2
и L
1
+ L
2
также конечномерны размерностей d
′
и d
′′
соответственно, причем выполнено равенство d
′
+ d
′′
= d
1
+ d
2
Доказательство. Берем произвольную базу пространства L
1
∩ L
2
:
a
1
, a
2
, . . . , a d
′
,
дополняем ее до баз подпространств L
1
a
1
, a
2
, . . . , a d
′
, b d
′
+1
, . . . , b d
1
и L
2
a
1
, a
2
, . . . , a d
′
, c d
′
+1
, . . . , c d
2
(11.14.2)
соответственно.
Тогда подпространство L
1
+ L
2
порождается системой векторов a
1
, a
2
, . . . , a d
′
, b d
′
+1
, . . . , b d
1
, c d
′
+1
, . . . , c d
2
(11.14.3)
– 430 –
Число векторов в системе (11.14.3) равно d
1
+ d
2
− d
′
, и теорема будет доказана,
если показать, что они — линейно независимы. Пусть имеет место равенство
α
1
a
1
+ α
1
a
2
+ . . . + α
d
′
a d
′
+ β
d
′
+1
b d
′
+1
+ . . . +
+β
d
1
b d
1
+ γ
d
′
+1
c d
′
+1
+ . . . + γ
d
2
c d
2
= 0.
Отсюда d = α
1
a
1
+ α
2
a
2
+ . . . + α
d
′
a d
′
+ β
d
′
+1
b d
′
+1
+ . . . + β
d
1
b d
1
=
= −γ
d
′
+1
c d
′
+1
− . . . − γ
d
2
c d
2
(11.14.4)
Левая часть этого равенства содержится в L
1
, правая часть — в L
2
. Поэтому век- тор d принадлежит L
1
∩ L
2
и, следовательно, линейно выражается через базы этого подпространства. Но равенство (11.14.4) показывает, что d есть линейная комбина- ция векторов c d
′
+1
, . . . , c d
2
. Так как система (11.14.2) линейно независима, получаем,
что все коэффициенты в равенстве (11.14.4) равны нулю. Тогда и все остальные ко- эффициенты равны нулю, т.е. система (11.14.3) линейно независима.
2
Пусть в n-мерном векторном пространстве V
n задано линейное преобразование ϕ.
Если L — любое подпространство V
n
, то множество Lϕ образов всех векторов из L
само образует подпространство. В частности, множество V
n
ϕ есть подпространство.
Оно называется областью значений преобразования ϕ.
Определение 11.14.1. Размерность области значений преобразования ϕ назы- вается рангом этого преобразования.
Можно показать, что ранг линейного преобразования совпадает с рангом матри- цы этого преобразования (в любом базисе пространства V
n
).
Совокупность N(ϕ) векторов a из V
n
, для которых aϕ = 0, называется ядром линейного преобразования.
Очевидно, ядро является линейным подпространством.
Определение 11.14.2. Размерность ядра линейного преобразования ϕ называ- ется дефектом линейного преобразования.
Из теоремы 11.14.1 вытекает
Следствие 11.14.1. Сумма ранга и дефекта любого линейного преобразования равна размерности пространства V
n
Линейное преобразование ϕ называется невырожденным, если ранг этого преоб- разования равен размерности пространства.
В силу следствия 11.14.1 невырожденные преобразования характеризуются тем,
что их дефект равен нулю.
Для невырожденных преобразований матрицы этих преобразований в любой базе также невырождены.
Так как невырожденное преобразование есть взаимно однозначное отображение пространства V
n на себя, то можно определить обратное отображение ϕ
−1
, которое также является линейным преобразованием.
11.14.2. Характеристические и собственные значения. Рассмотрим поня- тия характеристических и собственных значений линейного преобразования. Начнем с матриц.
– 431 –