-
행렬 곱은 함수의 합성이다.Math♾️/Linear Algebra 2025. 4. 2. 10:45
선형 변환 : 행렬은 함수다.
선형 변환이란 무엇인가? 먼저 '변환(transformation)'라는 용어부터 이해해볼까요? 변환은 사실 함수(function)의 또 다른 표현일 뿐입니다. 함수는 입력 값과 출력 값간의 관계를 정의합니다. 따라서
people-analysis.tistory.com
선형 변환의 기본 개념 복습
지난 글에서 선형 변환은 "벡터를 입력으로 받아 벡터를 출력으로 내놓은 함수 일종의 함수"라고 했습니다.
또한 '선형' 변환은 다음과 같은 특성을 가진 공간의 '변형'으로도 생각할 수 있습니다.
- 격자선(그리드 라인)이 평행을 유지합니다.
- 격자선 사이의 간격이 균일하게 유지됩니다.
- 원점(0,0)은 항상 고정된 상태로 유지됩니다.
이러한 특성은 선형 변환이 공간 전체를 일관된 방식으로 변형시킨다는 것을 의미합니다. 가장 주목해야 할 점은 선형 변환은 기저 벡터의 변환 결과만 알면 완전히 결정된다는 사실입니다. 이것이 중요한 이유는 모든 벡터 공간이 기저 벡터들의 선형 결합으로 생성(span)되기 때문입니다. 따라서 임의의 벡터가 선형 변환 후 어떻게 변하는지 알고 싶다면, 먼저 (해당 벡터가 놓여 있는 공간을 구성하는) 기저 벡터들이 어떻게 변환되는지 파악한 다음, 원래 벡터를 표현했던 것과 동일한 계수(스칼라)들을 변환된 기저 벡터들에 적용(선형결합)하면 됩니다. 이렇게 하면 변형된 공간에서의 새로운 벡터 위치를 결정할 수 있습니다.
선형 변환과 행렬의 관계
또 다시 말하지만 선형 변환에서는 모든 벡터 (x,y)가 x×(변환된 i-hat) + y×(변환된 j-hat)으로 표현될 수 있습니다. 즉 원래 벡터가 기저 벡터의 선형 조합으로 표현된다면, 변환 후에도 동일한 계수를 사용하여 변환된 기저 벡터의 선형 조합으로 표현됩니다.
그리고 행렬은 변환된 열벡터를 모아 선형 변환을 통해 이루어질 변화를 표현할 수 있습니다.
- 행렬의 첫 번째 열은 변환된 i-hat의 좌표입니다.
- 행렬의 두 번째 열은 변환된 j-hat의 좌표입니다.
행렬-벡터 곱셈은 이 변환된 기저 벡터들을 원래 벡터의 좌표에 따라 적절히 스케일링하고 더하는 과정입니다. 즉, 행렬은 선형 변환을 표현하는 방법이고, 행렬-벡터 곱셈은 그 변환을 벡터에 적용하는 방법입니다.
행렬 곱셈: 두 변환의 합성
그렇다면 행렬과 행렬간의 곱은 무엇을 의미할까요? 두 개의 선형 변환을 연속으로 적용한다고 생각해보세요. 예를 들어
- 먼저 평면을 반시계 방향으로 90도 회전시킵니다.
- 그 다음 전단 변환(shear transformation)을 적용합니다.
이렇게 두 변환을 연속으로 적용한 전체 효과는 또 다른 하나의 선형 변환이 됩니다. 이를 '두 변환의 합성(composition)'이라고 부릅니다. 그리고 어떤 선형 변환이든 그 효과를 알기 위해서는 i-hat과 j-hat이 어디로 가는지 추적하면 됩니다.
예를 들어, 위의 두 변환(회전 후 전단)을 적용한 후
- i-hat이 최종적으로 (1,1)에 도달했다면, 이것이 합성 행렬의 첫 번째 열이 됩니다.
- j-hat이 최종적으로 (-1,0)에 도달했다면, 이것이 합성 행렬의 두 번째 열이 됩니다.
따라서 두 변환의 효과를 합친 합성 행렬은 [1 -1; 1 0]이 됩니다.
행렬 곱셈을 기저 벡터의 연속 변환으로 이해하기
두 행렬 $A$와 $B$의 곱 $C = AB$가 있을 때
- 행렬 $A$의 열들은 표준 기저벡터들이 $A$에 의해 어떻게 변환되는지 보여줍니다.
- 행렬 $B$의 열들은 표준 기저벡터들이 $B$에 의해 어떻게 변환되는지 보여줍니다.
- 행렬 $C$의 열들은 표준 기저벡터들이 먼저 $B$에 의해, 그 다음 $A$에 의해 연속적으로 변환된 결과입니다. 이 과정은 $B$에 의해 변환된 기저벡터를 표준 기저벡터의 선형결합으로 표현한 다음, $A$를 각 표준 기저벡터에 적용하고 선형결합의 법칙에 따라 결과를 합산함으로써 얻어집니다.
예시로 설명
두 행렬 $P$와 $Q$가 있다고 가정해봅시다.
$$P = \begin{bmatrix} 2 & 1 \\ 3 & 0 \end{bmatrix}, \quad Q = \begin{bmatrix} 1 & 4 \\ 2 & -1 \end{bmatrix}$$
$P \times Q$를 계산해보겠습니다.
1단계: 표준 기저벡터 정의
2차원에서 표준 기저벡터는
- $\hat{e}_1 = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$
- $\hat{e}_2 = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$
2단계: 첫 번째 변환 ($Q$) 적용
$Q$의 열은 표준 기저벡터가 $Q$에 의해 어떻게 변환되는지 보여줍니다.
$$Q\hat{e}_1 = \begin{bmatrix} 1 \\ 2 \end{bmatrix}$$ $$Q\hat{e}_2 = \begin{bmatrix} 4 \\ -1 \end{bmatrix}$$
3단계: 두 번째 변환 ($P$) 적용
변환된 첫 번째 기저벡터를 또 다시 표준 기저벡터의 선형결합으로 표현합니다.
$$Q\hat{e}_1 = \begin{bmatrix} 1 \\ 2 \end{bmatrix} = 1 \cdot \hat{e}_1 + 2 \cdot \hat{e}_2$$
변환된 두 번째 기저벡터도 동일하게 표현합니다.
$$Q\hat{e}_2 = \begin{bmatrix} 4 \\-1 \end{bmatrix} = 4 \cdot \hat{e}_1 + (-1) \cdot \hat{e}_2$$
$P$가 표준 기저벡터에 작용하는 방식은 다음과 같습니다.
$$P\hat{e}_1 = \begin{bmatrix} 2 \\ 3 \end{bmatrix}$$ $$P\hat{e}_2 = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$$
선형성을 이용하여 $P$를 $Q$에 의해 변환된 기저벡터들에 적용합니다.
$$P(Q\hat{e}_1) = P(1 \cdot \hat{e}_1 + 2 \cdot \hat{e}_2) = 1 \cdot P\hat{e}_1 + 2 \cdot P\hat{e}_2 = 1 \cdot \begin{bmatrix} 2 \\ 3 \end{bmatrix} + 2 \cdot \begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 4 \\ 3 \end{bmatrix}$$
$$P(Q\hat{e}_2) = P(4 \cdot \hat{e}_1 + (-1) \cdot \hat{e}_2) = 4 \cdot P\hat{e}_1 + (-1) \cdot P\hat{e}_2 = 4 \cdot \begin{bmatrix} 2 \\ 3 \end{bmatrix} + (-1) \cdot \begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 7 \\ 12 \end{bmatrix}$$
4단계: 결과 행렬 구성
연속 변환 후의 기저벡터들이 결과 행렬 $P \times Q$의 열이 됩니다.
$$P \times Q = \begin{bmatrix} 4 & 7 \\ 3 & 12 \end{bmatrix}$$
이 행렬은 표준 기저벡터가 먼저 $Q$에 의해, 그 다음 $P$에 의해 어떻게 변환되는지를 나타냅니다.
대수적 확인
전통적인 행렬 곱셈 방법으로 계산해도 동일한 결과를 얻을 수 있습니다.
$$P \times Q = \begin{bmatrix} 2 & 1 \\ 3 & 0 \end{bmatrix} \begin{bmatrix} 1 & 4 \\ 2 & -1 \end{bmatrix} = \begin{bmatrix} 2 \cdot 1 + 1 \cdot 2 & 2 \cdot 4 + 1 \cdot (-1) \\ 3 \cdot 1 + 0 \cdot 2 & 3 \cdot 4 + 0 \cdot (-1) \end{bmatrix} = \begin{bmatrix} 4 & 7 \\ 3 & 12 \end{bmatrix}$$
이처럼 행렬 곱셈은 기저벡터에 대한 연속 선형 변환으로 이해할 수 있으며, 이는 행렬 곱셈의 기하학적 의미를 잘 보여줍니다.
행렬 곱셈의 중요한 성질들
1. 교환법칙이 성립하지 않음
행렬 $A$와 $B$의 곱 $A \times B$와 $B \times A$가 다르다는 것을 기저벡터 변환으로 설명하겠습니다.
두 행렬을 다음과 같이 가정합니다.
- $A$: 90도 회전 변환 행렬 $\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}$
- $B$: 수평 전단 변환 행렬 $\begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}$
$A \times B$의 경우 (먼저 전단, 그 다음 회전)
첫 번째 변환 ($B$)
- $B\hat{e}_1 = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ (변화 없음)
- $B\hat{e}_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}$ (전단 변환됨)
두 번째 변환 ($A$): 각 변환된 기저벡터를 표준 기저벡터의 선형결합으로 표현한 후 $A$를 적용합니다.
$B\hat{e}_1 = \begin{bmatrix} 1 \\ 0 \end{bmatrix} = 1 \cdot \hat{e}_1 + 0 \cdot \hat{e}_2$
따라서 $A(B\hat{e}_1) = 1 \cdot A\hat{e}_1 + 0 \cdot A\hat{e}_2 = 1 \cdot \begin{bmatrix} 0 \\ 1 \end{bmatrix} + 0 \cdot \begin{bmatrix} -1 \ 0 \end{bmatrix} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$
$B\hat{e}_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix} = 1 \cdot \hat{e}_1 + 1 \cdot \hat{e}_2$ 따라서 $A(B\hat{e}_2) = 1 \cdot A\hat{e}_1 + 1 \cdot A\hat{e}_2 = 1 \cdot \begin{bmatrix} 0 \\ 1 \end{bmatrix} + 1 \cdot \begin{bmatrix} -1 \ 0 \end{bmatrix} = \begin{bmatrix} -1 \\ 1 \end{bmatrix}$
결과 행렬: $A \times B = \begin{bmatrix} 0 & -1 \\ 1 & 1 \end{bmatrix}$
$B \times A$의 경우 (먼저 회전, 그 다음 전단)
첫 번째 변환 ($A$)
- $A\hat{e}_1 = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$ (90도 회전)
- $A\hat{e}_2 = \begin{bmatrix} -1 \\ 0 \end{bmatrix}$ (90도 회전)
두 번째 변환 ($B$): 각 변환된 기저벡터를 표준 기저벡터의 선형결합으로 표현한 후 $B$를 적용합니다.
$A\hat{e}_1 = \begin{bmatrix} 0 \\ 1 \end{bmatrix} = 0 \cdot \hat{e}_1 + 1 \cdot \hat{e}_2$
따라서 $B(A\hat{e}_1) = 0 \cdot B\hat{e}_1 + 1 \cdot B\hat{e}_2 = 0 \cdot \begin{bmatrix} 1 \\0 \end{bmatrix} + 1 \cdot \begin{bmatrix} 1 \ 1 \end{bmatrix} = \begin{bmatrix} 1 \\ 1 \end{bmatrix}$
$A\hat{e}_2 = \begin{bmatrix} -1 \\ 0 \end{bmatrix} = (-1) \cdot \hat{e}_1 + 0 \cdot \hat{e}_2$
따라서 $B(A\hat{e}_2) = (-1) \cdot B\hat{e}_1 + 0 \cdot B\hat{e}_2 = (-1) \cdot \begin{bmatrix} 1 \\ 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 1 \ 1 \end{bmatrix} = \begin{bmatrix} -1 \ 0 \end{bmatrix}$
결과 행렬: $B \times A = \begin{bmatrix} 1 & -1 \\ 1 & 0 \end{bmatrix}$
$B\hat{e}_1 = \begin{bmatrix} 1 \\ 0 \end{bmatrix} = 1 \cdot \hat{e}_1 + 0 \cdot \hat{e}_2$
따라서 $A(B\hat{e}_1) = 1 \cdot A\hat{e}_1 + 0 \cdot A\hat{e}_2 = 1 \cdot \begin{bmatrix} 0 \\ 1 \end{bmatrix} + 0 \cdot \begin{bmatrix} -1 \\ 0 \end{bmatrix} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$
$B\hat{e}_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix} = 1 \cdot \hat{e}_1 + 1 \cdot \hat{e}_2$
따라서 $A(B\hat{e}_2) = 1 \cdot A\hat{e}_1 + 1 \cdot A\hat{e}_2 = 1 \cdot \begin{bmatrix} 0 \\ 1 \end{bmatrix} + 1 \cdot \begin{bmatrix} -1 \\ 0 \end{bmatrix} = \begin{bmatrix} -1 \\ 1 \end{bmatrix}$
결과 행렬: $A \times B = \begin{bmatrix} 0 & -1 \\ 1 & 1 \end{bmatrix}$
2. 결합법칙은 성립함
세 행렬 $A$, $B$, $C$에 대해 $(A \times B) \times C = A \times (B \times C)$가 성립하는지 기저벡터 변환으로 살펴보겠습니다.
$(A \times B) \times C$의 경우
첫 번째 변환 ($C$): 표준 기저벡터 $\hat{e}$에 $C$를 적용하면 $C\hat{e}$가 됩니다.
두 번째 변환 ($A \times B$): $C\hat{e}$를 표준 기저벡터의 선형결합으로 표현: $C\hat{e} = \sum_i c_i \hat{e}_i$ (여기서 $c_i$는 계수)
$(A \times B)$는 "먼저 $B$ 변환 후 $A$ 변환"이므로, 각 표준 기저벡터 $\hat{e}_i$에 대해:
- $B\hat{e}_i$를 계산하고 이를 표준 기저벡터의 선형결합으로 표현: $B\hat{e}i = \sum_j b{ji} \hat{e}_j$
- 각 $\hat{e}_j$에 $A$를 적용: $A\hat{e}_j$
- 선형결합의 결과: $(A \times B)\hat{e}i = \sum_j b{ji} A\hat{e}_j$
따라서 최종 결과는: $(A \times B) \times C\hat{e} = \sum_i c_i (A \times B)\hat{e}i = \sum_i c_i \sum_j b{ji} A\hat{e}_j$
이는 "먼저 $C$를 적용하고, 그 다음 $B$를 적용하고, 마지막으로 $A$를 적용"한 결과입니다.
$A \times (B \times C)$의 경우
첫 번째 변환 ($B \times C$): $(B \times C)$는 "먼저 $C$ 변환 후 $B$ 변환"을 의미합니다.
- 표준 기저벡터 $\hat{e}$에 $C$를 적용: $C\hat{e}$를 계산
- $C\hat{e}$를 표준 기저벡터의 선형결합으로 표현: $C\hat{e} = \sum_i c_i \hat{e}_i$
- 각 $\hat{e}_i$에 $B$를 적용: $B\hat{e}_i$
- 선형결합의 결과: $(B \times C)\hat{e} = \sum_i c_i B\hat{e}_i$
두 번째 변환 ($A$): $(B \times C)\hat{e}$에 $A$를 적용:
- 각 $B\hat{e}_i$를 표준 기저벡터의 선형결합으로 표현: $B\hat{e}i = \sum_j b{ji} \hat{e}_j$
- $A$를 각 $\hat{e}_j$에 적용: $A\hat{e}_j$
- 선형결합의 결과: $A(B\hat{e}i) = \sum_j b{ji} A\hat{e}_j$
따라서 최종 결과는: $A \times (B \times C)\hat{e} = A \times \sum_i c_i B\hat{e}_i = \sum_i c_i A(B\hat{e}i) = \sum_i c_i \sum_j b{ji} A\hat{e}_j$
양쪽 모두 동일한 결과를 얻으므로, 행렬 곱셈은 결합법칙이 성립합니다.
이러한 기저벡터 변환 관점의 분석은 행렬 곱셈의 교환법칙이 성립하지 않고 결합법칙이 성립하는 이유를 직관적으로 보여줍니다.
'Math♾️ > Linear Algebra' 카테고리의 다른 글
선형 변환 : 행렬은 함수다. (0) 2025.03.22 Span : 영역 전개 (領域展開) (2) 2025.03.16 내 말로 풀어보는 선형 대수 (0) 2023.03.31 2차원 선형 변환 시각화 (0) 2023.03.16 선형 시스템 파이썬으로 표현하기 (0) 2023.03.13