リーマン計量の正体を暴く

最近、微分幾何学の勉強をしている。これは最終的に情報幾何学を理解するためである。情報幾何学ではFisher情報行列なるものがリーマン計量を定めるのであるが、そもそもリーマン計量がなんだかよく分からない。その他、いろいろと分からないことが多すぎて、情報幾何学は一度挫折してしまった。そこで、本稿では情報幾何学を理解するための足がかりとして、リーマン計量について考えてみることにする。

定義とその解釈

多様体の基礎」[1]からリーマン計量の定義を引用する*1

 C^{\infty}多様体M上の2次の対称テンソル場gが, Mの各点pにおいて正定値であるとき, gをM上のリーマン計量 (Riemannian metric) という.

ここで、gは多様体M上の各点pに対して T^*_p(M) \otimes  T^*_p(M)の元を1つずつ割り当てるような対応、すなわちテンソル場である。

この定義を見ただけでは分かりづらいが、リーマン計量の最も重要な役割は接ベクトル空間 T_p (M)内積を定めることである。各点に割り当てられたテンソルは実は内積を定める写像となっており、点pについて得られた写像 g_pとすると、これは T_p (M) \times T_p (M) \to \mathbb{R}という写像である。このとき、任意のゼロでないベクトル {\bf x}, {\bf y} \in T_p (M)について以下が成立する。

 \displaystyle{
\begin{eqnarray}
g_p({\bf x}, {\bf y}) &=& g_p({\bf y}, {\bf x}) \\
g_p({\bf x}, {\bf x}) &>& 0
\end{eqnarray}
}

1つ目の式はgが対称テンソル場であることを、2つ目の式はgが正定値であることをそれぞれ表している。

変幻自在のリーマン計量

リーマン計量の定義は上で示した通りであるが、私は最初リーマン計量について調べ始めたとき、とても混乱させられた。その理由は、リーマン計量が文献によって様々な形で記述されるからである。例えばWikipedia[2]を見ると以下のような記述がある。

n個の実数値関数 x^1, x^2, \cdots, x^nによって与えられる、多様体M上の局所座標系において、ベクトル場

 \displaystyle{
\left\{\frac {\partial }{\partial x^{1}},\dotsc ,\frac{\partial }{\partial x^{n}}\right\}
}

はMの各点において接ベクトルの基底を与える。この座標系に関して、計量テンソルの成分は、各点pにおいて、

 \displaystyle{
g_{ij}(p):=g_{p}{\Biggl (}\left({\frac {\partial }{\partial x^{i}}}\right)_{p},\left({\frac {\partial }{\partial x^{j}}}\right)_{p}{\Biggr )}
}

同じことだが、計量テンソルは余接束の双対基底 \{dx^1, …, dx^n\}のことばで次のように書くことができる。

 \displaystyle{
g=\sum _{i,j}g_{ij}\mathrm {d} x^{i}\otimes \mathrm {d} x^{j}
}

ここではリーマン計量を計量テンソルというものと関連付けて説明しており、さらに双対基底とも関係があるようなことが書かれている。これが初見だとよく分からなかった。

また、「曲線と曲面の微分幾何」[3]においては、例えば第一基本形式を ds^2 = E dudu + 2F dudv + G dvdvと書いて、 ds^2がリーマン計量だというような言い方がされていたりもする。定義によるとリーマン計量はテンソル場のはずだが、 ds^2は微小距離の2乗というスカラー値を表しているように見える。これらの間の整合性がこれまたよく分からなかった。

このような混沌とした状況の中から、私が感じた疑問を抜粋すると以下のようになる。

  1. リーマン計量と計量テンソルの関係は何か?
  2. リーマン計量と接ベクトル空間の双対基底の関係は何か?
  3. 内積を定める写像テンソル場としてのリーマン計量と微小距離の2乗としてのリーマン計量の間にはどのように整合性が取れるのか?

これら3つの疑問の答えは、互いに少しずつ関連がある。以下で順を追って見ていこう。

リーマン計量の局所座標系における表現

疑問の答えを解き明かす鍵は、リーマン計量を局所座標系を用いて表現することにある。これを理解するために、リーマン計量を用いて2つの接ベクトル {\bf x}, {\bf y}内積を計算することを考えてみよう。これを具体的に計算するためには、2つのベクトルを何らかの局所座標系で表してみるのが良いだろう。局所座標系が決まれば、接ベクトル空間の基底が決まる。今は接ベクトル空間が2次元だと仮定して、基底を \left\{\left(\frac {\partial }{\partial x^{1}}\right)_p, \left(\frac{\partial }{\partial x^{2}}\right)_p\right\}とする。このとき、2つの接ベクトルを {\bf x} = a^{1} \left(\frac {\partial }{\partial x^{1}}\right)_p + a^{2} \left(\frac {\partial }{\partial x^{2}}\right)_p,  {\bf y} = b^{1} \left(\frac {\partial }{\partial x^{1}}\right)_p + b^{2} \left(\frac {\partial }{\partial x^{2}}\right)_pと表すことができる。すると、これらの内積は以下のよう定められる。

 \displaystyle{
g_p({\bf x} ,  {\bf y}) = \sum_{i=1}^{2} \sum_{j=1}^{2} a^{i} b^{j} g_p \left( \left(\frac {\partial }{\partial x^{i}}\right)_p , \left(\frac {\partial }{\partial x^{j}}\right)_p \right)
}

局所座標系が正規直交系とは限らないため、各基底ベクトルの長さが1とは限らないし、2つの異なる基底ベクトルの内積が0になるとも限らないという点に注意が必要である。

このままではなんだかごちゃごちゃしているので、以下のような置き換えを行う。

 \displaystyle{
g_{ij}(p)=g_{p}{\Biggl (}\left({\frac {\partial }{\partial x^{i}}}\right)_{p},\left({\frac {\partial }{\partial x^{j}}}\right)_{p}{\Biggr )}
}

そして、(i, j)成分が g_{ij}であるような行列Gを考える。すると、内積は以下のように計算できることが分かる。

 \displaystyle{
g_p ({\bf x},  {\bf y}) = 
\begin{pmatrix}
a^{1} & a^{2}
\end{pmatrix}
G
\begin{pmatrix}
b^{1} \\
b^{2}
\end{pmatrix}
}

このように、リーマン計量は局所座標系に対して具体的に行列として表現することができる。行列は2階のテンソルであるため、これを計量テンソルと呼ぶ。計量テンソルはリーマン計量の性質を反映し、必ず正定値対称行列となる。

双対空間との関係

さて、Wikipedia[2]には以下のような式があった。

 \displaystyle{
g=\sum _{i,j}g_{ij}\mathrm {d} x^{i}\otimes \mathrm {d} x^{j}
}

この式の意味するところを考えてみよう。そのためには、一次微分形式が何者であったかを思い出さなければならない。詳細は本[1]等を見て頂くとして、簡単に言うと、一次微分形式とは、多様体Mの各点pに余接ベクトル空間の元を割りつけていくような対応、すなわち余接ベクトルによるベクトル場である。言い換えると、一次微分形式は M \to T^{*}_p (M)という写像である。

局所座標系 x^1, x^2, \cdots, x^nにおいて定義される dx^i (i=1, 2, \cdots, n)という一次微分形式に対して、点pを決めると余接ベクトル空間の元、すなわち1次形式が1つ得られる。こうして得られた1次形式を (dx^i)_pと表し、これに対して接ベクトル空間の基底を入力として与えたとき、その値は以下のように計算される。

 \displaystyle{
\begin{eqnarray}
(dx^i)_p \left(\left(\frac{\partial}{\partial x_j}\right)_p \right) &=& \frac{\partial x_i}{\partial x_j}(p) \\
&=&
\begin{cases}
  0\ (i \ne j) \\
  1\ (i = j)
\end{cases}
\end{eqnarray}
}

続いて、1次形式のテンソル (dx_i)_p \otimes (dx_j)_pに対して接ベクトル空間の基底の組を入力として与えた時、その値は以下のように計算される。

 \displaystyle{
\begin{eqnarray}
((dx^i)_p \otimes (dx^j)_p) \left(\left(\frac{\partial}{\partial x_k}\right)_p, \left(\frac{\partial}{\partial x_l}\right)_p \right)
&=& (dx^i)_p \left(\left(\frac{\partial}{\partial x_k}\right)_p \right) \cdot (dx^j)_p \left(\left(\frac{\partial}{\partial x_l}\right)_p \right) \\
&=& \frac{\partial x_i}{\partial x_k}(p) \cdot \frac{\partial x_j}{\partial x_l}(p) \\
&=&
\begin{cases}
  0\ \left((i, j) \ne (k, l)\right) \\
  1\ \left((i, j) = (k, l)\right)
\end{cases}
\end{eqnarray}
}

ここまで来ればもう分かったも同然だ。最初に掲げた式 g=\sum _{i,j}g_{ij}\mathrm {d} x^{i}\otimes \mathrm {d} x^{j}の意味を考えてみよう。これは、2つの接ベクトルの直積を入力に取り、スカラーを出力する写像を、多様体の各点に割り当てるような対応を与えるテンソル場である。これを使って、点pにおいて \left(\frac{\partial}{\partial x_k}\right)_p \left(\frac{\partial}{\partial x_l}\right)_p内積を計算してみよう。
 \displaystyle{
\begin{eqnarray}
\sum _{i,j}g_{ij}(p) (dx^{i})_p \otimes (dx^{j})_p \left(\left(\frac{\partial}{\partial x_k}\right)_p, \left(\frac{\partial}{\partial x_l}\right)_p \right)
&=& \sum_{i,j} g_{ij}(p) \frac{\partial x_i}{\partial x_k}(p) \cdot \frac{\partial x_j}{\partial x_l}(p) \\
&=& g_{kl}(p)
\end{eqnarray}
}

この計算結果は先程のリーマン計量の局所座標表示の話と見事に整合性が取れているのが分かるだろう。

微小距離の2乗?いいえ、2次微分形式です

最後に、リーマン計量を微小距離の2乗っぽく表すことと、リーマン計量の定義との整合性について考えてみよう。といっても、ここまでの議論でほぼ明らかであろう。先ほど言及した ds^2 = E dudu + 2F dudv + G dvdvを例に考えると、これはただのスカラーではなく、 dudu dudvなどを1次微分形式のテンソル積、すなわち2次微分形式と考えれば辻褄が合うのである。しかも、対称なテンソル積である。

確かに、これらの式の導出の仮定では微小距離を求めるような形で計算を行うのだが、最終的に得られたリーマン計量はあくまで内積を定める写像テンソル場なのである。

ただし、定義さえ見失わなければ、リーマン計量を微小距離の2乗だと思って議論を進めるのは直感的な理解の形成に役立つことである。

プログラミングの感覚で言うと、普段はテンソル場という実装は気にせず、微小距離の2乗というインターフェイスを用いて考えれば良い。もし深い議論が必要になったら、その時に実装も覗いてみれば良いのである。

まとめ

以上、リーマン計量に関する混沌とした状況を私なりに整理してみた。多様体においては、局所座標系への依存を嫌って抽象的な定義がなされたり、かと思えば具体的な計算のために局所座標系に頼ったりするので、そこが混乱を生む原因のようだ。気をつけよう。

参考

[1]

多様体の基礎 (基礎数学5)

多様体の基礎 (基礎数学5)

[2] リーマン多様体 - Wikipedia
[3]
曲線と曲面の微分幾何

曲線と曲面の微分幾何

*1:原著ではリーマン計量を表す記号を \omegaとしているが、勝手ながら私の好みでgに変えさせて頂いた。

射影被覆は何を被覆しているのか

前回の記事で射影加群と移入加群を紹介したが、これに関連する概念として、射影被覆と移入包絡というものがある。これらがその名の通り、何かを被覆し、何かを包絡する性質を持っていると思うのは自然なことだろう。

移入包絡は簡単である。詳しくは触れないが、移入包絡はR-加群Mの極大な本質拡大(詳しくはWikipedia[2]などを参照)と、Mを含む移入加群の中で極小なものとして特徴付けられ、それとなく包絡しているような感じがする。

問題は射影被覆である。こちらは一見すると何が何を被覆しているのかが分かりづらい。そこで、本稿ではこの疑問の答えを探ってみようと思う。

射影被覆の定義

まずは射影被覆の定義がないと始まらない。例によって本[1]から定義を引用する。

射影加群Pからの全射準同型 P \xrightarrow{\rho} Mは,  \mathrm{Ker}(\rho)がPの余剰部分加群であるとき, Mの射影被覆 (projective cover) と呼ばれる.

上の定義に余剰部分加群という言葉が出てきた。これの定義も引用しておく。

R-加群Mの部分加群Kが, 次の性質
「Mの部分加群Uについて,  K + U = Mならば,  U = M
をみたすとき, KはMの余剰部分加群 (superfluous submodule) と呼ばれる.

何が何を被覆するのか

射影被覆の定義だけ見ても、何が何を被覆しているのかさっぱり分からない。そこで調べてみたところ、英語版Wikipediaにおける射影被覆の記事[4]に日本語版[3]にはない重要な記述があることを発見した。それが以下である。

The main effect of p having a superfluous kernel is the following: if N is any proper submodule of P, then  p(N) \neq M.Informally speaking, this shows the superfluous kernel causes P to cover M optimally, that is, no submodule of P would suffice.

すなわち、Pのどの部分加群も、それを射影被覆 \rho*1で移したものはMと一致しないと言っている。ここで思い出して欲しいのは、 \rho全射準同型だということである。つまり、Pの1つの部分加群 \rhoで移しただけではMを覆い尽くすことはできないが、Pの全ての部分加群 \rhoで移すと、それらが互いの足りないところを補い合って、全体としてMを被覆するのである。

以上まとめると、「射影加群Pの全ての部分加群を射影被覆 \rhoで移した集合族」が「R-加群M」を(互いの足りないところを補い合いながら)被覆するのである(追記1参照)。

 \rho(N) \neq Mの証明

念の為、Wikipedia[4]に出てきた主張の証明を書いておこう。この証明はWikipedia[4]のReferencesの章に英語で書かれているので、それの和訳を記載する。

NをPの非自明な部分加群とし、 \rho(N) = Mと仮定する。 \mathrm{Ker}(\rho)は余剰部分加群なので、 \mathrm{Ker}(\rho) + N \neq Pである*2 x \in P \mathrm{Ker}(\rho) + N以外から選ぶ。 \rho全射性より、 \rho(x') = \rho(x)となるような x' \in Nが存在し、 x-x' \in \mathrm{Ker}(\rho)である。しかし、このとき x \in \mathrm{Ker}(\rho) + Nとなり、矛盾である。

まとめ

以上、射影被覆における被覆という言葉の意味について考えてみた。数学における諸概念の名前は、多くの場合その性質をよく表すように付けられている*3ため、個人的には名前の意味を考えることはとても勉強になると思っている。

気づけば非可換環論やらホモロジー代数周りの勉強を半年近く続けている。それでもまだ分からないことばかりなのだから、数学は本当に奥が深い。

追記1

Pが単純加群の場合、非自明な部分加群が存在しないため、結局 \rho(P)がMを被覆するしかない。つまり、非自明な部分加群だけではMを被覆できない時がある。こうなると何だか一気に話がつまらなくなるが、事実なので仕方がない。

*1:英語版Wikipediaではpと書かれているが、本稿では射影被覆の記号を \rhoに統一する。

*2:定義のところで述べた余剰加群が満たすべき性質の対偶を考えると良い。

*3:平坦加群のように、それを名付けた人が理由を覚えていないという衝撃的な例もあるが・・・

Homとテンソル積が成す完全列に関するまとめ2

本稿は前回の記事の続きである。前回はHomの左完全性、及びテンソル積の右完全性について述べた。これらは常に成立しているのだが、Homの右完全性、及びテンソル積の左完全性は一般には成立しない。これらが成立するかどうかは、加群Mがどのような加群であるかに依存する。

本稿ではそのような特別な加群について紹介し、その基本的な性質をまとめてみる。

射影加群

定義

本[1]での射影加群の定義を以下に示す。

R-加群Pが射影加群 (projective module) または射影的であるとは, 任意の全射準同型 Y \xrightarrow{\beta} Zに対して, 次が全射になることである:

 \displaystyle{
\mathrm{Hom}_R(P, Y) \xrightarrow{\mathrm{Hom}(P, \beta)} \mathrm{Hom}_R(P, Z)
}

これはつまり、完全列 \{0\} \to  X \xrightarrow{\alpha} Y \xrightarrow{\beta} Z \to \{0\}に対して、以下が完全列になることを意味する。

 \displaystyle{
\{0\} \to  \mathrm{Hom}_R(P, X) \xrightarrow{\mathrm{Hom}(P, \alpha)} \mathrm{Hom}_R(P, Y) \xrightarrow{\mathrm{Hom}(P, \beta)} \mathrm{Hom}_R(P, Z) \to \{0\}
}

右端に{0}が付いているのがポイントである。

基本的性質

以下に私が特に気になった性質を列挙する。

  1. 任意の全射準同型 M \xrightarrow{\rho} Pは分裂全射である。
  2. R-加群Pが射影加群であることと、自由加群の直和因子になることは同値である。

1点目について、分裂全射のイメージを述べておく。 \rho: Z \to Xが分裂全射ということは、 Z \cong X \oplus Yであり、 \rhoを自然な射影 X \oplus Y \to Xと考えてよいということである。写像の元の加群写像の行き先の加群を用いて直和因子に分裂するイメージだと思えばよいだろう。写像の行き先が射影加群の場合、任意の全射準同型が分裂全射になるというのが、ここで述べられていることである。

2点目について、本[1]ではこのような書き方がされているが、自由加群は自身の自明な直和因子であると考えると、射影加群であると言えることになる。すなわち、任意の自由加群は射影加群であると言える。

移入加群

定義

本[1]での移入加群の定義を以下に示す。

R-加群Eが移入加群 (injective module) または移入的であるとは, 任意の単射準同型 X \xrightarrow{\alpha} Yに対して, 次が全射になることである:

 \displaystyle{
\mathrm{Hom}_R(Y, E) \xrightarrow{\mathrm{Hom}(\alpha, E)} \mathrm{Hom}_R(X, E)
}

これはつまり、完全列 \{0\} \to  X \xrightarrow{\alpha} Y \xrightarrow{\beta} Z \to \{0\}に対して、以下が完全列になることを意味する。

 \displaystyle{
\{0\} \to  \mathrm{Hom}_R(Z, E) \xrightarrow{\mathrm{Hom}(\beta, E)} \mathrm{Hom}_R(Y, E) \xrightarrow{\mathrm{Hom}(\alpha, E)} \mathrm{Hom}_R(X, E) \to \{0\}
}

右端に{0}が付いているのがポイントである。

基本的性質

以下に私が特に気になった性質を列挙する。

  1. 任意の単射準同型 E \xrightarrow{\mu} Mは分裂単射である。
  2. 移入 \mathbb{Z}-加群の任意の剰余加群は移入加群である。
  3. 任意のR-加群は移入加群の部分加群に同型である。

1点目について、分裂単射のイメージを述べておく。 \mu: X \to Zが分裂単射ということは、 Z \cong X \oplus Yであり、 \muを自然な入射 X \to X \oplus Yと考えてよいということである。写像の行き先の加群写像の元の加群を用いて直和因子に分裂するイメージだと思えばよいだろう。写像の元が移入加群の場合、任意の単射準同型が分裂単射になるというのが、ここで述べられていることである。

2点目について一番有名な例として、 \mathbb{Q}が移入 \mathbb{Z}-加群であること、それゆえ \mathbb{Q}/\mathbb{Z}も移入加群であることが挙げられる。

平坦加群

定義

本[1]での平坦加群の定義を以下に示す。

右R-加群Mが平坦加群 (flat module) または平坦とは, 左R-加群の任意の完全列 \{0\} \to X \xrightarrow{\alpha} Yに対して, 次が完全列になることである:

 \displaystyle{
\{0\} \to M \otimes_R X \xrightarrow{M \otimes \alpha} M \otimes_R Y
}

これはつまり、完全列 \{0\} \to  X \xrightarrow{\alpha} Y \xrightarrow{\beta} Z \to \{0\}に対して、以下が完全列になることを意味する。

 \displaystyle{
\{0\} \to  M \otimes_R X \xrightarrow{M \otimes \alpha} M \otimes_R Y \xrightarrow{M \otimes \beta} M \otimes_R Z \to \{0\}
}

左端に{0}が付いているのがポイントである。

基本的性質

以下に私が特に気になった性質を列挙する。

  1. 射影加群は平坦加群である。

射影加群の章で述べた事実と合わせると、以下のような加群の間の関係が得られる。

 \displaystyle{
自由加群 \Rightarrow 射影加群 \Rightarrow 平坦加群
}

このあたりの詳細はWikipedia[2]が参考になる。なんだか移入加群だけ仲間外れのような気分になるが、前回述べたHomとテンソル積の完全性に関する定理の非対称性を考えれば、そういうものなのかもしれない。

まとめ

以上、完全列にまつわる重要な加群について紹介し、その基本的な性質について述べた。最後に表にしてまとめておく。

 \mathrm{Hom}_R (M, ?)  \mathrm{Hom}_R (?, M)  M \otimes_R ?
左完全性 常に成立 常に成立 Mが平坦加群のとき成立
右完全性 Mが射影加群のとき成立 Mが移入加群のとき成立 常に成立

これらの事実は証明を追うことも大切だが、そういうものだと認めて使いこなすことも重要だと考え、事実だけを列挙したまとめを作ってみた。ホモロジー代数ではこれらの加群については知っていて当然の世界が繰り広げられるので、よく理解しておきたい。

参考

[1]

環と加群のホモロジー代数的理論 21世紀数学で重要な手法をきちんと解説する初めての本

環と加群のホモロジー代数的理論 21世紀数学で重要な手法をきちんと解説する初めての本

[2] Projective module - Wikipedia

Homとテンソル積が成す完全列に関するまとめ1

本稿ではHomとテンソル積が成す完全列と、その左完全性・右完全性、及びこれらに関する重要な加群についてまとめてみたいと思う。このあたりの内容は概念と概念の間の関係が複雑で、全容を把握することが難しいと感じたため、このようなまとめ記事を書いてみることにした。なお、証明は省略しているので、気になる方は本[1]などをご覧頂くと良いだろう。

完全列

まずは完全列の定義から始めよう。本[1]では完全列を以下のように定義している。(ただし、X, Y, Zは適当な加群とする。)

準同型の列 X \xrightarrow{\phi} Y \xrightarrow{\psi} Zは,  \phi(X) = \mathrm{Ker}(\psi)をみたすとき, Yにおいて完全であるといい, この準同型の列を完全列(exact sequence)と呼ぶ. (以下略)

念の為、イメージ図を以下に示しておく。

f:id:peng225:20170602194721p:plain

要するに、加群の列とその間の準同型の列があったとして、隣り合う準同型の像と核が一致するとき、そのような加群と準同型の並びを完全列と呼ぶのである。

トポロジーにおけるホモロジー群でもこれと似たような話があったが、本稿の内容は代数的トポロジーの代数的な側面を抽象化した分野であるホモロジー代数の準備となるような内容なので、ある意味当然である。

Homの左完全性

主要な定理

次に、Homの左完全性と呼ばれる性質について述べる。本[1]から定理を引用する。(ただし、Mは任意のR-加群とする。)

R-加群について次が成り立つ.
(1)  \{0\} \to  X \xrightarrow{\phi} Y \xrightarrow{\psi} Zが完全列ならば, 次も完全列である:

\displaystyle{
\{0\} \to  \mathrm{Hom}_R(M, X) \xrightarrow{\mathrm{Hom}(M, \phi)} \mathrm{Hom}_R(M, Y) \xrightarrow{\mathrm{Hom}(M, \psi)} \mathrm{Hom}_R(M, Z)
}

(2)  X \xrightarrow{\phi} Y \xrightarrow{\psi} Z \to \{0\}が完全列ならば, 次も完全列である:

\displaystyle{
\{0\} \to  \mathrm{Hom}_R(Z, M) \xrightarrow{\mathrm{Hom}(\psi, M)} \mathrm{Hom}_R(Y, M) \xrightarrow{\mathrm{Hom}(\phi, M)} \mathrm{Hom}_R(X, M)
}

上記の定理は初見だと面食らうと思うので、以下で説明を加える。(1)(2)は写像の向き等に気をつければ同様なので、(1)についてのみ説明する。

{0}の意味

まず、仮定として与えられた完全列が{0}から始まっているが、これには大変重要な意味がある。最初の矢印は{0}からXへの準同型を意味するが、もとの集合が0のみから成るので、準同型としての性質を満たすためには、これはXの零元に移されなければならない。すると、この列はXにおいて完全であるから、 \mathrm{Ker}(\phi)=0になっているはずである。つまり、 \phiの核は零元のみから成るということである。準同型に関する基本的な事実により、これはすなわち \phi単射であることを意味する。

このように、完全列の頭に{0}が付いたら、続く準同型は単射になる。逆に、完全列の末尾に{0}が付く場合は、それより1つ前の準同型が全射になる。これが{0}という一見意味がなさそうな集合が付いている意味である。

準同型 \mathrm{Hom}(M, \phi)の意味

次に、2つの準同型 \mathrm{Hom}(M, \phi), \mathrm{Hom}(M, \psi)について説明する。と言っても、どちらも同じなので、ここでは \mathrm{Hom}(M, \phi)に着目する。

定義の式をよく見てみると、 \mathrm{Hom}(M, \phi) \mathrm{Hom}_R(M, X)から \mathrm{Hom}_R(M, Y)への写像であることが分かる。これはすなわち、MからXへの写像 \alpha \in \mathrm{Hom}_R(M, X)を、行き先をYに変えた写像 \beta \in \mathrm{Hom}_R(M, Y)に変換するような写像ということである。 \phi, \alpha, \betaの間には具体的に \beta = \phi \circ \alphaという関係がある。

Homは一般に加法群を成しているが、 \mathrm{Hom}(M, \phi)はこの加法群の準同型になっている。そのため、Homにもこの準同型を用いて完全列の考え方を適用することができるのである。

左完全性という言葉の意味

本[1]において、定理の名前は「Homの左完全性」となっている。左完全性という言葉の定義は残念ながら記載されていないが、これは恐らく完全列の最初に{0}が付いている、すなわち準同型 \mathrm{Hom}(M, \phi)単射であることを意味するものと思われる。すなわち、この定理が述べているのは、ある加群の完全列があり、その最初の写像単射であったとき、それに関するHomの完全列が存在して、その最初の写像もやはり単射になるということである。

テンソル積の右完全性

前回の記事でも見たように、Homとテンソル積の間には切っても切れない深い関係がある。それは完全列においても同様で、テンソル積については左完全性の代わりに右完全性が成立する。以下に本[1]の定理を引用する。

左R-加群の完全列 X \xrightarrow{\alpha} Y \xrightarrow{\beta} Z \to \{0\}と右R-加群Mに対して, 次は完全列になる:

\displaystyle{
M \otimes_R X \xrightarrow{M \otimes \alpha} M \otimes_R Y \xrightarrow{M \otimes \beta} M \otimes_R Z \to \{0\}
}

念のため補足するが、テンソル積が成す完全列の最後に{0}がくっついているので、 M \otimes \betaという写像全射となる。写像 M \otimes \betaは以下のように定義される。
 
\displaystyle{
M \otimes \beta :\ M \otimes_R Y \ni m \otimes y \to m \otimes \beta(y) \in M \otimes_R Z
}

Homとテンソル積の完全性に関する定理の非対称性

ここで、私が個人的に気になったことが1つある。それは、定理の形がHomとテンソル積とで非対称的になっていることである。Homでは \mathrm{Hom}_R(M, X) \mathrm{Hom}_R(X, M)の両方を考えたのに、なぜテンソル積については M \otimes_R Xのみを考え、 X \otimes_R Mを考えないのだろうか?

これに対する100%納得のいく回答はまだ自分の中で得られていない。しかし、そもそもテンソル M \otimes_R Xに対してMとXは単純に役割を交換することはできず、Mは右R-加群、Xは左R-加群でなければならない。そのあたりのことが原因となって、 X \otimes_R Mについては右完全性が成り立たないケースがあるのだろうと推測される。

ここまでのまとめ

以上まとめると、ある完全列に対して、Homとテンソル積はそれぞれ左完全性・右完全性を持つことが分かった。また、Homについては写像の向きに応じて2つのバリエーションがあるが、どちらも左完全列となる。

ここからの話

Homの左完全性、及びテンソル積の右完全性はいつでも成立するわけだが、Homの右完全性、及びテンソル積の左完全性は常に成り立つわけではない。では、どのようなときに成り立つのであろうか?この疑問の答えは、Mが射影加群、移入加群、及び平坦加群と呼ばれる特別な加群になっているときなのであるが、長くなってしまったので、本稿はここで一旦区切りにしたいと思う。続きは次回をお楽しみに。

参考

[1]

環と加群のホモロジー代数的理論 21世紀数学で重要な手法をきちんと解説する初めての本

環と加群のホモロジー代数的理論 21世紀数学で重要な手法をきちんと解説する初めての本

今度こそテンソル積とHom の随伴性を理解する

長らく続いたテンソルに関する記事も、今回が最後である。今日は最初に掲げた4つの疑問のうち最後の1つである随伴性について考察する。以下に疑問の内容を再掲する。

テンソル積の随伴性とは一体何なのか?

より正確には、テンソル積とHomの随伴性と呼ぶようである。随伴性というのは、より一般には圏論において議論されるような、数学においてあらゆるところに現れる概念のようだが、残念ながら圏論の勉強はまだこれからの予定なので、今日はテンソル積とHomについてだけ考える。

随伴性に関する定理の主張と意味

定理の主張

まずはテンソル積とHomの随伴性に関する定理の主張を示す。例によって文献[1]から引用する。

R, Tを環、Xを(T, R)-両側加群、Yを左R-加群、Zを左T-加群とすれば、次の加法群の同型が成り立つ:
\displaystyle{
\mathrm{Hom}_T (X \otimes_R Y, Z) \cong \mathrm{Hom}_R(Y, \mathrm{Hom}_T(X, Z))
}

準同型が成す加法群の構造

上記の定理を理解するためには、まずHomについて理解する必要がある。HomとはR-加群の準同型全体の集合を表す記号である。例えばR-加群X, Yについて、XからYへの準同型全体は \mathrm{Hom}_R(X, Y)と表される。ここで1つ重要なのは、Homが加法群になるということである。以下で簡単に確認してみる。

  1. 2つの写像 \phi, \psi \in \mathrm{Hom}_R(X, Y)と任意の x \in Xについて、 \phi + \psi : x \to \phi(x) + \psi(x)とすれば、 \phi + \psi \in \mathrm{Hom}_R(X, Y)となる。この演算について結合法則が成立することは明らかである。
  2. 写像 \phi \in \mathrm{Hom}_R(X, Y)について、その逆元を -\phi : X \ni x \to -\phi(x) \in Yと定められる。
  3. 全てのXの元をYの単位元に移すような写像、すなわち零写像単位元と定められる。

以上により、Homが加法群を成していることが分かった。

定理の意味

次に、随伴性に関する定理の意味を考えてみよう。定理は2つのHomの間の同型を述べるものであるが、このうち左辺の \mathrm{Hom}_T (X \otimes_R Y, Z)は、XとYのテンソル積からZへの準同型全体が成す加法群を表している。それに対して右辺の \mathrm{Hom}_R(Y, \mathrm{Hom}_T(X, Z))は、Yから"XからZへの準同型全体が成す加法群"への準同型全体が成す加法群を表しており、左辺に比べて少々複雑である。右辺のHomが述べているのは、Yの元が1つ決まると、XからZへの準同型が1つ決まるということである。

これら2つのHomが同型であるというのは、一体どういうことなのだろうか?文献[2]よると、これはカリー化と呼ばれる概念と関係があるようである。Wikipediaのカリー化に関する記事[4]の最初の一文を引用する。

カリー化 (currying, カリー化された=curried) とは、複数の引数をとる関数を、引数が「もとの関数の最初の引数」で戻り値が「もとの関数の残りの引数を取り結果を返す関数」であるような関数にすること(あるいはその関数のこと)である。

随伴性の定理に当てはめて考えると、まず準同型 X \otimes_R Y \to Zを、XとYの2つの引数を持つ関数であると捉える。そして、その戻り値はZの元であると考える。これがWikipediaで述べられているところの「複数の引数をとる関数」に相当する。この関数を1変数関数に変換する操作がカリー化である。すなわち、元の関数からYだけを引数とする関数を生成するのである*1。そして、カリー化により生成された関数の戻り値は、XからZへの準同型となる。別の言い方をすれば、カリー化によって高階関数が得られたということになるだろう。

以上、2変数関数をカリー化によって1変数の高階関数に変換したわけだが、それによってその関数(準同型)が成す加法群の構造が変わることはないというのが随伴性に関する定理の主張であると考えられる。

証明の概略

後の議論のために必要となるので、簡単に証明のポイントだけを記載したいと思う。詳細は文献[1][2]などを参照されたい。

まず、以下の2つの写像を考える。

 \displaystyle{
\begin{eqnarray}
\sigma: \mathrm{Hom}_T (X \otimes_R Y, Z) \to \mathrm{Hom}_R(Y, \mathrm{Hom}_T(X, Z)) \\
\tau: \mathrm{Hom}_R(Y, \mathrm{Hom}_T(X, Z)) \to \mathrm{Hom}_T (X \otimes_R Y, Z)
\end{eqnarray}
}

このとき、 \sigmaを以下の式を満たすような写像だと定義する。

 \displaystyle{
\begin{eqnarray}
&& [\sigma(\phi)(y)](x) = \phi(x \otimes y) \\
&& \ \ (x \in X, y \in Y, \phi \in \mathrm{Hom}_T (X \otimes_R Y, Z))
\end{eqnarray}
}

また、 \tauを以下の式を満たすような写像だと定義する。

 \displaystyle{
\begin{eqnarray}
&& \tau(\psi)(x \otimes y) = [\psi(y)](x) \\
&& \ \ (x \in X, y \in Y, \psi \in \mathrm{Hom}_R(Y, \mathrm{Hom}_T(X, Z))
\end{eqnarray}
}

このとき、 \sigma, \tauともに加法群の準同型であることを示すことができ、かつ \sigma \tau, \tau \sigmaが恒等写像となることが確かめられる。これはすなわち、 \sigma, \tauが同型であり、かつ互いに逆写像となっていることを意味する。

テンソル積を考える必然性

ここまでの考察で、随伴性とはカリー化前後において準同型が成す加法群Homの構造が変わらない性質のことを言うのだと理解できた。しかし、どうしても1つ引っかかることがある。それは、定理の主張にテンソル積が使われている理由である。2変数関数というのであれば、まず誰しもが直積 X \times Yの方を先に思いつくだろう。なぜ \mathrm{Hom}_T(X \times Y, Z)ではなく、 \mathrm{Hom}_T(X \otimes Y, Z)を考えなければならないのだろうか?

その答えに辿り着くためには、証明の概略で用いた同型 \sigmaについて再考する必要がある。証明の概略では [\sigma(\phi)(y)](x)を考えたが、ここでは仮に \phi \in \mathrm{Hom}_T(X \times Y, Z)だったとする。このとき \sigma(\phi)(y)の部分に着目すると、これは X \to Zという準同型になっているはずである。 x_1, x_2 \in X, y \in Y, \phi \in \mathrm{Hom}_T (X \times Y, Z)とすると、準同型の性質上、以下が成立していなければならない。

 \displaystyle{
\begin{eqnarray}
&& [\sigma(\phi)(y)](x_1 + x_2) = [\sigma(\phi)(y)](x_1) + [\sigma(\phi)(y)](x_2) \\
&\Leftrightarrow& \phi(x_1 + x_2, y) = \phi(x_1, y) + \phi(x_2, y)
\end{eqnarray}
}

同様に \sigma(\phi)に着目すると、これは Y \to \mathrm{Hom}_T(X, Z)という準同型になっているはずである。そのため、 x \in X, y_1, y_2 \in Y, \phi \in \mathrm{Hom}_T (X \times Y, Z)について以下が成立する。

 \displaystyle{
\begin{eqnarray}
&& [\sigma(\phi)(y_1 + y_2)](x) = [\sigma(\phi)(y_1)](x) + [\sigma(\phi)(y_2)](x) \\
&\Leftrightarrow& \phi(x, y_1 + y_2) = \phi(x, y_1) + \phi(x, y_2) \\
\end{eqnarray}
}

ここまで来ると、 \phiが双1次形式でなければならないのではないかという予想が立つ。もうひと押しして、 \phi(xr, y) = \phi(x, ry)\ (r \in R)を示してみよう。

Xが(T, R)-両側加群、Zが左T-加群であることから、 \mathrm{Hom}_T(X, Z)は以下の作用で左R-加群になる[1]。

 \displaystyle{
\begin{eqnarray}
[r \cdot \sigma(\phi)(y)](x) &=& [\sigma(\phi)(y)](xr)\ (r \in R) \\
                               &=& \phi(xr, y)
\end{eqnarray}
}

また、 \sigma(\phi)について、準同型としての性質から以下が成立する。

 \displaystyle{
\begin{eqnarray}
[r \cdot \sigma(\phi)(y)](x) &=& [\sigma(\phi)(ry)](x) \\
                               &=& \phi(x, ry)
\end{eqnarray}
}

よって \phi(xr, y) = \phi(x, ry)が確認できた。

以上により、写像 \phiは双1次形式でなければならないことが分かった。 X \times Y \to Zという双1次形式全体の集合を \mathrm{BiLin}(X \times Y, Z)と表すことにすると、これはやはり加法群になっている。以下で確かめてみる。

  1. 2つの写像 \phi, \psi \in \mathrm{BiLin}(X \times Y, Z)と任意の x \in X, y \in Yについて、 \phi + \psi : (x, y) \to \phi(x, y) + \psi(x, y)とすれば、 \phi + \psi \in \mathrm{BiLin}(X \times Y, Z)となる。実際、 x_1, x_2 \in Xとすると、例えば (\phi + \psi)(x_1 + x_2, y) = (\phi + \psi)(x_1, y) + (\phi + \psi)(x_2, y)が成立することが容易に確かめられる。他の性質も同様に確認でき、BiLinが演算について閉じていることが分かる。この演算について結合法則が成立することは明らかである。
  2. 写像 \phi \in \mathrm{BiLin}(X \times Y, Z)について、その逆元を -\phi : X \times Y \ni (x, y) \to -\phi(x, y) \in Zと定められる。
  3. 全ての X \times Yの元をZの単位元に移すような写像、すなわち零写像単位元と定められる。

実は、BinLinについて以下の同型が成り立つ[3]。

 \displaystyle{
\mathrm{BiLin}(X \times Y, Z) \cong \mathrm{Hom}_T (X \otimes_R Y, Z)
}

これより、テンソル積とHomの随伴性は以下のように書いても良いように思える。

\displaystyle{
\mathrm{BiLin}(X \times Y, Z) \cong \mathrm{Hom}_R(Y, \mathrm{Hom}_T(X, Z))
}

なぜこちらの書き方ではなくテンソル積を用いた書き方が常用されるのか、本当のところは分からない。ひょっとしたら私の考察に穴があり、実際にはテンソル積でなければならないのかもしれない。今のところの私の考えでは、以下のような理由ではないかと推測している。

  1. 圏論における一般の随伴性の定義に合う形式にするため。
  2. 実用上、テンソル積をHomに置き換えたい場面が多くあるため。
  3. HomだのBiLinだのが混ざり合った定義は美しくないため。

まとめ

以上、テンソル積とHomの随伴性について考察した。本当は自然変換がどうとか、もっと奥深い話があるようだが、そこまで行くと圏論を学んでからの方が面白いことを書けそうなので、今回は割愛した。現在読んでいる本[1]では、圏論についても基本的な事柄が記載されているようなので、また理解が深まってからそのあたりのことを書いてみたいと思う。

*1:Wikipediaでは「もとの関数の最初の引数」をとる関数にすることとあるが、実際には最初に限る必要もないのだろう。左加群とか右加群とかそういった諸々の関係を満たすために、カリー化された後の関数の引数はYの元としているのだと思われる。

今度こそテンソルの共変・反変を理解する(高階のテンソル編)

本稿は前回の記事の続編である。前項では、最も基本的なテンソルであるベクトルの共変・反変について述べた。簡単におさらいすると、座標変換によって自然基底がどのように変換されるかを調べ、それと比較してベクトルの係数や双対基底の変化の仕方が同じかどうかによって、共変・反変が決まるのであった。

本稿ではさらに高階のテンソルにおける共変・反変の概念について考えてみたいと思う。

2階のテンソルにおける座標変換

高階のテンソルと言っても、いきなり一般の階数から考え始めるとわけが分からなくなるので、まずは2階のテンソルから考えてみる。容易に予想されるのは、2階のテンソルにおいてもまずは元のテンソル積の空間における座標変換から議論が始まり、それに応じて何か双対的な空間の振る舞いが決まっていくのだろうということである。というわけで、まずは元のテンソル積における座標変換を考えてみる。

Vを適当な体K上のベクトル空間とする。このとき、テンソル V \otimes Vを考える。ここで別の空間Wを持ちだして V \otimes Wを考えてもよいのだろうが、そこまで議論が大きく変わるとは思えないので、本稿では V \otimes Vに着目することにする。

ある座標系におけるVの自然基底を {\bf e}_i\ (i=1, 2, \cdots, n)とする。これを別の座標系に変換したとき、変換先の座標系における自然基底を {\bf e}'_{\mu}\ (\mu=1, 2, \cdots, n)とする。ここで、変換後の自然基底を適当に2つ選び、それらのテンソル積を考える。選ばれた自然基底を {\bf e}'_{\mu}, {\bf e}'_{\nu}とすると、テンソル積は以下のように計算できる。

 \displaystyle{
\begin{eqnarray}
\otimes({\bf e}'_{\mu}, {\bf e}'_{\nu}) &=& {\bf e}'_{\mu} \otimes {\bf e}'_{\nu} \\
                           &=& \left(\left(\sum_{i=1}^{n} \frac{\partial x^i}{\partial x'^{\mu}} {\bf e}_i \right) 
                               \otimes \left(\sum_{j=1}^{n} \frac{\partial x^j}{\partial x'^{\nu}} {\bf e}_j \right) \right) \\
                           &=& \sum_{i=1}^{n} \sum_{j=1}^{n} \frac{\partial x^i}{\partial x'^{\mu}} \frac{\partial x^j}{\partial x'^{\nu}}
                               ({\bf e}_i \otimes {\bf e}_j ) \\
\end{eqnarray}
}

最後の等号はテンソル積の双1次形式としての性質による。この式の美しさをなんと表現したらよいのだろう。テンソル積の2つのオペランドに掛かっていたシグマと偏微分係数が綺麗にテンソル積の外に出され、極めて簡潔な形となった。

次に、双対空間 V^{*}について、テンソル V^{*} \otimes V^{*}考えてみよう。元の空間の双対基底を \phi^i\ (i=1, 2, \cdots, n)、座標変換後の双対基底を \phi'^{\mu}\ (\mu=1, 2, \cdots, n)とする。座標変換後の双対基底を適当に2つ選び、それらを \phi'^{\mu}, \phi'^{\nu}とすると、これらのテンソル積は以下のようになる。

 \displaystyle{
\begin{eqnarray}
\otimes(\phi'_{\mu}, \phi'_{\nu}) &=& \phi'_{\mu} \otimes \phi'_{\nu} \\
                           &=& \left(\left(\sum_{i=1}^{n} \frac{\partial x'^{\mu}}{\partial x^i} \phi_i \right) 
                               \otimes \left(\sum_{j=1}^{n} \frac{\partial x'^{\nu}}{\partial x^j} \phi_j \right) \right) \\
                           &=& \sum_{i=1}^{n} \sum_{j=1}^{n} \frac{\partial x'^{\mu}}{\partial x^i} \frac{\partial x'^{\nu}}{\partial x^j}  
                               (\phi_i \otimes \phi_j) \\
\end{eqnarray}
}

見事に元の空間のテンソル積と対称な形となった。偏微分係数の分子・分母がどちらもひっくり返っており、まさにこれが反変テンソルとなるのである。

さて、 V \otimes Vにおける座標変換に対して、 V^{*} \otimes V^{*}の振る舞いが反変的であることが分かった。これで議論は全て終わったように思えるが、実はそうではない。2階以上のテンソルの場合、さらに混合テンソルというものが存在する。すなわち、 V \otimes V^{*}という空間を考えることができるのである。実際の計算はせずとも、偏微分係数が共変的なものと反変的なものが入り交じることになるのは、ここまでの議論で容易に想像できるだろう。テンソル積はとにかく自由な双1次形式なのだ。

実は、前回の記事でクロネッカー \delta \delta_i^jと書いていたのは、これを混合テンソルと考えていたからである。例えば双対基底の性質から \phi^j({\bf e}_i) = \delta_i^jが成立していたが、ここでは共変テンソル {\bf e}_iと反変テンソル \phi^jからクロネッカー \deltaが得られるので、混合テンソルとして表現しているのだろう。

さて、そうなると V^{*} \otimes Vというテンソル積も考えたくなるのが人間というものだが、これは考える必要がない。なぜなら、 V^{*} \otimes V \cong V \otimes V^{*}という同型が成立するからである。この事実の証明については文献[2]を参照のこと。この同型により、テンソル積は全て共変的なものを前に、反変的なものを後ろに書くという、ある種の標準形のようなものだけを考えれば良いことが分かる。

テンソル空間

ついに一般の階数のテンソルを考えるときが来た。テンソルには共変・反変・混合の3つが存在することが分かったが、一般のテンソルでは共変と反変の割合がいろいろあり得る。一般に、 m, n \in \mathbb{N}について、m階の共変テンソルとn階の反変テンソルが混ざり合ったようなテンソルをm階共変-n階反変であると言い、このようなテンソル全体の空間をテンソル空間と呼ぶ[1]。共変、反変テンソルがそれぞれ V, V^{*}に属するとき、テンソル空間は以下のように書ける。

 \displaystyle{
T^m_n(V) = \underbrace{V \otimes \cdots \otimes V}_{m\ \mathrm{copies}} \otimes \underbrace{V^{*} \otimes \cdots \otimes V^{*}}_{n\ \mathrm{copies}}
}

これが高階のテンソルの正体である。

まとめ

ベクトルの共変・反変の議論を用いながら、高階のテンソルの共変・反変について考察した。高階のテンソルではさらに混合という概念が存在するが、結局はテンソル積の各オペランドがそれぞれ独立に共変・反変っぽく振る舞うというだけのことであり、ベクトルでの議論が分かっていれば何も怖くはない。

前回と今回の記事では、計量テンソルには触れることが出来なかった。これはこれで物理などでテンソルを扱う際に重要な概念なのだが、共変・反変の心を理解するだけの目的であれば不要であると考え、議論の簡潔さを優先して敢えて持ち出さないようにした。興味がある方は調べてみると良いだろう。

次回はいよいよテンソル積の随伴性の謎に迫ってみたいと思う。というわけで、また時間を見つけながら勉強の日々だ。