情報幾何学を嗜む ~指数型分布族の幾何学~
前回の記事では双対平坦空間について説明した。これまでの記事では具体的な確率分布族は登場せず、ひたすら抽象的な議論が続いたが、いよいよ具体的な確率分布族について考えてみる。本稿では情報幾何学的に重要である指数型分布族に着目し、その幾何学的な構造について述べる。
指数型分布族
定義
指数型分布族とはを確率変数、をパラメータとして、確率密度関数が以下のように書ける確率分布の族である。
いきなりだが、ここで (情報幾何学的な議論の本筋とはあまり関係ないが) 重要なポイントがある。それは、確率密度関数は積分してなんぼであり、その積分とは通常はLebesgue積分であるため、確率密度関数は測度と密接な関係にあるということである。確率密度関数と測度の両方が定まって初めて積分により確率を求める事ができる。
今、に着目すると、これはに依存していないため、確率密度関数から測度に追いやる事ができる。そうして、積分する際には測度としてを折り込み済みのものを使用するのである。
このように考えることで、指数型分布族の定義式からを省く事ができる。ここでさらにと置き、とすれば、確率密度関数は以下のように表せる。
左辺は確率密度関数なので、定義域全域で積分して1にならなければならない。この条件よりは以下のようになる。
念のため述べておくが、上記の計算に登場する積分では測度にが掛かる影響を考慮済みであると暗に仮定している。以降の計算でも同様である。
の凸性
前節で登場したは凸関数である。それを示すためにHesse行列を求めてみよう。
・・・(1)
これより、Hesse行列は共分散行列となる。共分散行列は半正定値であるため、は凸関数である[2][3]。
指数型分布族の双対平坦構造
これまでの議論により指数型分布族には自然と凸関数が備わっていることが分かった。前回、前々回の記事より、凸関数が与えられればBregmanダイバージェンスや双対平坦空間が得られることを見てきた。これらの事実より、指数型分布族にもこれらの情報幾何学的な構造を定めることができる。本章ではそれを見ていこう。
Riemann計量
Riemann計量は以下のように求められるのだった。
右辺は式(1)である程度まで計算したが、それをさらに以下のように変形してみる。
これはFisher情報行列に他ならない[5]。
例:指数分布
せっかくなので例を見てみよう。指数型分布族に属する確率分布はいろいろあるが、ここでは指数分布をピックアップしてみる。指数分布の確率密度関数は以下の式で表される[6]。
ただし、である。の場合の式においてと置いて少し変形すると以下のようにできる。
そのため、指数分布は指数型分布族に含まれる。
双対座標と双対凸関数
双対座標は以下のようになる。
双対凸関数は以下のようになる。
Riemann計量
指数分布はパラメータが1つしかないため、Riemann計量はスカラーとなる。具体的には以下のように計算される。
Riemann計量が分かるとパラメータ空間の中での確率分布同士の距離が分かる。確率分布同士の距離とは、定性的には確率分布の形状が互いにどれくらい異なるかを表すものと考えられる。
今回の例の場合、指数分布の平均はであるため、の絶対値が大きくなると平均は0に近づいていく。そのような領域ではの値が少し違う分布同士でほとんど形状の差がなくなる。これはの絶対値が大きくなるに連れてRiemann計量の値が0に近づいていくことに対応する。
一方、が0に近いところではが僅かに変わるだけで平均値が大幅に変動し、分布の形状が大きく変わる。これはが0に漸近するに連れてRiemann計量が急激に大きくなることと関連している。
ただし、本当は分散による影響も加味する必要がある。指数分布の分散はであるため、が0に近いところでは分散が大きくなる。分散が大きくなると分布が散らばるため、が変化しても分布が変動し辛くなる。これは先程の平均の議論と逆のことを言っていることになるが、指数分布の場合は平均の変化の方が分布の形状を決める上で支配的な要因になっているということなのだろう。
まとめ
本稿では指数型分布族が持つ情報幾何学的な構造について調べた。指数型分布族には必ず凸関数が付随し、これにより得られるBregmanダイバージェンスはKLダイバージェンスになっていることを見た。さらに、付随する凸関数から定められるRiemann計量はFisher情報行列に一致することが分かった。
参考
[1]
別冊数理科学 情報幾何学の新展開 2014年 08月号 [雑誌]
- 出版社/メーカー: サイエンス社
- 発売日: 2014/08/22
- メディア: 雑誌
- この商品を含むブログを見る
[3] ヘッセ行列 - Wikipedia
[4] カルバック・ライブラー情報量 - Wikipedia
[5] フィッシャー情報量 - Wikipedia
[6] 指数分布 - Wikipedia