Python networkx でマルコフ確率場 / 確率伝搬法を実装する

ここ 1ヶ月にわたって聖書 DeepLearning 0.1 Documentation を読み進め、ようやく制約付きボルツマンマシンの手前まできた。

<a href="http://sinhrks.hatenablog.com/archive/category/Deep%20Learning">Deep Learning カテゴリーの記事一覧 - StatsFragments</a>

制約付きボルツマンマシン (RBM) の解説には RBM = マルコフ確率場 ( Markov Random Field / MRF ) の一種だよっ、としれっと書いてあるのだがマルコフ確率場とはいったい何なのかは説明がない。マルコフ確率場 <マルコフ・ランダム・フィールド> は用語もカッコイイし結構おもしろいので、 Python でサンプルを書いてみる。

補足 Python では PyStruct というパッケージがマルコフ確率場 / 条件付き確率場 ( Conditional Random Field ) を実装しているため、実用したい方はこちらを。このパッケージ、ノーマークだったがよさげだなあ。

マルコフ確率場とは

グラフィカルモデルの一種。グラフィカルモデルとは、確率変数間の関係をグラフとしてあらわしたモデル。以下の資料が非常にわかりやすい。

グラフィカルモデル入門 from Kawamoto_Kazuhiko

さらに詳しくはPRML。

Pattern Recognition and Machine Learning (Information Science and Statistics)

作者: Christopher Bishop
出版社/メーカー: Springer
発売日: 2010/02/15
メディア: ハードカバー
購入: 5人クリック: 67回
この商品を含むブログ (29件) を見る

マルコフ確率場のサンプル

今回はマルコフ確率場を使って画像のノイズ除去をしてみる。そのため、以下のような構造をもつマルコフ確率場をグラフとしてモデル化する。

観測値はノイズを含む入力画像、潜在変数はノイズを除去した画像に対応。
観測値、潜在変数ともとりうる値は {0, 1} いずれか ( 2値画像 )。
観測値、潜在変数それぞれ 1 画素 (ピクセル) に対し 1 ノードが対応。つまりノード総数は画像の画素数 x 2。
観測値ノードは、同じ座標の潜在変数ノードと 1:1 で接続。
潜在変数ノードは、自身の上下左右にある 4 ノードと接続。ただし端点は接続できるノードにだけ接続。

上のモデルで仮定されるのは以下になる (というか以下の仮定のもとに上のモデルが作られている)。

潜在変数は、それぞれ隣接するノードからのみ直接的な影響を受ける
誤差 (ノイズ) は画素ごとに独立である

イメージ図を描くと以下のようになる。グレーのノードは観測値であり、画像が入力された時点で値が確定する。この状態から、潜在変数のありえそうな状態 (ノイズを除去した画像) を推定する。

f:id:sinhrks:20141227165953p:plain

補足上の構造は一例であり、必ずこうしなければならない！というものではない。ここがグラフィカルモデルのよい点であり、最初はとまどう点でもあると思う。何か別の仮定が存在する場合はそれにあわせてモデル (グラフ構造) を変える。

補足また、上記のマルコフ確率場は制約付きボルツマンマシンでの考え方とは異なる。あくまでノイズ除去の場合のサンプル。

マルコフ確率場の実装に必要なグラフ構造の作成には networkx パッケージ (後述) を利用する。

確率伝搬法

マルコフ確率場の潜在変数の値を推定する方法。詳細は上記の "いまさら聞けないグラフィカルモデリング入門" の "積和アルゴリズム" の箇所を。いや手抜きではなくて自分が変なこと書くよりわかりやすいと思うので、、、。

ここでは今回実装した確率伝搬法の考え方を図示する。確率伝搬法についても、必ずしも今回実装したような動きをするわけではない。例えば、以下はモデルによって変わりうる。

各ノードをどの順番で走査するか: 以下の例では横 -> 縦方向に全ノードを走査
周辺分布の計算 & 伝搬をどの範囲まで行うか: 以下の例では、対象ノードに隣接するノード + 隣接ノードに隣接するノード = 2 つ先まで
周辺分布の計算時に重み付けするかどうか: 以下の例では重み付けしない
伝搬が収束したとみなす条件

アルゴリズム


観測値 (灰) に対する潜在変数 (白) の周辺分布を計算し、各潜在変数ノードの周辺分布とする。以降の処理では観測値ノードは更新されない (観測された値は変わらない) ため、潜在変数ノードのみを図示する。
潜在変数のグラフは左図のようになっている。
ノード (0, 0) の周辺分布を求めるため、隣接するノード (0, 1), (1, 0) / 赤の周辺分布をまず計算する。
まずはノード (1, 0) について。ノード (1, 0) と隣接するノード (1, 1), (2, 0) / 緑の周辺分布から、ノード (1, 0) の周辺分布を求める。
次にノード (0, 1) について。ノード (0, 1) と隣接するノード (0, 2), (1, 1) / 緑の周辺分布から、ノード (0, 1) の周辺分布を求める。
隣接するノード (0, 1), (1, 0) の周辺分布が計算できたので、それらを使って対象ノード (0, 0) の周辺分布を計算する。
次に、ノード (0, 1) の周辺分布を求めるため、隣接するノード (0, 0), (0, 2), (1, 1) / 赤の周辺分布をまず計算する。
まずはノード (0, 0) について。ノード (0, 0) と隣接するノード (1, 0) / 緑の周辺分布から、ノード (0, 0) の周辺分布を求める。
次にノード (1, 1) について。ノード (1, 1) と隣接するノード (0, 1), (1, 2), (2, 1) / 緑の周辺分布から、ノード (1, 1) の周辺分布を求める。
最後にノード (0, 2) について。ノード (0, 2) と隣接するノード (0, 3), (1, 2) / 緑の周辺分布から、ノード (0, 1) の周辺分布を求める。
隣接するノード (0, 0), (0, 2), (1, 1) の周辺分布が計算できたので、それらを使って対象ノード (0, 1) の周辺分布を計算する。
以降、各ノードについて同様の計算を繰り返す。1 周した後も各値が収束するまで繰り返す。

補足後述のサンプルプログラムでは上の動きを 1 ステップずつ処理しているわけではない。例えば各潜在変数の周辺分布は収束するまで計算する必要がない (確率伝搬に必要な部分のみ計算する)。また、処理順序も効率的になるように変えている (最終的に同じ処理が行われるようにしている)。

補足 Propagation の訳語は Wikipedia の表記を一般的なものとみなしてあわせた。

多層パーセプトロンで使う Backpropagation は誤差逆伝播法になっている。
Belief Propagationは確率伝搬法になっている。

参考【機械学習】"Propagation"の訳は「伝播」or「伝搬」？ - 歩いたら休め

次から実装のはなし。

`networkx` の簡単な使い方

まず、サンプル中で利用する networkx パッケージの概要を記載する。networkx は各種グラフ (有向、無向、多重) の作成や経路探索などができるパッケージ。

インストール

pip で OK。

pip install networkx

グラフの作成

今回の例では以下の方法は使わないのだが、基本的なグラフの作り方を。

networkx.Graph: 空の無向グラフインスタンスを作成する。
networkx.Graph.add_node: グラフにノードを追加する。引数はノードのキー。ここでは 2次元のグラフを作る想定のため、キーとして長さ 2 の tuple を渡しているが、ハッシュ化可能なもの (文字列とか) は何でもキーにできる。
networkx.Graph.add_edge: グラフのノード間にエッジを追加する。引数は接続されるノードのキー 2 コ。今回は無向グラフなので順序は関係ない。

import networkx as nx

# グラフ作成
g = nx.Graph()

# ノード (0, 0) を追加
g.add_node((0, 0))

# ノード (0, 1) を追加
g.add_node((0, 1))

# ノード (0, 0) と (0,1) の間にエッジを追加
g.add_edge((0,0), (0, 1))

グラフの描画 (プロット)

描画方法に応じていくつかの関数が用意されている。詳細は以下ドキュメントを。

Drawing — NetworkX 1.9.1 documentation

import matplotlib.pyplot as plt
nx.draw_networkx(g, node_color='w')
plt.gca().xaxis.set_visible(False)
plt.gca().yaxis.set_visible(False)
plt.show()

先ほど作成したグラフ ( 2 ノード、1 エッジ ) が描画される。

f:id:sinhrks:20141227160640p:plain

格子グラフの作成

今回作成したい 2次元の格子グラフは networkx.grid_2d_graph で簡単に作成できる。マルコフ確率場の作成にはこちらを利用する。

3 行 3 列の格子グラフを作成し描画してみる。グラフを描画する際に、 pos キーワードを使うと各ノードの描画位置を指定できる。

nw = nx.grid_2d_graph(3, 3)

# 各ノードの描画位置を指定する辞書 { ノードのキー : (x座標, y座標) }
pos = {n: (n[0], -n[1]) for n in nw.nodes()}
pos
# {(0, 1): (0, -1), (1, 2): (1, -2), (0, 0): (0, 0),
#  (2, 1): (2, -1), (0, 2): (0, -2), (2, 0): (2, 0),
#  (2, 2): (2, -2), (1, 0): (1, 0), (1, 1): (1, -1)}

nx.draw_networkx(nw, pos=pos, node_color='w')
plt.gca().xaxis.set_visible(False)
plt.gca().yaxis.set_visible(False)
plt.show()