Theano で Deep Learning <6>: 制約付きボルツマンマシン <前編>

DeepLearning 0.1 Documentation の第六回は制約付きボルツマンマシン (Restricted Boltzmann Machines / 以降 RBM) 。RBM はオートエンコーダとはまた別の事前学習法。かなり分量があるので、とりあえず元文書前半のRBM の仕組みまで。 RBM を理解しにく…

2015-01-10

R {ggplot2} の散布図に凸包 / 確率楕円を描きたい

ggfortify R 可視化

小ネタ。{ggplot2} でグループ別の散布図を描くときに、ちょっと飾り付けをしてグループをわかりやすくしたい。凸包 (Convex) 最初にベースとなる散布図を描く。 library(dplyr) library(ggplot2) df <- iris p <- ggplot(df, aes(x = Petal.Width, y = Pet…

2014-12-30

Theano で Deep Learning <6の準備>: ホップフィールドネットワーク

Deep Learning Python

DeepLearning 0.1 Documentation の第六回は制約付きボルツマンマシン (Restricted Boltzmann Machines / RBM) なのだが、文書／内容とも結構ボリュームがあるので外堀から埋めていきたい。そのため、今回はボルツマンマシンの前身であるホップフィール…

2014-12-27

Python networkx でマルコフ確率場 / 確率伝搬法を実装する

可視化 Python

ここ 1ヶ月にわたって聖書 DeepLearning 0.1 Documentation を読み進め、ようやく制約付きボルツマンマシンの手前まできた。 Deep Learning カテゴリーの記事一覧 - StatsFragments 制約付きボルツマンマシン (RBM) の解説には RBM = マルコフ確率場 ( M…

2014-12-26

R で Google Speech API を使ってこっそりがんばりたい

R

この記事は R Advent Calendar 2014 (ATND) の26日目の記事です。こういう話がある。有意差でたよっ - 東京で尻を洗うすばらしいパッケージだ。特に yeah::zoi はよい。これを使えば今日も一日頑張れそうな気がする。 library(yeah) yeah::zoi() しかし、…

2014-12-23

R {arules} によるアソシエーション分析をちょっと詳しく <2>

R パターンマイニング

こちらの続き。 R {arules} によるアソシエーション分析をちょっと詳しく <1> - StatsFragments データの作り方 (承前) 単体の list や data.frame から arules::transactions インスタンスを作る方法は前回まとめた。加えて、一般のデータでありえそうな …

2014-12-21

Theano で Deep Learning <5> : 多層 Denoising オートエンコーダ

Deep Learning Python Theano

Python Theano を使って Deep Learning の理論とアルゴリズムを学ぶ会、第五回。目次 DeepLearning 0.1 について、対応する記事のリンクを記載。第一回 MNIST データをロジスティック回帰で判別する英第二回多層パーセプトロン英第三回畳み込みニュ…

2014-12-15

Theano で Deep Learning <4> : Denoising オートエンコーダ

Deep Learning Python Theano

Python Theano を使って Deep Learning の理論とアルゴリズムを学ぶ会、第四回。目次 DeepLearning 0.1 について、対応する記事のリンクを記載。第一回 MNIST データをロジスティック回帰で判別する英第二回多層パーセプトロン英第三回畳み込みニュ…

2014-12-14

Python simpy による離散イベントシミュレーション

Python シミュレーション

この記事は Python Advent Calendar 2014 の14日目の記事です。この記事では、離散イベントシミュレーション用の Python パッケージ simpy について書きたい。simpy の現在のバージョンは 3.0.5、イニシャルリリースは 2002 年とかなり歴史のあるパッケージ…

2014-12-12

R {arules} によるアソシエーション分析をちょっと詳しく <1>

R パターンマイニング

今週は系列パターンマイニング用 R パッケージ {arulesSequences} と格闘していた。使い方にところどころよくわからないポイントがあり、思ったよりも時間がかかってしまった。関連パッケージである {arules} ともども、ネットには簡単な分析についての情報…

2014-12-07

Theano で Deep Learning <3> : 畳み込みニューラルネットワーク

Deep Learning Theano Python

Python Theano を使って Deep Learning の理論とアルゴリズムを学ぶ会、第三回。今回で教師あり学習の部分はひと段落。目次 DeepLearning 0.1 について、対応する記事のリンクを記載。第一回 MNIST データをロジスティック回帰で判別する英第二回多層パ…

2014-12-06

Python pandas strアクセサによる文字列処理

pandas Python 前処理

概要今週の週刊 pandas は文字列処理について。やたらと文字数が多くなったのだが、これはデータを都度表示しているせいであって自分の話がムダに長いわけではない、、、と思いたい。今回はこちらの記事に書いた内容も使うので、適宜ご参照ください。 Pyt…

2014-11-30

多層パーセプトロンの動きを可視化する

Python 可視化

概要多層パーセプトロン記事の補足。下の記事の最後で、入力されたデータを隠れ層で線形分離しやすい形に変換している、ということを確かめたかったが、MNIST データでは次元が高すぎてよくわからなかった。ということで、もうちょっとわかりやすい例を考え…

2014-11-30

Theano で Deep Learning <2> : 多層パーセプトロン

Theano Deep Learning Python

Python Theano を使って Deep Learning の理論とアルゴリズムを学ぶ会、第二回。目次 DeepLearning 0.1 より、第一回 MNIST データをロジスティック回帰で判別する英第二回多層パーセプトロン (今回) 英第三回畳み込みニューラルネットワーク英第四…

2014-11-27

Python pandas の算術演算 / 集約関数 / 統計関数まとめ

前処理 Python pandas

概要恒例の pandas 記事。今回は基本的な算術演算についてまとめた。このあたりの挙動は numpy と一緒で直感的だと思うが、知っていないとハマるポイントがいくつかあるので。準備サンプルは DataFrame のみ。だが内容は Series でも同じ ( 行/列 2次元…

2014-11-26

Theano で Deep Learning <1> : MNIST データをロジスティック回帰で判別する

Theano Deep Learning Python

概要ここ数年 Deep Learning 勢の隆盛いちじるしい。自分が学生の頃はニューラルネットワークはオワコン扱いだったのに、、、どうしてこうなった？自分もちょっと触ってみようかな、と記事やらスライドやら読んでみても、活性化関数が〜とか、制約付き何…

2014-11-24

ロジスティック回帰 (勾配降下法 / 確率的勾配降下法) を可視化する

可視化 Python

いつの間にかシリーズ化して、今回はロジスティック回帰をやる。自分は行列計算ができないクラスタ所属なので、入力が3次元以上 / 出力が多クラスになるとちょっときつい。教科書を読んでいるときはなんかわかった感じになるんだが、式とか字面を追ってるだ…

2014-11-21

pandas でメモリに乗らない大容量ファイルを上手に扱う

Python pandas 前処理

概要分析のためにデータ集めしていると、たまにマジか！? と思うサイズの CSV に出くわすことがある。なぜこんなに育つまで放っておいたのか、、、？このエントリでは普通には開けないサイズの CSV を pandas を使ってうまいこと処理する方法をまとめたい…

2014-11-21

{flexclust} + DTW で時系列を k-means クラスタリングする

R 時系列分析

概要下の記事のつづき。下の記事では DTW (Dynamic Time Warping) 距離を使って階層的クラスタリングを行った。続けて、 DTW 距離を使って非階層的クラスタリング (k-means法) を試してみる。 stats::kmeans では任意の距離関数を利用することはできないた…

2014-11-18

Python pandas データ選択処理をちょっと詳しく <後編>

Python pandas 前処理

概要こちらの続き。これで pandas でのデータ選択についてはひとまず終わり。 Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments Python pandas データ選択処理をちょっと詳しく <中編> - StatsFragments サンプルデータの準備データ…

2014-11-16

{TSclust} ではじめる時系列クラスタリング

R 時系列分析

概要こちらで書いた動的時間伸縮法 / DTW (Dynamic Time Warping) を使って時系列をクラスタリングしてみる。ここからはパッケージ {TSclust} を使う動的時間伸縮法 / DTW (Dynamic Time Warping) を可視化する - StatsFragments {TSclust} のインストー…

2014-11-15

Python pandas データ選択処理をちょっと詳しく <中編>

Python pandas 前処理

こちらの続き。 Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments 上の記事では bool でのデータ選択について最後にしれっと書いて終わらせたのだが、一番よく使うところなので中編として補足。まず __getitem__ や ix の記法では、…

2014-11-14

動的時間伸縮法 / DTW (Dynamic Time Warping) を可視化する

可視化 R 時系列分析

いま手元に 20万件くらいの時系列があって、それらを適当にクラスタリングしたい。どうしたもんかなあ、と調べていたら {TSclust} というまさになパッケージがあることを知った。このパッケージでは時系列の類似度を測るためのさまざまな手法 (=クラスタリ…

2014-11-12

Python pandas データ選択処理をちょっと詳しく <前編>

Python pandas 前処理

概要書いていて長くなったため、まず前編として pandas でデータを行 / 列から選択する方法を少し詳しく書く。特に、個人的にはけっこう重要だと思っている loc と iloc について日本語で整理したものがなさそうなので。サンプルデータの準備 import pan…

2014-11-09

Python pandas で日時関連のデータ操作をカンタンに

Python pandas 前処理

概要 Python で日時/タイムスタンプ関連の操作をする場合は dateutil や arrow を使っている人が多いと思うが、 pandas でもそういった処理がわかりやすく書けるよ、という話。 pandas の本領は多次元データの蓄積/変形/集約処理にあるが、日時操作に関連し…

2014-11-09

R ggplot2 で線形回帰/一般化線形モデルの残差プロット

R 可視化 ggfortify

ggplot2 で出力している他のグラフとデザインを揃えたかったので作ってみた。インストール library(devtools) install_github('sinhrks/ggfortify') サンプルデフォルトの plot と (ほぼ) 同じ見た目にしたつもり。 library(ggplot2) library(ggfortify) m …