PytorchでDeep Learning : CPU onlyでインストールする際のメモ

Deep Learningのフレームワークの一つにPytorchがあります。Facebookを始めとして、様々な企業や大学が開発に携わっているようです。 PytorchはPython上でDeep Learningを行うためのフレームワークです。Preferred Networksが開発しているChainerからforkさ…

2017-12-12

Pythonでデータ分析：Auto-sklearnについてのメモ

auto-sklearn Python

導入最近、Meta Learningという考えに少し興味を持ちました。もともとは認知科学発祥の考えですが、機械学習の文脈だとある決まったバイアス，すなわち仮説空間の中から，事例に応じて，適切な仮説を獲得する普通の学習器をベース学習器という．その上位で…

2017-12-11

Pythonでデータ分析：imbalanced-learnで不均衡データのサンプリングを行う

Python

導入クラス分類、例えば0：負例と1：正例の二値分類を行う際に、データが不均衡である場合がたびたびあります。例えば、クレジットカードの取引データで、一つの取引に対して不正利用かどうか（不正利用なら1、それ以外は0）といった値が付与されているカラ…

2017-10-18

Pythonでデータ分析：Prophetを使ってビットコインの予測（笑）をやってみる

Python Prophet

導入直近、これといって緊急の業務がなく、「自分の時間だ何勉強しようかなー」とPyStanとかをいじっていた矢先、「暇なら技術調査やってよ、Deep Learning的な何かとか」というお達しがきました。あいにく私は天邪鬼なので、２つ返事をして気になっていた…

2017-10-16

Pythonでデータ分析：主成分分析（PCA）による異常検知

Python scikit-learn

導入データ分析の種類の一つとして、教師なし学習による異常検知というものがあります。ほとんどが正常なデータでまれに異常なデータが混じっている、その異常発生のパターンや異常と他の要因との紐付きがいまいちつかみきれていないというような場合、教師…

2017-10-14

Pythonでデータ分析：PyStanで線形回帰モデル

Python PyStan Stan

導入ベイズ推定を行うための道具として、マルコフ連鎖モンテカルロ（MCMC）があります。その派生系であるハミルトニアンモンテカルロ（HMC）をベースにしたソフトウェアとして、Stanというものがよく知られています。 Stan - Stan StanはC++ベースのソフト…

2017-10-13

Pythonでデータ分析：Catboost

Python Catboost

導入 2017年7月に、ロシアのGoogleと言われている（らしい）Yandex社から、Catboostと呼ばれるGradient Boostingの機械学習ライブラリが公開されています。catboost.yandexここ何ヶ月か調整さんになっていて分析から遠ざかりがちになりやすくなっていたので…

2017-10-09

Memo：MacOS SierraでXGboostをpipで入れる

Python XGboost

XGboostを自宅のMacに入れようとしても入らなかったので、調べてみたことを備忘録として残しておきます。以前との差分を考えてみたら、MacOSをSierraにアップデートしてたことに気が付き、調べると以下の記事がヒットしました。qiita.com上の記事では、clan…

2017-07-25

KerasでDeep Learning：LSTMで日経平均株価を予測してみる

Deep Learning Keras Python

導入前回までで、画像データに関してDeep Learningを試してきました。画像データは、各データが独立と期待されるようなタイプのデータです。しかしながら、Deep Learningはこのような各データが独立であるような場合だけでしかできないというわけではありま…

2017-07-23

ヒアリチェッカーを作ってみた：とにかく出してみる

Keras Python Deep Learning

（注）中身はまだ非公開導入最近、日本に危機が迫っています。そう、ヒアリです。ヒアリは在来種と違った繁殖方法を持ち、毒性もあるので、あれよあれよという間に我々の周りに広がっていく可能性もあります。その場合、ヒアリをきちんと見分けられないと…

2017-07-05

KerasでDeep Learning：KerasでMNISTデータを扱ってみる

Keras Deep Learning Python

導入前回は人工データを用いたネットワーク構築について紹介しました。 tekenuko.hatenablog.com 今回は、異なるデータ（MNIST）に対してモデルを作成してみます。 MNIST MNISTとは、「Mixed National Institute of Standards and Technology database」の…

2017-07-04

KerasでDeep Learning：とりあえずネットワークを組んでみる

Python Deep Learning Keras

導入前回はKerasを導入しました。 tekenuko.hatenablog.com今回は、実際にネットワークを組んで学習をさせてみようと思います。簡単すぎるような気がしますが一歩ずつ…。データセット人工的に乱数を振って作成したものを用います。 import numpy as np # …

2017-07-04

KerasでDeep Learning：導入

Python Deep Learning Keras

導入年齢を重ねるにつれて、能力が落ちてきて危機感を感じています。こまめに努力しようと思います。最近、Deep Learningを使うふりをしていて、申し訳程度にChainerを使っています。Chainerも書きやすいのですが、日本人ユーザがメインなので、Tensorflow…

2016-10-02

Pythonでデータ分析：機械学習の自動化

Python auto-sklearn

導入何か問題を解決するにあたって機械学習を活用する場合、膨大なアルゴリズム、そのアルゴリズムに付随する多くのハイパーパラメータが存在します。分析の要件が「とにかく精度、中身は問わない」だった場合、何とかして効率的にモデルとパラメータを知り…

2016-09-24

複数の棒グラフを表示させるのはpandasが便利

Python pandas

経緯ある対象に対して、複数のアプローチの結果を可視化したいとき、棒グラフで並べて比較する方法があります。これをmatplotlib.pyplot.bar()で描いていましたが、棒の太さやら目盛の調整が大変でした。matplotlibは柔軟な可視化ができる反面、匠の技が要…

2016-09-23

FastBDTの計算時間が速いかを確認してみる

Python FastBDT

はじめに最近、ブースティング系のアルゴリズムでXGboostより速いものが実装されているようです。 github.com 論文は以下になります。 [1609.06119] FastBDT: A speed-optimized and cache-friendly implementation of stochastic gradient-boosted decisio…