データサイエンティスト(仮)

元素粒子論博士。今はデータサイエンティスト(仮)。

R

Rでスパースモデリング:Elastic Net回帰についてまとめてみる

導入 回帰モデル構築の際、汎化性能を向上させるために正則化の手法がたびたび用いられます。これは、考えているデータ数に対して特徴量の数が非常に多い場合や、特徴量間に強い相関(多重共線性)がある場合に有効な方法となっています。このような場合に、…

Rでスパースモデリング:Adaptive Lasso

導入 スパース推定の代表的な手法として、Lassoがあります。様々なシーンで活用されているLassoですが、Lassoは変数選択の一致性が保証されないという欠点があります。Adaptive Lassoは、その欠点を補う形で提唱されている手法となっています。こちらは、あ…

トポロジカルデータアナリシス:TDAパッケージを使ってみる

導入 とあることがきっかけで、とっても久しぶりにRでTDA(トポロジカルデータアナリシス)をしてみました。だいぶいろんなことを忘れていたので、単純な例を使ったメモを残しておきます。 トポロジカルデータアナリシスとは とてもざっくりいうと、位相幾何…

時系列データでお絵かきする

はじめに 最近、趣味の時間があまり取れなかったので更新が滞ってました(汗)。周期性をもつ(だろう)時系列データをお遊びで可視化してみました。やってみるとなかなか面白かったので、備忘録として残しておくことにしました。 どうやって可視化するのか …

R Notebookを使えるようにしてみる

動機 最近、R Notebookが少し話題になっていました。自分はまだ使ったことがなかったので、この機会にR Notebookを導入してみようと思いました。 R Notebookとは RStudio上でインタラクティブに作成できるNotebookです。RMarkdownで書くJupyter notebookとい…

アソシエーション分析のちょい復習

動機 最近こんな本を購入しました。 www.shoeisha.co.jp 第I部の「データアナリティクスの基礎」は、データ分析のプロジェクトの全体像に触れていて、データ分析のプロジェクトをどう進めていくかについて整理するのには良いのかな、と思いました*1。後半部…

Rで粒子フィルタ:RcppSMCのテスト

経緯 Rで粒子フィルタ(逐次モンテカルロ)ってできるんだっけ、とふと思ったので少し調べてみました。すると、Rのパッケージでは、例えば https://cran.r-project.org/web/packages/SMC/SMC.pdf : {SMC} https://cran.r-project.org/web/packages/RcppSMC/R…

Rでスパースモデリング:Group Lasso

はじめに スパース推定の代表例として、Lasso(Least Absolute Shrinkage and Selection Operator)があります。 これは、正則化項としてノルムを加えるようなパラメータ推定法です。 このような正則化項を導入すると、大部分のパラメータは0に潰れてスパー…

RでTopological Data Analysis : パッケージ(順次更新予定)

今回は、RでTopological Data Analysis(TDA)を行うためのパッケージとその概要を紹介します。TDAのパッケージは、Rでもいくつか開発されています。 代表的なものは{TDA}、他にも{TDAmapper}、{phom}などあるようです。 本ブログでは、{TDA}を代表例として…