データサイエンティスト(仮)

元素粒子論博士。今はデータサイエンティスト(仮)。

不定期

多重共線性があるときにL2正則化項を加えると解けるようになることのざっくりとした説明

動機 回帰モデル構築の際、特徴量とデータの関係によってはうまく機能しない(解けない)ことがあります。たとえば、考えているデータ数に対して特徴量の数が非常に多い場合や、特徴量間に強い相関(多重共線性)がある場合です。このような場合に、正則化項…

トポロジカルデータアナリシス:単体の境界

導入 不定期でトポロジカルデータアナリシス(TDA)に関する紹介をします。今回は単体の境界を数学的にどう表現するかを紹介します。 振り返り 前回、図形の穴は「境界」に着目することで特徴づけができそうだということを紹介しました。tekenuko.hatenablog…

トポロジカルデータアナリシス:ホモロジー群の紹介のための準備

導入 不定期でトポロジカルデータアナリシス(TDA)に関する紹介をします。今回は、図形の「穴」を数学的に表現するための準備をします。具体的に表現していくのは次回以降になります。 振り返り これまで、データから図形を見立てる方法を紹介してきました…

トポロジカルデータアナリシス:ノイズのあるデータへ応用する

導入 不定期でトポロジカルデータアナリシス(TDA)に関する紹介をします。今回は、ノイズをもったデータへのTDAの応用方法を紹介します。 振り返り データが与えられたとき、それを高次元空間の点の集まりとみなし、それらから図形を見立てる方法を紹介しまし…

トポロジカルデータアナリシス:データと図形を結びつける

導入 不定期でトポロジカルデータアナリシス(TDA)に関する紹介をします。今回の内容は、データから図形を見立てる方法と、TDAにて登場する単体的複体の紹介をします。 データを図形に読み替える 以下の図の左側のような点の集まりを、データの集まりだとしま…

トポロジカルデータアナリシス : 単体的複体

導入 不定期でトポロジカルデータアナリシス(TDA)に関する紹介をします。今回は、私たちが普段から何気なく慣れ親しんできた図形に関する話題です。ここでは、単体的複体をいう対象を考えます。 参考 このブログでは、数式を交えた説明は基本的にしません。…