データサイエンティスト(仮)

元素粒子論博士。今はデータサイエンティスト(仮)。

2017-12-11から1日間の記事一覧

Pythonでデータ分析:imbalanced-learnで不均衡データのサンプリングを行う

導入 クラス分類、例えば0:負例と1:正例の二値分類を行う際に、データが不均衡である場合がたびたびあります。例えば、クレジットカードの取引データで、一つの取引に対して不正利用かどうか(不正利用なら1、それ以外は0)といった値が付与されているカラ…