機械学習

【機械学習】地味だけど手軽で便利な「対数変換」

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践という本を読んだので、今日はその備忘録です。 今回は対数変換について。具体的には、高校で習う対数関数(でお馴染みのやつ)を使って、特徴量のスケール*1を変換しようとい...
メモ

WindowsのAnacondaのjupyter notebookでRを使えるようにする

Windows上のAnacondaにRを追加することになりました。今回は私が導入時に嵌った問題対処法のメモです。 本稿は以下の1, 2が完了した状況を想定しています。 1. R for Windowsのインストール 2. Rのコンソー...
Python

【Python】複数のリストに含まれる要素の全通りの組み合わせを取得する

、という2つのリストがあり、'a'と'd'、'a'と'e'、'b'と'd'…(以下略)のような、それぞれのリストに含まれる要素の全通りの組み合わせが欲しいときの話です。 これまで私はリスト内包表記で for j in ] と書いていたの...
その他

言語処理学会の年次大会(NLP2019)に参加しました。

先週は言語処理学会の年次大会(NLP2019)を見に行ってきました。 平日開催で仕事と重なっていた為、一部しか参加できなかったですが、専門家の方々の熱意ある発表を聞けて勉強になりました。 参加費18000円と新幹線代の価値はあったと思いま...
確率統計

独立同一分布(i.i.d.)に従うってどういうことなんだ

機械学習の解説なんかを読んでいると、不意に独立同一分布(i.i.d.)という単語に出くわすことがあります。i.i.d.をネットでぱっと調べてもいまいちピンと来ず、平岡和幸氏著『プログラミングのための確率統計』 (P.102)を読んで腹落ちし...