機械学習

書籍

【入門】Kaggle本でデータ分析の技術を勉強する【第3章】Part2

『Kaggleで勝つデータ分析の技術』第3章の特徴量の作成について、前回の続きです。 以下、第3章の備忘録(メモ、引用)になります。 備忘録 GBDTで効果的な変数の組み合わせについての著者の方の意見 GBDT...
書籍

【入門】Kaggle本でデータ分析の技術を勉強する【第3章】Part1

今回は『Kaggleで勝つデータ分析の技術』の第3章、特徴量の作成についてです。 第3章は中身が濃く、分量が多いので2回に分けて投稿します。 以下、第3章途中までの備忘録(メモ、引用)になります。 備忘録 ある...
書籍

【入門】Kaggle本でデータ分析の技術を勉強する【第2章】

今日も元気にKaggle本。 今回は『Kaggleで勝つデータ分析の技術』第2章、タスクと評価指標についてです。 以下、第2章についての備忘録(メモ、引用)になります。 備忘録 テーブルデータ(構造化データ)と...
書籍

【入門】Kaggle本でデータ分析の技術を勉強する【第1章】

冬休みですね。せっかくの連休、何を学ぼうかと考えながら本屋を散策していたところ、『Kaggleで勝つデータ分析の技術』という本が目に入ってきました。 Kaggleは友人の間では何年も前から流行っていたのですが、私は興味が持てず、...
機械学習

All-but-the-Top: Simple and Effective Postprocessing for Word Representations, ICLR2018

word2vecやGloVeなどの単語分散表現の精度を向上させる後処理を提案。タイトル通り手法がシンプルで実用的。
機械学習

【機械学習】地味だけど手軽で便利な「対数変換」

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践という本を読んだので、今日はその備忘録です。 今回は対数変換について。具体的には、高校で習う対数関数(でお馴染みのやつ)を使って、特徴量のスケール*1を変換しようとい...