機械学習

機械学習

ベイズ推定と機械学習入門【具体例でベイズ推定の雰囲気を知る編】

DNNやLightGBMにデータを突っ込むだけで機械学習した気分になっていませんか? 私はそうでした。同時に、データを整形して、sklearnやlightgbmをインポートし、model.fit(X_train, y_train)するルーチ...
機械学習

All-but-the-Top: Simple and Effective Postprocessing for Word Representations, ICLR2018

word2vecやGloVeなどの単語分散表現の精度を向上させる後処理を提案。タイトル通り手法がシンプルで実用的。
機械学習

【機械学習】地味だけど手軽で便利な「対数変換」

機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践という本を読んだので、今日はその備忘録です。 今回は対数変換について。具体的には、高校で習う対数関数(でお馴染みのやつ)を使って、特徴量のスケール*1を変換しようとい...
機械学習

【機械学習】モデルに最適な乱数シードを選んで性能を上げる

Yoav Goldberg氏原著の訳本『自然言語処理のための深層学習』を一通り読みました。難しくて理解できない箇所もありましたが、自然言語処理×ディープラーニングの話が網羅的に学べてよかったです。 印象に残った箇所について、今後何回かにわた...
機械学習

バッチサイズとかエポックとかイテレーションとか

ニューラルネットワークの解説記事なんかで目にするバッチサイズとかエポックという単語で混乱したので調べました。 これについて、こちらの記事*1の以下の説明で疑問が晴れました。 We can divide the dataset of 2000...