大手企業の冬のボーナスに対するヤフコメを分析したら、ヤフコメ民のお気持ちが察せられた。

その他

ボーナスシーズンですね。

少し前ですが、経団連が大手企業のボーナス平均額を発表していました。

headlines.yahoo.co.jp

今日はこの大手企業のボーナスに対する世間*1の反応を私なりに分析してみたいと思います。

その前に余談ですが、今回の発表の調査対象は原則として東証一部上場、従業員500人以上、主要21業種大手251社だそうです*2

ちなみに、政府が発表している経済センサス活動調査によると日本の企業等数は法人個人合わせて385万6457社(2016/6/1現在)*3。つまり、今回の調査対象は単純な比率で考えると251/3856457の0.0065%の企業の平均値。会社企業の法人に絞っても1,629,286社中の251社ですから0.015%の存在です。まさに一握り中の一握りの企業ですね。

さて、このニュース記事に対するコメント欄に目を向けますと、最初のページから大手企業に対する恨みつらみが散見されます。しかし、2018/12/8現在、3000件弱のコメント(返信コメントを除く)がついており、その全てに目を通すことは難しい。かと言って、いまいちよく分からない基準でソートされている上位コメントに目を通すだけで、世間の声を知った気になるのは危険です。ということで、この記事に対する全コメント(非表示対象を除く)を分析してみました。いったいコメントにはどういったお気持ちが表れているのでしょうか。

分析の手順は、ここでは簡単な紹介にとどめますが、

1. コメントをスクレイピングする

2. コメントに前処理をする。

形態素解析を行い、内容語(名詞、形容詞、動詞)を抽出。その後簡易的な正規化を実施。

(テキストマイニングツール*4を使うので、事前に形態素解析等しなくても分析はできます。)

3. ツールに突っ込む

今回はざっくりと分析するので、簡単に使えて見栄えの良いツールを利用します*5

さて、早速結果です。今回のコメントで特徴的(重要)だった名詞*6ですが、

f:id:mimosom:20181208103442p:plain

ニュース記事の見出し通り「ボーナス」や「大手企業」はもちろんのこと、「中小企業」や「公務員」といった単語が目立ちます。こういった話題ですから、大手企業と比較した中小企業の景気などに言及するコメントが噴出するのは想定通りでしょう。また、「公務員」については、共起ネットワーク*7を見てみると

f:id:mimosom:20181208103734p:plain

上記のような単語と共起しているようで、これはどうやら「大手のボーナスが良いからって公務員のボーナスも上げるんだろう。中小企業にも目を向けろ。」というようなコメントが影響していると推測できます。実際に「公務員」という単語が含まれるコメントのみを抽出して分析してみると、特徴的な動詞は「上げる」「貰う」「上がる」、その共起語として「ボーナス」が出現しており、上述のようなコメントが散見されます。

最後に最も特徴的だった形容詞ですが、

f:id:mimosom:20181208102817p:plain

第一位は「羨ましい」でした。この程度の出現頻度なので解釈が難しいですが、この単語が重要なのは間違いなさそうです。

さて、以上を大雑把にまとめますと、今回のニュースに対して世間の反応は、中小企業を引き合いに出して大手企業や公務員に対する恨みつらみ妬みを述べる傾向にあることが掴めました*8

実際、私も羨ましいです。実は私もいわゆる大手企業に勤務しているのですが、私も含めて若手に分類される社員はこんなに貰っていません…。というか、こういうニュースを見ると、職場のおじさま方はそんなに貰ってるのかと年功序列を痛感させられます…。

ただ、ボーナスを沢山もらう方々は同時に税金を沢山払ってくださるので感謝もしていますが…。

以上、長くなってしまいましたが、最後までお付き合い頂きましてありがとうございました。

*1:ヤフコメという狭い世間

*2:http://www.keidanren.or.jp/policy/2018/105.pdf

*3:https://www.stat.go.jp/data/e-census/2016/kekka/pdf/k_gaiyo.pdf

*4:https://textmining.userlocal.jp/

*5:素敵なツールではありますが、しっかりと分析をするには向いていないように思われます。例えば、このツールではどういった形態素解析器と辞書が使われているか不明ですし、可視化の為のt-SNEなんかもハイパーパラメータの値が不明でかつ調整できないので結果の解釈に苦しみます。

*6:ここでは単語(厳密には形態素)の出現頻度スコアであるTF-IDF(出現頻度が高いものの重要度は高く、一方でどんな文書にも出てくる単語の重要度は低くなるように設計された指標)が高いものを特徴的な単語として扱います。

*7:コメントの中でセットで出てくる単語ペアのグラフ

*8:この結論は正しくないかもしれないので、興味を持った方はぜひご自身でも分析してみてください。

コメント