ナード戦隊データマン

機械学習, 自然言語処理, データサイエンスについてのブログ

2017-10-30から1日間の記事一覧

アメブロの芸能人ブログをTopic Modelingで分類する

トピックモデリングとは、教師なし学習の一つで、文書を分類する手法です。ここでは、アメブロの芸能人ブログを分類しますが、結果としてはとても面白い分類結果になったので紹介します。 seleniumとPhantomJSを用いてスクレイピング まず、芸能人ブログのUR…