ナード戦隊データマン

データサイエンスを用いて悪と戦うぞ

2018-08-29から1日間の記事一覧

sentencepieceとgensimとツイートデータを使ってword2vecを訓練

ランダムに収集したツイートデータが6000万件あったようなので、そのデータを使ってgensimのword2vecモデルを作りました。このモデルは、次回の記事でツイート分類タスクに使おうと思いますが、どんな感じのword2vecになったのか、その生成過程も含めて書い…