ナード戦隊データマン

機械学習と自然言語処理についてのブログ

2018-08-29から1日間の記事一覧

sentencepieceとgensimとツイートデータを使ってword2vecを訓練

ランダムに収集したツイートデータが6000万件あったようなので、そのデータを使ってgensimのword2vecモデルを作りました。このモデルは、次回の記事でツイート分類タスクに使おうと思いますが、どんな感じのword2vecになったのか、その生成過程も含めて書い…