ナード戦隊データマン

機械学習, 自然言語処理, データサイエンスについてのブログ

2017-11-25から1日間の記事一覧

固有表現抽出ツールanagoの訓練データを京都ウェブ文書リードコーパスから用意する

前回( https://qiita.com/sugiyamath/items/365b263d4f03d3bca26f ), Hironsanのgithubのツール「anago」を試しましたが、十分なデータの用意ができませんでした。今回は、KWDLCから入力形式のデータを生成します。 形式のルール 単語とラベルをタブでつなぐ…