ナード戦隊データマン

機械学習と自然言語処理についてのブログ

2019-06-24から1日間の記事一覧

Wikipediaから拡張固有表現を用いたCoNLL形式のデータを生成

拡張固有表現とは、PER, LOC, ORG, MISCのような少数のタイプではなく、より多くのタイプを定義したものです。 追記: 2019-06-25 11:09 IOBタグの定義を間違えました。 Bは先頭、Iは中間です。 CoNLL形式について 固有表現抽出でよく使われるデータには、CoN…