データナード

機械学習と自然言語処理についての備忘録 (旧ナード戦隊データマン)

2019-10-10から1日間の記事一覧

Zipporahの特徴量設計をpythonで実装

ZipporahはWebクロールによって収集したパラレルコーパスのノイズを除去するツールですが、bashによる複雑なスクリプトで実装されていてモジュール性がありません。そこで、特徴量設計部分をpythonで実装してみます。 論文の要点 ノイズ生成 実装 zipporah_f…