ナード戦隊データマン

機械学習, 自然言語処理, データサイエンスについてのブログ

2019-10-10から1日間の記事一覧

Zipporahの特徴量設計をpythonで実装

ZipporahはWebクロールによって収集したパラレルコーパスのノイズを除去するツールですが、bashによる複雑なスクリプトで実装されていてモジュール性がありません。そこで、特徴量設計部分をpythonで実装してみます。 論文の要点 ノイズ生成 実装 zipporah_f…