ナード戦隊データマン

機械学習, 自然言語処理, データサイエンスについてのブログ

2019-08-01から1日間の記事一覧

相互翻訳されたhtml内の文をalignmentする

Sentence Alignment: 翻訳文は常に1対1で対応しているわけではありませんが、Sentence Alignmentでは、そのようなコーパスから1対1に対応したパラレルテキストを生成するタスクです。 やりたいこと かんたんな方法 length-based method 課題 参考 github.com…