データナード

機械学習と自然言語処理についての備忘録 (旧ナード戦隊データマン)

2019-10-07から1日間の記事一覧

MGIZA++の最終出力からbicleaner用の確率的辞書を生成する

確率的辞書とは、ソース言語の各単語に対して、どのぐらいの確率でターゲット言語の対応する各単語が生起するかを表す辞書です。この辞書は、ターゲット言語の単語[space]ソース言語の単語[space]生起確率[newline]という形式で生成されます。MGIZA++は単語…