ナード戦隊データマン

機械学習と自然言語処理についてのブログ

2018-09-15から1日間の記事一覧

diffbotのようにコンテンツ抽出したい

Webコンテンツ抽出におけるvision-based手法とは、Webコンテンツのスクリーンショットの画像を用いて、ターゲットのコンテンツを自動的に抽出する手法です。ここでは、TextMapsというプロジェクトを見つけたので、その理論の概要と、デモの実行を行います。 …