ナード戦隊データマン

機械学習, 自然言語処理, データサイエンスについてのブログ

2018-02-12から1日間の記事一覧

spark-sklearnをjupyterで試しに使ってみる

巨大なデータに対してGridSearchCVを回し、たくさんのハイパーパラメータの組合せから最適なものを探すのには結構時間がかかります。ここでは、spark-sklearnを使うことにより、その問題の解決策を探ります。 事前準備 まず、ドライバとワーカーのマシンを用…