データナード

機械学習と自然言語処理についての備忘録 (旧ナード戦隊データマン)

2019-09-13から1日間の記事一覧

探索と活用のトレードオフ: バンディットアルゴリズムでの検証

探索と活用のトレードオフとは、情報の探索にかける時間と、情報を活用する時間をどう割り振るかによって引き起こるトレードオフです。 バンディットアルゴリズムの概要 コーディング epsilon_greedy.py bernoulli_arm.py simulator.py jupyter notebookで実…