もっと詳しく

3つの要点 ?? 深層強化学習の評価基準のバイアス・不確実性について検証 ?? 既存のアルゴリズム評価について再検討 ?? 実行回数が少ない条件下でより有効な評価基準の提案 Deep Reinforcement Learning at the Edge of the Statistical Precipice written by Rishabh Agarwal, Max Schwarzer, Pablo Sa…