タグ: RL
- ドメインランダム化は技術ではなく、告白だ 2026/6/21
sim2realで物理パラメータをばらまくほど、本当は「測るべき一つ」を測り損ねたという告白に近い。野放図なランダム化が買うのは計算量と保守性——本当の近道は計測だ。
- 制御理論は、RLが再発明している半分を、もっと前に解いていた 2026/6/19
深層RLが「発見」する安定性・最適性・頑健性の多くは、制御理論が数十年前に保証付きで解いていた。RLは保証なしで、桁違いのサンプルで再発明する——ただしモデルが無い領域では本当に勝つ。