タグ: 強化学習

倒立振子を、制御とRLの両方で立たせてみた——賢い方が、無料で勝つわけではない 2026/6/18
MuJoCoの倒立振子を、古典制御(LQR)と強化学習(REINFORCE)の両方で実際に動かし、同じ物差しで測った。結果は対照的で、正直だった。
シミュの中で完璧なロボットは、なぜ現実で転ぶのか——sim2realギャップを実際に測る 2026/6/18
歩行AIを実際に学習させ、訓練したシミュとほんの少し違う物理に置くと何が起きるかを実測した。1ステップの作動遅延で、完璧だった方策が崩壊する。そして「直す」側のコストも測る。