スイス滞在記【167日目】
滞在日程が変わった、、、
帰国便の変更
当初予定していたJALの帰国便が運休になったため,代替便を探すことになった.
エクスペディア経由のため,カスタマーセンターに電話→振替便を探してもらったが,すでに空きがなくキャンセル扱いになる.
そのため自力で探すことに.
色々探したが,ANAでロンドン経由での帰国便があったのでそれを抑えるも直前のため21万もかかった!
しかも帰国日が2日前倒しになってしまうという、、
旅行会社経由ではサポートが少ないみたいだ.
お金がかかってもきちんと航空会社で予約しようと思いました.金稼ごう.
研究
あと2週間しかないのでまじで焦る.加えていい結果が出るとは限らないのでなおさらきつい.
資料も作り始めた.でも解決法が思いつかず暗雲低迷.どうなることやら.
帰国まであと14日
スイス滞在記【165日目】
外食!!!!
計算打ち切り
100イタレーションごとにstep数やrewardを保存して書き出しているのだが,150,000あたりから収束してきたので一旦パフォーマンスを確認.
できはあまり良くなく,なぜだろうかと考えてしまう.
平均報酬ほどのパフォーマンスが出ないのはなぜ?
難しい.
久々の外飯
久々にがっつりとした外飯食べました.
油淋鶏です.うますぎて泣くかと思った.
外食最高.
設計の肝
報酬関数の設計もそうだが,とにかくどこをどういうふうに制御するのかのフレームワークが重要なのだろう.
車輪制御に関しては,古典的な制御がうまく機能するからそれよりは行動パターン作成のほうがいいのだろうか.
時間もない中でゴールが見えないのは辛い.
やるしかない.
帰国まであと18日.
スイス滞在記【162日目】
メモリクラッシュ
負荷の原因
今朝進捗を確認したらメモリクラッシュで強制終了していました.
しばらくコードを眺めていたら,ロボットの軌跡を保存している部分が原因でした.
エピソードごとに保存してリセットしているはずが,リセットされておらず,どんどん要素が追加されていた.
そりゃあメモリも埋まってしまうわな、、
強化学習みたいな高負荷計算の場合だと一つのバグで何十時間も失うのが辛いですね、、
パフォーマンス
連続値制御の場合も車輪限定だと古典制御のほうがうまくいきやすいみたい.
まあ考えてみれば当たり前のような結論かもしれないけれど,強化学習適用の難しさを体感している.
ただただ繰り返し増やしても非現実的な動きになるだけだし本当に難しい.
ボストン・ダイナミクスが制御に最適化を用いているのもよくわかる.
ジャンプ
鬼滅は来週が最終回みたい.
留学中に終わっちゃうのか、、
帰国してからの楽しみがどんどんなくなっていく.
帰国まであと21日
スイス滞在記【161日目】
計算重くなった
メモリ不足?
100,000イタレーションで回していて,2時間で25,000回終えていたから朝には終わっていると思いきや,76,000程度であった.
その後も経過を見るも,80,000過ぎたあたりから一気に計算が遅くなっている.
もしかしてメモリ不足か?
他の動作も一気に重くなっているので検証ができない、、
NVIDIAのコンパネも全然開かないし,リモートデスクトップも不安定である.
一旦行って確認したいができるか?
開業準備
5/11より実施される第二段階の規制緩和では全店舗の開業が認められる.
そのため,大型スーパーなどでは準備で賑わっていた.
EPFLには相変わらず立ち入れそうもないが.
帰国まであと22日