2020-05-16

スイス滞在記【167日目】

留学

滞在日程が変わった、、、

帰国便の変更
研究

帰国便の変更

当初予定していたJALの帰国便が運休になったため，代替便を探すことになった．
エクスペディア経由のため，カスタマーセンターに電話→振替便を探してもらったが，すでに空きがなくキャンセル扱いになる．
そのため自力で探すことに．
色々探したが，ANAでロンドン経由での帰国便があったのでそれを抑えるも直前のため21万もかかった！
しかも帰国日が2日前倒しになってしまうという、、
旅行会社経由ではサポートが少ないみたいだ．
お金がかかってもきちんと航空会社で予約しようと思いました．金稼ごう．

研究

あと2週間しかないのでまじで焦る．加えていい結果が出るとは限らないのでなおさらきつい．
資料も作り始めた．でも解決法が思いつかず暗雲低迷．どうなることやら．
帰国まであと14日

2020-05-15

スイス滞在記【166日目】

留学

終わりの意識

本の購入
帰国日変更？

本の購入

フランス語圏にいるのならぜひ買いたいと思っていた「星の王子さま」を購入した．
今更だがこれで少しでもフランス語の勉強をしたいものである．
ついでにサピエンス全史の英語版も購入した．

f:id:feynmanrp:20200515015408j:plain — サピエンス全史と星の王子さま

帰国日変更？

帰国便をJALで予約していたのだが，欧州運行路線の計画変更により帰国日が変更になるかも知れない．
JAL側からの連絡がないので問い合わせ中．
変わったら面倒だな．でも仕方ないか、、
コロナ禍は色々だるいなと思った次第．
帰国まであと17日？

2020-05-14

スイス滞在記【165日目】

留学

外食！！！！

計算打ち切り
久々の外飯
設計の肝

計算打ち切り

100イタレーションごとにstep数やrewardを保存して書き出しているのだが，150,000あたりから収束してきたので一旦パフォーマンスを確認．
できはあまり良くなく，なぜだろうかと考えてしまう．
平均報酬ほどのパフォーマンスが出ないのはなぜ？
難しい．

久々の外飯

久々にがっつりとした外飯食べました．
油淋鶏です．

f:id:feynmanrp:20200514014154j:plain — 激ウマ泣

うますぎて泣くかと思った．
外食最高．

設計の肝

報酬関数の設計もそうだが，とにかくどこをどういうふうに制御するのかのフレームワークが重要なのだろう．
車輪制御に関しては，古典的な制御がうまく機能するからそれよりは行動パターン作成のほうがいいのだろうか．
時間もない中でゴールが見えないのは辛い．
やるしかない．
帰国まであと18日．

2020-05-13

スイス滞在記【164日目】

留学

勉強三昧

RL
スタバ
懐古

RL

計算全然終わりませんね．
これでまただめだったらちょっと凹むぞ．
強化学習難しい、、

スタバ

スタバに行ってみたら，しばらくは持ち帰りのみの営業らしい．
なので，行きつけのカフェ一択になるな．
でもカフェで作業できるのは気分が変わっていいね．
ロックダウン緩和さまさまです．

懐古

ニコニコ動画のマイリストを見てしまいました、、
ノスタルジーがエモい、、
帰国まであと19日

2020-05-12

スイス滞在記【163日目】

留学

活気

規制緩和
RL

規制緩和

飲食店含むほぼすべての業種が営業再開された．
フロン地区に赴いたが，それなりに街に活気が戻っている．
一方でソーシャルディスタンスや店内の人数制限などがあるので店内はそれほど混んでいない．
また義務教育も再開されたらしく先週以前ほど子供の姿はなかった．

f:id:feynmanrp:20200511235305j:plain — タピオカ店

昼のレストランも再開していたし，久しぶりに好きなコーヒーショップにも行けて大満足．

RL

報酬関数変えて，行動リスト変えて，もう一度トライ．
今回は500,000イタレーション．
明日には終わるか？
勉強や学会予稿も進めないといけなくなってきた．
終盤にやることが増えてきたな．
帰国まであと20日

2020-05-11

スイス滞在記【162日目】

留学

メモリクラッシュ

負荷の原因
パフォーマンス
ジャンプ

負荷の原因

今朝進捗を確認したらメモリクラッシュで強制終了していました．
しばらくコードを眺めていたら，ロボットの軌跡を保存している部分が原因でした．
エピソードごとに保存してリセットしているはずが，リセットされておらず，どんどん要素が追加されていた．
そりゃあメモリも埋まってしまうわな、、
強化学習みたいな高負荷計算の場合だと一つのバグで何十時間も失うのが辛いですね、、

パフォーマンス

連続値制御の場合も車輪限定だと古典制御のほうがうまくいきやすいみたい．
まあ考えてみれば当たり前のような結論かもしれないけれど，強化学習適用の難しさを体感している．
ただただ繰り返し増やしても非現実的な動きになるだけだし本当に難しい．
ボストン・ダイナミクスが制御に最適化を用いているのもよくわかる．

ジャンプ

鬼滅は来週が最終回みたい．
留学中に終わっちゃうのか、、
帰国してからの楽しみがどんどんなくなっていく．
帰国まであと21日

2020-05-10

スイス滞在記【161日目】

留学

計算重くなった

メモリ不足？
開業準備

メモリ不足？

100,000イタレーションで回していて，2時間で25,000回終えていたから朝には終わっていると思いきや，76,000程度であった．
その後も経過を見るも，80,000過ぎたあたりから一気に計算が遅くなっている．
もしかしてメモリ不足か？
他の動作も一気に重くなっているので検証ができない、、
NVIDIAのコンパネも全然開かないし，リモートデスクトップも不安定である．
一旦行って確認したいができるか？

開業準備

5/11より実施される第二段階の規制緩和では全店舗の開業が認められる．
そのため，大型スーパーなどでは準備で賑わっていた．
EPFLには相変わらず立ち入れそうもないが.
帰国まであと22日

ご注文はカフェインですか？

コーヒーは浅煎りで