そのインスタンスタイプ、スポットインスタンス起動に対応していますか?

本記事では「使いたいインスタンスタイプをスポットインスタンスで起動できるのか?」という疑問に対して、空きキャパシティがあるない以前にスポットインスタンス起動がサポートされているのかを AWS CLI から確認する方法を紹 […]…

AWS PrallelCluster 要求した台数分のスポットインスタンスが起動しないときの挙動を知ろう

AWS ParallelClusterを利用したクラウドHPC環境では計算リソースはほぼ無制限に使えます。「計算リソース無限」と言われると逆にコストが気になります。計算リソースにあたるコンピュートノードではスポットインス […]…

AWS ParallelCluster 3.0.0 と Ubuntu 18.04 または Ubutu 20.04 の組み合わせはヘッドノード再起動後にコンピュートノードが起動できない原因と対処方法について

AWS ParallelCluster 3.0.0 と Ubuntu 20.04の組み合わせのクラスターで検証していました。以前はジョブを登録するとコンピュートノードが正常に起動してたのに、ヘッドノードを再起動後するとコ […]…

AWS ParallelCluster コンピュートノードのSTATEをdownからidleへ強制的に戻したいときの対処方法について

困っていた内容 sinfoから確認できるSTATEが全ノードdown#状態になってしまいました。ジョブ投げてもなにも反応がありません。切り分けのためにも初期状態に戻し、コンピュートノードが起動しない原因を探りたいです。S […]…