はじめに
先日、 オンプレ環境におけるGPUの最適化の記事 を掲載させて頂きましたが、今回はAWSにおける同等の機能についてご紹介させて頂きます。
GPUに限った話ではありませんが、ユーザーは自分自身のアプリケーションを運用する基盤として、数百を超えるクラウドインスタンスから、何が最適かを判断するは非常に難しく、また余裕を持たせた結果としてオーバープロビジョニングになってしまう傾向が殆どかと思います。
そんな中、特にGPU インスタンスのコストは高価であり、クラウド料金が大幅に増加する可能性があり、生成AIに代表されるGPUワークロードをクラウド上で走らせる際には、コストはこれまでよりも更に頭を悩ませる問題になってきます。 ...