AWSの深層学習向けマシンイメージ(DLAMI)とコンテナ(DLC)が、必要なファイルだけ先に読む技術「Seekable OCI(SOCI)」に対応した。検証では、圧縮9.72GB・展開時32.7GBのvLLMコンテナで、標準Docker起動の約6分59秒に対しSOCI遅延読み込みが約21秒を記録した。
起動方式は標準Docker・SOCI並列取得・SOCI遅延読み込みの3種類があり、機器性能や記憶装置の構成に応じて選ぶ。遅延読み込みにはコンテナ画像へのSOCI索引が必須で、索引がない画像は標準取得へ戻る点が落とし穴になる。
AWSが用意する「-soci」付きの公式コンテナは索引が作成済みのため、自前で索引を作る初期作業なしに起動短縮の効果を得られる。GPUの起動待ち時間と遊休コストを削りたい推論運用者にとって、運用効率を左右する選択肢となる。