AWSが、データを暗号化したまま機械学習の推論を実行する手法を公開した。完全準同型暗号(FHE)に対応した高水準ライブラリconcrete-mlを使い、Amazon SageMaker AIのエンドポイント上で暗号化された問い合わせをそのまま処理し、暗号化された予測結果を返す。クラウド側であるSageMaker AI自身もデータの中身を読めない。
先行記事では低レベルライブラリSEALとCKKSスキームで線形回帰を手作りしていたが、今回はconcrete-mlの採用により、よく使われるscikit-learnとAPI互換の形で複数のモデル種別を扱える。学習は平文データに対して行い、正規化以外の前処理は通常の機械学習と同じで、暗号化が入るのは推論段階だ。
AWS Nitroのような専用ハードでデータを隔離して平文処理する「機密コンピューティング」と異なり、FHEは安全性を暗号の数学に依存させる。これにより、規制上データを暗号化なしで第三者に渡せない医療・エネルギー・通信などの業界が、クラウドでMLを使う選択肢を広げる。ただしconcrete-mlは商用利用に有料ライセンスが必要な場合があり、計算負荷も含めた本番採用コストの見積もりが要る。