3次元フラッシュメモリを用いたエネルギー効率の高いインメモリコンピューティング技術

2025年8月7日

AIや機械学習の幅広い普及に伴い、ハイパフォーマンスコンピューティングはスーパーコンピューティングのような専門的な分野だけでなく、汎用的な分野でも利用され始めています。一方で、ハイパフォーマンスコンピューティングは膨大なエネルギーを消費し、環境への負荷も大きくなります。そのため、コンピューティング性能とエネルギー効率の両方を向上させる解決策が強く求められています。解決策の一つとして、メモリ内にコンピューティング機能を持たせることでプロセッサとメモリ間のデータ転送に伴うエネルギー消費を削減する“インメモリコンピューティング”が注目されています。

先行研究において、私たちは昇圧回路搭載パッケージを開発しました[1]。この技術によって3次元フラッシュメモリのRead動作の消費電力を大幅に削減できることを示しました。今回はこの先行研究を拡張し、エネルギー効率の高い新たなインメモリコンピューティング技術が3次元フラッシュメモリを用いて実現可能であることを検証しました。

AIや機械学習ではベクトルデータ化された文章や画像に対して類似のベクトルデータを検索する処理があります。似ているものを探すことでAIが文脈や画像に映っている対象を認識する過程に用いられていて、このような処理は一般的に類似検索と呼ばれています[2]

今回は、インメモリコンピューティングで類似検索をおこなう新たな手法を提案しました。複数ブロックに対して順次Read動作をおこなう“シーケンシャルマルチブロック活性化”と“電流制御セル(CCセル)”を組み合わせて実現されます(図1)。キーベクトルデータはビットラインに沿って格納されており、検索対象のクエリベクトルデータはワードライン電圧として入力されます。CCセルは各ストリングに配置され、電流を小さく均一に調整する役割を担っています。CCセルによって決定されるオン電流の和から求められるベクトル内積が、キーとクエリベクトルデータの類似度を表します。

図1 シーケンシャルマルチブロック活性化と電流制御セル(CCセル)を用いた類似検索手法の模式図[3]
Ⓒ2025 IEEE

128次元ベクトルデータを用いて類似検索を検証しました。その結果、キーベクトルデータを十分な精度で判別できることがわかりました(図2)。

図2 128次元ベクトルデータを用いた場合の内積計算結果[3] Ⓒ2025 IEEE

また、今回提案したインメモリコンピューティング技術では、従来のRead動作と比較してメモリアクセスエネルギーが30 pJ/bitから0.17 pJ/bitに削減され、エネルギー効率を大幅に向上することができます(図3)。本技術は、従来の3次元フラッシュメモリと完全に互換性があり、エネルギー効率の高いインメモリコンピューティングにおいて不可欠であると考えています。

図3 インメモリコンピューティング時の消費電力削減効果[3] ©2025 IEEE

本成果は2025年5月に開催された国際学会IMW2025において発表されました。

文献
[1] Kazuma Hasegawa et al., "Low Power and Thermal Throttling-less SSD with In-Package Boost Converter for 1000-WL Layer 3D Flash Memory", IEEE International Memory Workshop (IMW), 2023.
[2] Shinichi Sasaki et al., "Mitigation of Accuracy Degradation in 3D Flash Memory Based Approximate Nearest Neighbor Search with Binary Tree Balanced Soft Clustering for Retrieval-Augmented AI", IEEE Interregional NEWCAS Conference, 2024, pp. 238-242.
[3] Kana Kudo et al., “Energy-Efficient In-Memory Computing using 3D Flash Memory with Sequential Multi-Block Activation and Current Control Cell (CC cell)”, IEEE International Memory Workshop (IMW), 2025.