We use cookies to improve your experience with our site.

PPIMCE:一种用于隐私保护计算的存内计算体系结构

PPIMCE: In-Memory Computing Fabric for Privacy Preserving Computing

  • 摘要:
    文章摘要图/表: PPIMCE体系结构概览该图展示了PPIMCE的整体架构及其基于SRAM的存内计算核心(IMC core)。左侧为定制的RISC-V处理器与IMC指令调度器(IMC-Instruction Scheduler),负责生成并分发控制指令(C-Inst),以及进行数据依赖检测。右侧展示单个IMC核心的结构,包括核心控制器(Core-controller)与IMC处理单元(IMC-PE)。IMC-PE内部集成查找表(LUT)阵列、移位器(Shifter)与计算使能存储阵列(CEM),可实现加密计算的逻辑与算术操作。PPIMCE与现有方案在CIFAR-10和ImageNet任务上的性能、面积与功耗比较研究该表对比了PPIMCE与现有代表性隐私保护计算加速器(包括Gazelle、Cheetah、F1、BTS、CraterLake、ARK及GPU)的性能与能效表现。实验结果表明,PPIMCE在5nm技术节点下实现了显著的性能提升与功耗优化。在CIFAR-10任务上,PPIMCE较CPU加速约800倍;在ImageNet任务上,其整体能效与面积效率均优于现有同类设计。
    研究背景 随着云计算与人工智能的发展,数据隐私问题日益突出。尽管同态加密(HE)与混淆电路(GC)可在加密数据上实现安全计算,但各自存在计算开销大、通信延迟高等问题。现有研究多针对 HE 或 GC 单独优化,缺乏一种统一的硬件平台来同时支持两种协议的高效执行。
    目的 本研究旨在设计一种统一的、可在加密数据上直接执行计算的硬件体系结构——PPIMCE,以同时支持 HE 与 GC 的运算过程,从而在保证数据隐私安全的前提下,实现高能效与高性能的加密计算加速。
    方法 PPIMCE 基于 SRAM 的存内计算(IMC)技术构建,通过自定义的 32 位 RISC-V 微处理器控制多个 IMC 核心以并行执行 HE 与 GC 运算。系统在指令集层面扩展了八条 R 型指令以支持多项式加法、乘法、NTT/INTT 变换以及 GC 的 Half-Gate 与 FreeXOR 操作。此外,PPIMCE 采用专用调度机制实现跨核心的数据依赖管理与流水化执行。
    结果 仿真结果表明,PPIMCE 在执行混淆电路(GC)时比 CPU 提速 107 倍,在执行基于 CKKS 的同态加密(HE)乘法时分别比 CPU 和 GPU 提速 1 500 倍和 800 倍。在隐私保护机器学习推理任务中,PPIMCE 相比 CPU 提升 1 000 倍性能,并较最新加密计算加速器 CraterLake 提升 12 倍性能。
    结论 PPIMCE 首次在单一的存内计算平台上实现了 HE 与 GC 的融合加速,显著降低了数据传输与加密运算的能耗,提升了隐私保护计算的实用性与扩展性。该工作为未来面向隐私保护的人工智能硬件架构提供了新的研究方向,并具备在安全云计算与边缘智能等领域的广泛应用潜力。

     

    Abstract: Privacy has rapidly become a major concern/design consideration. Homomorphic encryption (HE) and garbled circuits (GC) are privacy-preserving techniques that support computations on encrypted data. HE and GC can complement each other, as HE is more efficient for linear operations, while GC is more effective for non-linear operations. Together, they enable complex computing tasks, such as machine learning, to be performed exactly on ciphertexts. However, HE and GC introduce two major bottlenecks: an elevated computational overhead and high data transfer costs. This paper presents Privacy Preserving In-Memory Computing Engine (PPIMCE), an in-memory computing (IMC) fabric designed to mitigate both computational overhead and data transfer issues. Through the use of multiple IMC cores for high parallelism, and by leveraging in-SRAM IMC for data management, PPIMCE offers a compact, energy-efficient solution for accelerating HE and GC. PPIMCE achieves a 107x speedup against a CPU implementation of GC. Additionally, PPIMCE achieves a 1500x and 800x speedup compared with CPU and GPU implementations of CKKS-based HE multiplications. For privacy-preserving machine learning inference, PPIMCE attains a 1000x speedup compared with CPU and a 12x speedup against CraterLake, the state-of-art privacy preserving computation accelerator.

     

/

返回文章
返回