在数字安全领域,密码恢复一直是保护和检查数据访问权限的关键环节。尤其是在离线密码恢复场景下,攻击者基于泄露的加密摘要和盐值,通过不断猜测密码寻找正确的认证凭据,然而这不仅计算量庞大,还面临效率瓶颈。近年来,深度学习技术,特别是生成对抗网络(GAN)和大型语言模型(LLM)的应用,为密码生成带来了革命性变化,能够更智能地模拟人类密码习惯,缩小猜测空间。然而,深度学习模型的极高计算复杂度,使得传统系统难以满足快速密码恢复的需求。为此,多FPGA(现场可编程门阵列)系统的设计与实现成为了加速密码恢复的创新途径。多FPGA系统通过并行处理能力和自定义硬件架构,实现模型推理和加密算法的协同优化,既提升了处理速度,也降低了功耗。
PassRecover便是此领域的代表性系统,该系统通过集成一个Zynq MPSoC XCZU7EV和两个Virtex Ultrascale+ XCVU9P FPGA,构建了一个覆盖离线密码恢复全过程的加速方案。系统内置神经处理单元(NPU)专门负责深度学习密码生成,配合定制化的加密算法加速器,实现了密码候选生成与加密校验的无缝数据流式并行处理。PassRecover选用了具代表性的深度学习密码生成算法PassGAN,充分展示了其密码生产的优势和瓶颈。与传统字典攻击和概率上下文无关文法(PCFG)相比,PassGAN在密码恢复率上表现出色,尤其擅长挖掘稀有及超稀有密码类别,在Rockyou等典型数据集上的测试显示了其卓越的通用性和准确性。然而,高精度的密码生成也伴随着大幅的性能开销。PassRecover通过FPGA的高度并行计算能力,缓解了这一瓶颈,实现了比传统GPU平台高达82.16%的速度提升以及155.22%的能效提升。
硬件设计方面,PassRecover巧妙地采用了异构FPGA架构,Zynq MPSoC利用其内置ARM Cortex-A53处理器,负责管理、调度以及高效生成基于高斯分布的随机向量输入,保证NPU的持续运作。两块XCVU9P FPGA则专注于加密算法的并行化处理,支持Office2010、Office2013、PDF1.7、Winzip和RAR5等主流加密标准的批量加速。通过片间高速传输接口和DMA机制,实现了密码生成模块与加密模块的数据流水线化操作,最大限度地减少了等待和数据传输延迟。PassRecover还采用了运行时重配置技术,根据任务需求灵活切换加密算法,保障了系统的适应性和扩展能力。此外,系统设计支持两种加速模式,以兼顾不同加密算法速度的特性。针对较慢的加密算法,NPU在Zynq MPSoC上运行,生成密码后由两个XCVU9P FPGA进行加密计算,形成生产者消费者协作链路。
在面对高速加密算法时,密码生成任务被转移至XCVU9P FPGA进行,另一块XCVU9P则专注于加密加速,同时采用加密掩码进行混合攻击策略,扩大密码空间并缓解生成速度瓶颈。硬件架构的统一模板化设计,使得针对不同加密算法的定制细节能够快速实现,同时保持整体架构的稳定和效率。以Office2013加密算法为例,其核心计算主要由大量迭代的SHA-512哈希操作及AES-256加解密构成。PassRecover通过在FPGA内部实现深度流水线化的SHA-512加速单元和高性能AES模块,将数万个密码尝试的哈希计算时间大幅压缩。实验数据显示,相比传统CPU和GPU平台,PassRecover在仅加密加速部分就已实现最高近2倍速度提升及4倍能效提升,整体端到端系统相较于GPU方案完成任务速度提升了近93%,能效提升超过3.7倍。系统的可扩展性也非常出色。
通过分布式计算框架如Dask的支持,一个计算节点对应一个PassRecover硬件单元,实现了线性几乎不衰减的多节点协同加速,满足了大规模密码恢复任务对算力的需求。虽然FPGA方案在部署速度、算法定制复杂度等方面存在劣势,但PassRecover以硬件级的高吞吐和能效优势,成为数字取证领域面向未来密码破解的理想解决选择。展望未来,随着更复杂的自然语言处理模型PassGPT以及其它更强深度学习算法的普及,PassRecover的通用NPU架构为进一步模型映射提供了坚实基础。此外,提高FPGA开发效率和高层次综合工具的发展趋势,也将促使此类高性能密码恢复系统更加普及和易用。在数字安全监管态势日益严峻的今天,PassRecover为离线密码恢复提供了崭新的硬件加速视角,不仅提升了密码猜测效率,还有效降低了时间和能源成本,推动密码学与人工智能及硬件技术的深度融合,开创了密码恢复技术升级的新篇章。 。