随着人工智能技术的迅猛发展和现实世界优化问题的日益复杂,传统数字计算面临着能耗和性能的双重挑战。大量的人工智能推理任务和组合优化问题对计算资源的需求持续攀升,给数据中心和边缘设备带来了巨大压力。针对这一难题,模拟光学计算机(Analog Optical Computer,简称AOC)应运而生,成为促进未来高效能计算的突破口。 模拟光学计算机结合了模拟电子学和三维光学技术,利用光的自然并行性和高速传播特性,实现了矩阵-向量乘法等核心计算任务的极致加速。与传统数字硬件相比,AOC通过避免频繁的数字-模拟转换,降低了能量消耗,显著提升了计算效率。其共轭的模拟架构不仅支持复杂的人工智能迭代推理模型,也适配混合二元与连续变量的组合优化问题,具备广泛的适用性。
该系统通过一种独特的快速固定点搜索算法,使得整个计算过程能够在模拟域内闭环运行,从而免除了能耗高昂的中间数字转换过程。固定点搜索算法让系统在迭代中趋向稳定解,天然增强了模拟计算对噪声的鲁棒性,为实际部署奠定了坚实基础。 从硬件架构角度看,AOC主要由微型发光二极管(microLED)阵列、空间光调制器(SLM)以及光电探测器阵列构成。微LED阵列将当前状态向量编码为发光强度,空间光调制器则存储网络权重或问题系数,利用光强的调制完成矩阵乘法。随后,经过光电探测器转换成电信号,再通过模拟电子电路实现非线性激活、减法和退火机制。光与电的交替操作构成了模拟反馈环,实现固定点的快速迭代运算。
AOC的模拟光学核心设计克服了传统计算硬件面临的冯·诺依曼瓶颈,将计算与存储紧密耦合。由于采用三维光学结构,AOC实现了优越的光路扇入与扇出效果,突破了平面光学计算架构在矩阵规模上的限制,使得大规模矩阵运算具备高效的扩展性。 在人工智能推理方面,AOC天然契合迭代式均衡模型(equilibrium models),例如深度均衡网络(deep equilibrium networks)。这类模型通过固定点迭代实现递归推理,具备较强的代表性和泛化能力,能够有效处理动态推理计算需求。AOC利用其固定点搜索能力,在硬件层面对这类模型进行加速,实现低延迟且能耗极低的推理过程。 模拟光学计算机还成功应用于非线性回归和图像分类任务。
通过数字孪生技术,研究团队能够在线训练模型,并将权重精确量化为9位模拟数值映射到硬件。实验结果显示,AOC在处理复杂非线性函数拟合以及MNIST和Fashion-MNIST分类上均表现出与数字仿真高度一致的性能,证明了其模拟推理的可靠性和稳定性。 在组合优化领域,AOC支持通用的二次无约束混合优化问题(QUMO),涵盖了具有连续与二进制变量的混合优化任务。相比传统的单纯二进制优化(QUBO),QUMO更具表达能力,能够更高效地编码实际优化约束,这为金融交易结算、医疗图像压缩感知等复杂工业应用提供了广阔的空间。 以医疗图像重建为例,AOC能够高效解决利用ℓ0范数约束的稀疏信号重构问题,这在传统数字优化中往往因组合爆炸而难以实现。通过将MRI采集过程和图像稀疏性约束编码为QUMO问题,AOC实现了对真实脑部扫描图像的高质量重建,极大提升了图像采集速度和患者体验。
在金融领域,AOC通过解决多方证券交割的交易结算问题,实现了在严格法律约束与流动性限制下最大化已结算交易数量。这类问题因其NP难的复杂性,对计算能力要求极高。AOC利用块坐标下降法,将大型问题分解为多步子问题,逐步逼近最优解,并在实际硬件中展现出快速收敛和全球最优解的优势。 针对多种合成和实际优化实例,AOC均展现了优异的性能。通过实验硬件和数值数字孪生验证,AOC在16变量的高精度QUMO及QUBO实例中,均能在千次采样内达到95%以上的最优目标接近度。更重要的是,相较于商业优化软件,如Gurobi,AOC的数字孪生算法在多项大规模含复杂线性约束的QPLIB基准问题上表现出高达千倍的速度提升,甚至发现了新的最优解。
未来,AOC的扩展路径依赖于模块化架构设计,采用多个4百万像素级别的光学模块并联,突破亿级变量规模。通过集成式模拟电子与三维光学技术,AOC有望实现厘米级模块尺寸,并通过堆栈网格结构构建数十到数百个光学模块,支撑千万甚至十亿级权重模型的计算需求。 整体而言,预估AOC的计算效率可达到每瓦500万亿次操作(TOPS),远超现有GPU的能效水平,为构建绿色、可持续的智能计算体系提供了可能。其对推理和优化模型的双模式支持,也充分体现了软硬件协同设计理念在创新计算领域的巨大潜力。 随着模拟光学计算技术不断迈向成熟,从现有的实验室规模原型到大规模产业应用,AOC有望成为推动下一代人工智能和组合优化研究与实践的基石。它不仅能够减轻数字计算体系因计算密集与数据运动带来的能耗压力,更为包括医疗、金融等关键领域提供高效解决方案,助力实现智能社会的低碳绿色发展愿景。
。