近日,复旦大学刘琦教授、向都青年研究员、张续猛青年副研究员发表了题为“Reward-modulated spike-timing-dependent plasticity in van der Waals ferroelectric memtransistor for robotic recognition and tracking”的工作于Science Bulletin期刊上。
本文介绍了一种通过基于单个二维铁电浮栅异质结器件模拟实现R-STDP突触可塑性的研究。研究团队基于石墨烯/CuInP2S6/MoS2铁电浮栅异质结器件模拟实现了R-STDP突触可塑性,并在此基础上构筑SNN网络,模拟执行了机器人对于静态以及动态目标的捕获任务,模拟结果显示机器人对于动态样品以及静态样品均能实现快速识别及捕获,并且对于动态目标的捕获成功率可达到85.5%,体现出网络优异的性能。
脉冲神经网络(SNN)是众多神经形态计算范式中的一种,在执行AI任务过程中因能够表现出低延迟、高能效的特征而得到了广泛关注。脉冲时许依赖可塑性(STDP)作为一种仿生学习训练规则能够使SNN在对静态样本的学习和识别中表现出优异的性能,然而却无法满足网络对于动态环境的适应需求。受生物体中多巴胺对于突触可塑性调控作用的启发,受奖励信号调控的STDP(R-STDP)被提出用于训练SNN网络权重以满足对于动态复杂环境的适应需求。然而,在实际应用过程中,往往需要多个器件才能实现对R-STDP的模拟,继而表现出硬件结构复杂、功耗大的问题。
本文的核心内容是基于单个二维铁电异质结器件实现R-STDP突触可塑性,并构筑SNN网络模拟执行对动态目标的捕获。通过独立施加偏压以及栅压诱导CIPS发生铁电极化,从而降低界面势垒高度,有助于载流子注入浮栅层中进行存储,进而使器件表现出显著的非易失存储特性以及长时程突触可塑性。在此基础上,通过以栅压脉冲作为奖励信号对由偏压脉冲主导的STDP进行调控,可以实现STDP与anti-STDP之间的转变,从而在单个器件中实现R-STDP,使得硬件架构相比于之前的工作得到了极大的简化。在实现R-STDP的基础上,通过构筑SNN网络进一步模拟实现了图像识别、小样本学习和机器人对于静态以及动态目标的捕获任务。在图像识别任务中,网络在经过5个训练批次以内即可获得95.1%的识别准确率,并且网络的参数量仅为8000,远小于之前报道中所用网络的参数规模。在小样本学习内容中,使用R-STDP训练的网络体现出更高的学习效率,其在经过一个批次的数据训练后即可获得高达100%的识别准确率,而使用STDP训练的网络在经过八个批次的数据训练后,识别准确率仅为87.4%。在对于静态、动态目标的模拟捕获任务中,不论是对于静态还是动态目标,机器人都能快速对其捕获。特别是在对于动态目标的捕获任务中,网络的捕获成功率可达到85.5%,并且在器件间差异以及周期间差异达到10%时依旧可保持约80%左右的捕获成功率,体现出良好的鲁棒特性。综上,本研究提出了基于单个器件模拟实现R-STDP的硬件结构,有助于实现紧凑、高效的交互式 AI 应用。
本工作中采用了三类不同形式的任务验证基于单个二维铁电异质结器件实现R-STDP训练脉冲神经网络的可行性。在仿真工作中,首先采用一个多层全卷积脉冲神经网络实现了针对MNIST手写数字数据集的高精度识别。该网络共包含3个卷积层,卷积核通道数(尺寸)分别为30(5×5);250(3×3);200(5×5)。根据奖惩信号的不同,输出层的权重将受到STDP或anti-STDP规则的调控。此外,在ETH-80数据集的小样本学习任务中,本工作采用了一个单层包含了20个尺寸为30×30的卷积核的脉冲神经网络以实现对数据集的学习与识别。机器人对静态与动态目标的捕获任务中采用了一个双层全连接结构的脉冲神经网络,神经元层分别包含100与13个神经元。上述任务中采用的脉冲神经元模型均为LIF神经元,可通过泄漏-积分-发放过程实现对脉冲信号的时序处理。
1、优异的非易失存储特性:铁电浮栅异质结在±45 V栅压范围下可实现85 V的存储窗口,存储窗口比值高达96%。
2、通过单个器件实现R-STDP:通过独立调控偏压以及栅压信号均能使器件表现出非易失存储特性,因此通过同时施加栅压以及偏压脉冲可实现对STDP特性的调控,进而实现R-STDP。
3、实现R-STDP功耗低:由于CuInP2S6铁电极化场可对界面势垒高度进行调控,因此只需施加±5 V范围内的电压脉冲即可实现R-STDP,对应功耗仅为1.3 nJ。
4、网络结构精简:基于异质结器件实现的R-STDP构筑的SNN网络参数量仅为8000,却能够实现95.1%的图像识别准确率。
5、网络鲁棒性突出:在模拟执行动态目标捕获任务中,当器件间差异以及周期间差异达到10%时,网络依旧可保持约80%左右的捕获成功率。
研究团队基于单个二维铁电异质结器件实现了R-STDP突触可塑性,并在此基础上构筑了SNN网络,模拟执行了图像识别、小样本学习和静态以及动态目标的捕获任务。该异质结器件表现出结构简单、功耗低的特性,能够显著简化模拟实现R-STDP所需的硬件架构。并且,基于R-STDP构筑的SNN网络表现出学习效率高、鲁棒性突出的优势。综上,本研究提出了基于单个器件模拟实现R-STDP的硬件结构,有助于实现紧凑、高效的交互式 AI 应用。