针对犚犛犃算法的踪迹驱动数据犆犪犮犺犲计时攻击...

书书书

第３７卷　第５期２０１４年５月

计　　算　　机　　学　　报ＣＨＩＮＥＳＥＪＯＵＲＮＡＬＯＦＣＯＭＰＵＴＥＲＳ

Ｖｏｌ．３７Ｎｏ．５Ｍａｙ２０１４

　

收稿日期：２０１２０５０８；最终修改稿收到日期：２０１４０１０２．本课题得到国家自然科学基金（６０７７２０８２）、河北省自然科学基金数学研究专项（０８Ｍ０１０）资助．陈财森，男，１９８３年生，博士，助理工程师，主要研究方向为公钥密码旁路攻击和故障分析．Ｅｍａｉｌ：ｃａｉｓｅｎｃｈｅｎ＠１６３．ｃｏｍ．王　韬，男，１９６４年生，博士，教授，博士生导师，主要研究领域为信息安全和密码学．郭世泽，男，１９６９年生，博士，研究员，博士生导师，主要研究领域为信息安全和密码学．周　平，男，１９８８年生，博士研究生，主要研究方向为公钥密码微架构分析．

针对犚犛犃算法的踪迹驱动数据犆犪犮犺犲计时攻击研究陈财森１），２）　王韬２）　郭世泽３）　周平２）

１）（装甲兵工程学院科研部　北京　１０００７２）２）（军械工程学院信息工程系　石家庄　０５０００３）

３）（北方电子设备研究所　北京　１０００８３）

摘　要　Ｃａｃｈｅ计时攻击是旁路攻击领域的研究热点．针对滑动窗口算法实现模幂运算的ＲＳＡ算法，分析了ＲＳＡ算法访问驱动Ｃａｃｈｅ计时攻击的难点，建立了踪迹驱动数据Ｃａｃｈｅ计时攻击模型．在攻击模型与原有踪迹驱动计时攻击算法的基础上，利用幂指数与操作序列的相关性、窗口大小特征和预计算表索引值与窗口值的映射关系，提出了一种改进的幂指数分析算法，并给出了利用幂指数犱狆和犱狇的部分离散位恢复出私钥犱的格攻击过程．利用处理器的同步多线程能力实现了间谍进程与密码进程的同步执行，针对ＯｐｅｎＳＳＬｖ０．９．８ｂ中的ＲＳＡ算法，在真实环境下执行攻击实验．实验结果表明：新的分析算法大约能够获取５１２位幂指数中的３４０位，比原有算法进一步降低了密钥恢复的复杂度；同时对实际攻击中的关键技术以及可能遇到的困难进行分析，给出相应的解决方案，进一步提高了攻击的可行性．

关键词　ＲＳＡ密码算法；旁路攻击；数据Ｃａｃｈｅ计时攻击；踪迹驱动；滑动窗口算法；网络安全；信息安全中图法分类号ＴＰ３９３　　　犇犗犐号１０．３７２４／ＳＰ．Ｊ．１０１６．２０１４．０１０３９

犚犲狊犲犪狉犮犺狅狀犜狉犪犮犲犇狉犻狏犲狀犇犪狋犪犆犪犮犺犲犜犻犿犻狀犵犃狋狋犪犮犽犃犵犪犻狀狊狋犚犛犃ＣＨＥＮＣａｉＳｅｎ１），２）　ＷＡＮＧＴａｏ２）　ＧＵＯＳｈｉＺｅ３）　ＺＨＯＵＰｉｎｇ２）

１）（犇犲狆犪狉狋犿犲狀狋狅犳犛犮犻犲狀狋犻犳犻犮犚犲狊犲犪狉犮犺，犜犺犲犃犮犪犱犲犿狔狅犳犃狉犿狅狉犲犱犉狅狉犮犲狊犈狀犵犻狀犲犲狉犻狀犵，犅犲犻犼犻狀犵　１０００７２）２）（犇犲狆犪狉狋犿犲狀狋狅犳犐狀犳狅狉犿犪狋犻狅狀犈狀犵犻狀犲犲狉犻狀犵，犗狉犱狀犪狀犮犲犈狀犵犻狀犲犲狉犻狀犵犆狅犾犾犲犵犲，犛犺犻犼犻犪狕犺狌犪狀犵　０５０００３）

３）（犜犺犲犐狀狊狋犻狋狌狋犲狅犳犖狅狉狋犺犈犾犲犮狋狉狅狀犻犮犈狇狌犻狆犿犲狀狋，犅犲犻犼犻狀犵　１０００８３）

犃犫狊狋狉犪犮狋　Ｃａｃｈｅｔｉｍｉｎｇａｔｔａｃｋｉｓｏｎｅｏｆｒｅｓｅａｒｃｈｆｉｅｌｄｓｏｆｓｉｄｅｃｈａｎｎｅｌａｔｔａｃｋ．ＡｇａｉｎｓｔｔｈｅＲＳＡａｌｇｏｒｉｔｈｍｗｈｉｃｈｕｓｅｓｔｈｅｓｌｉｄｉｎｇｗｉｎｄｏｗａｌｇｏｒｉｔｈｍｆｏｒｍｏｄｕｌａｒｅｘｐｏｎｅｎｔｉａｔｉｏｎ，ｔｈｉｓｐａｐｅｒａｎａｌｙｚｅｓｔｈｅｄｉｆｆｉｃｕｌｔｙｏｆａｃｃｅｓｓｄｒｉｖｅｎＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋ，ａｎｄｂｕｉｌｄｓａｔｒａｃｅｄｒｉｖｅｎＤａｔａＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋｍｏｄｅｌ．Ｂａｓｅｄｏｎｔｈｅｔｒａｃｅｄｒｉｖｅｎａｔｔａｃｋｍｏｄｅｌａｎｄｔｈｅｐｒｅｖｉｏｕｓｔｒａｃｅｄｒｉｖｅｎｔｉｍｉｎｇａｔｔａｃｋａｌｇｏｒｉｔｈｍ，ｗｅｐｒｏｐｏｓｅａｎｅｗａｎａｌｙｓｉｓａｌｇｏｒｉｔｈｍｏｆｔｈｅｐｏｗｅｒｅｘｐｏｎｅｎｔ，ｂｙａｎａｌｙｚｉｎｇｔｈｅｃｏｒｒｅｌａｔｉｖｉｔｙｂｅｔｗｅｅｎｔｈｅｐｏｗｅｒｅｘｐｏｎｅｎｔｂｉｔｓａｎｄｔｈｅｏｐｅｒａｔｉｏｎｓｅｑｕｅｎｃｅ，ｕｓｉｎｇｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｏｆｔｈｅｗｉｎｄｏｗｓｉｚｅａｎｄｔｈｅｃｏｒｒｅｓｐｏｎｄｅｎｃｅｒｅｌａｔｉｏｎｓｈｉｐｂｅｔｗｅｅｎｔｈｅｏｆｔｈｅｐｒｅｃｏｍｐｕｔｅｄｔａｂｌｅｉｎｄｅｘｅｓａｎｄｔｈｅｗｉｎｄｏｗｖａｌｕｅｓ．Ｗｅｆｕｒｔｈｅｒａｄｖａｎｃｅａｌａｔｔｉｃｅｒｅｄｕｃｔｉｏｎｍｅｔｈｏｄｗｈｉｃｈｃａｎｇｅｔｔｈｅｗｈｏｌｅｐｒｉｖａｔｅｋｅｙ犱ｕｓｉｎｇｐａｒｔｉａｌｄｉｓｃｒｅｔｅｋｎｏｗｎｂｉｔｓｏｆ犱狆ａｎｄ犱狇．Ｆｉｎａｌｌｙ，ｗｅｉｍｐｌｅｍｅｎｔｔｈｅｓｐｙｐｒｏｃｅｓｓａｎｄｃｉｐｈｅｒｐｒｏｃｅｓｓｒｕｎｉｎｐａｒａｌｌｅｌｕｓｉｎｇａｓｉｍｕｌｔａｎｅｏｕｓｍｕｌｔｉｔｈｒｅａｄｉｎｇｐｒｏｃｅｓｓｏｒ，ａｎｄｒｅａｌｉｚｅｔｈｅＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋａｇａｉｎｓｔｔｈｅＲＳＡａｌｇｏｒｉｔｈｍｏｆＯｐｅｎＳＳＬｖ０．９．８ｂｕｎｄｅｒｔｈｅｐｒａｃｔｉｃａｌｅｎｖｉｒｏｎｍｅｎｔ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｓｈｏｗｔｈａｔ：ｔｈｅｐｒｏｐｏｓｅｄａｎａｌｙｓｉｓａｌｇｏｒｉｔｈｍｃａｎｏｂｔａｉｎａｐｐｒｏｘｉｍａｔｅｌｙ３４０ｂｉｔｓｏｕｔｏｆｅａｃｈ５１２ｂｉｔｅｘｐｏｎｅｎｔ，ｆｕｒｔｈｅｒｒｅｄｕｃｅｔｈｅｓｅａｒｃｈｓｐａｃｅｏｆｔｈｅｂｉｔｓｏｆｔｈｅｐｒｉｖａｔｅｋｅｙｔｈａｎｔｈｅｆｏｒｍｅｒ．Ｗｅａｌｓｏａｎａｌｙｚｅｔｈｅｋｅｙｔｅｃｈｎｉｑｕｅｓａｎｄｔｈｅｐｏｔｅｎｔｉａｌｄｉｆｆｉｃｕｌｔｙ

ｄｕｒｉｎｇｔｈｅｐｒａｃｔｉｃａｌａｔｔａｃｋ，ａｎｄｐｒｏｖｉｄｅｔｈｅｃｏｒｒｅｓｐｏｎｄｉｎｇｓｏｌｕｔｉｏｎｓ，ｔｏｆｕｒｔｈｅｒｉｍｐｒｏｖｅｔｈｅｆｅａｓｉｂｉｌｉｔｙｏｆＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋ．

犓犲狔狑狅狉犱狊　ＲＳＡｃｒｙｐｔｏｇｒａｐｈｉｃａｌｇｏｒｉｔｈｍ；ｓｉｄｅｃｈａｎｎｅｌａｔｔａｃｋ；ｄａｔａｃａｃｈｅｔｉｍｉｎｇａｔｔａｃｋ；ｔｒａｃｅｄｒｉｖｅｎ；ｓｌｉｄｉｎｇｗｉｎｄｏｗａｌｇｏｒｉｔｈｍ；ｎｅｔｗｏｒｋｓｅｃｕｒｉｔｙ；ｉｎｆｏｒｍａｔｉｏｎｓｅｃｕｒｉｔｙ

１　引　言ＲＳＡ算法是目前最为广泛使用的公钥密码算

法之一，其安全性是依赖于大整数因式分解的困难性，一定长度的密钥从数学分析的角度上能够保证私钥的安全性．然而随着旁路分析的发展，研究结果表明，由于采用窗口算法实现的ＲＳＡ算法存在查找预计算表的操作，导致其遭受数据Ｃａｃｈｅ攻击的威胁．

自从Ｋｏｃｈｅｒ［１］和Ｋｅｌｓｅｙ等人［２］提出将高速缓冲存储器Ｃａｃｈｅ的行为信息作为旁路泄露信息的思想以来，不少密码分析学家针对各种密码算法的Ｃａｃｈｅ攻击展开研究．２００２年，Ｐａｇｅ［３］提出了一种针对ＤＥＳ的Ｃａｃｈｅ攻击方法，利用访问Ｃａｃｈｅ时命中与失效的时间差异信息与Ｓ盒查找表的索引值以及子密钥的相关性，缩小密钥的搜索空间，将ＤＥＳ密钥搜索空间由５６位降低到３２位；２００４年，Ｂｅｒｎｓｔｅｉｎ①提出并实现了一种针对ＯｐｅｎＳＳＬ中ＡＥＳ算法的时序驱动Ｃａｃｈｅ计时攻击方案．由于分组密码算法实现过程中大部分存在查找Ｓ盒的操作，导致很容易遭受Ｃａｃｈｅ攻击，因此起初的研究大都针对分组密码展开，而针对公钥密码算法的Ｃａｃｈｅ攻击研究相对较晚．２００５年，Ｐｅｒｃｉｖａｌ［４］首次提出了利用多线程间共享Ｃａｃｈｅ资源的特点，使间谍进程能够与密码进程同步执行，并监视密码进程实现过程中访问Ｃａｃｈｅ的状态信息，设计并实现了一种针对采用滑动窗口算法实现的ＲＳＡ算法Ｃａｃｈｅ计时攻击方案．２００７年，Ａｃｉｉｃｍｅｚ等人［５］提出了一种新的旁路攻击概念．微架构攻击（ＭｉｃｒｏａｒｃｈｉｔｅｃｔｕｒａｌＡｔｔａｃｋ，ＭＡ），将攻击的微处理器部件单元由数据Ｃａｃｈｅ扩展到包括指令Ｃａｃｈｅ和分支预测单元等微架构元器件，主要提出了基于指令Ｃａｃｈｅ［６］和ＢＰＵ［７］的攻击模型与算法，但只停留在理论验证和仿真实验阶段，而且实验细节及实验结果很少公开．国内在密码Ｃａｃｈｅ计时攻击方面的研究起步较晚，而且大都是针对分组密码算法，针对公钥密码算法的Ｃａｃｈｅ攻击研究较少，仅仅停留在攻

击机理研究阶段．目前针对密码算法的Ｃａｃｈｅ攻击按照采集的时

间类型不同可分为时序驱动攻击①、访问驱动攻击［８］和踪迹驱动攻击［９］．时序驱动攻击采集的是密码进程整个加解密时间，执行操作简单，但所需样本量非常大，且易受外界因素的干扰；访问驱动攻击利用间谍进程采集密码进程加解密过程中访问Ｃａｃｈｅ的特征信息，利用密码进程查找表操作导致间谍进程二次访问时命中和失效的时间差异以及查找表索引值与密钥信息的相关性进行密码分析，主要适用于基于Ｓ盒查找的分组密码算法，对于不存在查找表操作或查找表很小的公钥密码算法执行此类攻击存在一定的困难性；踪迹驱动攻击利用间谍程序采集密码进程一次加解密过程中每次查表Ｃａｃｈｅ访问的命中和失效信息，具有采集方法复杂、分析方法简单的特点，先前的大部分研究是通过采集功耗［１０］或电磁②的手段进行的，需要物理接触密码设备，实施起来较为复杂．

本文主要针对ＲＳＡ算法的踪迹驱动Ｃａｃｈｅ计时攻击展开研究．利用采用滑动窗口算法实现模幂运算过程中预计算表的查找操作导致的Ｃａｃｈｅ命中与失效特性，建立基于数据Ｃａｃｈｅ的踪迹驱动攻击模型；利用间谍进程采集密码进程执行过程中泄露的Ｃａｃｈｅ访问踪迹，获取算法执行的关键操作序列，提出由算法操作序列推导出幂指数位信息的分析方法；利用窗口大小特征以及预计算表索引值与窗口值的相关性，提出一种能进一步缩小幂指数搜索空间的算法；最后在具有同步多线程能力的处理器上执行攻击实验，精心编写能够与密码进程同步执行的间谍程序，在真实环境下针对ＯｐｅｎＳＳＬｖ０．９．８ｂ密码库中的ＲＳＡ算法执行攻击，对攻击过程中的难点进行分析并给出相应的解决方案．设计并执行实验成功获取幂指数犱狆和犱狇大约３４０位的幂指数值，再运用格攻击的分析方法推导出完整的密钥值，验证了

０４０１计　　算　　机　　学　　报２０１４年

①

②

ＢｅｒｎｓｔｅｉｎＤＪ．ＣａｃｈｅＴｉｍｉｎｇａｔｔａｃｋｓｏｎＡＥＳ［ＥＢ／ＯＬ］．ｈｔｔｐ：／／ｃｒ．ｙｐ．ｔｏ／ｐａｐｅｒｓ．ｈｔｍｌ＼＃ｃａｃｈｅｔｉｍｉｎｇ２００５，０８，０９ＭａｔｔｈｅｗｓＡ．Ｌｏｗｃｏｓｔａｔｔａｃｋｓｏｎｓｍａｒｔｃａｒｄｓ：ｔｈｅｅｌｅｃｔｒｏｍａｇｎｅｔｉｃｓｉｄｅｃｈａｎｎｅｌ［ＥＢ／ＯＬ］．ｈｔｔｐ：／／ｗｗｗ．ｎｇｓｓｏｆｔｗａｒｅ．ｃｏｍ／ｒｅｓｅａｒｃｈ／ｐａｐｅｒｓ／ＥＭＡ．ｐｄｆ２００９，１２，０５

密钥分析方法与踪迹驱动攻击的正确性和可行性．目前在国内外研究中，针对ＲＳＡ算法的踪迹驱

动Ｃａｃｈｅ计时攻击研究成果不显著，还没有提出一种通用的针对公钥密码算法踪迹驱动Ｃａｃｈｅ计时攻击分析算法，原有的攻击大都通过修改源码的方式将间谍进程嵌入密码进程的方式实现，实现两个进程间的假同步，而且实验还处于仿真验证阶段，尚未有真实环境下的攻击实验结果公开．依据研究现状，本文的主要贡献有：

（１）通过分析ＲＳＡ密码算法的内部执行操作流程，结合针对分组密码算法的访问驱动攻击原理，指出针对ＲＳＡ算法访问驱动Ｃａｃｈｅ计时攻击的困难性，依据踪迹驱动攻击原理，建立了一种通用的踪迹驱动数据Ｃａｃｈｅ计时攻击模型．

（２）结合ＯｐｅｎＳＳＬ密码库中ＢＩＧＮＵＭ类型的数据结构，深入分析了ＲＳＡ算法实现过程中相关算法内部执行状态，利用幂指数位与平方乘法操作序列的相关性以及预计算表虚拟内存地址与Ｃａｃｈｅ组的映射关系，在原有分析算法的基础上，提出了一种基于窗口大小特征的分析算法，进一步提高Ｃａｃｈｅ计时信息的利用率，缩小了密钥的搜索空间．

（３）在实际环境下执行Ｃａｃｈｅ攻击实验，对攻击的关键技术和可能遇到的难点进行分析，主要对有效信息筛选、Ｃａｃｈｅ组定位以及索引值与Ｃａｃｈｅ组的映射等关键性问题进行阐述，并给出了相应的解决方案．

（４）给出由幂指数犱狆和犱狇的部分离散位信息推导出完整私钥犱的格攻击过程．针对ＯｐｅｎＳＳＬｖ０．９．８ｂ密码库中的ＲＳＡ算法，在同步多线程（ＳＭＴ）处理器上执行攻击实验，采集真实的数据Ｃａｃｈｅ访问时间，真正实现间谍进程与密码进程同步执行．实验获取５１２位幂指数中大约３４０位离散的位信息，利用给出的格攻击算法恢复完整密钥，证明比原有算法进一步缩小了密钥搜索空间．

本文第２节给出ＲＳＡ算法及滑动窗口实现算法、Ｃａｃｈｅ访问机制和Ｃａｃｈｅ计时攻击等相关知识；第３节给出了查找预计算表访问Ｃａｃｈｅ时间泄露和密钥分析的机理，分析了针对ＲＳＡ算法访问驱动Ｃａｃｈｅ计时攻击的困难性，建立了基于数据Ｃａｃｈｅ的踪迹驱动攻击模型；第４节依据攻击模型，给出由Ｃａｃｈｅ踪迹信息推算幂指数的分析算法；第５节分析了实际攻击中存在的难点，并给出相应的解决方案；第６节设计并实现针对ＯｐｅｎＳＳＬ的ＲＳＡ算法Ｃａｃｈｅ攻击实验，给出密钥推导过程，对实验结果进

行对比分析并讨论；第７节进行总结．

２　相关知识２１　犚犛犃算法及其实现

ＲＳＡ密码算法［１１］是目前最为广泛使用的公钥密码算法，是第一个既能用于数据加密也能用于数字签名的算法．密钥的构造过程：首先选择两个素数狆和狇，计算犖＝狆狇，随机选取加密密钥犲，满足犲犱＝１ｍｏｄ（狆－１）（狇－１），然后采用欧几里得扩展算法获得解密密钥犱，则犱＝犲－１ｍｏｄ（狆－１）（狇－１）．其中犲和犖公开，犱为私钥．设犕表示明文，犆表示密文，则算法的加密操作为犆＝犕犲ｍｏｄ犖，解密操作为犕＝犆犱ｍｏｄ犖，实现算法的核心是模幂运算：犛＝犿犱ｍｏｄ犖．

目前流行使用的ＯｐｅｎＳＳＬ密码库③是广大密码分析学家关注的主要对象，为了更好地掌握时间泄露机理，现对ＲＳＡ算法中模幂运算具体实现进行分析．最简单的实现方式是平方乘算法，即将模幂运算分解成一系列平方和乘法运算，包括从左到右和从右到左两种算法．但平方乘算法存在运算速度慢的缺点，为了提高ＲＳＡ执行速度，１９８２年比利时的Ｑｕｉｓｑｕａｔｅｒ等人［１２］首次应用著名的中国剩余定理提高了ＲＳＡ算法的运算速度，将犿犱ｍｏｄ犖分解为犿犱狆ｍｏｄ狆和犿犱狇ｍｏｄ狇，降低计算复杂度，大约能够提高４倍的执行速度．ＯｐｅｎＳＳＬ算法库在实现模幂运算时，采用滑动窗口算法［１３］．它是一种优化的快速计算模幂运算算法，将模幂运算分解为一系列的乘法运算和平方运算，幂指数以一定大小的窗口在二进制幂指数上进行滑动，利用预计算表中的元素直接作为乘数，减少乘数重复计算的步骤，提高运算效率．该思想也在ＤＳＡ、ＥＣＣ等公钥密码算法中得到了应用，是本文重点关注的实现算法，具体描述如算法１所示．

算法１．　模幂运算的滑动窗口实现算法．输入：犿、犖和犱＝（犱狀－１，犱狀－２，…，犱１，犱０），狑犻狀＿狊犻狕犲输出：犛＝犿犱ｍｏｄ犖初始化表犜［２!（狑犻狀＿狊犻狕犲－１）］犛＝１；Ｆｏｒ（犽＝狀－１，犽＞０，犽－－）｛

１４０１５期陈财森等：针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击研究

③ＴｈｅＯｐｅｎＳＳＬＰｒｏｊｅｃｔ：ＯｐｅｎＳＳＬ．ＴｈｅｏｐｅｎｓｏｕｒｃｅｔｏｏｌｋｉｔｆｏｒＳＳＬ／ＴＬＳ［ＥＢ／ＯＬ］．ｈｔｔｐ：／／ｗｗｗ．ｏｐｅｎｓｓｌ．ｏｒｇ２０１３，０５，１２

ＩＦ（犱犽＝＝０）｛犛＝犛×犛ｍｏｄ犖ｃｏｎｔｉｎｕｅ｝ＦＯＲ（犻＝１；犻＜狑犻狀＿狊犻狕犲；犻＋＋）｛　获取窗口位数狑犲狀犱和窗口值狑狏犪犾狌犲｝ＦＯＲ（犼＝０；犻＜狑犲狀犱；犼＋＋）｛犛＝犛×犛ｍｏｄ犖；｝犛＝犛×犜［狑狏犪犾狌犲１］ｍｏｄ犖；犽＝犽－狑犲狀犱；｝Ｒｅｔｕｒｎ犛；算法１中，窗口大小狑犻狀＿狊犻狕犲与幂指数犱的

长度犾有关，在ＯｐｅｎＳＳＬｖ０．９．８ｂ中，通过调用ＢＮ＿ｗｉｎｄｏｗ＿ｂｉｔｓ＿ｆｏｒ＿ｅｘｐｏｎｅｎｔ＿ｓｉｚｅ（）函数计算出对应窗口大小，当犾６７１时狑犻狀＿狊犻狕犲＝６，当６７１＞犾＞２３９时，狑犻狀＿狊犻狕犲＝５．对于通常采用的１０２４位ＲＳＡ密钥来说，ＣＲＴ实现算法中涉及的幂指数犱狆和犱狇的长度约为５１２，因此对应的窗口大小为５．２２　犆犪犮犺犲工作原理

为解决ＣＰＵ与主存之间速度不匹配的问题，现代微处理器和微型计算机中，大都采用高速缓存Ｃａｃｈｅ［１４］，为处理器提供一种快速方便地访问最频繁访问的数据和指令的方式，依据级别不同可分为Ｌ１Ｃａｃｈｅ、Ｌ２Ｃａｃｈｅ甚至还有Ｌ３Ｃａｃｈｅ，依据类型可分为数据Ｃａｃｈｅ和指令Ｃａｃｈｅ．为了解决直接映射高速缓存中冲突不命中造成的问题，目前Ｃａｃｈｅ一般采用组相连的结构，设整个Ｃａｃｈｅ包括犛个Ｃａｃｈｅ组，犠路组相连，每个Ｃａｃｈｅ行大小为犅字节，每个Ｃａｃｈｅ组有犠个Ｃａｃｈｅ行，则Ｃａｃｈｅ总大小为犛×犠×犅字节．

Ｃａｃｈｅ的工作原理［１４］：以数据Ｃａｃｈｅ为例，当处理器需要从主存读取数据时，它首先检测这些数据是否存在数据Ｃａｃｈｅ中，如果存在，处理器立即读取这些数据，而不需要访问主存（发生Ｃａｃｈｅ命中）；否则，处理器必须从更高一级的Ｃａｃｈｅ或主存中读取数据（发生Ｃａｃｈｅ失效），同时将数据的副本存储在Ｃａｃｈｅ中，可以使得以后对整块数据的读取都从缓存中进行，不必再调用内存．每一次Ｃａｃｈｅ失效都会产生对更高一级存储器的访问，从而导致额外的存取延迟时间或较大的能量消耗．另外ＣＰＵ与Ｃａｃｈｅ之间的数据交换以字为单位，而Ｃａｃｈｅ与主存之间的数据交换是以字块为单位．而且根据程序局部性

原理，会把包括要访问的数据在内的一整块Ｃａｃｈｅ行犅字节大小的数据从主存读出，装载入Ｃａｃｈｅ中．当需要驱逐Ｃａｃｈｅ时，为了保证ＣＰＵ访问时有较高的命中率，缓存中的内容应该按一定的算法替换．通常采用的算法是“最近最少使用算法”（ＬＲＵ算法），将最近一段时间内最少被访问过的Ｃａｃｈｅ行淘汰出局．具体查找Ｃａｃｈｅ行是否存在的过程如下：

在组相连的Ｃａｃｈｅ结构中，Ｃａｃｈｅ组中的任何一行都可以包含被映射到这个组的存储块，因此Ｃａｃｈｅ在寻找一个有效的行时，必须搜索组中的每一行，检查其标记与地址中的标记是否相匹配．如果在Ｃａｃｈｅ中找到了，则发生命中，块偏移从这个块中选择一个字，否则发生失效，需要从主存载入再读取．以本文采用的ＩｎｔｅｌＰｅｎｔｉｕｍ４处理器的Ｌ１数据Ｃａｃｈｅ结构为例，给出虚拟内存地址的逻辑结构图如图１所示，为后面的密钥分析算法做准备．总大小为１６ＫＢ，Ｃａｃｈｅ行大小为６４字节，８路组相连，因此共２５６个Ｃａｃｈｅ行被分为３２个Ｃａｃｈｅ组．在目标系统中每个虚拟存储器地址被分为３个部分：最低６位为块偏移位，用于选择每个Ｃａｃｈｅ行中６４个字节起始位置；与之邻近的５位为组索引位，用于选择３２个相连的Ｃａｃｈｅ组，剩余的２１位为标记位，用于区分关联到相同Ｃａｃｈｅ组的地址，标记位与索引位连起来唯一地标识了存储器中的每个块．

图１　目标系统中虚拟存储器地址的逻辑结构图

Ｃａｃｈｅ攻击正是利用Ｃａｃｈｅ访问的时间或者能量消耗差异信息，得到Ｃａｃｈｅ“命中”和“失效”特征信息，然后使用相应的旁路信息分析方法，缩小密钥搜索空间甚至得到完整密钥．２３　犆犪犮犺犲计时攻击

Ｃａｃｈｅ计时攻击［１５］属于微架构攻击的一种，主要利用密码算法在加解密过程中通过微架构元器件Ｃａｃｈｅ泄露出来的时间信息，结合明文或密文，以及Ｃａｃｈｅ行为和密钥信息的相关性来进行密钥分析的一种攻击方式，属于旁路攻击的范畴．依据Ｃａｃｈｅ工作原理可知，密码进程访问数据时，由于目标数据当前是否存在于Ｃａｃｈｅ中可通过计时手段的方式进行判断，同时由于“命中”与“失效”的时间差异信息和密钥往往是紧密相关的，所以只要能采集到足够多的时间旁路信息，结合分析算法就有可能推测出密钥．

２４０１计　　算　　机　　学　　报２０１４年

根据Ｃａｃｈｅ类型，可将计时攻击分为数据Ｃａｃｈｅ攻击、指令Ｃａｃｈｅ攻击两种［１５］．由于现代分组密码大多使用Ｓ盒查找表实现非线性混淆，而查找表需要对数据Ｃａｃｈｅ进行访问，所以目前利用数据Ｃａｃｈｅ进行的攻击对象主要为分组密码，如ＤＥＳ［３］、ＡＥＳ①；另外有部分公钥密码算法，如ＲＳＡ［４］，采用窗口算法实现实现模幂运算时，存在查找表的操作，同样存在遭受数据Ｃａｃｈｅ计时攻击的可能；现代公钥加密系统大都利用经典数学问题的单向陷门特性，使用了大量的指令访问操作，其加解密过程中由于密钥位值不同所要进行的指令访问操作数目有很大的区别，此时会导致对指令Ｃａｃｈｅ访问次数及时间存在很大区别．所以，目前利用指令Ｃａｃｈｅ的攻击对象主要是公钥加密系统，如ＲＳＡ［５６］、ＤＳＡ［１６］、ＥＣＣ［１７］．指令Ｃａｃｈｅ攻击不在本文的讨论范围内，本文主要针对数据Ｃａｃｈｅ计时攻击进行分析．

根据所采集的时间信息类型的不同［１８］，可将计时攻击分为时序驱动①、访问驱动［８］、踪迹驱动［９］

３种方式．时序驱动攻击采集的是密码进程整个加解密时间，采集方法简单，平台适用性强，但所需样本量大，一般都要百万计，离线分析方法比较复杂．更重要的是，在远程环境中，网络传输时延甚至是抖动时延都会大大影响计时的精度，采集到精确的加密时间显得极为困难．访问驱动攻击［８］主要利用间谍进程两次采集密码进程加密或解密前后访问的Ｃａｃｈｅ组集合差异信息，采集方法比时序驱动稍显复杂，但分析方法比较简单，在木马植入技术日趋成熟的今天，攻击实现的可行性比较强，但该攻击方式主要适用于针对使用Ｓ盒的分组密码算法的攻击，对于公钥密码算法存在一定的困难性，具体在３．１节进行分析．踪迹驱动攻击［９］比访问驱动攻击信息采集精度更高，攻击方需要采集密码进程一次加密或解密过程中每次查表Ｃａｃｈｅ访问的命中和失效信息，一般通过功耗检测手段进行，但该手段需要特殊的信息采集设备而且需要物理接触密码设备，实现起来比较复杂．采用计时的手段，利用处理器的同步多线程技术可实现间谍进程与密码进程的同步执行，不断监视密码进程执行过程中Ｃａｃｈｅ访问的状态信息，可获取密码进程执行过程的整个踪迹，理想情况下一条完整的踪迹信息就足以推算出整个密钥，无论在本地还是远程攻击中都具有较强的可行性．

通过分析对比发现，采用滑动窗口算法实现的公钥密码算法都存在遭受踪迹驱动攻击的可能性，本文以ＲＳＡ算法为分析对象，研究基于数据Ｃａｃｈｅ

的踪迹驱动攻击模型以及算法．２４　预先定义

为了更好地描述攻击过程，事先做如下说明：（１）Ｃａｃｈｅ结构参数本文主要针对组相连的Ｃａｃｈｅ结构，犠路组相

连，每个Ｃａｃｈｅ组包含犠个Ｃａｃｈｅ行，每个Ｃａｃｈｅ行大小定义为犅字节，每个行由犛个元素组成，整个Ｃａｃｈｅ大小为犛×犠×犅字节，每一路Ｃａｃｈｅ的大小为犛×犅字节．用犛０，犛１，犛２，…，犛狊－１分别表示犛个Ｃａｃｈｅ组，犛犻０，犛犻１，…，犛犻（狑－１），０犻＜犠，表示第犻个Ｃａｃｈｅ组的狑个Ｃａｃｈｅ行，以此类推．

（２）ＲＳＡ密钥的推导采用中国剩余定理实现ＲＳＡ算法的模幂运

算犿犱ｍｏｄ犖，模数犖长度为βｂｉｔ，将其分解为犿犱狆ｍｏｄ狆和犿犱狇ｍｏｄ狇的计算，其中犱狆和犱狇约为β／２ｂｉｔ，只要能够获取犱狆和犱狇中的任何一个数，就可通过犲．犱狆＝１ｍｏｄ（狆－１）或犲．犱狇＝１ｍｏｄ（狇－１）计算素数狆或狇；如果只能够获取犱狆或犱狇一半以上的位信息，可利用格基化约减的方法因式分解模数犖，从而计算出私钥犱．本文为了描述方便，以模幂运算犿犽ｍｏｄ狀为分析对象，幂指数犽为攻击要获取的目标，狀为模数．

（３）间谍进程、密码进程与攻击进程定义间谍进程为ＳＰ，密码进程为ＣＰ，攻击进程

为ＡＰ．（４）窗口实现算法的参数定义滑动窗口大小为狑犻狀＿狊犻狕犲，预计算表为

犜［２!（狑犻狀＿狊犻狕犲－１）］，每次滑动的窗口大小为狑犲狀犱，对应的二进制值为狑狏犪犾狌犲；如果是固定窗口算法，窗口大小为狑犻狀＿狊犻狕犲时，预计算表为犜［２!狑犻狀＿狊犻狕犲］．狑犻狀＿狊犻狕犲的大小由幂指数长度决定，依据ＯｐｅｎＳＳＬｖ０．９．８ｂ的实现方式，当β／２６７１时狑犻狀＿狊犻狕犲＝６，当６７１＞β／２＞２３９时狑犻狀＿狊犻狕犲＝５．

由于私钥犱只包含在ＲＳＡ的解密或签名计算中，如无特别说明，本文的Ｃａｃｈｅ计时攻击针对２０１４ｂｉｔ的ＲＳＡ解密算法，β／２大约为５１２，因此窗口大小狑犻狀＿狊犻狕犲＝５．

３　基于数据犆犪犮犺犲的踪迹驱动攻击模型３．１　针对犚犛犃算法访问驱动犆犪犮犺犲计时攻击的困

难性访问驱动Ｃａｃｈｅ计时攻击［８］主要利用Ｃａｃｈｅ访

３４０１５期陈财森等：针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击研究

问时间不确定性和Ｃａｃｈｅ存储空间资源共享机制，利用间谍进程监视密码进程Ｃａｃｈｅ访问操作，在密码进程一次或多次解密后，通过计时方法采集间谍进程二次访问数据的Ｃａｃｈｅ“命中”和“失效”特征信息，间接得到密码进程的Ｃａｃｈｅ访问信息并对其进行分析，预测加密查表索引信息，根据查表索引、明文（或密文）对以及密钥之间的关系缩小密钥搜索空间．由于多次执行密码进程会导致Ｃａｃｈｅ“命中”和“失效”信息混乱，因此攻击一般采取在间谍进程连续两次运行之间仅仅进行一次加密或解密操作，从而使间谍采集密码进程执行过程中所有可能的Ｃａｃｈｅ访问行为．

针对分组密码算法的访问驱动攻击算法，主要是基于算法实现过程中，查找表相关信息与明文（或密文）和子密钥三者之间存在异或操作关系，即查找表的相关信息不仅仅与子密钥有关，还受输入的明文或密钥影响．攻击利用不同的明文执行操作，采集某一轮操作过程中的Ｃａｃｈｅ访问行为，即查找表的信息，对所采集的信息依据是否具有某一相同Ｃａｃｈｅ组命中或失效的信息进行筛选，再利用三者之间的相互关系，在一定样本量情况下，通过直接分析法或排除分析法推导出子密钥的字节信息，逐步推导出某一轮的扩展密钥信息，最后再利用子密钥和主密钥的扩展关系恢复完整密钥．

在针对公钥密码算法的访问驱动攻击方面，主要涉及滑动窗口实现算法中，利用预计算表的索引

值与窗口值的对应关系，推导出幂指数的片段信息，但该方法在实现过程中具有一定的困难性．

（１）由幂指数滑动的窗口值决定预计算表的索引值，因此预计算表的相关信息只与幂指数相关，而与输入和输出值无关．

（２）由滑动窗口实现算法可知，实现过程中如果幂指数位存在若干相同的窗口值，则会对同一预计算表的对应元素多次访问．由于预计算表的大小一般较小，当窗口大小为５时，其大小有１６个元素，即有１６种可能的窗口值｛１，３，５，…，２９，３１｝，且多个元素可能被映射到相同的Ｃａｃｈｅ组，如果幂指数包含全部的窗口值，则预计算表中的每个元素都会被访问，导致无法推导并区分出窗口值及各个窗口值的数目．

（３）最主要是访问驱动攻击采集整个密码执行过程的Ｃａｃｈｅ访问状态，而没有记录获取Ｃａｃｈｅ组访问“命中”和“失效”的顺序以及次数，从而不能判断窗口值的位置，导致即使能够获取了部分窗口值，最多也只有８０＝１６×５个窗口位，这对于恢复５１２位幂指数，其计算量仍然是不可忍受的．３２　踪迹驱动犆犪犮犺犲计时攻击模型

踪迹驱动攻击比访问驱动攻击信息采集的精度更高，需要间谍进程ＳＰ与密码进程ＣＰ同步执行，采集ＣＰ一次解密过程中每次查表Ｃａｃｈｅ访问的命中和失效序列，利用获取的状态序列推导出幂指数犽的值．具体攻击模型如图２所示．

图２　踪迹驱动Ｃａｃｈｅ计时攻击模型

　　为了方便描述，图２中对内存结构和Ｃａｃｈｅ结构进行了简化，假设ＣＰ预计算表数据和ＳＰ数据在主存中所占的内存块分别用ＣＴＤ和ＳＰＤ表示，ＣＴＤ大小即为预计算表的大小，ＳＰＤ大小和Ｃａｃｈｅ存储空间大小相同（图２（ａ））．踪迹驱动Ｃａｃｈｅ计时

攻击步骤如下：（１）采集一条Ｃａｃｈｅ踪迹计时信息．间谍进程与

密码进程在同一台ＰＣ上同步运行，攻击进程ＡＰ控制间谍ＳＰ在ＣＰ执行解密之前先启动，将ＳＰＤ数据全部加载到数据Ｃａｃｈｅ中，清空整个Ｃａｃｈｅ（图２

４４０１计　　算　　机　　学　　报２０１４年

（ｂ））；然后触发ＡＰ执行ＣＰ解密操作，运算过程中可能会执行查表操作，从而将ＳＰ部分预先加载的数据从Ｃａｃｈｅ中驱逐出去，而将查到的表元素加载到Ｃａｃｈｅ中（图２（ｃ））；ＳＰ与ＣＰ同步执行，循环访问私有数据ＳＰＤ并测量访问每个Ｃａｃｈｅ行的执行时间，ＳＰ再次对所有私有数据ＳＰＤ进行访问时，对那些已被ＣＰ从Ｃａｃｈｅ中驱除出来的数据进行访问时会发生Ｃａｃｈｅ“失效”，需访问更高一级的存储器而消耗更多的时间（图２（ｄ）），如果ＣＰ没有执行查表操作，则访问时发生Ｃａｃｈｅ“命中”（图２（ｅ）），并通过计算每个Ｃａｃｈｅ组中所有Ｃａｃｈｅ行访问时间之和作为每个Ｃａｃｈｅ组的访问时间．

（２）采集完整的Ｃａｃｈｅ踪迹计时信息：ＡＰ使ＳＰ以一定的频率按照步骤（１）循环执行整个Ｃａｃｈｅ填充并测量每个Ｃａｃｈｅ组的执行时间，不断获取ＣＰ执行时的Ｃａｃｈｅ访问踪迹，直到ＣＰ执行完毕，将采集的踪迹计时信息按照时间顺序进行排列，最终得到整个ＣＰ执行的Ｃａｃｈｅ踪迹计时信息（图２（ｆ））和ＣＰ的执行踪迹（图２（ｇ））．

（３）分析Ｃａｃｈｅ踪迹计时信息：根据所采集的计时信息，推算出ＣＰ执行过程中的操作序列，利用查表操作与ＣＰ算法执行的操作序列相关性，得到部分幂指数的位信息，再依据查找表Ｃａｃｈｅ组与查表索引值之间的映射关系以及查表索引值与窗口位的对应关系，恢复幂指数的窗口位信息，然后运用格攻击［２２］推导算法恢复完整密钥．

４　踪迹驱动犆犪犮犺犲计时攻击算法４１　犆犪犮犺犲踪迹计时数据采集

依据建立的踪迹驱动计时攻击模型，为间谍进程ＳＰ分配与Ｌ１数据Ｃａｃｈｅ大小相等的字节数组犃［０，…，犛×犠×犅－１］，依据Ｃａｃｈｅ的结构特征，让ＳＰ从犃中每隔犅字节顺序读取数组数据元素占据整个Ｃａｃｈｅ，初始化Ｃａｃｈｅ的状态，为采集ＣＰ执行时的Ｃａｃｈｅ踪迹做准备，具体数据采集步骤如下：

（１）在Ｃａｃｈｅ状态初始化完毕后，ＡＰ通知ＣＰ开始对随机生成的密文执行解密操作；

（２）在ＣＰ的执行过程中，ＳＰ与其同步执行，不断访问数组犃的元素，按照元素犃［犻×犛×犅＋犼×犅］，０犻＜犠，０犼＜犛的顺序进行访问，并测量访问每个Ｃａｃｈｅ行的时间，从而获取每个Ｃａｃｈｅ组中所有Ｃａｃｈｅ行的访问时间，循环一次操作就可获取一条踪迹计时信息集合犜狋犾，０狋＜犜犻犿犲，０犾＜犛，

犜犻犿犲为ＳＰ循环采集的总次数，如果发生查表操作，则同时获取表的索引值犓犻狀犱犲狓狋，０犻狀犱犲狓３１．

（３）设置犜犻犿犲的值，使得ＳＰ在ＣＰ执行完毕之后才停止循环已采集完整的踪迹计时信息集合犜，重复步骤（２），直到ＣＰ执行完毕，将所采集的计时信息集合以及查表索引值集合分别保存为犜和犓．４．２　幂指数分析算法

（１）基于查找表与操作相关性的指数位推导算法由算法１的执行过程可以看出，只有执行乘法

运行时才会发生查表操作，其余的均为平方操作．而且滑动窗口算法中每个窗口值都是奇数，即窗口最后一位的值为１，因此如果发生查表操作即可推算出相应的指数位为１；另外窗口每次滑动都是以一定窗口的大小进行滑动的，窗口的首位值为１，滑动时是以指数位为１开始计算窗口大小的，由于狑犻狀＿狊犻狕犲＝５，因此从执行的平方乘法操作序列可以发现，如果连续出现５次以上的平方操作时，可推算出窗口大小开始计算前滑过指数位是０的数目．图３举例给出幂指数位与操作序列的映射关系．

图３　幂指数位与操作序列的映射关系图３给出执行过程中观察到的部分操作序列，

可以看出起始操作为乘法操作，由前面分析可以判断对应的指数位为１，以窗口大小狑犻狀＿狊犻狕犲＝５开始从左向右滑动，除第一个平方操作外，共有３个窗口，以乘法操作为结束点；可以判断第一个窗口大小１狑犲狀犱１２，２种可能情况，因此推算出指数位片段犽１＝｛ｘ１｝；从犽３开始出现连续５个以上的平方操作序列，第３个窗口大小为１狑犲狀犱３５，５种可能情况，推算出指数位片段犽３＝｛０００｝，犽４＝｛ｘｘｘｘ１｝．如果狑犲狀犱３＝１，犽４＝｛００００１｝；如果狑犲狀犱３＝２，犽４＝｛０００１１｝；如果狑犲狀犱３＝３，犽４＝｛００１ｘ１｝，以此类推；同样推导出犽２＝｛ｘｘｘｘ１｝．依据该方法大约可以推导出５１２位幂指数中２５６位的值．

（２）利用窗口大小的特征缩小幂指数空间除了利用操作序列进行指数位片段的推导外，还

可以利用窗口大小的特征缩小幂指数空间．从算法１可知，窗口是以狑犻狀＿狊犻狕犲＝５进行滑动的，以指数位为１结束，当滑动的窗口小于５时，可以判断窗口

５４０１５期陈财森等：针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击研究

之后存在与狑犻狀＿狊犻狕犲的差值数目相等的幂指数位为０．以图３为例，由于犽１＝｛ｘ１｝，１狑犲狀犱１２．当狑犲狀犱１＝１时，犽１＝｛０１｝，则可推算出犽２＝｛００００１｝；当狑犲狀犱１＝２时，犽１＝｛１１｝，则可推算出犽２＝｛０００ｘ１｝．利用这一特征关系可以进一步缩小密钥的搜索空间，并有利于定位索引值与Ｃａｃｈｅ组的对应关系．

（３）依据查找表索引值与窗口位对应关系的幂指数窗口位推导算法

从算法１发现，查找预计算表的索引值犓狋等于狑狏犪犾狌犲１，而且由于狑狏犪犾狌犲为奇数，即狑狏犪犾狌犲＝２×犓狋＋１，因此如果知道表的索引值就可以计算出对应的窗口值狑狏犪犾狌犲．攻击过程中是利用预计算表与Ｃａｃｈｅ组的映射关系，通过间谍进程监视Ｃａｃｈｅ组的访问状态判断出是否发生查表操作，对表中的哪些元素进行访问，从而获取索引值，推算出窗口位，理论上能够恢复完整的幂指数位．本文针对的窗口大小为５，预计算表的大小为１６个元素，据ＯｐｅｎＳＳＬ提供的ＢＩＧＮＵＭ类型分析可知，每个元素的大小为２０个字节，共３２０个字节，而Ｃａｃｈｅ行大小为６４字节，因此１６个预计算表元素对应５～６个连续Ｃａｃｈｅ组区域，即多个表元素会被映射到同

一个Ｃａｃｈｅ组，因此实际攻击时无法精确定位索引值，而是通过定位Ｃａｃｈｅ组缩小索引值的搜索空间．

５　攻击难点分析及解决方案５１　计时信息筛选

由于ＳＰ采集的信息包括ＣＰ运行前后的Ｃａｃｈｅ访问状态，而且在ＣＰ运行过程中，也并非一开始就执行滑动窗口算法操作，其中还包括蒙哥马利乘法运行时需要将参与运行的数进行蒙哥马利形式变换，临时变量的初始化与释放等其它运算操作，因此首先需要对采集的数据进行筛选，尽可能剔除与滑动窗口算法操作无关的Ｃａｃｈｅ访问状态对应的计时信息．

为了保证ＳＰ是在ＣＰ执行前启动，在ＣＰ执行完毕后终止，当ＡＰ启动ＣＰ时，先调用高精度休眠函数ｎａｎｏｓｌｅｅｐ，将休眠时间精确到毫微秒级的，实验中设置的ｔｉｍｅｓｐｅｃ的参数为｛０，０ｘ２８０００｝，ＳＰ循环采集的次数为４０００次，采集的部分结果以伪彩色图表示如图４所示．

图４　采集的Ｃａｃｈｅ计时数据的伪彩色图表示结果

　　图４中用颜色的深浅表示访问每个Ｃａｃｈｅ组的时钟周期数，颜色越深表示所消耗的时间越短．横坐标犡表示循环的序列，对应于采集的时间顺序，纵坐标犢表示３２个Ｃａｃｈｅ组对应的计时数据．从图中可以明显判断ＣＰ是从犡＝２５时开始执行解密操作的，因为此时只执行ＳＰ进程，基本上访问所有的Ｃａｃｈｅ组都发生Ｃａｃｈｅ命中，除了部分受系统进程干扰外．从犡＝８０时开始出现有规律的Ｃａｃｈｅ访问踪迹，可以判断ＣＰ此时开始执行滑动窗口计算；利用同样的方法可以判断ＣＰ执行滑动窗口计算的结束位置以及整个模幂运算执行完毕的位置，从而筛选出对应于滑动窗口算法执行过程的计时信息集

合犜狊．５２　预计算表对应犆犪犮犺犲组的定位

本文针对ＯｐｅｎＳＳＬ密码库的ＲＳＡ算法执行攻击，狑犻狀＿狊犻狕犲＝５时，预计算表的大小为１６个元素，每个ＢＩＧＮＵＭ变量的大小为２０个字节③，在Ｃａｃｈｅ行大小为６４字节的Ｃａｃｈｅ中，整个３２０字节大小的预计算表对应于５～６个连续Ｃａｃｈｅ组区域．对前面筛选的犜狊中的每一个Ｃａｃｈｅ组访问时间取平均值，结果如图５所示，从图中可以看出６个连续出现的较小值（图中标注映射Ｃａｃｈｅ组范围的区域）刚好对应于图４中的第１１～１６行，因此可以判断出预计算表对应Ｃａｃｈｅ组的起始位置．

６４０１计　　算　　机　　学　　报２０１４年

图５犜狊中３２个Ｃａｃｈｅ组对应的平均访问时钟周期分布情况由于３２０字节大小的预计算表刚好等于５个

Ｃａｃｈｅ行的大小，因此只有当第一个表元素的起始位置对应于Ｃａｃｈｅ行的偏移地址为０时，预计算表对应的Ｃａｃｈｅ组数目才为５，否则都为６．５３　预计算表索引值与犆犪犮犺犲组的映射

当依据查找表索引值与窗口位对应关系推导出幂指数窗口位时，需要知道预计算表索引值与Ｃａｃｈｅ组的映射关系．由于预计算表的１６个元素映射到５～６个Ｃａｃｈｅ组区域，而且表元素在Ｃａｃｈｅ中存储是连续的，从图１虚拟存储器地址的逻辑结构可以看出，当块偏移地址为０时，第１个表元素对应Ｃａｃｈｅ行的起始位置，此时预计算表刚好映射到５个Ｃａｃｈｅ组区域，可以很快从定位的５个Ｃａｃｈｅ组中推算出第１个Ｃａｃｈｅ组映射的索引值为｛１，３，５，７｝，第２个Ｃａｃｈｅ组映射的索引值为｛７，９，１１，１３｝，依次类推．而实际情况下往往不是这样的，从实验结果可知，预计算表往往占据６个Ｃａｃｈｅ组区域，第１个或最后一个Ｃａｃｈｅ组可能映射１～３个表元素索引值，其余均映射４个表元素索引值．

从ＯｐｅｎＳＳＬ密码库可知预计算表元素的类型为ＢＩＧＮＵＭ，该类型为结构体，共包含５个结构体元素③，且每个结构体元素的大小均为４个字节．由于元素在Ｃａｃｈｅ中的存储是连续的，因此对于６４字节的Ｃａｃｈｅ行大小，可以推算出第一个表元素在对应Ｃａｃｈｅ组中的Ｃａｃｈｅ行起始位置有１６种可能情况，攻击时需要对每种可能性进行分析．实际上可以依据４．２节中基于窗口大小特征的幂指数空间缩小算法，通过判断相邻索引值的Ｃａｃｈｅ组映射情况，结合算法的操作序列，能够进一步缩小这１６种可能的情况．例如推算出相邻的两个表索引值１与３分别映射到相邻的两个Ｃａｃｈｅ组区域，则可以将Ｃａｃｈｅ

行起始位置的情况缩小为４种情况，再分别对每种情况分析判断后面索引值对应的Ｃａｃｈｅ组是否正确，经过多次分析能够确定或进一步缩小Ｃａｃｈｅ行的起始位置，从而能够利用索引值推导出对应窗口位的可能值．

６　实验结果及分析６１　实验配置与攻击步骤

Ｃａｃｈｅ攻击可以在同步多线程（ＳＭＴ）处理器上执行，也可以在普通单线程处理器上执行．但是在ＳＭＴ处理器上，比较容易实现间谍进程与密码进程在同一个物理核中的两个虚拟核上同步执行［１９］，并监视密码进程的执行过程．而在单线程处理器上实现攻击则较为困难，攻击者需要利用间谍进程与密码进程之间的“ＰｉｎｇＰｏｎｇ”效应切换两个进程的执行进度，通过操作系统的调度机制，恶意垄断ＣＰＵ周期［２０］．本文为了便于研究，在具有ＳＭＴ能力的Ｐｅｎｔｉｕｍ４处理器上执行攻击实验，具体实验环境配置如表１所示．

表１　针对犚犛犃算法的犆犪犮犺犲攻击实验环境配置配置项参数操作系统ＬｉｎｕｘＦｅｄｏｒａ８

超线程是否开启是ＯｐｅｎＳＳＬＯｐｅｎＳＳＬｖ０．９．８ｂＣＰＵＩｎｔｅｌＰｅｎｔｉｕｍ４（Ｒ）３．０ＧＨｚ内存１ＧＢ

Ｌ１ＣａｃｈｅＣａｃｈｅｓｉｚｅ：１６ＫＢａｓｓｏｃｉａｔｉｖｅｓｉｚｅ：８ｗａｙＣａｃｈｅｌｉｎｅｓｉｚｅ：６４ＢＮｕｍｂｅｒｏｆｃａｃｈｅｓｅｔｓ：３２

Ｌ２ＣａｃｈｅＣａｃｈｅｓｉｚｅ：２０４８ＫＢａｓｓｏｃｉａｔｉｖｅｓｉｚｅ：８ｗａｙＣａｃｈｅｌｉｎｅｓｉｚｅ：６４Ｂ

在Ｌｉｎｕｘ操作系统中，攻击进程ＡＰ启动间谍进程ＳＰ，同时利用ｆｏｒｋ函数创建一个带有独立虚拟地址空间的新进程，执行解密操作，当ｆｏｒｋ在新进程中返回时，新进程现在的虚拟存储器刚好和调用ｆｏｒｋ时存在的虚拟存储器相同，使得间谍进程与密码进程共享同一数据Ｃａｃｈｅ．为了保证ＳＰ能够在ＣＰ执行前启动，而在ＣＰ执行完毕后终止，当ＡＰ调用ｆｏｒｋ函数启动ＣＰ进程时，先调用高精度休眠函数ｎａｎｏｓｌｅｅｐ，将休眠时间精确到毫微秒级，实验中设置ｔｉｍｅｓｐｅｃ的参数为｛０，０ｘ２８０００｝，同时依据ＣＰ的执行时间长短以及ＳＰ单次采集数据所需的时间长短，设置ＳＰ循环采集的次数为４０００次．实验过程中，为了提高采集数据的精度，最小化其它系统进程．

７４０１５期陈财森等：针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击研究

６．２　踪迹信息采集依据Ｌ１Ｃａｃｈｅ结构，ＳＰ的构造大小为１６ＫＢ

的字节数组犃［１６３８４］，以６４为步长，逐次访问犃［犻狀犱犲狓］、犃［犻狀犱犲狓＋０ｘ８００］、犃［犻狀犱犲狓＋０ｘ１０００］、犃［犻狀犱犲狓＋０ｘ１８００］、犃［犻狀犱犲狓＋０ｘ２０００］、犃［犻狀犱犲狓＋０ｘ２８００］、犃［犻狀犱犲狓＋０ｘ３０００］、犃［犻狀犱犲狓＋０ｘ３８００］，其中犻狀犱犲狓＝犼×６４，０犼＜３２，并通过调用ＣＰＵ的时间戳指令ＲＤＳＴＣ，测量访问每个Ｃａｃｈｅ组中所有Ｃａｃｈｅ行的时钟周期数狋犻，从而获取一条计时踪迹

犜犻＝｛狋０犻，狋１犻，…，狋３１犻｝．从采集的实验结果可知：平方操作没有执行查表操作时对应的时钟周期数为１６５～２２０；乘法操作发生查表时对应的时钟周期数为２８０～３３０．采集的Ｃａｃｈｅ计时结果以伪彩色图表示为如图４，利用前面的分析算法对采集的数据进行筛选，同时定位Ｃａｃｈｅ组的范围以及预计算表索引值对应Ｃａｃｈｅ行的起始位置．下面对其中的部分结果进行分析，如图６所示．

图６　部分Ｃａｃｈｅ计时数据的伪彩色图表示结果

６３　幂指数分析针对图６结果，利用前面的分析方法，可以推导

出算法执行的平方乘法操作序列．图中圈出了乘法操作发生的序列，其余为平方操作，因此对应的操作序列为“ＭＳＳＳＳＭＳＭＳＳＳＳＭＳＳＳＭＳＳＭ”，其中Ｓ表示平方操作，Ｍ表示乘法操作，依据算法１可知第一个操作为乘法操作．对筛选过的Ｃａｃｈｅ计时数据犜狊，利用４．２节的密钥分析算法，对幂指数位的值展开分析．在一次实验中，ＯｐｅｎＳＳＬ密码库随机生成的１０２４位ＲＳＡ密钥，对于第一个５１２位幂指数犱狆，共执行８８次乘法操作，５１１次平方操作，出现６９次５个连续的平方操作，利用操作序列与幂指数相关性可推算出犱狆中８９个值为１的比特位（包含第一位的值为１），１２１个值为０的比特位，并通过平方操作数目可知第１个窗口值为１；利用窗口大小特征可推导出剩余的３０２个幂指数位中１５个值为０的比特位；最后利用索引值的映射关系缩小窗口位的搜索空间大约能够获取１１５位左右的幂指数位，最终大约获取３４０位的值．利用相同的方法可以获取第２个幂指数犱狇的大约３４０位的信息．６４　密钥推导

理论上利用前面３种幂指数分析算法可完整推算出幂指数的值，但实际攻击中一方面由于临时变

量也可能映射到预计算表所映射的Ｃａｃｈｅ组中，导致ＳＰ无法采集有效的信息；另一方面由于同一个Ｃａｃｈｅ组映射于多个表索引值，同一个表索引值可能对应于两个相邻的Ｃａｃｈｅ组，因此攻击者只能获取犱狆和犱狇的部分信息，还需要利用获取的信息推导出私钥犱的值．尽管文献［２１］已经表明在获得其中一个因子一半的位数时，就足以在多项式时间内采用格基约化［２２］的方法分解模数犖，但是这一方法的前提是获得的密钥位必须是连续的，使得该方法不适合本文的攻击．因此必须找到一种新的方法能够利用我们所获取的信息因式分解模数犖．

给定模数犖和公钥犲，假设我们已经获取ＣＲＴ算法中通过模狆和狇所获取的幂指数犱狆和犱狇的部分信息，那么从ＲＳＡ的结构我们可以得到犲犱狆≡１（ｍｏｄ狆－１）和犲犱狇≡１（ｍｏｄ狇－１）．那么设犽狆，犽狇∈犣犲可得犲犱狆≡犽狆（狆－１）＋１和犲犱狇≡犽狇（狇－１）＋１．利用上面等式经过简单的代数计算可得等式：

犖犽狆犽狇＝（狆犽狆）．（狇犽狇）＝（犲犱狆＋犽狆－１）．（犲犱狇＋犽狇－１）（１）

接下来构造一个满足等式（１）ｍｏｄ犲．２狀的４维数组（犽狆，犽狇，犱狆，犱狇）集合犛狀，狀表示犱狆和犱狇的位长度，并且与所获取的犱狆和犱狇的部分观察值匹配，其

８４０１计　　算　　机　　学　　报２０１４年

中０犱狆，犱狇＜２狀．其中集合犛０＝（犽狆，犽狇，０，０），则有犖犽狆犽狇ｍｏｄ犲＝（犽狆－１）．（犽狇－１）ｍｏｄ犲，那么犽狇由犖和犽狆的值唯一确定，且｜犛０｜＜犲．此外，如果我们获得集合犛狀，由于犱狆的第狀ｔｈ位可能为０或者１，那么可以通过遍历犛狀中的犱狆第狀ｔｈ位值的两种情况，组成２个４元组计算得到犛狀＋１，再通过等式（１）判断犱狇第狀ｔｈ位的值，并且抛弃其它任何不满足该等式的４元组候选值．

如果我们都无法确定指数犱狆和犱狇第狀ｔｈ位的值，则有｜犛狀＋１｜＝２｜犛狀｜，其中｜犛狀｜表示集合犛狀的大小；如果我们知道其中一个指数第狀ｔｈ位的值，那么犛狀中每个４元组与犛狀＋１有唯一匹配的４元组，则有｜犛狀＋１｜＝｜犛狀｜；如果两个指数第狀ｔｈ位的值都知道的话，那么犛狀＋１的大小约为犛狀的一半．犛狀≈犲×（１／２）犽×２犾，其中犽表示犱狆和犱狇第狀ｔｈ位值都已知的数目，犾表示犱狆和犱狇第狀ｔｈ位值都未知的数目．由于获取的犱狆和犱狇的部分信息是随机分布的，因此犛狀的大小随着狀的逐渐增大，会以犲为起始点呈随机分布趋势，但由于已经获取的幂指数位数目比未知幂指数位数目多，因此犛狀的大小随着狀的增大会呈整体下降趋势．当已知位的数目多于一半时，最终犛５１２的大小小于犲．那么一旦获取犛５１２就可以简单地测试剩余的候选指数位，因式分解模数犖从而恢复出密钥犱的值．利用６．３节获取的犱狆和犱狇的部分信息进行分析，其中犲＝６５５３７，集合犛狀的大小与狀的关系如图７所示，总共需要遍历的集合数目大约为３．９７×１０６个即可获得私钥犱的值．获取犱狆和犱狇的部分信息分布不同，犛狀的大小也随之更改．总体上，获取的信息越丰富，恢复私钥犱的复杂度越小．

图７　集合犛狀大小与狀的关系图

６５　结果对比分析与讨论目前国外在踪迹驱动数据Ｃａｃｈｅ计时攻击研究

中，主要针对分组密码算法展开，而针对ＲＳＡ算法的研究相对较少，只有Ｐｅｒｃｉｖａｌ利用多线程间共享

Ｃａｃｈｅ资源的特点，提出了一种针对ＲＳＡ算法的Ｃａｃｈｅ计时攻击思想［４］，并进行实验验证；国内在该领域的研究还仅处于理论研究阶段，并没有进行实验验证．本文与分组密码算法的Ｃａｃｈｅ攻击①［３］、针对ＲＳＡ算法的指令Ｃａｃｈｅ攻击［５６］以及功耗踪迹分析［１０］因分析对象、方法不同而不具有太大的可比性，因此只与文献［４］做如下比较：

（１）原有的攻击算法针对ＯｐｅｎＳＳＬｖ０．９．７ｃ的ＲＳＡ执行攻击实验，实验中在平方操作中手工加入时延，以控制间谍进程与密码进程的执行时机，从某种意义上来说还只是处于仿真实验阶段，并没有应用于实际的攻击；本文在ＳＭＴ处理器上，针对版本较新的ＯｐｅｎＳＳＬｖ０．９．８ｂ中的ＲＳＡ算法执行攻击实验，真正意义上实现了间谍进程与密码进程的同步执行，而且还给出了实际攻击中密码进程执行踪迹起始点以及滑动窗口算法执行起始点和结束点的判断方法，对预计算表映射的Ｃａｃｈｅ组进行定位，确定了表索引值与Ｃａｃｈｅ组的映射关系，筛选出有用的Ｃａｃｈｅ计时踪迹，执行真实环境下的攻击．

（２）原有的分析算法大约能够获取５１２位幂指数中的３１０位；本文在原有分析算法的基础上提出了一种新的幂指数分析算法，利用窗口大小特征和索引值与Ｃａｃｈｅ组的映射关系，大约能够获取５１２位幂指数中的３４０位，进一步减小了密钥分析的复杂度．

（３）原有攻击算法在获取部分的幂指数位信息后，只指出能够用格攻击的思想恢复完整的私钥，并没有给出具体的推导算法；本文分析并参考了利用犱狆和犱狇部分连续幂指数位恢复私钥犱的推导算法，给出由部分离散幂指数位恢复完整私钥犱的格攻击过程，并结合实验结果进行复杂度分析．

通过前面的分析，我们运用踪迹驱动数据Ｃａｃｈｅ攻击模型以及算法，实现了对ＯｐｅｎＳＳＬ密码库中ＲＳＡ算法的Ｃａｃｈｅ计时攻击．攻击算法在理论上，只需要采集一次密码算法执行的Ｃａｃｈｅ计时踪迹，就能够恢复出完整的密钥，不像时序攻击一样需要采集百万次以上的数据，能够有效地缩小密钥的搜索空间，提高Ｃａｃｈｅ攻击的效率．利用精心编写的间谍进程不仅能够执行本地攻击，而且利用植入木马的方式同样能够作用于远程攻击．在未来的研究工作中，针对实际的攻击过程，还有如下的问题值得注意：

（１）由于受操作系统中其它进程噪声的干扰，影响Ｃａｃｈｅ组定位的精度，可能在同一次采集的计

９４０１５期陈财森等：针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击研究

时数据中，同时出现多个Ｃａｃｈｅ组访问失效的情况，很难精确定位具体的Ｃａｃｈｅ组．

（２）经研究发现ＯｐｅｎＳＳＬ中采用ＢＩＧＮＵＭ类型的大数操作过程中需要分配临时变量，分配的数目与操作的复杂度有关，以ＢＮ＿ＣＴＸ类型进行内存的动态分配，因此同样会对Ｃａｃｈｅ组访问时间的采集以及预计算表对应Ｃａｃｈｅ组的定位带来一定的影响．

（３）预计算表不像分组密码算法的Ｓ盒是固定不变的，它是在模幂运算中动态生成的，因此可能每次执行时所得到的预计算表对应的Ｃａｃｈｅ组位置以及数目都不相同，会对分析算法带来一定的影响．

综上所述，新的攻击算法尽管能够比原有算法进一步缩小密钥的搜索空间，但是在实际攻击应用中仍有不少困难需要克服，在下一步的研究中，我们需要研究如何尽量排除或减小噪声的影响，比如可以采用汇编语言实现间谍进程，使其中部分指令能够绕过Ｃａｃｈｅ的方式执行，从而减少间谍进程本身记录Ｃａｃｈｅ访问时间等操作对Ｃａｃｈｅ的影响；寻找能够进一步消除或减小噪声的数据分析方法，同时给出能够有效抵御Ｃａｃｈｅ计时攻击的措施．

７　结　论本文对ＲＳＡ算法的踪迹驱动Ｃａｃｈｅ计时攻击

进行了一些相关研究，建立了针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击模型，提出了能够进一步有效利用采集的Ｃａｃｈｅ计时信息的分析算法，指出实际攻击过程中存在的难点并给出相应的解决方案，最终针对ＯｐｅｎＳＳＬ密码库的ＲＳＡ算法进行攻击实验验证，研究结果表明：采用滑动窗口算法实现模幂运算的ＲＳＡ算法存在遭受Ｃａｃｈｅ计时攻击的安全漏洞，此类攻击方式对其它同样采用窗口算法实现的公钥密码算法安全性带来一定的威胁，能够作用于“ＣａｃｈｅＭｅｍｏｒｙ”层次存储结构的计算机平台；针对ＲＳＡ算法的访问驱动Ｃａｃｈｅ计时攻击存在一定的困难性，新的幂指数分析算法能比原有攻击算法能够获取更多的幂指数位，进一步缩小了密钥恢复的复杂度；由于此类攻击相比较于时序驱动攻击和访问驱动攻击所需的样本量小，攻击性强，应引起充分的关注．

在实际攻击过程中，由于Ｃａｃｈｅ计时攻击受外界因素影响较大，不同的执行环境、不同的密码库以及密码算法实现方式等因素都会影响攻击的执行效

果，仍然存在噪声干扰大以及Ｃａｃｈｅ组定位不准等问题；另外如何寻找一种既能有效抵御此类攻击又能保证密码算法性能的防御措施，这都需要我们做进一步的工作．

参考文献

［１］ＫｏｃｈｅｒＰＣ．ＴｉｍｉｎｇａｔｔａｃｋｓｏｎｉｍｐｌｅｍｅｎｔａｔｉｏｎｓｏｆＤｉｆｆｉｅＨｅｌｌｍａｎ，ＲＳＡ，ＤＳＳ，ａｎｄｏｔｈｅｒｓｙｓｔｅｍｓ／／Ｐｒｏｃｅｅｄｉｎｇｏｆｔｈｅ１６ｔｈＡｎｎｕａｌＩｎｔｅｒｎａｔｉｏｎａｌＣｒｙｐｔｏｌｏｇｙＣｏｎｆｅｒｅｎｃｅ（ＣＲＹＰＴＯ１９９６）．ＳａｎｔａＢａｒｂａｒａ，ＵＳＡ，１９９６：１０４１１３

［２］ＫｅｌｓｅｙＪ，ＳｃｈｎｅｉｅｒＢ，ＷａｇｎｅｒＤ，ＨａｌｌＣ．Ｓｉｄｅｃｈａｎｎｅｌｃｒｙｐｔａｎａｌｙｓｉｓｏｆｐｒｏｄｕｃｔｃｉｐｈｅｒｓ／／Ｐｒｏｃｅｅｄｉｎｇｏｆｔｈｅ５ｔｈＥｕｒｏｐｅａｎＳｙｍｐｏｓｉｕｍｏｎＲｅｓｅａｒｃｈｉｎＣｏｍｐｕｔｅｒＳｅｃｕｒｉｔｙ．ＬｏｕｖａｉｎｌａＮｅｕｖｅ，Ｂｅｌｇｉｕｍ，１９９８：９７１１０

［３］ＰａｇｅＤ．ＴｈｅｏｒｅｔｉｃａｌｕｓｅｏｆＣａｃｈｅｍｅｍｏｒｙａｓａｃｒｙｐｔａｎａｌｙｔｉｃｓｉｄｅｃｈａｎｎｅｌ．ＤｅｐａｒｔｍｅｎｔｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，ＵｎｉｖｅｒｓｉｔｙｏｆＢｒｉｓｔｏｌ：ＴｅｃｈｎｉｃａｌＲｅｐｏｒｔＣＳＴＲ０２００３，２００２

［４］ＰｅｒｃｉｖａｌＣ．Ｃａｃｈｅｍｉｓｓｉｎｇｆｏｒｆｕｎａｎｄｐｒｏｆｉｔ／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＴｅｃｈｎｉｃａｌＢＳＤＣｏｎｆｅｒｅｎｃｅ２００５（ＢＳＤ２００５）．Ｏｔｔａｗａ，Ｃａｎａｄａ，２００５：１１３

［５］ＡｃｉｉｃｍｅｚＯ，ＳｃｈｉｎｄｌｅｒＷ．ＡｍａｊｏｒｖｕｌｎｅｒａｂｉｌｉｔｙｉｎＲＳＡｉｍｐｌｅｍｅｎｔａｔｉｏｎｓｄｕｅｔｏｍｉｃｒｏａｒｃｈｉｔｅｃｔｕｒａｌａｎａｌｙｓｉｓｔｈｒｅａｔ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１４ｔｈＡＣＭＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎｓＳｅｃｕｒｉｔｙ（ＡＣＭＣＣＳ２００７）．Ａｌｅｘａｎｄｒｉａ，ＵＳＡ，２００７：２５６２７３

［６］ＡｃｉｉｃｍｅｚＯ，ＳｃｈｉｎｄｌｅｒＷ．ＡｖｕｌｎｅｒａｂｉｌｉｔｙｉｎＲＳＡｉｍｐｌｅｍｅｎｔａｔｉｏｎｓｄｕｅｔｏｉｎｓｔｒｕｃｔｉｏｎＣａｃｈｅａｎａｌｙｓｉｓａｎｄｉｔｓｄｅｍｏｎｓｔｒａｔｉｏｎｏｎＯｐｅｎＳＳＬ／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＴｏｐｉｃｓｉｎＣｒｙｐｔｏｌｏｇｙＴｈｅＣｒｙｐｔｏｇｒａｐｈｅｒｓ’ＴｒａｃｋａｔｔｈｅＲＳＡＣｏｎｆｅｒｅｎｃｅ２００８（ＣＴＲＳＡ２００８）．ＳａｎＦｒａｎｃｉｓｃｏ，ＵＳＡ，２００８：２５６２７３

［７］ＡｃｉｉｃｍｅｚＯ，ＫｏｃＣＫ，ＳｅｉｆｅｒｔＪＰ．Ｏｎｔｈｅｐｏｗｅｒｏｆｓｉｍｐｌｅｂｒａｎｃｈｐｒｅｄｉｃｔｉｏｎａｎａｌｙｓｉｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２ｎｄＡＣＭＳｙｍｐｏｓｉｕｍｏｎＩｎｆｏｒｍａｔｉｏｎ，ＣｏｍｐｕｔｅｒａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎｓＳｅｃｕｒｉｔｙ（ＡＳＩＡＣＣＳ２００７）．Ｓｉｎｇａｐｏｒｅ，２００７：３１２３２０

［８］ＮｅｖｅＭ，ＳｅｉｆｅｒｔＪＰ．ＡｄｖａｎｃｅｓｏｎａｃｃｅｓｓｄｒｉｖｅｎＣａｃｈｅａｔｔａｃｋｓｏｎＡＥＳ／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＳｅｌｅｃｔｅｄＡｒｅａｓｉｎＣｒｙｐｔｏｇｒａｐｈｙ（ＳＡＣ２００６）．Ｍｏｎｔｒｅａｌ，Ｃａｎａｄａ，２００６：１４７１６２

［９］ＡｃｉｉｃｍｅｚＯ，ＫｏｃＣＫ．ＴｒａｃｅｄｒｉｖｅｎＣａｃｈｅａｔｔａｃｋｓｏｎＡＥＳ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ９ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｆｏｒｍａｔｉｏｎａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎｓＳｅｃｕｒｉｔｙ（ＩＣＩＣＳ２００７）．Ｚｈｅｎｇｚｈｏｕ，Ｃｈｉｎａ，２００６：１１２１２１

［１０］ＨａｎＪｕｎ，ＺｅｎｇＸｉａｏＹａｎｇ，ＴａｎｇＴｉｎｇＡｏ．ＰｏｗｅｒｔｒａｃｅａｎａｌｙｓｉｓａｔｔａｃｋａｎｄｃｏｕｎｔｅｒｍｅａｓｕｒｅｓｆｏｒＲＳＡｃｒｙｐｔｏｇｒａｐｈｉｃｃｉｒｃｕｉｔｓ．ＣｈｉｎｅｓｅＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒｓ，２００６，２９（４）：５９０５９６（ｉｎＣｈｉｎｅｓｅ）（韩军，曾晓洋，汤庭鳌．ＲＳＡ密码算法的功耗轨迹分析及其防御措施．计算机学报，２００６，２９（４）：５９０５９６）

［１１］ＲｖｅｓｔＲＬ，ＳｈｍａｉｒＡ，ＡｄｌｅｍａｎＬ．Ａｍｅｔｈｏｄｏｆｒｏｂｔａｉｎｉｎｇｄｉｇｉｔａｌｓｉｇｎａｔｕｒｅｓａｎｄｐｕｂｌｉｃｋｅｙｃｒｙｐｔｏｓｙｓｔｅｍｓ．ＣｏｍｍｕｎｉｃａｔｉｏｎｓｏｆｔｈｅＡＣＭ，１９７８，２１（２）：１２０１２６

０５０１计　　算　　机　　学　　报２０１４年

［１２］ＱｕｉｓｑｕａｔｅｒＪＪ，ＣｏｕｖｒｅｕｒＣ．ＦａｓｔｄｅｃｉｐｈｅｒｍｅｎｔａｌｇｏｒｉｔｈｍｆｏｒＲＳＡｐｕｂｌｉｃｋｅｙｃｒｙｐｔｏｓｙｓｔｅｍ．ＥｌｅｃｔｒｏｎｉｃｓＬｅｔｔｅｒｓ，１９８２，１８（２１）：９０５９０７

［１３］ＫｏｃＣＫ．Ａｎａｌｙｓｉｓｏｆｓｌｉｄｉｎｇｗｉｎｄｏｗｔｅｃｈｎｉｑｕｅｓｆｏｒｅｘｐｏｎｅｎｔｉａｔｉｏｎ．ＣｏｍｐｕｔｅｒｓａｎｄＭａｔｈｅｍａｔｉｃｓｗｉｔｈＡｐｐｌｉｃａｔｉｏｎｓ，１９９５，３０（１０）：１７２４

［１４］ＢｒｙａｎｔＲＥ，Ｏ’ＨａｌｌａＤＲ．ＣｏｍｐｕｔｅｒＳｙｓｔｅｍｓ：ＡＰｒｏｇｒａｍｍｅｒ’ｓＰｅｒｓｐｅｃｔｉｖｅ．２ｎｄＥｄｉｔｉｏｎ．Ｂｅｉｊｉｎｇ：ＣｈｉｎａＭａｃｈｉｎｅＰｒｅｓｓ，２０１０（ｉｎＣｈｉｎｅｓｅ）（ＢｒｙａｎｔＲＥ，Ｏ’ＨａｌｌａｒｏｎＤＲ．深入理解计算机系统．第２版．北京：机械工业出版社，２０１０）

［１５］ＡｃｉｉｃｍｅｚＯ，ＧｕｅｒｏｎＳ，ＳｅｉｆｅｒｔＪＰ．ＭｉｃｒｏＡｒｃｈｉｔｅｃｔｕｒａｌｃｒｙｐｔａｎａｌｙｓｉｓ．ＩＥＥＥＳｅｃｕｒｉｔｙａｎｄＰｒｉｖａｃｙ，２００７，５（４）：６２６４

［１６］ＡｃｉｉｃｍｅｚＯ，ＢｒｕｍｌｅｙＢＢ，ＧｒａｂｈｅｒＰ．ＮｅｗｒｅｓｕｌｔｓｏｎｉｎｓｔｒｕｃｔｉｏｎＣａｃｈｅａｔｔａｃｋｓ／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＣｒｙｐｔｏｇｒａｐｈｉｃＨａｒｄｗａｒｅａｎｄＥｍｂｅｄｄｅｄＳｙｓｔｅｍｓ（ＣＨＥＳ２０１０）．ＳａｎｔａＢａｒｂａｒａ，ＵＳＡ，２０１０：１１０１２４

［１７］ＢｒｕｍｌｅｙＢＢ，ＨａｋａｌａＲＭ．Ｃａｃｈｅｔｉｍｉｎｇｔｅｍｐｌａｔｅａｔｔａｃｋｓ／／

ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＡｄｖａｎｃｅｓｉｎＣｒｙｐｔｏｌｏｇｙＡＳＩＡＣＲＹＰＴ２００９．Ｔｏｋｙｏ，Ｊａｐａｎ，２００９：６６７６８４

［１８］ＯｓｖｉｋＤＡ，ＳｈａｍｉｒＡ，ＴｒｏｍｅｒＥ．Ｃａｃｈｅａｔｔａｃｋｓａｎｄｃｏｕｎｔｅｒｍｅａｓｕｒｅｓ：ＴｈｅｃａｓｅｏｆＡＥＳ／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＴｏｐｉｃｓｉｎＣｒｙｐｔｏｌｏｇｙ（ＣＴＲＳＡ２００６）．ＳａｎＪｏｓｅ，ＵＳＡ，２００６：１２０

［１９］ＭａｒｒＤ，ＢｉｎｎｓＦ，ＨｉｌｌＤ，ｅｔａｌ．Ｈｙｐｅｒｔｈｒｅａｄｉｎｇｔｅｃｈｎｏｌｏｇｙａｒｃｈｉｔｅｃｔｕｒｅａｎｄｍｉｃｒｏａｒｃｈｉｔｅｃｔｕｒｅ：Ａｈｙｐｅｒｔｅｘｔｈｉｓｔｏｒｙ．ＩｎｔｅｌＴｅｃｈｎｏｌｏｇｙＪｏｕｒｎａｌ，２００２，６（１）：１１２

［２０］ＴｓａｆｒｉｒＤ，ＥｔｓｉｏｎＹ，ＦｅｉｔｅｌｓｏｎＤＧ．ＳｅｃｒｅｔｌｙｍｏｎｏｐｏｌｉｚｉｎｇｔｈｅＣＰＵｗｉｔｈｏｕｔｓｕｐｅｒｕｓｅｒｐｒｉｖｉｌｅｇｅｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１６ｔｈＵＳＥＮＩＸＳｅｃｕｒｉｔｙＳｙｍｐｏｓｉｕｍ（ＳＥＣＵＲＩＴＹ２００７）．Ｂｏｓｔｏｎ，ＵＳＡ，２００７：２３９２５６

［２１］ＢｒｕｍｌｅｙＤ，ＢｏｎｅｈＤ．Ｒｅｍｏｔｅｔｉｍｉｎｇａｔｔａｃｋｓａｒｅｐｒａｃｔｉｃａｌ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１２ｔｈＵｓｅｎｉｘＳｅｃｕｒｉｔｙＳｙｍｐｏｓｉｕｍ（ＳＥＣＵＲＩＴＹ２００３）．ＷａｓｈｉｎｇｔｏｎＤＣ，ＵＳＡ，２００３：１１４

［２２］ＣｏｐｐｅｒｓｍｉｔｈＤ．Ｆｉｎｄｉｎｇａｓｍａｌｌｒｏｏｔｏｆａｂｉｖａｒｉａｔｅｉｎｔｅｇｅｒｅｑｕａｔｉｏｎ；ｆａｃｔｏｒｉｎｇｗｉｔｈｈｉｇｈｂｉｔｓｋｎｏｗｎ／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＡｄｖａｎｃｅｓｉｎＣｒｙｐｔｏｌｏｇｙＥＵＲＯＣＲＹＰＴ’９６．Ｓａｒａｇｏｓｓａ，Ｓｐａｉｎ，１９９６：１７８１８９

犆犎犈犖犆犪犻犛犲狀，ｂｏｒｎｉｎ１９８３，Ｐｈ．Ｄ．，ｒｅｓｅａｒｃｈａｓｓｉｓｔａｎｔ．ＨｉｓｃｕｒｒｅｎｔｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｉｍｐｌｅｍｅｎｔａｔｉｏｎａｔｔａｃｋａｎａｌｙｓｉｓｏｎＰｕｂｌｉｃｋｅｙｃｒｙｐｔｏｓｙｓｔｅｍｓａｎｄｆａｕｌｔａｎａｌｙｓｉｓ．

犠犃犖犌犜犪狅，ｂｏｒｎｉｎ１９６４，Ｐｈ．Ｄ．，ｐｒｏｆｅｓｓｏｒ，Ｐｈ．Ｄ．ｓｕｐｅｒｖｉｓｏｒ．Ｈｉｓｍａｉｎｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｉｎｆｏｒｍａｔｉｏｎｓｅｃｕｒｉｔｙａｎｄｃｒｙｐｔｏｇｒａｐｈｙ．

犌犝犗犛犺犻犣犲，ｂｏｒｎｉｎ１９６９，Ｐｈ．Ｄ．，ｒｅｓｅａｒｃｈｅｒ，Ｐｈ．Ｄ．ｓｕｐｅｒｖｉｓｏｒ．Ｈｉｓｍａｉｎｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｉｎｆｏｒｍａｔｉｏｎｓｅｃｕｒｉｔｙａｎｄｃｒｙｐｔｏｇｒａｐｈｙ．

犣犎犗犝犘犻狀犵，ｂｏｒｎｉｎ１９８８，Ｐｈ．Ｄ．ｃａｎｄｉｄａｔｅ．Ｈｉｓｍａｉｎｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｐｕｂｌｉｃｋｅｙｃｒｙｐｔｏｓｙｓｔｅｍｓａｎｄｍｉｃｒｏａｒｃｈｉｔｅｃｔｕｒａｌａｔｔａｃｋ．

犅犪犮犽犵狉狅狌狀犱ＴｈｉｓｗｏｒｋｉｓｓｕｐｐｏｒｔｅｄｂｙｔｈｅＮａｔｉｏｎａｌＮａｔｕｒａｌＳｃｉｅｎｃｅ

ＦｏｕｎｄａｔｉｏｎｏｆＣｈｉｎａ（６０７７２０８２）ａｎｄｔｈｅＮａｔｕｒａｌＳｃｉｅｎｃｅＦｏｕｎｄａｔｉｏｎｏｆＨｅｂｅｉＰｒｏｖｉｎｃｅ（０８Ｍ０１０）．Ｔｈｅｙａｉｍｔｏｆｉｎｄｏｕｔｈｏｗｔｏａｎａｌｙｚｅｔｈｅｋｅｙｏｆｔｈｅｃｉｐｈｅｒｓｙｓｔｅｍｓｆｒｏｍｔｈｅｌｅａｋａｇｅｏｆｔｈｅｔｉｍｉｎｇｉｎｆｏｒｍａｔｉｏｎｄｕｒｉｎｇｔｈｅｉｒｉｍｐｌｅｍｅｎｔａｔｉｏｎｓｂｙｔｈｅｍｉｃｒｏａｒｃｈｉｔｅｃｔｕｒａｌｕｎｉｔｓ，ｓｕｃｈａｓＤＣａｃｈｅ，ＩＣａｃｈｅ，ａｎｄＢＰＵｅｔｃ．

ＴｈｉｓｐａｐｅｒｆｏｃｕｓｅｓｔｈｅｔｒａｃｅｄｒｉｖｅｎＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋｏｎＲＳＡａｌｇｏｒｉｔｈｍ．ＡｇａｉｎｓｔｔｈｅＲＳＡａｌｇｏｒｉｔｈｍｗｈｉｃｈｕｓｅｓｔｈｅｓｌｉｄｉｎｇｗｉｎｄｏｗａｌｇｏｒｉｔｈｍｆｏｒｍｏｄｕｌａｒｅｘｐｏｎｅｎｔｉａｔｉｏｎ，ｗｅｓｔｕｄｙｔｈｅｐｒｉｎｃｉｐｌｅｏｆＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋ，ａｎａｌｙｚｅｔｈｅｄｉｆｆｉｃｕｌｔｙｉｎａｃｃｅｓｓｄｒｉｖｅｎＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋｏｎＲＳＡ，ａｎｄｂｕｉｌｄｔｈｅｔｒａｃｅｄｒｉｖｅｎＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋｍｏｄｅｌ．Ｂａｓｅｄｏｎｔｈｅａｔｔａｃｋｍｏｄｅｌ，ｗｅｐｒｏｐｏｓｅｓａｎａｄｖａｎｃｅｄａｎａｌｙｓｉｓａｌｇｏｒｉｔｈｍｏｆｔｈｅｐｏｗｅｒｅｘｐｏｎｅｎｔｂａｓｅｄｏｎｔｈｅＣａｃｈｅｔｉｍｉｎｇｄａｔａ，ｂｙａｎａｌｙｚｉｎｇｔｈｅｃｏｒｒｅｌａｔｉｖｉｔｙｂｅｔｗｅｅｎｔｈｅｐｏｗｅｒｅｘｐｏｎｅｎｔｂｉｔｓａｎｄｏｐｅｒａｔｉｏｎｓｅｑｕｅｎｃｅ，ｕｓｉｎｇｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｏｆｔｈｅｓｉｚｅｏｆｗｉｎｄｏｗａｎｄｔｈｅｃｏｒｒｅｓｐｏｎｄｅｎｃｅｒｅｌａｔｉｏｎｓｈｉｐｂｅｔｗｅｅｎｔｈｅｐｒｅｃｏｍｐｕｔｅｄｔａｂｌｅｉｎｄｅｘｅｓａｎｄｔｈｅｗｉｎｄｏｗｖａｌｕｅｓ．Ｗｅａｌｓｏ

ｐｒｏｖｉｄｅｔｈｅｋｅｙｔｅｃｈｎｉｑｕｅｓｄｕｒｉｎｇｔｈｅａｔｔａｃｋａｎｄｓｏｍｅｓｏｌｕｔｉｏｎｓｆｏｒｔｈｅｐｏｔｅｎｔｉａｌｐｒｏｂｌｅｍｓｏｆｔｈｅｒｅａｌａｔｔａｃｋ．Ｆｉｎａｌｌｙ，ｗｅｒｅａｌｉｚｅａＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋｏｎＲＳＡｏｆＯｐｅｎＳＳＬｖ０．９．８ｂｕｎｄｅｒｔｈｅＬｉｎｕｘｏｐｅｒａｔｉｎｇｓｙｓｔｅｍｗｈｉｃｈｒａｎｏｎｔｈｅｓｉｍｕｌｔａｎｅｏｕｓｍｕｌｔｉｔｈｒｅａｄｉｎｇｐｒｏｃｅｓｓｏｒ，ｔｈｅｔｒａｃｅｄａｔａｉｓｃｏｌｌｅｃｔｅｄｂｙｔｈｅｓｐｙｐｒｏｃｅｓｓｗｈｉｃｈｃａｎｒｕｎｗｉｔｈｔｈｅｃｉｐｈｅｒｐｒｏｃｅｓｓｉｎｐａｒａｌｌｅｌ，ａｎｄｔｈｅｐｏｗｅｒｅｘｐｏｎｅｎｔｓａｒｅａｎａｌｙｚｅｄ．Ｕｓｉｎｇｔｈｅｄｉｓｃｒｅｔｅｋｎｏｗｎｂｉｔｓｏｆ犱狆ａｎｄ犱狇，ｔｈｅｗｈｏｌｅｐｒｉｖａｔｅｋｅｙｃａｎｂｅｇｏｔｕｓｉｎｇｌａｔｔｉｃｅｒｅｄｕｃｔｉｏｎｍｅｔｈｏｄｓ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｄｅｍｏｎｓｔｒａｔｅ：ｔｈｅｎｅｗｐｒｏｐｏｓｅｄａｎａｌｙｓｉｓａｌｇｏｒｉｔｈｍｓｏｆｔｈｅｐｏｗｅｒｅｘｐｏｎｅｎｔｃａｎａｎａｌｙｚｅｔｈｅＣａｃｈｅｔｉｍｉｎｇｄａｔａａｄｅｑｕａｔｅｌｙ；ｉｔｉｓｐｏｓｓｉｂｌｅｔｏｏｂｔａｉｎａｐｐｒｏｘｉｍａｔｅｌｙ３４０ｂｉｔｓｏｕｔｏｆｅａｃｈ５１２ｂｉｔｅｘｐｏｎｅｎｔ，ｆｕｒｔｈｅｒｒｅｄｕｃｅｔｈｅｓｅａｒｃｈｓｐａｃｅｏｆｔｈｅｂｉｔｓｏｆｔｈｅｋｅｙ．ＴｈｅｃｏｒｒｅｃｔｎｅｓｓａｎｄｔｈｅｆｅａｓｉｂｉｌｉｔｙｏｆｔｒａｃｅｄｒｉｖｅｎＣａｃｈｅｔｉｍｉｎｇａｔｔａｃｋａｒｅｖｅｒｉｆｉｅｄｂｙｔｈｅａｔｔａｃｋｒｅｓｕｌｔｓ．Ｔｈｉｓｔｙｐｅｏｆａｔｔａｃｋａｌｓｏｃａｎｂｅｉｍｐｌｅｍｅｎｔｅｄｔｏｏｔｈｅｒｐｕｂｌｉｃｋｅｙｃｒｙｐｔｏｓｙｓｔｅｍｓｗｈｉｃｈｕｓｅｔｈｅｓｌｉｄｉｎｇｗｉｎｄｏｗａｌｇｏｒｉｔｈｍｏｆｍｏｄｕｌａｒｅｘｐｏｎｅｎｔｉａｔｉｏｎ，ｈａｓｓｏｍｅｅｘｐａｎｄａｂｉｌｉｔｙ．

１５０１５期陈财森等：针对ＲＳＡ算法的踪迹驱动数据Ｃａｃｈｅ计时攻击研究

针对犚犛犃算法的踪迹驱动数据犆犪犮犺犲计时攻击...

Documents