信息安全研究 ›› 2018, Vol. 4 ›› Issue (2): 133-139.

• 学术论文 • 上一篇    下一篇

基于多维特征的Android恶意应用检测系统

陈泽峰1,方勇2,刘亮2,左政3,李抒霞4   

  1. 1. 四川大学
    2. 四川大学 网络空间学院
    3. 四川大学 信息安全研究所
    4. 四川大学网络空间学院
  • 收稿日期:2018-02-25 出版日期:2018-02-15 发布日期:2018-02-25
  • 通讯作者: 陈泽峰
  • 作者简介:陈泽峰(1992-),男(汉族),湖北省襄阳市人,硕士研究生,研究方向为Android安全。 方勇(1966-),男(汉族),四川省成都人,博士,教授,研究方向为信息安全,网络信息对抗。 刘亮(1982-),男(汉族),四川省叙永人,硕士,讲师,研究方向为信息安全,网络信息对抗。 左政(1986-),男(汉族),四川省成都人,博士研究生,研究方向为恶意代码攻击模型/恶意代码自动化检测/异常检测/内核安全。 李抒霞(1995-),女(汉族),湖南省邵阳市人,硕士研究生,研究方向为Android安全。

Android malicious application detection system based on multidimensional feature

  • Received:2018-02-25 Online:2018-02-15 Published:2018-02-25

摘要: 为了提高检测效率和降低系统开销,提出了使用多个级别的不同分类器用于平衡精确度和系统开销的检测机制。采用操作码等多个独立的数据源作为机器学习的训练集,仅在级别一无法提供可靠的检测时,将级别二作为最终检测结果。并在关注申请权限的同时,研究运行时权限之间的关联性,使用n-gram处理操作码序列。最后,通过实验验证了该方法能够在降低开销的同时保证方法的有效性,因此,提出的方法可以有效地用于未知应用的恶意代码检测。

关键词: Android系统, 恶意代码检测, 随机森林, 操作码, 机器学习, 数据挖掘

Abstract: In order to improve the detection efficiency and reduce the system overhead, a detection mechanism using multiple levels of different classifiers for balancing accuracy and system overhead is proposed. A number of independent data sources, such as operation codes, are used as machine learning training sets. Only when level 1 fails to provide reliable detection, level two is used as the final detection result. While paying attention to the application permissions, we study the association between the runtime permissions, and use n-gram to process the opcode sequences. Finally, experiments show that the proposed method can reduce the overhead and ensure the effectiveness of the method. Therefore, the proposed method can be used effectively for malicious code detection in unknown applications.

Key words: Android, malicious code detection, random forest, opcode, machine learning, data mining