信息安全研究 ›› 2024, Vol. 10 ›› Issue (E2): 240-.

• 数字经济安全 • 上一篇    下一篇

公共数据开发中个人信息识别挑战

姚思诚陈海粟廖佳纯   

  1. (南湖实验室大数据技术研究中心浙江嘉兴314000)
  • 出版日期:2024-11-22 发布日期:2024-11-23
  • 通讯作者: 姚思诚 硕士.主要研究方向为隐私保护与信息识别. scyao@nanhulab.ac.cn
  • 作者简介:姚思诚 硕士.主要研究方向为隐私保护与信息识别. scyao@nanhulab.ac.cn 陈海粟 硕士.主要研究方向为隐私保护与信息安全. hschen@nanhulab.ac.cn 廖佳纯 博士,副研究员.主要研究方向为隐私保护与信息安全. jliao@nanhulab.ac.an

  • Online:2024-11-22 Published:2024-11-23

摘要: 在国家大数据战略指导下,数据要素已成为国家的重要基础性战略资源.作为数据要素的重要组成部分,公共数据是指政府等机构在公共服务中产生的数据资源,其中很可能涵盖大量个人信息.提出一种结合正则表达式、自然语言处理等技术的个人信息识别方案.通过对人工校验的自动化识别结果从信息种类、涉及个体数量等多个角度进行分析,发现公共数据中不仅包含丰富多样的个人信息,且个人信息还具有复杂的形式.详细梳理了公共数据中个人信息识别面临的困难,针对字段层级抽样识别技术方案无法应对复杂公共数据的现状,提出了细化识别粒度来构建更合理的个人信息识别框架的建议.

关键词: 公共数据, 个人信息, 隐私保护, 信息识别技术

中图分类号: