快速指南
3分钟了解如何使用DaCat。
一、什么是数据资产目录
数据资产目录使用元数据对一个组织或实体所有数据资产创建一个信息完备且可搜索的清单。通常,数据资产包括但不限于以下类型:
- 结构化(表格)数据
- 非结构化数据,包括文档、网页、电子邮件、社交媒体内容、移动数据、图像、音频和视频
- 报告和查询结果
- 数据图表和仪表板
- 机器学习模型
- 数据库之间的连接
建立数据资产目录的好处主要是让数据消费者、数据生产者能够更方便、快捷和准确的发现数据。
数据资产目录通常能够收集和不断的整理与每个数据资产相关联的元数据,以使每个数据资产更容易识别、评估和正确使用。
数据资产目录不仅提供一份清单,也会提供用户能够开展以下活动的工具:
- 搜索工具
- 自动发现他们没有专门搜索的潜在相关数据
- 根据行业或政府法规来规范数据资产的格式以及要求等。
二、什么是DaCat
DaCat是针对各个国家关于个人数据资产的法律法规要求和规范构建的个人数据自称目录。
2.1 中国的个人信息
在中国,个人信息的分类分级管理规范主要由以下两个国标规范。 《信息安全技术 个人信息安全规范》 GB/T35273 -2020 《信息安全技术 个人信息安全影响评估指南》 GB/T 39335-2020
由此规范,可以罗列出个人信息的清单:
表A.1 个人信息分类参考示例
- 个人基本资料
- 个人基本资料
- 个人姓名
- 生日
- 性别
- 民族
- 国籍
- 家庭关系
- 住址
- 个人电话号码
- 电子邮件地址等
- 个人基本资料
- 个人身份信息
- 个人身份信息
- 身份证
- 军官证
- 护照
- 驾驶证
- 工作证
- 出入证
- 社保卡
- 居住证
- 港澳台通行证等
- 个人身份信息
- 个人生物识别信息
- 个人生物识别信息
- 个人基因
- 指纹
- 声纹
- 掌纹
- 眼纹
- 耳廓
- 虹膜
- 面部识别特征
- 步态等
- 个人生物识别信息
- 网络身份标识信息
- 网络身份标识信息
- 个人信息主体账号
- IP 地址
- Wi-Fi 列表
- 个人数字证书等
- 网络身份标识信息
- 个人健康生理信息
- 健康状况信息
- 与个人身体健康状况相关的一般信息,如体重、身 高、肺活量、血压、血型等个人医疗信息
- 个人因生病医治等产生的相关记录,如病症、住院 志、医嘱单、检验报告、手术及麻醉记录、护理记 录、用药记录、药物食物过敏信息、生育信息、以往 病史、诊治情况、家族病史、现病史、传染病史等
- 健康状况信息
- 个人教育工作信息
- 个人教育信息
- 学历
- 学位
- 教育经历
- 成绩单等
- 个人工作信息
- 个人职业
- 职位
- 职称
- 工作单位
- 工作经历
- 培训记录等
- 个人教育信息
- 个人财产信息
- 金融账户信息 金融账户及金融账户相关信息
- 支付账号
- 银行卡磁道数据(或芯片等效信息)
- 证券账户
- 基金账户
- 保险账户
- 其他财富账户
- 公积金账 户
- 公积金联名账号
- 账户开立时间
- 开户机构
- 账户余额
- 以及基于上述信息产生的支付标记信息等
- 交易信息
- 个人信息主体在交易过程中产生的各类信息
- 交易金额
- 支付记录
- 流水记录
- 透支记 录
- 交易状态
- 交易日志
- 交易凭证
- 证券委托
- 成交记录
- 持仓信息
- 保单信息
- 理赔信息等
- 资产信息
- 包括但不限于个人收入状况、拥有的不动产状况、 拥有的车辆状况、虚拟货币、游戏类兑换码等虚拟财产信息
- 借贷信息
- 借贷业务中产生的信息,包括但不限于信贷记录、 征信信息、担保情况等
- 个人信息主体在交易过程中产生的各类信息
- 金融账户信息 金融账户及金融账户相关信息
- 身份鉴别信息
- 身份鉴别信息
- 用于验证主体是否具有访问或使用权限的信息
- 包括但不限于登录密码、支付密码、账户查询密码、交 易密码、银行卡有效期、银行卡片验证码(CVN 和 CVN2)、口令、动态口令、口令保护答案、短信验证 码、密码提示问题答案、随机令牌等
- 用于验证主体是否具有访问或使用权限的信息
- 身份鉴别信息
- 个人通信信息
- 个人通信信息
- 通信记录和内容、短信、彩信、电子邮件,以及描 述个人通信的数据(通常称为元数据)等
- 个人通信信息
- 联系人信息
- 联系人信息 通讯录、好友列表、群列表、电子邮件地址列表等
- 个人上网记录
- 个人上网记录 指通过日志储存的个人信息主体操作记录
- 包括网页浏览记录、软件使用记录、Cookie、发布的社交 信息、点击记录、收藏列表、搜索记录、服务使用 时间、下载记录等
- 个人上网记录 指通过日志储存的个人信息主体操作记录
- 个人设备信息
- 可变更的唯一设备识别码
- Android ID、IDFA、IDFV、OAID 等
- 不可变更的唯一设备识别码
- IMEI、IMSI、MEID、设备 MAC 地址、硬件序列号、 ICCID 等
- 软件列表
- 终端上安装的应用程序列表,如每款应用软件的名 称、版本等
- 可变更的唯一设备识别码
- 个人位置信息
- 粗略位置信息
- 仅能定位到行政区、县级等的位置信息
- 精确位置信息
- 包括行踪轨迹、精准定位信息、住宿信息、经纬度等
- 粗略位置信息
- 个人画像信息
- 间接用户画像
- 使用来源于特定自然人以外的个人信息(如其所在群体的数据)形成的该自然人的特征模型
- 直接画像信息
- 直接使用特定自然人的个人信息,形成的该自然人 的特征模型
- 间接用户画像
- 未成年人个人信息
- 未成年人个人信 息 14 岁以下(含)未成年人的个人信息
- 其他信息
- 其他信息
- 性取向
- 婚史
- 宗教信仰
- 未公开的违法犯罪记录
- 个人运动信息等
- 其他信息
上述个人信息源是由来自不同的实体分别或联合生产的。
DaCat采用区块链来构建和维护一个分布式的数据资产目录,可以对来自不同实体生产的个人信息格式、规范进行整理、归集和添加必要的元数据(标识),以便个人、数据消费者能够更好的发现个人数据。
DaCat采集和归集了来自不同应用程序(App)发布的隐私政策、个人信息收集清单、第三方信息共享清单以及个人信息复制权所要求的个人信息字段说明、获取方式等。
DaCat通过包括但不限于如下方式对上述信息的准确性、合规性以及规范性进行审阅:
- 志愿者测试
- 用户问卷调查
- APP发布方的沟通和联系
- 测试模型
- 多方核验
- 其他
如何使用DaCat
- 用户可以通过
浏览
,查阅来自不同应用程序(App)发布的“双清单“以及个人复制权的行使方法。 - 用户可以通过
搜索
,搜索关键字和索引来查找和检索。 - App所有者可以通过
发布
,来发布“双清单“以及个人复制权的行使方法。 - 个人数据受托机构可以通过
发布
,发布其授权的个人数据清单和使用方法。
DaCat
浏览
免责声明
DaCat是一个开源的、非赢利性的项目。由志愿者开发和维护。