DB3302T 1163-2024 基层智治公共数据整合规范_第1页
DB3302T 1163-2024 基层智治公共数据整合规范_第2页
DB3302T 1163-2024 基层智治公共数据整合规范_第3页
DB3302T 1163-2024 基层智治公共数据整合规范_第4页
DB3302T 1163-2024 基层智治公共数据整合规范_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3302Specificationforpublicdataintegrationofgrass-rootsintelligentgovernanceI本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定1基层智治公共数据整合规范DB33/T2487公共数据安全体系建设DB3302/T1126—2021公4整合原则b)准确性:通过动态更新和错误识别,使数据信息符合实际;d)一致性:整合前后数据信息内容、含义无歧义;e)关联性:多源数据之间建立对应关系,相互关联的数据信息内容无矛盾。2包括数据归集、数据处理、质量控制、成果形成四个流程环节(人工采集数据加工数据回流数据人工采集数据加工数据数据归集数据清洗数据完善物联感知数据数据清洗数据完善数据处理数据关联数据分类质量控制成果形成3通过影像采集、AI识别、智能感知等设备终7.2.1.2人工采集数据应以村(社区)为单位进行7.2.1.3对数据进行排序算法,按照预定义的重复标识规则进行检测和去重,对删除数据进行单独备7.2.1.4对数据按照重要性等级进行判断,根据判断结果和缺失比例制定规则进行删除或填充,对删7.2.1.5用统计分析方法、简单规则库或不同属性间的约束、外部数据进行检测、识别,修正错误值7.2.1.6对多源数据进行关联性验证,调整、去除关联数据间的矛盾内容,并通过分析检测,使数据7.2.1.7对包括但不限于时间、日期、数值等错误显示的格式进行7.2.2.2应对错项、空项数据进行核7.2.2.3根据产权部门、更新时间、数据质量等属性,建立数据更新机制和多源数据的优先为基本数据,其他字段按照数源单位最新的更新时间为准,针对一数多源情况(如),对数据设置标签(见附录A),并建立人房数据关联、人地数据关联、人企数据关联、房地数据关47.3.1数据质量应按DB33027.3.2应对数据实行动态管理,实现回流、共享数据自动更新。人工采集数据经核实后手动更新,并7.4.1应形成数据库及相应数据元,整合过程相关记录、文档等整7.4.2数据元应具备数据建模的可用7.4.3不同来源的相同数据元应保持一致,并建立对应关系(见附录C)。51234567896h)08:共青团工作,握到某个标签对应样本的本质特征,从而达到分类的7a)分类定义:通过公司业务专家与技术专家积累的经验,将事件归类;b)样本打标:将十万综合治理线上数据打上对应的分c)算法训练:对事先标注好的样本,逐条进行hanlp分词处理,并基于训练好的词向量库、自生成的one-hot等来表征每条样本的特征张量。采用深度学习环神经网络建模,批量输入样本特征集,利用梯度下降法,不断调整模型输出的样本预测分类的概率分布,期望模型预测分类的概率分布和样本实际标注分类的概率分布越相似越好,e)接口对接:将标准的算法接口授权给业务系统,业务系统通过简单对接后,即可调用,接口a)抽取数据:以每月评估每个模型一次为例,每月初,随机抽取上月的部分数据。原则上每个b)实施人工标注:针对每个模型的数据进行专业实施打标,打标过程中存在争议的数据,参考线上用户标注结果,由三个或三个以上实施人d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论