商标审阅数字化管理平台建设需求_第1页
商标审阅数字化管理平台建设需求_第2页
商标审阅数字化管理平台建设需求_第3页
商标审阅数字化管理平台建设需求_第4页
商标审阅数字化管理平台建设需求_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商标审阅数字化管理平台建设需求一、总体设计要求1.系统架构设计1.1总体架构设计商标审查数字化管理平台设计为用户交换层、业务应用层、应用支撑层、数据资源层、基础设施层、外部系统。系统的开发源码、数据库、中间件等需采用国产化技术。用户交互层支持用户使用电脑、手机、平板操作。业务应用层由公告模块管理、商品检索比对、商标审查管理、重大不良影响排查组成。应用支撑层包含省级业务云等公共平台支撑,本项目采用了统一身份认证。业务中台包含审核标准、审核流程更新、商标分类等。数据支撑支持多源同步、数据重构。数据支撑具备强大的功能特性,能够实现多源同步与数据重构。所谓多源同步,是指该数据支撑体系可以无缝对接来自多个不同源头的数据,无论是结构化数据,如传统数据库中的表格数据,还是非结构化数据,像文本文件、图像数据等,都能高效地进行采集、整合与同步更新,确保数据的一致性和时效性。而数据重构则是在多源数据同步的基础上,依据特定的业务规则和分析需求,对数据进行重新组织、转换和整合,打破原有数据的局限,挖掘出更具价值和深度的信息,为后续的数据分析和决策提供坚实可靠的数据基础。数据资源层包含商标商品规范书籍的各类系统,其中包含文字识别、数据汇总等。数据资源层作为商标管理系统的数据基石,深度整合了商标商品规范书籍相关的多层次数据体系,涵盖多类别系统模块。其主要功能聚焦于数据采集、处理与结构化存储。1.文字识别系统:基于OCR(光学字符识别)技术,对商标商品规范书籍中的纸质文档或扫描件进行高精度文字提取,支持中文、英文及多语种混合文本的识别,并通过自然语言处理(NLP)技术对提取的文本进行语义解析,提取商标名称、商品分类、申请人信息等关键字段,为后续数据校验和关联提供基础。2.数据清洗与标准化模块:针对采集到的原始数据,通过正则表达式、规则引擎和数据质量校验工具,完成格式标准化(如日期、编号、单位统一)、去重、纠错和补全,确保数据一致性,例如将不同来源的商品描述字段统一为结构化模板(如“商品名称-品牌-类目”格式)。3.数据汇总与关联引擎:通过ETL(Extract,Transform,Load)工具将多源异构数据(如规范书籍文本、历史数据库记录、外部标准文件)进行跨系统集成,建立商标-商品-权利人的多维度关联关系图谱,并通过分布式计算框架(如Hadoop/Spark)实现大规模数据的高效汇总与实时更新。业务数据库有基础库、备用库、信息库、业务库。业务数据库作为系统的核心存储中枢,采用分层架构设计以满足不同场景下的高性能与高可靠性需求,包含四大核心子库,分别承担差异化功能:1.基础库:存储商标管理的核心元数据,包括商标注册信息(名称、编号、申请日期、国际分类)、权利人基本信息(名称、地址、联系方式)、商品/服务的基础分类标准(如尼斯分类目录)等,作为系统运行的基础支撑,具备强一致性和不可篡改性。2.备用库:通过主从复制和定期快照机制,对基础库进行实时数据备份与容灾恢复,确保极端场景下(如硬件故障或网络中断)系统的连续性。同时支持离线数据分析任务,例如定期生成业务合规性报告、历史趋势分析等。3.信息库:聚焦于非结构化与半结构化数据的整合,例如商标审查意见书的扫描件、申请人提交的补充材料电子档、商品图样图片库等,结合元数据管理实现信息的高效检索与调用,并通过全文索引技术支持模糊搜索与语义关联。4.业务库:服务于动态业务流程,存储商标申请、审查、异议、撤销等全生命周期的流转记录,包括状态变更日志、操作人行为轨迹、业务审批节点数据等,并通过实时计算引擎(如Flink)触发规则引擎进行自动化流程推进(如自动分配审查任务、到期预警等)。数据资源层与业务数据库之间通过标准化API接口与数据总线实现无缝对接,支持实时数据同步与异步任务调度。例如,文字识别系统提取的商标信息可直接推送至基础库更新,同时触发业务库的状态校验逻辑;备用库的备份数据则可通过批处理管道同步至信息库以补全历史档案。此外,系统架构设计预留扩展接口,可动态接入第三方数据源(如国际商标数据库、行业分析报告平台),进一步提升数据的广度与深度。基础设施层包含硬件资源、软件资源、网络资源。1.2业务架构设计业务架构设计为数据运营服务、网络安全服务、查询统计服务。业务信息系统通过分级管理处理省级、市级服务,直接对接项目实施运营部分。数据处理运营服务包含数据采集、数据清洗、数据更新、统计分析、数据迁移。这些业务应用在重大不良影响排查板块。数据处理服务与用户管理关联、用户管理关联业务变更配置,变更配置会同步到知识库维护再通过反馈业务流程通知数据运营服务流程处理。1.3应用架构设计本期建设内容为:前端层:使用Web方式实现,提供商标申请、查询、审核等前台功能,支持多种设备,包括PC、手机、平板等。使用流行的前端框架来实现商标审核管理平台的前端交互,提升用户体验。中间层:采用分布式微服务架构设计,包括应用服务、数据服务、消息服务等,为前端层提供统一接口,支持水平扩展,提高系统可用性和容错性。后端层:采用云原生技术,提供一种基于高并发、高可用的服务框架;该框架能够提供完善的ORM支持,减少数据库操作的代码量。将业务系统部署在容器化的集群环境中,实现快速部署和自动化运维。数据层:采用分布式数据库,包括主数据库和备份数据库,支持水平扩展和容错性。选择可扩展性强、高性能的数据库技术。为了避免单点故障,采用数据库集群的方式来实现高可用性。安全层:采用多重安全措施,包括防火墙、入侵检测、加密传输、身份认证等,保障系统安全和数据隐私,使用HTTPS加密协议保证数据传输过程中的安全性。在代码中加入防御SQL注入、XSS攻击等安全漏洞的措施,以避免数据泄露和攻击。监控层:采用监控系统,实现对应用层、中间层、后端层的监控,包括性能、容量、日志等,提供异常告警和问题定位功能。开发工具:采用敏捷开发方式,使用开发工具集成开发环境、版本控制、自动化构建、测试和部署等功能,提高开发效率和质量。部署方式:采用容器技术来打包应用程序和环境,以实现快速部署和移植。1.4数据架构设计关系型数据库(RDBMS):该系统需要对大量商标申请数据进行存储、查询和管理,因此使用关系型数据库可以是一个可靠的选择。NoSQL数据库:该系统需要存储大量的商标数据,其中一些数据可能具有非结构化的特点,因此使用NoSQL数据库解决。分布式数据库:该需要处理大量的商标数据,并需要对数据进行分析和查询,因此使用分布式数据库可以帮助提高系统的性能和可伸缩性。1.5网络架构设计网络架构应该具备高可用性、高安全性、高性能和可扩展性等特点,同时应该满足不同子系统之间的协同作业和数据共享要求。建立负载均衡机制商标审核系统平台数字化改造需要支持大量的数据处理、存储和访问,因此需要建立负载均衡机制,以确保系统的高可用性和高性能。负载均衡可以通过硬件设备或软件实现。设置安全控制商标审核系统平台的数字化改造必须要遵循相关法规和规定,同时需要确保数据的保密性、完整性和可用性。因此设置安全控制包括网络防火墙、数据加密、身份验证等措施,以保证系统的安全性。采用分布式架构商标审核系统平台数字化改造需要支持大量的数据处理和存储,因此采用分布式架构。建立数据备份和恢复机制商标审核系统平台进行数字化改造后,需要建立数据备份和恢复机制,确保数据的安全性和可靠性。备份和恢复可以采用本地备份和远程备份等方式。1.6安全架构设计网络隔离和访问控制:确保应用系统、数据库、服务器等组件能够在独立的网络区域中运行,并实施严格的访问控制机制,如IP白名单、用户身份验证等。数据加密:使用加密技术来保护数据在传输和存储过程中的安全。可以采用SSL/TLS协议、AES等加密算法。安全审计和日志记录:在关键的操作环节上记录日志,包括操作人员的身份、时间、地点和操作内容,以便后续审计和追溯。备份和恢复:采用定期备份和恢复机制,确保数据在遭受病毒、攻击或者灾难性事件后能够及时恢复。安全监测和预警:实时监测系统运行状况和安全威胁,对异常情况进行及时预警和处理。安全培训和意识:加强员工的安全意识和培训,提高员工识别、预防和应对安全事件的能力。二、服务内容1.软件开发服务1.1商标审查数字化管理平台定制软件开发服务1.1.1公告模块管理板块发布审查业务信息、发布特殊商标公告信息,使得审查员能够快速准确地判断商标的可注册性,避免商标的不良影响发生。以下模块为采购人更好地管理公告信息,提高内部沟通和协作效率,同时也可以帮助审查员更好地进行商标审查工作,提高审查质量。全局公告模块:用于发布采购人的公告信息,如单位政策、规定、重要通知等,通知全单位员工。部门公告模块:用于发布采购人部门的公告信息,如部门工作计划、汇报、人员调整、重要会议通知等,让部门管理人员能即时通知部门员工,落实上级要求。该模块根据人员信息设置不同权限,展示不同的部门公告,各部门之间无法相互查看。业务信息模块:用于发布商标审查业务通用的相关通知和信息,如审查标准、商标分类指南、审查流程的更新等,帮助审查员更好地进行审查工作。该板块应随时监控商品检索比对板块的数据库和程序更新,自动发出更新公告。重要信息模块:用于发布重要的商标审查信息,如特殊商标公告、时事敏感词汇的处理等,以便审查员能够及时准确地判断商标的可注册性。公告查看模块:用于用户点击公告信息时进入查看页面,应具有展示不同格式的功能,如查看包括文字、文字样式、图片、表格、思维导图、多媒体的功能。公告查询模块:用于查询和搜索历史公告信息,根据标题、关键字、标签查询,方便员工查询以前的公告,列出公告的前几行摘要,点击后进入公告查看板块,查看各版块的历史公告信息。1.1.2商品检索比对板块商品检索比对板块包含以下模块:商品书模块:根据每年的商品书内容,将商品和服务作电子化归纳,并具备前端检索功能,便于审查员在原始书籍资料上对商品和服务详情进行确认和比对。商品书模块包含1988年至今所有类似商品和服务区分表各类、各类似群的商品和服务内容、注释内容,并在录入后进行逐字逐句的校对,以确保与原书一致,后续检索和比对模块的数据库数据,将以此模块的内容为依据。该模块管理后台应具备后续年份的书籍数据增删改查功能,以供审查管理人员更新每年新数据。商品检索模块:通过查询商品数据库,实现商品和服务名称、类别、交叉商品、商品和服务详情的快速检索和筛选,获取商品名称、类别、类似群、描述、状态、历史变更等信息。该模块以独立页面的展示表格形式呈现,并具备预检索列表功能。根据用户检索的关键词或完整商品名称,预检索列表预查询数据库,根据文字匹配相同比例、读音、包含等算法规则,即时列出用户最有可能想要检索的商品。展示表格根据用户点击的商品或服务展示商品和服务的详细信息。展示时只改变表格内容,格式不变。每个商品和服务的展示都应经过逻辑运算,根据数据库录入的商品信息及注释规则进行相应逻辑运算后向展示表格发送数据。展示表格的表头包括:正式名称、别称(多个)、所属书本年份、所属类似群、所属部分、所属段落、有效状态、历史变更、交叉群、交叉部分、交叉段落、交叉商品、不交叉群、不交叉部分、不交叉段落、不交叉商品、备注及商品描述。点击展示表格的正式名称时,将跳转到商品书模块并定位该商品的所在位置。商品或服务的别称与该商品的正式名称,在检索、跳转、比对上有同等效果,别称将跳转到商品书模块该商品的正式名称。模块提供一个“提交讨论”入口,当审查员使用时对现有商品存疑、存在未知商品、新增商品或商品检索模块无法在数据库找到商品时,该入口可自动弹出,让审查员填写包括名称、类似群、处理意见等信息,提交并储存到数据库以供下面说到的“商标审查管理板块”中的“商品讨论”使用。商品比对模块:在商品检索模块的基础上,将审查员提供的多个待审商品和服务名称、类别、交叉商品等信息与商标数据库中的商品信息和注释规则进行比对及运算,自动筛选出相似或相同的待审商品或服务的冲突项。该模块应具备一个文字输入框、清空按钮、对比列表、详情列表、书本版本筛选或时间筛选及其他多个必需按钮。使用时用户可将审查系统中的待审或引证件中的多个商品和服务字符串复制入该模块中,该模块将自动格式化其输入内容,用户输入商品或服务有误时根据预检索列表纠正用户的错误输入(需用户确认,如不确认将以显著样式标出,让用户自行比对),再由用户分配给待审列表或比对列表。待审列表只有一组,比对列表则有无穷多组。该模块对比列表以对称表格的形式呈现,左边为待审的商品和服务列表,右边则以选项卡形式组织好的一系列引证的商品和服务列表,并存在一个总表,包含用户所输入的所有引证商品。左右两个列表每项每行应排列对齐。当用户点击每个选项卡时,待审列表中的商品和该选项卡引证列表中的商品,应立刻与服务器通信进行比对(逻辑运算),如发现交叉商品(冲突商品)时,待审列表所对应的冲突商品应瞬时以突出样式呈现给审查员,冲突引证商品所属的选项卡也应以突出样式呈现,并于详情列表显示详细分析过的信息,详情应包括该商品与哪些类、类似群、部分、段落及商品有交叉(冲突),也应包括该商品与哪些类、类似群、部分、段落及商品没有交叉(冲突),并列举其所涉及到的注释内容。点击总表时亦相同。当用户双击每个选项卡时,需要有选项卡改名功能(默认名字为递增自然数)。商品统计模块:对商标审查过程中通过该模块检索过的商品和服务进行统计和分析,以便管理人员对业务进行监督和管理。模块具备引证商品和服务的计数统计功能,包括可选时间段的类统计、类似群统计、商品统计等。即每当审查员使用商品比对模块输入引证商品和服务后,都在后台记录每日的引证商品和服务数据。模块的统计数据应以列表及可视化图表展示。并提供易错商品统计功能,在商品比对模块进行提示。1.1.3文档存储检索板块文档存储检索板块具备文档分类上传下载、添加附件、查看文档(各种常用WPS格式、PDF格式)、权限控制、分享、搜索和检索功能,并具备给文档贴标签的功能。文档存储检索板块可以有效地管理和检索与商标审查相关的文档,提高审查员的工作效率和质量。具备各种文档格式的内容检索功能,有简洁的操作和展示界面。文档存储检索板块由以下模块组成:文档上传模块:允许用户上传与商标审查相关的文档并实现上传文件的业务区分,如申请书、授权委托书、商标图片等文档存储模块:存储用户上传的文档,并对文档进行管理,包括归档、备份、恢复等功能。文档检索模块:根据检索次数或时间等要素进行排序,允许用户根据不同的检索条件,如会议名称、文档类型、上传日期等,快速检索出所需的文档。同时应实现基于文档内容的精准检索。文档预览模块:允许用户在系统内直接预览所需的文档,避免了需要下载文档后再进行查看的麻烦。文档权限控制模块:对于不同的用户,可以进行权限控制,如只允许部分用户查看某些文档。文档分享模块:允许用户将文档分享给其他用户,以方便用户之间的协作和沟通。1.1.4重大不良影响排查板块重大不良影响排查板块是本项目重点建设对象,该系统的功能依赖人工智能处理及人类自然语言处理技术。重大不良影响排查板块主要包括以下几个模块:外网关键词检索模块:用于对商标文字相关的关键词进行检索,可以自定义关键词列表和排除列表,同时支持自然语言处理和人工干预。该模块主要负责收集大量的语料库,并对其进行处理和清洗,去除一些常见的噪声数据和停用词,减少语义干扰。关键词检索模块对每一条待检索的文本,都应进行分词处理,将其分解为一个个词语,并标注上词性、词频等信息。在分词处理的基础上,需要对文本中出现的实体(如商品名称、品牌名称等)进行识别和标注,构建重大不良影响语料库,并从已经分词并识别出实体的文本中,提取出关键词,作为检索的主要语料索引。通过将关键词与输入上下文结合起来,进行语义分析和计算,提高检索的精度和效率。将检索到的文本按照相关度高低进行排名,并展示给审查员,帮助其快速地定位和处理不良影响商标。外网动态更新模块:通过对各种网络渠道(如新闻、社交媒体、论坛等)的监控,实现对与商标相关的最新动态信息的获取和更新,保持对不良影响的敏感度。该模块通过数据API接口、订阅等技术手段,每日在固定时刻从网络渠道定期更新数据,对最新数据进行预处理、数据清洗和过滤、分类和标记,并将处理后的信息存储到数据库中,供系统查询和使用。外网自动筛选模块:将关键词和动态更新模块的结果进行匹配和筛选,自动化地过滤出可能会对社会产生不良影响的商标关键词信息,生成不良影响清单。该模块对经过关键词检索和动态更新模块筛选出来的数据,根据不同权重值进行数据筛选和分类,进行进一步处理和筛选。对筛选出来的数据进行分类和整合,根据不良影响的程度,将数据分为高、中、低三个级别,使用机器学习等技术,自动化处理筛选出来的数据,对数据进行自动分类,并将数据存储到相应的数据表中。在使用时,模块将筛选出的数据直接输出给审查员使用。外网人工审核模块:该模块可将自动筛选模块生成的不良影响清单在后台以审核列表的形式展示给审查管理人员,由审查管理人员根据自己的专业知识和经验进行综合判断和决策,进行人工审核和修正。审核结果包括通过、不通过和待定三种状态,审查管理人员需要填写相应的审核意见和备注。系统将审查管理人员的审核记录进行保存和统计,以便后续的数据分析和业务调整。模块可以将待审核商标分配给不同的审查管理人员,同时通过邮件或消息提醒审查管理人员完成审核任务,以保证审核工作的及时性和有效性。专网检索模块:专网检索模块主要为专网审查员服务,为实现重大不良影响排查板块功能而设计必要的用户操作界面。该模块部署在国家商标总局专网,与互联网物理隔绝,并有专人定时使用移动介质导入外网模块的机器学习数据,以供审查人员使用。重大不良影响提示模块:具有多人协作功能,允许审查员上传重大不良影响提示信息,自动生成《重大不良影响提示单》。允许普通用户填写、修改数据;允许管理员填写、修改、核对数据、更改选项、导出提示单和汇总表格。系统可以对数据进行加工处理,自动形成各类统计分析图表和报告。不良筛查模块:具有多人协作功能,允许管理员上传数据、修改数据、导出统计表,发布公告信息。允许审查员填写反馈意见、修改反馈意见、撤回反馈,填写处理情况。允许负责人修改反馈意见、审批反馈意见、撤回反馈。系统可以对数据进行加工处理,自动形成各类分析统计图表及分析报告,并自动对关联审查员进行处理提醒。1.1.5商标审查管理板块商品讨论模块:大屏讨论的表单展示。审查员根据在审查过程中遇到的不规范商品与服务,使用商品检索比对板块提交的相关商品与服务问题,该模块搜集用户提交的资料,每周的非规范商品讨论会议上,该模块提供集中展示、讨论、处理、自动录入检索比对数据库等一系列操作,方便参会人员使用商品讨论模块进行讨论和管理。该模块应提供类似PPT的大屏讨论、会议时间、参会人员、意见记录等功能,并记录下每一期讨论的历史以供翻阅。会议纪要模块:主要分为上会讨论、纪要生成、纪要核查、数据统计四大功能。上会讨论部分允许审查员填写、修改、导出上会商标相关信息,由部门负责人审核、修改相关信息,导出汇总生成上会文件。纪要生成部分允许中心纪要员填写、修改、导出会议纪要结论,同步发布公告信息。纪要核查部分允许审查员填写、修改会议纪要未执行理由,允许中心纪要核查员导出上会商标相关信息,修改、导出会议纪要结论,填写、修改、导出会议纪要执行情况,审核会议纪要未执行理由,以及发布公告信息。数据统计部分提供各类数据统计分析及可视化,如对应期号的纪要里自动生成总条数、总件数、各类型商标的数据条数统计,以及根据审核意见计算出审核通过率。恶意注册台账模块:主要所需功能包括恶意商标工作移交填写及审核、每月工作清单录入和数据导出、数据统计、综合评价表相关文档上传和下载。追文需求模块:具有多人协作功能,主要为固定格式的表格内容的提交与审批流程。由审查员填写数据、修改数据;并由负责人审批、修改、退回;允许管理员检索、审批、修改、退回、导出数据并对数据进行加工处理,形成分析图表及分析报告。退文模块:主要分为退文讨论、退文统计两大功能。退文讨论部分审查员的退回商标如需提交退文讨论,可通过该模块填写退文疑难并上传图片。管理员可在后台编辑结论后,形成定稿,审查员可自行下载。退文统计部分收集审查员在审核、自检、审签、局抽检4个环节的退文,以固定格式的统计表格展示,由负责人后台录入修改并在前端展示。统计数据需要进行数据分析和可视化处理,并控制查看权限和导出权限。错误记分台账模块、审签记错台账模块:固定格式的统计表格展示。在质量管理过程中,一段时间内审查员的局记错、中心记错、审签记错的次数及分数统计,由负责人后台上传台账统计表并在前端展示,须具备按时间段统计功能。系统可以对数据进行加工处理,自动形成各类分析统计图表及分析报告。自检记错台账模块、审核记错台账模块:审核员、自检员使用该模块进行记错商标填写(可上传图片),日常为本地保存,不可他人查看,提交后不可更改。可实现筛选统计功能,例如按时间、部门、姓名、部门筛选等。月均900-1500条记录,文件大小约200MB,文件能长期保存。管理员拥有该模块所有读写权限并可发布公告。审限管理台账模块:在目前已开发的审限管理系统上进一步扩展。允许管理员上传待审商标清单、修改数据、导出统计表,审核理由,进行记错,发布公告信息。允许审查员填写未审理由、修改填写内容,填写申诉内容、修改申诉内容、撤回申诉。允许负责人、抽查人员审核理由,进行记错,修改申诉内容、审批申诉内容、退回申诉。统计数据需要进行数据分析和可视化处理,并自动对关联审查员进行处理提醒。申诉需求模块:可变格式的表格内容的提交与审批流程。该模块自动生成申诉表格,处理由以下模块引发的业务错误:追文需求模块、自检退回商标统计模块、错误记分台账模块、自检记错台账模块、审签记错台账模块、审核记错台账模块以及审限管理台账模块。审查员填写申诉原因并决定是否提交申诉,表单需经负责人同意。其中自检申诉、审核申诉直接在台账表格填写申诉理由,局申诉、审签申诉需要填写申诉单。申诉单部分允许管理员上传记错的待申诉商标、修改申诉内容、审批申诉内容、退回申诉、下载申诉内容,发布公告信息,设置申诉时限。允许审查员填写申诉内容、修改申诉内容、撤回申诉。允许负责人修改申诉内容、审批申诉内容、退回申诉。考核分档评选模块:主要分为质效考核、质量分档、能手评选三大部分。质效考核部分允许各部门负责人填写、修改数据、反馈异议,导出表格;允许管理员填写、修改、核对数据、修改指标选项、导出表格,发布公告信息(包括考核人员情况统计、商标移转情况统计、退回情况统计、追回情况统计、审查员工作量统计、质效考核情况统计、分档情况统计等);该部分数据需要关联人力考勤模块、移转件统计模块、工资计算系统的工作量、错误记分台账模块、审签记错台账模块、审核积分台账模块、退文汇总模块、追文需求模块等。并通过数据加工处理,形成分析统计图表和分析报告。质量分档部分对上述质效考核数据进行统计排名,允许各部负责人填写、修改数据、导出分档表格;允许管理员填写、修改、核对数据、导出分档表格。能手评选部分对上述质效考核得分进行统计排名,允许各部负责人填写、修改数据、导出能手评选表格;允许管理员填写、修改、核对数据、导出能手评选表格。事先咨询模块:值班人员记录咨询商标基本情况和查询结果。允许普通用户填写、修改数据;允许管理员填写、修改、核对数据、更改选项、导出表格。系统可以对数据进行加工处理,自动形成各类统计分析图表和报告。同日模块:具有多人协作功能,允许审查员填写修改同日抽签商标数据、终止同日数据、同日证据领取数据等。允许管理员上传、修改、审核、退回、导出数据,并发布公告信息。系统可以对数据进行加工处理,自动形成各类分析统计图表及分析报告。不规范汉字模块:具有多人协作功能,允许审查员上传不规范汉字库。收集汇总审查员提交不规范汉字信息,允许管理员审核、修改、下载汇总表。商标数据更正模块:具有多人协作功能,允许审查员上传有误商标数据信息,自动生成《有误商标数据更正单》。允许普通用户填写、修改数据;允许管理员填写、修改、核对数据、更改选项、导出更正单和汇总表格。系统可以对数据进行加工处理,自动形成各类统计分析图表和报告。2.系统业务运营服务业务运营服务项主要为:基于实际业务开发的功能需求模块,如商品检索对比、重大不良影响排查、商标审查管理等,为各业务功能模块提供基础业务支撑且响应功能模块表单中,字段设置需依照业务运营成果服务提供基础性支撑。预计重大不良影响排查板块需要排查的商标数据(含地理标志)数据,包含商标使用情况、商标舆情、商标相关热搜热点、注册号、商标名称、类别号、商标状态、申请日期、商标类型、初审公告期号、注册公告期号、专用期开始日期;相关数据关系芜杂且数据挖掘需求(数据关联性)及可用性需求较高,如重大不良影响排查,需要综合考量汇聚商标多方面信息。2.1数据处理运营服务2.1.1数据清洗和标准化服务要求根据每年的商品书内容,将商品和服务作电子化归纳,包含1988年至今年所有类似商品和服务区分表各类、各类似群的商品和服务内容、注释内容,并在录入后进行逐字逐句的校对,以确保与原书一致。使用数据挖掘和机器学习等技术,自动识别和清理不规范的数据,同时使用标准化规则将不同格式的数据转换为标准格式。需要进行数据清洗,以保证输入到系统中的商标数据都是准确、标准、干净的数据。针对商标数据进行初步过滤和校验,包括对商标名称、分类、申请人信息等数据进行去重、规范化、补全、转义、归一化等操作,确保数据的完整性、准确性和一致性。需要对大数据进行预处理和预测,以提高系统的处理速度和准确性。对商标数据进行特征提取、特征选择、数据变换等处理方式,提高商标数据的重要性、分类准确率和识别率,同时也需要根据商标数据所涉及的业务环节进行预测和预警,比如商标名称近似度、商标风险评估等。需要对商标相关数据进行标准化,以确保商标管理全流程的标准化和精确化。包括对商标名称、分类、申请人信息等数据进行标准化处理,根据商标管理法规和管理要求进行规范化的数据录入、处理和管理,确保各项业务标准化、流程规范化,并能够满足商标管理的实际需求。需要根据商标相关信息进行数据匹配和对比,包括对商标名称、分类、权利人信息等进行精准匹配和对比,确定商标相关信息的合规性、准确性和一致性,对商标行业、类别、标志等数据进行精准化处理,确保商标管理全流程中的关键数据的精准化和标准化。需要对商标相关数据进行建模处理,将商标数据分析、挖掘和建模相结合,对商标数据的历史记录、未来趋势、风险评估等进行分析,提高商标管理的决策能力和预警能力,促进商标管理全流程信息化实现。(1)数据标准化包括了数据的提取、清洗、关联、比对、标识、对象化等操作,支持实时计算和离线计算,支持批量处理操作。数据传输过程支持分布式数据传输方式。在数据处理过程中,引入人工智能技术,实现结构化和非结构化数据的处理,采用图计算和内存计算技术,实现数据的价值提升。在数据处理过程中,引入模型体系和标签工程和知识图谱技术,进一步提升数据价值密度,为数据智能应用实现数据增值、数据准备、数据抽象。数据处理遵循相关标准,通过对数据进行提取、清洗、关联、比对、标识、对象化、构建知识图谱等规范化处理流程,实现异构数据的标准化及深度融合。数据处理采用开放式架构,能够以统一、标准、易于扩展的方式进行数据处理流程的动态编排。同时,在各环节引入了自然语言处理、多媒体信息处理和机器学习等技术,实现对数据的智能感知和认知。(2)数据清洗过滤那些不符合要求的数据,将过滤的结果能够直观地展示给相应的主管部门,主管部门确认是否过滤掉或者修正之后再进行抽取。不符合要求的数据主要有以下几类:1)缺失的数据:主要是一些数据的信息缺失,如物品名称、物品代号、业务系统中数据不能匹配等。在系统中用户可以选择过滤规则,把这一类数据过滤出来,输出到文本文件或Excel等格式文件提交给业务用户,业务用户在人工对数据修改核对后,再写入数据仓库,如果修改的规则是固定的,也可以由系统按照规则自动添加、修改数据。2)错误的数据:错误的数据生产的原因是业务系统不够健全,或者人为误操作再接手输入后没有进行判断直接写入后台数据库造成的,这一类数据也要进行分类,不同的分类采取不同的处理方式,包括人工处理和自动处理,处理之后再更改数据库里的数据。3)重复的数据:系统可以按照规则将重复数据导出来,让用户确认并回写到数据库。系统内置智能去重引擎,可基于预设规则(如商标名称+申请人+商品类别完全匹配、相似度阈值判定等)自动识别重复数据,并通过可视化界面将疑似重复记录导出至中间文件(如Excel、CSV或专用比对工作台)。用户在交互式界面中可逐条审核数据,支持批量操作与自定义校验规则,确认后通过一键回写功能将修正结果同步至业务数据库,同时触发关联数据的级联更新(如状态变更、关联记录修正)。整个流程支持操作日志记录与版本回溯,确保数据修改的可追溯性与一致性。1)非结构化数据清洗非结构化数据主要为文本、XML、图片和视频数据。对于非结构化数据,主要通过同一时间窗口比对去重、MD5值比对去重、人工智能等技术方法去重。文本数据的清洗,主要基于自然语言处理技术,通过分词、语料标注、字典构建、关键词识别等技术,根据相应的非结构化数据特点进行数据建模,利用机器学习和数据挖掘的方法进行文件去重。图片数据可以通过以图找图技术,进行图片去重。根据相似图像检测技术可以通过提取某些表征图像内容的特征,与数据库中目标图片特征进行匹配判断,从而判别出该图像是否为目标图像的拷贝或近似。考虑到图像编辑的多样化,相似图像检测选择具有良好的尺度和亮度不变性,同时对仿射形变、视角改变和噪声等也有一定的鲁棒性的特征点来进行建库。通过比较查询图像与参考图像的特征点相似性,判断出查询图像是否为相似图像。该技术能够有效的处理复制、编辑等操作引擎的图像内容的变化,具有较好的检测准确率。图片检测技术提供图像清晰度识别,适用于各类图库产品,提升整体图像质量。通过图像模糊、失焦、噪点、锯齿以及马赛克等维度进行检测,对无价值的图像数据实现去重。针对音频数据,除了MD5值进行校验去重之外,还可以通过对音频样本进行分析,可以在一个音频集合中发现与音频样本相同的内容。这里相同的内容是指在不同的音视频文件中,与样本内容片段一致的部分,实现音频数据的去重。视频文件可以通过关键帧抽取,通过以图找图、语音识别、MD5值校验等技术,实现视频的去重。2)结构化数据清洗遵从数据标准,根据业务规划对冗余数据进行过滤,根据不同的去重规则和方法对数据进行去重判定,去除重复冗余数据。通过定义过滤规则,使用流式SQL和表达式,按条件对数据进行重新组合和二次加工。数据清洗可以区分为冗余信息过滤、敏感信息过滤、数据去重和格式清洗等内容。通过对数据进行清洗,提高数据的使用价值。数据清洗在具体实现上可分为全量清洗、增量清洗,根据实时性需要可以区分为实时清洗、非实时清洗。清洗过程又可以细分为过滤、去重、检验、格转。3)数据清洗任务调度任务调度须具备高可用、可扩展、可视化的能力,同时支持全面的任务调度功能。基础功能:对任务进行手动执行、定时执行等调度编排;对多种类型任务的调度,包括shell,python,sql,mr,spark,flink,sqoop等;同时在任务调度维度支持任务依赖调度,即可以对多个有依赖关系的任务,按照依赖顺序执行。高可用:支持拔盘、掉电、断网等异常场景时任务编排和处理仍能正常进行。可扩展:支持分布式的任务处理,处理能力可通过增加机器或资源进行横纵向扩容。可视化:支持可视化地进行任务编排,而不需要通过后台撰写代码、脚本来实现;支持可视化地查看任务状态,而不需要通过后台命令行来查看。2.1.2数据分类和关联服务方案要求商标商品数据需要进行分类和关联,以便审核员能够更好地管理和查询商标申请。使用自然语言处理和知识图谱等技术,对商标商品数据进行分类和关联,使商标申请人能够更方便地查询商标商品信息。商标分类:对商标数据进行分类,以保证商标管理全流程的分类准确化和标准化。包括对商标数据进行分类处理,将商标数据按照国际分类系统(Nice分类、Vienna分类等)进行分类,同时也需要根据国家商标管理局的要求进行商标分类,确保商标分类标准化、流程规范化,并能够满足商标管理的实际需求。数据归档:对商标相关数据进行归档处理,包括对商标数据归档、信息存储、备份、还原等,确保商标管理全流程中的各项数据都能够实时、准确地归档、存储、管理、使用,并能够满足商标管理的实际需求。数据查找:对商标相关数据进行查找处理,包括对商标数据的关键字、词汇、标志等进行查找,根据商标的分类、权利人、申请地、申请时间、商标状态等信息进行查找,确保商标管理全流程中的查找准确、快速、标准化,并能够满足商标管理的实际需求。数据关联:对商标相关数据进行关联处理,包括对商标数据与申请人信息、商标申请分类、商标优先权等进行关联和匹配,实现商标数据和其他相关数据的关联化和匹配化,确保商标管理全流程信息化、精准化、标准化、自动化,并能够满足商标管理的实际需求。数据的多源性,导致不同来源的数据之间的关系是离散的,需要对这些离散关系进行匹配或联接,进一步提高数据可用性。数据经过提取、清洗之后形成的数据实体,比如可以通过命名实体识别,对身份证进行识别,根据两个身份证之间的共现或根据词向量计算词与词之间的相似度来判断两个人是否有关系。数据排重:对商标相关数据进行排重处理,包括对商标数据进行去重、清洗、规范化处理,保证商标数据的完整性、准确性、一致性和唯一性,避免重复的商标数据在商标审查、商标管理过程中产生的问题,确保商标管理全流程信息化、精准化、标准化、高效化。2.1.3数据分析和可视化服务要求商标商品数据的分析和可视化可以帮助审核员更好地了解商标商品的情况和趋势。使用数据分析和可视化工具,对商标商品数据进行分析和展示,以支持审核员做出更好的审核决策。(1)通过商标引文数据库的开发和建设,商标信息能够及时、有序地存放在应用系统中,并且可以通过文献应用关系实现有效的管理,在满足对单一商标微观层面的分析基础上,还可以借助数据挖掘技术进一步对其进行整序和加工,实现对某一行业或者技术领域的宏观把控。采用微观与宏观分析、行业分析与规模分析、纵向分析与横向分析相结合等方式方法,通过统计图表展现为决策分析提供技术和数据支撑。商标数据统计:对商标数据进行统计分析,包括对商标申请量、商标审查情况、商标转让情况、商标维权情况等进行统计分析,以便对商标管理全流程进行数据归纳和分析,为管理者提供决策依据。(2)结合本期项目建设内容具体而言,通过实时监测外网商标舆情数据、敏感词数据及商标申请热点数据项,可以确定行业领域内的核心商标热点,比较分析得到商标申请中重大不良影响可能因素,基于上述理由,需要分析获取商标不良影响数据,而这则是数据挖掘的必要性的充分体现。商标趋势分析:对商标数据进行趋势分析,包括对商标数量、申请量、审查量、转让量、维权量等趋势进行分析,以便预测商标的发展趋势,为商标管理全流程的决策和规划提供依据。商标网络分析:对商标数据进行网络分析,包括对商标权利人之间的关联、商标之间的关联等进行分析,以便了解商标、权利人之间的关系,为商标管理全流程的监督和审核提供依据。商标地理分析:对商标数据进行地理分析,包括对商标申请地、商标权利人所在地等进行地理位置分析,以便了解商标在不同地理位置的申请和使用情况,为商标管理的地方化和定向化提供依据。可视化展示:将商标数据进行可视化展示,包括对商标数据进行图表、表格、地图等形式的展示,以便管理者快速了解商标数据的主要特征和趋势,为商标管理全流程的决策和规划提供依据。同时,商标数据的可视化展示也可以帮助更好地向外部相关方进行统计和汇报。2.1.4数据挖掘和智能推荐服务方案商标商品数据中包含了丰富的信息,使用数据挖掘和机器学习等技术,从商标商品数据中挖掘出有用的信息,比如关键词、商标类别等,以便为审核员提供更精准的审核建议和商标申请人的相关信息。(一)数据挖掘需求商标分类挖掘:对商标数据进行分类挖掘,包括对商标类别、商标权利人等信息进行数据挖掘和分析,以便为商标管理提供更精准的分类和管理服务。深入研究不同商标类别在各个行业中的分布情况,了解哪些行业对特定类别商标的需求旺盛,哪些行业的商标类别结构较为单一。例如,科技行业可能更侧重于第9类(科学仪器、电子产品等)、第42类(技术服务、软件开发等)商标的申请;而食品行业则主要集中于第29类(食品、饮料等)、第30类(糕点、调味品等)。通过对行业分布的分析,能够把握不同行业的发展趋势和商标需求特点,为政府部门制定行业政策、引导产业升级提供数据支持。密切关注市场动态和技术发展,挖掘新兴行业和新技术领域中商标类别的变化趋势。随着人工智能、区块链、虚拟现实等新兴技术的崛起,相关的商标类别申请呈现出快速增长的趋势。通过提前捕捉这些趋势,商标管理部门可以有针对性地加强相关领域的商标审查和监管,同时为企业提供前瞻性的商标注册建议,帮助企业抢占市场先机。商标相似性分析:对商标数据进行相似性分析,包括对商标的名称、标志、申请人信息等方面进行分析和比较,以便为商标管理提供更好的商标相似性评估和商标申请审查服务。商标智能检索:对商标数据进行智能检索,包括对商标名称、商标类别、商标权利人等信息进行智能检索和推荐,为商标管理提供快捷、准确的商标查询服务。商标维权推荐:对商标权利人进行维权推荐,包括对商标维权情况、维权方式等进行分析和推荐,为商标权利人提供商标维权服务。商标行业分析:对商标数据进行行业分析,包括对商标申请、商标分类等方面进行行业分析,为商标管理提供更深入的行业数据和趋势分析服务,帮助企业更好地了解市场和竞争。就商标申请而言,不仅会统计不同时间段内的申请总量变化趋势,深入探究申请数量的年度波动、季度起伏以及月度变化规律,以精准把握行业整体的商标申请活跃度。同时,还会进一步剖析申请主体的构成情况,明确企业、个体工商户、社会组织等各类主体在申请数量、申请频率等方面的占比分布,了解不同类型主体在商标布局上的差异与策略。此外,会对申请地域分布进行细致分析,识别申请集中的核心区域、新兴热点地区以及相对薄弱的区域,从而洞察行业的地域发展不均衡态势,挖掘潜在的市场空白与发展机遇。在商标分类方面,将依据国际商标分类标准,对各个类别的申请数量、占比情况进行深入研究,明确哪些类别是行业的热门申请领域,哪些类别的申请相对较少,进而洞察行业的发展重心与潜在拓展方向。同时,分析不同类别之间的关联性,探究跨类别申请的频率与趋势,以把握企业多元化发展的战略布局。通过对商标分类的细致研究,还可以识别各类别中的热门细分领域,为企业精准定位市场切入点、制定差异化的商标策略提供有力支持。通过对商标数据进行全面、深入的行业分析,涵盖商标申请与商标分类等各个方面,致力于为商标管理提供更深入、更精准的行业数据和趋势分析服务。这将帮助企业敏锐捕捉市场的细微变化,精准把握竞争对手的商标策略,从而更好地了解市场动态、洞察行业竞争格局,为企业制定科学合理的商标战略、提升品牌竞争力提供坚实的数据支撑和决策依据。2.1.5数据安全和隐私保护服务要求数据存储安全。包括物理安全、系统安全存储数据的安全,主要通过安全硬件的采购来保障数据存储安全。数据传输安全。包括数据的加密和数据网络安全控制,主要通过专业加密软件厂商进行规范设计和安装。数据在传输过程中,通过在互联网服务器部署防火墙,通过防火墙提供的Web防护功能,实现网页防篡改,以确保应用数据页面的完整性。传输过程的完整性受到损坏则采取数据重传的机制。对于存储的数据则应采取多重备份的方式,防止单一数据损坏造成的损失。数据使用安全。需要加强从业务系统层面进行控制,防范非授权访问和下载打印客户数据信息;部署客户端安全控制工具,建立完善的客户端信息防泄漏机制,防范将客户端上存储的个人客户信息非授权传播;建立完善的数据安全管理体系,建立数据安全规范制度体系,组建数据安全管理组织机构,建立有效的数据安全审查机制;对于生产及研发测试过程中使用的各类敏感数据进行严密管理;严格与外单位合作中的个人客户信息安全管理等。确保数据安全的首要关键是完善的信息安全战略,本项目在遵循国家等保要求设计基础上,进行数据分级分类,根据信息安全等级保护管理办法和当地省市相关政策标准,建议将数据安全保护的监管级别划分为五个级别:用户自主保护级、系统审计保护级、安全标记保护级、结构化保护级、访问验证保护级。同时,根据数据使用性分为元数据、基础数据、业务数据、主题数据等不同类型。在商标商品数据处理过程中,需要关注数据的安全性和用户隐私的保护。并采用数据加密和身份认证等安全机制,确保商标商品数据的安全性和用户隐私的保护。数据安全运营服务主要包括:(1)数据备份:定期对数据进行备份,确保数据安全性和完整性,防止数据丢失或被篡改。备份系统设计在明确安全防护需求的基础上,综合采用多种安全技术手段,需要设计一套计算安全体系框架,从终端安全、通信安全、应用安全、运行安全、接口安全、虚拟化安全、数据安全、网络安全、主机安全、物理安全和管理安全等多个层面,构建层次化的纵深安全防御体系,保障应用安全。1、终端安全:主要涉及病毒控制、防火墙、入侵检测、系统升级管理、在线补丁等。2、通信安全:保护用户安全,主要涉及身份认证、安全信道、数据完整性等。3、多级权限控制:对计算资源的访问和管理涉及多个安全领域,每一个安全领域都需要进行权限控制,一般分为以下几类:机房管理和维护人员,系统管理员。4、数据安全:数据在通信过程中和存储以及处理时的安全,主要涉及数据的隔离、加密、备份等。5、应用层安全:主要涉及应用软件质量安全管理,包括软件源代码级漏洞分析,源代码安全质量检测(支持自定义源代码安全审计规则),安全编程标准的依从性检查。6、平台层安全:包括运行安全和接口安全。7、基础设施层安全:包括网络安全、主机安全和物理安全。备份原则对数据进行备份是为了保证数据的一致性和完整性,消除系统使用者和操作者的后顾之忧。不同的应用环境要求不同的解决方案来适应,一般来说,一个完善的备份系统,需要满足以下原则:稳定性:备份产品的主要作用是为系统提供一个数据保护的方法,备份软件一定要与操作系统100%的兼容,当事故发生时,能够快速有效地恢复数据。自动化:由于工作性质,对何时备份、用多长时间备份都有一定的限制。备份方案应能提供定时的自动备份,并利用磁带库等技术进行自动换带。在自动备份过程中,还要有日志记录功能,并在出现异常情况时自动告警。高性能:随着业务的不断发展,数据越来越多,更新越来越快,尽量考虑到提高数据备份的速度,利用多个磁带机并行操作的方法。操作简单:数据备份需要一个直观的、操作简单的图形化用户界面,缩短操作人员的学习时间。实时性:有些关键性的任务是要24小时不停机运行的,在备份的时候,有一些文件可能仍然处于打开的状态。那么在进行备份的时候,要采取措施,实时地查看文件大小、进行事务跟踪,以保证正确地备份系统中的所有文件。容错性:数据是备份在磁带上的,对磁带进行保护,并确认备份磁带中数据的可靠性,引入RAID技术,对磁带进行镜像,加一把保险锁。备份方案设计:系统具有数据集中、数据存储量大、数据量增长快、可靠性要求高等特点,因而所采用的备份系统软硬件平台必须能很好地满足数据备份和存储管理的要求,并具有非常好的扩展能力,应采用主流备份软件实现备份管理。选择两台有较高处理性能的服务器作为备份控制服务器,连接高性能的高速磁带库,其上安装备份软件,管理整个数据中心的数据备份任务。(2)数据安全风险评估一般分为“按数据生命周期安全评估”和“按场景化数据安全评估”两种方法。将评估结果输入数据安全风险矩阵,输出风险视图和消除举措。按数据生命周期安全评估是基于数据生命周期各阶段进行风险识别,按数据安全成熟度评估相应差距。按场景化数据安全评估是在数据生命周期各阶段的数据安全细化场景,基于数据资产分级分类的不同安全属性,识别数据安全具体风险点。将数据安全风险评估的风险点输入数据安全风险矩阵,列出各场景的风险消除举措。围绕数据安全场景,以数据分级分类为核心,根据数据安全合规监管和业务提升要求,评估相应数据访问控制的现状差距、制定数据安全控制措施。主要场景的风险评估重点数据访问账号和用户权限管理,通过账号专人专用、账号独立、账号授权审批、最小授权、账号及时回收、行为内部审计、定期账号稽核等方式控制;数据使用过程的访问权限管理,建议批量操作审批、高敏感数据访问审批、批量操作和高敏感数据访问的指定设备、地点、访问过程内部审计记录、开发测试访问模糊化、访问行为定期稽核等方式控制;数据共享(提取)权限管理,通过最小共享和泛化、共享(提取)审批、最小使用范围、责任传递、定期稽核等方式控制;定期权限稽核,主要通过数据安全的合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论