一、数据内容定义
AI专利是指涉及人工智能技术的相关专利,包括机器学习、深度学习、自然语言处理、计算机视觉等领域的创新成果。
本数据库聚焦中国人工智能领域专利信息,依据自主构建的双重关键词体系与《关键数字技术专利分类体系(2023)》等双重标准,系统性整合中国专利申请与授权数据及国际专利事务信息。核心内容包括:
-
基础信息层
- 专利属性:申请号、授权公告号、专利名称、IPC分类号、申请日、授权日、申请人/专利权人、发明人、地址、专利代理机构及代理人信息。
- 专利类型:覆盖发明专利(含公开与授权两个阶段)、实用新型、外观设计三类。
-
事务管理层
- 法律状态变更记录(如审查意见、驳回、授权、无效宣告、转让、质押等)。
- 国际专利事务:PCT申请数据、优先权信息、分案申请、进入国家阶段日等。
二、数据独特性
(一)双重判定标准
-
标准一(人工+政策双驱动)
- 自主构建关键词词库:整合AI领域核心术语(如大模型、深度学习、机器学习等)及国家知识产权局政策文件中列示的技术范畴。
- 动态更新机制:定期追踪政策文件与技术文献,确保关键词覆盖率。
-
标准二(对标国际分类)
- 严格遵循《关键数字技术专利分类体系(2023)》中细化的人工智能分支(如机器学习、计算机视觉、自然语言处理等),提升分类精准度。
(二)多源异构数据融合机制
- 突破单一数据源局限,全面整合中国产权局的官方专利数据与全球专利法律状态动态信息,形成覆盖专利全生命周期的立体数据网络。通过构建专利家族识别算法,实现全球同族专利的智能关联,解决传统数据库分散检索导致的重复计算问题。
三、数据完整性
- 时间跨度:支持1985年至今的全部专利数据(具体年限可根据需求定制)。
- 地域覆盖:以中国专利为核心,兼顾国际专利布局(通过PCT途径进入中国的专利)。
- 要素覆盖:结构化全字段记录专利从申请到失效的全生命周期状态变迁,特别设计了权利要求数、同族专利数、引用频次等指标。
四、数据可靠性
-
数据清洗流程
- 去重校验:通过申请号、公开号等多维度标识去重。
- 异常值过滤:剔除明显错误数据。
-
交叉验证
- 权威数据源架构:通过多源数据进行交叉验证,确保关键字段的准确性,并提供专利唯一识别符供使用者进行三方对比核验。
-
质量控制流程
- 人工抽检:每月抽取3%数据与各源公告系统进行交叉验证。
- 纠错反馈:开放与客户之间的错误提交通道,建立季度更新修正机制。
五、潜在应用场景
(一)学术研究
- 技术趋势分析:利用专利时间序列数据追踪AI技术热点迁移(如从传统机器学习向大模型演进、2023年“生成式AI”专利爆发等)。
- 专利价值评估:结合权利要求数、引用频次、法律状态等指标构建评价模型。
- 创新主体画像:构建上市公司/工业企业/高新技术企业/高校的AI专利竞争体系、通过申请人共现网络发现产学研协同创新热点等。
(二)产业应用
- 竞争情报分析:监测竞争对手专利布局,识别技术空白点。
- 专利导航:为企业研发方向提供数据支撑,规避侵权风险。
(三)政策制定
- 产业扶持参考:量化分析区域AI专利密度,辅助制定创新激励政策。
- 国际合作研判:通过PCT数据评估我国AI技术的国际影响力。
(四)商业服务
- 专利交易估值:基于历史交易数据与专利质量指标建立定价模型。
- 侵权预警系统:通过关键词匹配与同族专利分析识别潜在侵权风险。
本数据库通过结构化设计、双重验证机制及动态更新策略,构建了兼具广度与深度的AI专利知识图谱,可为学术研究、产业决策及政策制定提供可靠的数据底座。
时间区间
- 发明公布按照申请公布日统计:1985-2023年
- 发明授权/实用新型/外观设计按照授权公告日统计:1985-2023年
数据规模
字段展示
注:关键数字技术版本不含“AI人工智能外观设计专利基本信息表”。
样本数据
因本数据表格较多,本页面仅作关键词版本的部分表格展示,完整表格样例请点击左侧列表浏览。
AI人工智能发明公布专利基本信息表
AI人工智能发明公布专利事务表
参考文献
- 刘青、肖柏高,2023:《劳动力成本与劳动节约型技术创新——来自AI语言模型和专利文本的证据》,《经济研究》第2期。
- 陈楠、蔡跃洲,2022:《人工智能、承接能力与中国经济增长——新“索洛悖论”和基于AI专利的实证分析》,《经济学动态》第11期。
数据更新频率
年度更新