一、数据内容定义
AI专利是指涉及人工智能技术的相关专利,包括机器学习、深度学习、自然语言处理、计算机视觉等领域的创新成果。
本数据库聚焦中国人工智能领域专利信息,依据自主构建的双重关键词词库与《关键数字技术专利分类体系(2023)》等双重标准,系统整合全球专利及引用被引信息。核心内容包括:
-
基础信息层
- 专利属性:引用专利及被引专利的申请号、授权公告号、专利名称、IPC分类号、申请日、授权日、申请人/专利权人等信息。
- 专利类型:覆盖发明专利(含公开与授权两个阶段)、实用新型、外观设计三类。
-
引用关系网络
- 直接引用:被引用专利ID列表、引用专利ID列表(含申请日、授权日、分类号)。
- 间接引用:多级引用链条(支持追溯技术演进脉络)。
- 引用强度:被引用总次数、同族引用判断等。
二、数据独特性
(一)双重判定标准
-
标准一(人工+政策双驱动)
- 自主构建关键词词库:整合AI领域核心术语(如大模型、深度学习、机器学习等)及国家知识产权局政策文件中列示的技术范畴。
- 动态更新机制:定期追踪政策文件与技术文献,确保关键词覆盖率。
-
标准二(对标国际分类)
- 严格遵循《关键数字技术专利分类体系(2023)》中细化的人工智能分支(如机器学习、计算机视觉、自然语言处理等),提升分类精准度。
(二)多源异构数据融合机制
- 突破单一数据源局限,全面整合中国产权局的官方专利数据与全球多个专利局的详细信息,形成覆盖专利全生命周期的立体数据网络。通过构建专利家族识别算法,实现全球同族专利的智能关联,解决传统数据库分散检索导致的重复计算问题。
(三)全景刻画双向引用网络
- 技术传承链:完整记录授权专利对在先技术的引用关系(含引用专利ID、申请日、法律状态),支持逆向追溯技术演进脉络。例如,可识别某自动驾驶专利是否继承自Waymo早期传感器技术。
三、数据完整性
- 时间跨度:支持1985年至今的全部专利数据(具体年限可根据需求定制)。
- 地域覆盖:以中国专利为核心,覆盖中国专利在世界范围内的引用和被引信息。
四、数据可靠性
-
数据清洗流程
- 去重校验:通过申请号、公开号等多维度标识去重。
- 异常值过滤:剔除明显错误数据。
-
交叉验证
- 权威数据源架构:通过多源数据进行交叉验证,确保关键字段的准确性,并提供专利唯一识别符供使用者进行三方对比核验。
-
质量控制流程
- 人工抽检:每月抽取3%数据与各源公告系统进行交叉验证。
- 纠错反馈:开放与客户之间的错误提交通道,建立季度更新修正机制。
五、潜在应用场景
(一)学术研究
- 技术趋势分析:通过CiteSpace可视化工具解析AI技术演进路径。
- 创新影响力评估:构建专利引用强度指数(PCI)衡量技术突破性。
- 研发合作网络:识别跨机构技术联盟与产学研协同模式。
(二)产业应用
- 竞争情报分析:绘制竞争对手技术布局地图。
- 技术风险评估:预警专利侵权风险与专利悬崖周期。
- 投资决策支持:量化企业专利资产组合价值。
(三)政策制定
- 产业规划依据:测算区域AI专利密度与创新生态成熟度。
- 标准制定参考:分析核心专利簇的技术控制力。
- 国际合作指引:识别重点专利池与跨境许可机会。
(四)金融投资
-
科创板企业估值:将专利引用指标纳入DCF模型参数。
-
专利质押融资:建立专利价值评估基准曲线。
-
并购尽职调查:快速筛查目标企业核心技术资产。
本数据库通过构建"技术特征-法律状态-经济价值"三位一体的AI专利知识图谱,为人工智能技术创新生态提供可量化、可追溯、可预测的数据基础设施,助力产学研各界把握技术变革脉搏,优化创新资源配置效率。
时间区间
- 发明公布按照申请公布日统计:1985-2023年
- 发明授权/实用新型/外观设计按照授权公告日统计:1985-2023年
数据规模
字段展示
样本数据
因本数据表格较多,本页面仅作关键词版本的部分表格展示,完整表格样例请点击左侧列表浏览。
AI人工智能发明公布专利引用表
AI人工智能发明公布专利被引用表
参考文献
- 刘青、肖柏高,2023:《劳动力成本与劳动节约型技术创新——来自AI语言模型和专利文本的证据》,《经济研究》第2期。
- 陈楠、蔡跃洲,2022:《人工智能、承接能力与中国经济增长——新“索洛悖论”和基于AI专利的实证分析》,《经济学动态》第11期。
数据更新频率
年度更新