关键词:
TRIZ分析矩阵
专利文献
预训练技术
实体识别
关系抽取
摘要:
中国正从“制造大国”向“智造强国”战略转型,以科技创新为核心的创新驱动发展战略已上升为国家战略,国家和企业对创新的需求不断提高,主要体现在产品快速迭代的需求、技术交叉加剧的需求和创新知识集中汇聚的需求。在当前的时代背景下,创新已经不仅仅是依靠个人灵感而产生的想法,而更需要科学的方法和依据给予突破。TRIZ创新方法通过对专利大数据的挖掘分析,形成了一套指导人们进行发明创新的系统化的方法学体系,可以准确分析和发现核心问题,提高创新的效率与质量,是行之有效的创新方法之一。
系统相互作用分析矩阵是TRIZ创新方法体系中实现功能分析的核心技术。系统相互作用分析矩阵基于人工方法从专利文献中提取组件和功能两类知识实体及对应关系,再建立矩阵开展系统功能分析,指导技术创新。然而,面对全球科技快速进步迭代和专利申请量的爆炸式增长,传统的系统相互作用分析矩阵也面临知识要素不足、人工构建速度慢、人力成本高等问题,导致利用TRIZ创新方法促进创新的效应偏低,难以满足国家和企业日益增长的创新需求。
面对上述背景及发展需求,本研究在TRIZ创新方法的指导下,面向特定领域拓展系统相互作用分析矩阵涵盖的知识要素,同时将本文提出的面向特定领域且包含更丰富知识实体和关系的矩阵定义为TRIZ分析矩阵,并提出利用大数据和人工智能技术开展TRIZ分析矩阵智能构建方法研究。具体的,利用BERT预训练语言模型技术,从海量专利数据中自动识别知识实体和关系,完成领域知识图谱构建;面向具体需求,基于知识查询和知识推理,从领域知识图谱中自动读取所需要的知识实体和关系,实现TRIZ分析矩阵的自动构建。一方面解决TRIZ创新方法的知识供应问题,另一方面丰富TRIZ创新方法的体系基础。
围绕TRIZ分析矩阵智能构建的研究目标,本文主要进行了以下三部分工作:(1)完成TRIZ分析矩阵智能构架方法体系的设计,整体方法框架包括面向TRIZ分析矩阵的领域知识图谱模式层设计、面向专利的知识实体和知识关系抽取方法、基于领域知识图谱的TRIZ分析矩阵自动构建三大模块。(2)完成薄膜磁头技术领域专利知识抽取的BERT模型构建。采用“预训练+继续预训练+微调”的技术路径,开展BERT模型继续预训练、实体识别和关系抽取实验,构建得到BERT-MH+CRF实体识别模型和BERT-MH+softmax关系抽取模型,证明本文提出的技术路径的有效性。(3)完成薄膜磁头技术领域TRIZ分析矩阵构建实证研究。基于自建的薄膜磁头技术领域专利语料,应用上述实体识别和关系抽取模型,面向具体技术创新情境完成TRIZ分析矩阵构建的全流程实证示范。
本研究的主要贡献在于:(1)将深度学习和领域知识图谱技术应用于传统TRIZ理论体系的改进,提供TRIZ分析矩阵智能构建的完整解决方案,拓展了大数据环境下TRIZ分析矩阵的知识体系,为TRIZ理论的发展提供了新的解决思路和视角。(2)提出了“预训练+继续预训练+微调”的实体关系抽取技术路径,有效提升了面向专利的实体识别和关系抽取模型的性能,同时减少模型对标注数据的依赖。(3)在实体识别和关系抽取实验中,对不同的BERT模型参数和下游神经网络进行了对比探索,同时面向薄膜磁头技术领域开展TRIZ分析矩阵构建实证示范,为其他领域的应用提供指导与借鉴。
本文共包括图21个,表20个,附录2个。