基于ipc分类号生成样本训练集指导文本分类
1.文本分类的简要过程
在实际分类中,首先将训练文本表示成某种形式的元素(词)的向量,通过特征提取,用权重表示特征,这样就可以对元素-权重表示的文档向量进行训练,获得向量模型。
分类时,待分类的文档表示成元素-权重文档向量,并于向量模型进行比较,最终判断其类别。
2.第一个问题:如何找到合理的文档训练集?
由于在专利检索方面有一定的经验,因此可以依据ipc分类号,提取一批规范的文档集,作为文档训练集。
3.ipc分类号介绍
国际专利分类系统的体系结构如下: 国际专利分类系统按照技术主题设立类目,把整个技术领域分为5个不同等级:部 、 大类、 小类、大组、 小组。
IPC分为A-H八个部,其中
A部:生活必须(农、轻、医);
B部:作业、运输;
C部:化学、冶金;
D部:纺织、造纸;
E部:固定建筑物;
F部:机械工程、照明、采暖、武器、爆破;
G部:物理;
H部:电技术
B ----- 部,表示作业、运输。
B64 ---- 大类,表示飞行器、航空、宇宙飞船。大类类号用二位数标记。
B64C---- 小类,表示飞行。小类类号用大写字母标记。
B64C25/00- 大组,表示起落装置。大组类号用1-3位数加/00标记。
B64C25/02- 小组,标记是将大组/00中的00改为其他数字.小组内的等级是依次降低的,但从分类号上看不出来,只能根据小类前的圆点数目加以判断。如:
25/02 . 起落架;
25/08 .. 非固定的;
25/10 ...可快放的,可折叠的或其他的;
25/18 ....操作机构;
25/26 ..... 操纵或锁定系统;
25/30 ...... 应急动作的
因此该实验的目的就是根据ipc分类号找出一组文档训练集,为后期开发文本分类做好准备。
分享到:
相关推荐
将ipc分类号按照主组分类,用于专利爬虫
数字技术-IPC专利分类号对应表,基于2023年的关键数字技术专利分类体系,通过 国际专利分类(IPC)号进行筛选。这些数据涵盖了各种数字技术领域的创新,包括但不 限于人工智能、大数据、云计算、物联网、5G通信等。...
西门子工控机IPC产品选型样本ppt,西门子工控机IPC产品选型样本 西门子工控机IPC产品选型样本 西门子工控机IPC产品选型样本 西门子工控机IPC产品选型样本
研祥嵌入式工控机IPC-8206产品样本pdf,研祥嵌入式工控机IPC-8206产品样本:IPC-8206 是一款优质钢结构的19″ 2U 可上架机箱,支持符合PICMG1.0 及PICMG1.3 系列主板,支持5 槽标准工业级底板,机箱内预留光驱...
国际专利分类IPC介绍.ppt
研祥壁挂式工业机箱IPC-6810产品样本pdf,研祥壁挂式工业机箱IPC-6810产品样本:IPC-6810是一款壁挂式机箱,可配符合PICMG1.0及PICMG1.3系列主板,可配8 槽标准工业级底板,兼容性强;预留有一个HDD空间,具有减震...
西门子SIMATIC IPC产品样本zip,提供“西门子SIMATIC IPC 产品样本”免费资料下载,包括机架式、箱式、面板式等工控机的技术参数、规格尺寸等,可供选型参考。
研祥嵌入式工控机IPC-820产品样本pdf,研祥嵌入式工控机IPC-820产品样本:IPC-820 是一款 4U 19"上架型整机,外观全黑;前面板采用钣金造型,机箱为优质钢板成型,机箱的压条设计可调整高度,可满足EPI主板和PCI...
上市公司专利质量/知识宽度/专利申请和授权IPC分类号,含原始数据、测算代码、参 考文献,1990-2022,excel及stata版本,整理好的面板数据 熊彼特 在《经济发展理论》一书中指出,创新是一种内在因素,所谓创新,指...
TUXEDO:基于IPC机制浅析TUXEDO及其应用.doc
二元创新数据2000-2021年上市公司探索式创新和利用式创新数据,双元创新数据借鉴Guan and Liu(2016)、徐露允等(2017)、张庆垒等(2018)的方法,采用IPC专利分类号前4位为基础,选择五年的窗口期。既是当某企业...
SIMATIC IPC 工业PC样本.pdf
基于IPC-7351B的表贴器件PCB封装设计.pdf
2.内容:基于IPC模糊控制算法的倒立摆控制系统matlab仿真+代码仿真操作视频 3.用处:用于基于IPC模糊控制算法的倒立摆控制系统算法编程学习 4.指向人群:本硕博等教研学习使用 5.运行注意事项: 使用matlab2021...
一种基于IPC_RT LINUX数控系统控制面板的设计及实现.pdf
文章介绍一种基于IPC+PLC的燃天然气热处理炉微机温控系统的硬件结构和软件设计,论述实现这一系统遇到的具体问题及解决方法。该系统的应用表明:IPC+PLC是一种开发周期短、成本低、可靠性和准确度高的温控措施,对其它...
在Altium Designer 16中利用IPC向导生成3D封装以及STEP模型的操作步骤
研祥嵌入式工控机IPC-8421B产品样本pdf,研祥嵌入式工控机IPC-8421B:IPC-8421B是一款19″ 4U 多硬盘DVR机箱,既支持工业底板,也支持ATX大母板,符合EIA RS-310C标准;支持多达6个3.5 英寸硬盘空间,符合高存储...
数字技术-IPC专利分类号统计-new.pdf
本文从底层IPC机制出发,结合UNIX核心系统参数和ATMI技术,借用ipcs观察Tuxedo所消耗的IPC系统资源状况,浅析了Tuxedo强大功能背后的工作原理,进一步加深对Tuxedo应用和ATMI编程的理解,提出了解决实际工作中关键...