首页>成果转化>专利

一种基于音形义的中文词相似度检测算法

分类:G06F40/126

发明人:黄梦醒,王华敏,冯思玲,冯文龙,张雨,吴迪

专利权人:海南大学

申请号:CN202011058506.X申请日期:2020-09-30

联系电话:18571690695

联系邮箱:niujj@uipplus.com

价值度评分:48

本发明提供了一种基于音形义的中文词相似度检测算法,通过综合考虑汉字的音形义三大特征去检测中文字符串的总体相似度,首先将中文字符串s1、s2的每个汉字的拼音转换成对应的音码,将中文字符串s1、s2的每个汉字转换为形码,然后分别计算中文字符串s1、s2之间的音码相似度和形码相似度,其次单独算出中文字符串义的相似度,最后结合音形义,针对应用场景,设置贡献参数算出最后中文字符串s1、s2的总体相似度。此算法可以满足较为复杂的应用场景,可应用于结构化数据项重复度的检测,特别是存在手工输入错误的情况,另外,也可应用于错别字隐藏的敏感词检测等。相比同类型的中文字符相似度检测算法,大大增强了对中文字符串相似度的检测效果。
公告日 法律状态 法律状态信息
专利价值度评分
技术价值
经济价值
法律价值
总评:48
该专利价值较低(仅供参考)

该专利的技术、经济、法律价值经系统自动评估后的总评得分较低,可以重点关注其公开的技术内容。

本专利文献包含【2个独立权利要求】、【1个实施例】、【3个技术分类】,从一定程度上而言上述指标的数值越大可以反映出所述专利的技术保护及应用范围越广。

技术价值:34

该指标主要从专利申请的著录信息、法律事件等内容中挖掘其技术价值,专利类型、独立权利要求数量、无效请求次数等内容均可反映出专利的技术性价值。技术创新是专利申请的核心,若您需要进行技术借鉴或寻找可合作的项目,推荐您重点关注该指标。

部分指标包括:

授权周期(发明)0个月

独立权利要求数量2个

从属权利要求数量7个

说明书页数10页

实施例个数1个

发明人数量6人

被引用次数0次

引用文献数量0个

优先权个数0个

技术分类数量3个

无效请求次数0次

分案子案个数0个

同族专利数0个

专利获奖情况

保密专利的解密

经济价值:7

该指标主要指示了专利技术在商品化、产业化及市场化过程中可能带来的预期利益。专利技术只有转化成生产力才能体现其经济价值,专利技术的许可、转让、质押次数等指标均是其经济价值的表征。因此,若您希望找到行业内的运用广泛的热点专利技术及侵权诉讼中的涉案专利,推荐您重点关注该指标。

部分指标包括:

申请人数量1人

申请人类型院校;

许可备案次数0次

权利质押次数0次

权利转移次数0次

是否海关备案

法律价值:7

该指标主要从专利权的稳定性角度评议其价值。专利权是一种垄断权,但其在法律保护的期间和范围内才有效。专利权的存续时间、当前的法律状态可反映出其法律价值。故而,若您准备找寻权属稳定且专利权人非常重视的专利技术,推荐您关注该指标。

部分指标包括:

存活期/维持时间0

法律状态审中-实质审查

发表留言