技术标签:模糊相关,信息检索,Web挖掘
产业分类:经济分类:文化、体育和娱乐业
成果所属人:海南大学技术成熟度:小试阶段
是否指派:否计划转让金额:面议
合作方式:联系人:牛老师
联系电话:联系邮箱:niujj@ige-live.com
中图分类:TP391
学科分类:520.60
成果类别:软科学
研究起止时间:2006-01~2007-05
评价形式:验收
针对Web信息检索的特点,提出了一种多层向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。由于Web文档往往具有不确定的特征,使得利用模糊集合理论对信息检索过程的不确定性建立模型成为可能。提出了一种基于模糊相关技术的Web文档分类方法,实验结果表明,该方法比基于向量空间模型的Web分类方法有较高的分类精度。并将该方法应用于交互式Web信息检索系统中,试验结果表明,使用该方法实现查询表达式的重构,可较大幅度地提高Web信息检索系统的查准率。提出了一种简明而有效的基于分级神经网络的模糊聚类算法。与现有方法不同,该模糊聚类方法采用自组织神经网络和模糊聚类网络两部分组成的三层神经网络来实现。首先采用自组织神经网络从原始数据产生一个初始聚类结果,然后运用FCM方法对初始聚类的数目进行优化。实验结果表明,提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的Web文档较完全和准确地聚成一类。