1.一种文献引用网络可视化及文献推荐方法,其特征在于,包括以下步骤:首先,获取文献并存入数据库,利用文本相似度算法计算文献相似度;其次,利用改进的网页链接度排序算法计算文献重要度,并对文献进行排序;然后,对排序后的文献利用K均值聚类算法进行聚类,并对聚类的结果进行可视化,构建双层网络模型,将其重要文献展示出来;最后根据聚类结果将聚类中心的文献推荐给用户;
所述改进的网页链接度排序算法计算文献重要度具体步骤包括:根据文献的固有属性包括作者、年份及引用次数,结合文献相似度,通过引用行为定量分析所产生的传递价值,计算文献重要度,公式如下:其中,A(i)为文献i在科研合作网中采用原始网页链接度排序算法计算的作者权威度的平均值,wji为文献j将价值传给文献i时的权重,l为文献与参考文献间的时间差,k为推荐年份与文献年份的差值,d为阻尼系数。
2.根据权利要求1所述的文献引用网络可视化及文献推荐方法,其特征在于,所述对排序后的文献利用K均值聚类算法进行聚类具体步骤包括:对排序后的文献利用K均值聚类算法进行聚类,将改进的网页链接度排序算法与K均值聚类算法相结合,此方法适用于文献网中的社区发现,通过改进的网页连接度排序算法结果,选取重要度最高的做为种子节点,利用欧式距离进行聚类。
3.根据权利要求2所述的文献引用网络可视化及文献推荐方法,其特征在于,所述引用行为定量分析所产生的传递价值计算具体步骤包括:首先,将论文划分为引言、相关研究、实验、结论、主要内容五部分;其次,利用正则表达式模板从论文主体部分提取出带有引用标记格式的标注句子,并标明其所属部分;最后根据参考文献所在位置赋予不同的重要值。
4.一种文献引用网络可视化及文献推荐系统,包括用户获取文献模块、数据库,用户获取文献模块用于用户输入关键词后,从文献网上抓取相关文献;数据库用于获得相关信息并下载全文后存入数据库,其特征在于,还包括:预处理模块、引用行为定量分析模块、重要度计算模块、基础网络构建单元及可视化模块;其中预处理模块用于对文献的摘要和关键词进行分词处理、词性标注及词性过滤,并计算查询文献与候选相似文献之间的余弦相似度;引用行为定量分析模块用于根据参考文献所在位置赋予不同的重要值;重要度计算模块用于采用改进的网页链接度排序算法计算文献重要度,并对文献进行排序,所述改进的网页链接度排序算法计算文献重要度具体步骤包括:根据文献的固有属性包括作者、年份及引用次数,结合文献相似度,通过引用行为定量分析所产生的传递价值,计算文献重要度,公式如下:其中,A(i)为文献i在科研合作网中采用原始网页链接度排序算法计算的作者权威度的平均值,wji为文献j将价值传给文献i时的权重,l为文献与参考文献间的时间差,k为推荐年份与文献年份的差值,d为阻尼系数;基础网络构建单元用于从数据库中获取论文及引文信息;可视化模块,用于选取得分最高若干论文,并对排序结果进行可视化布局。
5.根据权利要求4所述的文献引用网络可视化及文献推荐系统,其特征在于,所述基础网络构建单元得到带权值的双层引用网络,其中包括作者间、论文间引用关系,作者和论文间的著作关系,论文间和作者间引用关系。
6.根据权利要求4所述的文献引用网络可视化及文献推荐系统,其特征在于,还包括个性化学术推荐模块:用于根据科研领域中研究人员撰写学术论文的行为特性,挖掘异质学术网络数据,采用有监督的排序学习方法实现基于用户的个性化论文推荐。