现代矿业 ›› 2022, Vol. 38 ›› Issue (11): 266-.
汪贻杰1 沙梦钒2 赵鹏2 周建平1
WANG Yijie1 SHA Mengfan2 ZHAO Peng2 ZHOU Jianping1
摘要: 为促进期刊融媒体发展,提高杂志社网站的知识服务能力,实现为读者提供论文在 线推荐服务,提出了一种基于数据仓库的论文推荐方法。首先建立数据仓库,设立论文推荐主题 库,抽取数据集中论文的标题、摘要、关键词等数据建立特征数据集;然后,再对这些特征数据集进 行预处理,得到半结构化的分词特征数据集,存入数据仓库的ODS 层,格式化和ETL 化原始数据 层中的数据,清洗维度缺项的数据,存入DWD 层,构造维度-论文权重矩阵,存储在DWS 层,ADS 层存储汇总的推荐结果;最后,推荐时根据ADS 层主题表中的分词特征数据集,计算待推荐论文 的相似度,根据相似度值对目标论文推荐相似文献。结果表明,该推荐方法提高了论文推荐的实 时性和准确率,应用效果良好。