文章目录
[+]
专利摘要显示,本发明涉及一种项目相似度判断方法,具体步骤包括:从项目库中提取相关项目的业务数据;建立分词模型对项目库提取的业务数据进行统计切分;利用Tf‑idf算法建立特征向量转化模型,通过统计分词模型输出的分词文本列表的词频数,将分词文本列表转化为分词特征向量列表,并获取各项目各业务数据维度的特征向量列表;利用余弦相似度算法建立相似度计算模型,通过各项目各业务数据维度的特征向量列表分别计算各项目各业务数据维度间的相似度,并进行加权求和,获得各项目的相似度;选取项目间相似度大于预设范围的所有项目作为疑似相似项目。
本文源自金融界

(图片来自网络侵删)