基于网页特征的TFIDF改进算法
宋斌,方小璐
摘要(Abstract):
本文分析了传统的TFIDF算法。提出了一种改进的TFIDF算法,将提取到的网页特征加入传统的TFIDF算法,从而更为准确地抽取网页中的重要文字。
关键词(KeyWords): TFIDF;权重;网页标记;HTML
基金项目(Foundation):
作者(Author): 宋斌,方小璐
摘要(Abstract):
本文分析了传统的TFIDF算法。提出了一种改进的TFIDF算法,将提取到的网页特征加入传统的TFIDF算法,从而更为准确地抽取网页中的重要文字。
关键词(KeyWords): TFIDF;权重;网页标记;HTML
基金项目(Foundation):
作者(Author): 宋斌,方小璐