[1]谢红,赵洪野.基于卡方距离度量的改进KNN 算法[J].应用科技,2015,(01):10-14.[doi:10.3969/j.issn.1009671X.201312017]
 XIE Hong,ZHAO Hongye.An improved KNN algorithm based on Chisquare distance measure[J].yykj,2015,(01):10-14.[doi:10.3969/j.issn.1009671X.201312017]
点击复制

基于卡方距离度量的改进KNN 算法(/HTML)
分享到:

《应用科技》[ISSN:1009-671X/CN:23-1191/U]

卷:
期数:
2015年01期
页码:
10-14
栏目:
现代电子技术
出版日期:
2015-02-05

文章信息/Info

Title:
An improved KNN algorithm based on Chisquare distance measure
文章编号:
1009671X(2015)0101005
作者:
谢红赵洪野
哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨 150001
Author(s):
XIE Hong ZHAO Hongye
College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China
关键词:
K近邻算法卡方距离距离度量二次式距离欧式距离灵敏度法
分类号:
TP391.4
DOI:
10.3969/j.issn.1009671X.201312017
文献标志码:
A
摘要:
K近邻算法(Knearest neighbor, KNN)是一种思路简单、易于掌握、分类效果显著的算法。决定K近邻算法分类效果关键因素之一就是距离的度量,欧氏距离经常作为K近邻算法中度量函数,欧式距离将样本的不同特征量赋予相同的权重,但是不同特征量对分类结果准确性影响是不同的。采用更能体现特征量之间相对关系的卡方距离度量作为KNN算法的度量函数,并且采用灵敏度法进行特征权重计算,克服欧氏距离的不足。分类实验结果显示,基于卡方距离的改进算法的各项评价指标优于传统的KNN算法。
Abstract:
Knearest neighbor algorithm; Chisquare distance; distance measure; quadraticform distance; Euclidean distance; sensitivity method

参考文献/References:

[1]奉国和. 自动文本分类技术研究[J]. 情报杂志, 2004, 2(4): 108111.

[2]COVER T M, HART P E. Nearest neighbor pattern classification[J]. IEEE Transactions on Information Theory, 1967, 13(1): 2127.

[3]LI J. TKNN: an improved KNN algorithm based on tree structure[C]// Seventh International IEEE Conference on Computational Intelligence and Security. Sanya, China, 2011: 13901394.

[4]彭凯, 汪伟, 杨煜普. 基于余弦距离度量学习的伪 K 近邻文本分类算法[J]. 计算机工程与设计, 2013, 34(6): 22002203.

[5]LIM H. An improve KNN learning based Korean text classifier with heuristic information[C]// The 9th International Conference on Neural Information Processing. Singapore, 2002: 731735

[6]桑应宾. 一种基于特征加权的KNearestNeighbor算法[J]. 海南大学学报, 2008, 26(4): 352355.

[7]WEINBERGER K Q, SAUL L K. Distance metric learning for large margin nearest neighbor classification[J]. The Journal of Machine Learning Research, 2009(10): 207244.

[8]KEDEM D, TYREE S, WEINBERGER K Q, et al. Nonlinear metric learning[C]// Neural Information Processing Systems Foundation. Lake Tahoe, USA, 2012: 25822590.

[9]苏金树, 张博锋, 徐昕. 基于机器学习的文本分类技术研究进展[J]. 软件学报, 2006, 17(9): 18481859.

[10]PELE O, WERMAN M. The quadraticChi histogram distance family[C]// The 11th European Conference on Computer Vision. Crete, Greece, 2010: 749762.

更新日期/Last Update: 2015-03-11