重庆时时彩后一必中|重庆时时彩的规律

基于K-Means文献聚类算法的文本聚类系统设计

时间:2018-01-11 11:03来源:毕业论文
实现了基于K-Means文献聚类算法的文本聚类系统。此系统可以根据用户输入的聚类数目,对海量信息进行聚类操作,返回给用户类别信息。通过系统测试,该系统能够完成文献的分类工作
摘要:随着计算机网络的发展,信息急速增长,在浩如烟海的信息中快速地挖掘去有价值的内容,需要对海量信息进行分析处理。利用文献聚类算法,通过计算机对海量信息进行处理,形成更有层次的分类和类别特征描述。在此基础上,可以引导用户进一步明确其需求,而信息查询与检索的范围会更精确,很好地提高结果的准确性和相关性,极大地节约信息使用的成本,提高信息利用的效率。本论文分析了当前各类别的文献聚类算法,对其思想、实现进行阐述,同时对其性能进行比较。最后,实现了基于K-Means文献聚类算法的文本聚类系统。此系统可以根据用户输入的聚类数目,对海量信息进行聚类操作,返回给用户类别信息。通过系统测试,该系统能够完成文献的分类工作,达到了预期的目标。17418
关键词:数据挖掘;文本分词;聚类算法;K-Means算法
Research and Implementation of Text Clustering Method
Abstract: With the development of computer networks, the rapid growth of information, and how to dig to the valuable content in vast amounts of information, it just need to analyze the information. The use of document clustering algorithm, through the computer dealing with the flood of information get a more hierarchical classification and category characteristics description. On this basis, it guides users to further clarify their needs, the information of query and retrieve will be more accurate to improve the accuracy and relevance of the results, which greatly save the cost of using information and improve information utilization. This paper analyzes the present all kinds of other literature clustering algorithm, explaining their thinking, comparing their performance difference. Finally, based on the K-Means algorithm realizes text clustering system. This system can be based on the cluster numbers which users input, the mass information on the clustering operation, returning to the user category information. By system testing, the system is able to complete the classification of the literature to achieve the desired task. 源自六/维\论]文[网!加7位QQ324.9114 重庆时时彩的规律 www.mamitama.com
Keywords: data mining; word segmentation; clustering algorithm; K-Means algorithm
 目  录
1 绪论    1
1.1 课题目的和意义    1
1.2 研究现状概述和发展趋势    1
1.2.1 研究现状概述    1
1.2.2 发展趋势    2
1.3 本文组织安排    2
2 文本聚类算法分析    4
2.1文本聚类分析简介    4
2.2基于划分的聚类算法    5
2.2.1 算法基本原理    5
2.2.2 K-MEDOIDS算法实现流程    5
2.3基于层次的聚类算法    6
2.3.1算法思想    6
2.3.2算法实现流程    6
2.3.3 CURE算法分析    7
2.4基于密度的聚类算法    8
2.4.1算法思想    8
2.4.2 算法设计与实现分析    8
2.5其他聚类算法    9
2.5.1基于网格的聚类算法    9
2.5.2期望最大化聚类算法    10
2.5.3基于模型的聚类算法    10
2.6算法性能比较    10
2.7算法性能数据分析    11
3 K-MEANS算法实现    14
3.1 算法流程    14
3.2 算法描述    15
3.3 算法代码实现    17
3.3.1编程语言说明    17
3.3.2算法变量    17
3.3.3 主要函数    18
3.4 算法评价    19
4 基于K-Means算法的文本聚类系统    21 本文来源:http://www.mamitama.com/a/www.jiaoyubao.cn/

重庆时时彩的规律 www.mamitama.com,  《我国经济社会发展的阶段性特征和需要抓紧解决的重大问题》(2005年10月11日)这是胡锦涛同志在中共十六届五中全会第二次全体会议上讲话的一部分。1996年,中国成为东盟全面对话伙伴。

源自六/维\论]文[网!加7位QQ324.9114 重庆时时彩的规律 www.mamitama.com


4.1 系统分析    21 基于K-Means文献聚类算法的文本聚类系统设计:/a/jisuanjilunwen/20180111/19075.html
------分隔线----------------------------
推荐内容
小说 小说 小说 小说 小说 小说
小说 小说 小说 小说 小说 小说
小说 小说 小说 小说 小说 小说