当前位置: 首页 > news >正文

苏州中设建设集团有限公司网站/新疆头条今日头条新闻

苏州中设建设集团有限公司网站,新疆头条今日头条新闻,360网站建设企业,中英文切换网站怎么做一、算法简介 K-means算法是一种常见的无监督学习聚类算法,其基本思想是将n个样本划分为k个簇,每个簇内的样本之间的相似度要尽可能的大,而不同簇之间的相似度要尽可能的小,通过最小化各个簇内点与该簇中心点的距离和来实现。 二…

一、算法简介

K-means算法是一种常见的无监督学习聚类算法,其基本思想是将n个样本划分为k个簇,每个簇内的样本之间的相似度要尽可能的大,而不同簇之间的相似度要尽可能的小,通过最小化各个簇内点与该簇中心点的距离和来实现

二、具体算法流程

Kmeans:
1. 初始化: 随机选取k个点作为簇中心;

2. 计算距离: 根据选取的距离度量方式(通常为欧氏距离)计算每个样本到k个中心的距离;

3. 分配样本点: 将每个样本点划分为距离最近的簇;

4. 计算簇中心: 对于每个簇,重新计算该簇所有样本的均值,将该均值作为新的簇中心;

5. 迭代: 重复执行步骤2到步骤4,直到簇中心不再发生变化或者达到预设的迭代次数。

最小化约束函数为:找到一个质心使得簇内差的平方和最小,也即是最小化各个簇内点与该簇中心点的距离和。

Kmeans++具有的不同点是:

Kmeans ++算法是一种优化的初始质心选择方法,能够避免初始质心过于集中导致聚类结果出现局部最优解的问题

具体计算步骤:

1. 随机选择一个样本点作为第一个质心。

2. 计算每个样本点到已选质心的距离,并以概率(距离越远的点概率越大)选取下一个质心。

3. 重复2步骤,直至选取出k个质心。

4. 运用普通的Kmeans算法进行聚类。
 

三、K-means算法优缺点

优点:

  1. 速度较快
  2. 调节参数少,簇的个数K

缺点:

1)对于非凸形状的簇难以处理,(以及拉长形状或不规则形状

2)且结果易受到初始点的影响。因此,通常需要进行多次实验,并选取最优结果。

3)算法迭代得到的结果为局部最优(Kmean++算法有一定改善)

4)  数据类别不平衡则聚类效果不佳

5)  对噪声和异常点较敏感

四、对随机数据样本聚类及分析

 

 参考文献

【1】 https://www.cnblogs.com/pinard/p/6164214.html

【2】 sklearn.cluster.kmeans_plusplus — scikit-learn 1.2.2 documentation

http://www.jmfq.cn/news/4789855.html

相关文章:

  • 网站建设的主要工作流程/企业内训课程
  • 政务信息网站建设工作方案/网络广告推广
  • 老网站怎么优化/百度搜索广告投放
  • 北京企业官网网站建设哪家好/网络工程师培训班要多少钱
  • 有没有专门做字体排版设的网站/苏州百度推广代理商
  • 做网站需要的知识/网站快速排名公司
  • 上海 网站设计/整站快速排名优化
  • 常见的网站开发语言/加强服务保障 满足群众急需需求
  • 深圳专业网站建设/网络营销的内容主要有哪些
  • 南通外贸网站制作/免费b站推广网站下载
  • 手机网站 收录/线上营销有哪些
  • 领卷网站怎么做/网络营销课程总结1500字
  • 网站被入侵后需做的检测 1/成都网站seo报价
  • 青岛做门户网站公司/企业网站推广方法
  • wordpress添加菜单/seo关键词排名优化是什么
  • 宾川网站建设/郑州模板网站建设
  • 创建个人网站有什么好处/seo链接优化
  • 浙江网站备案查询/百度搜索排名服务
  • 网站建设需要哪些资料/如何做一个自己的网站
  • ckeditor for wordpress 设置/百度网站怎么优化排名
  • 靠谱建网站公司/淘宝seo什么意思
  • 河南中国建设厅官方网站/信息流广告投放渠道
  • 做网站最新技术/网站设计师
  • 网站建设的多少钱/免费搭建个人网站
  • 西宁网站建设报价ew君博贴心/西安优化排名推广
  • php做动漫网站/汕头seo
  • 网站建设指导方案/宁波免费建站seo排名
  • 直播电商平台开发/搜索引擎优化包括哪些
  • 手机网站建设公/百度搜索指数和资讯指数
  • 宁至网站建设/优化营商环境条例全文