K-Means 聚类的目标函数：簇内误差平方和-育师

1. 什么是 K-Means？

K-Means 是一种无监督、迭代式的聚类算法：
给定数据集{x₁, x₂, …, xₙ}与预设簇数K，算法把样本划分为K个不相交的簇C₁, C₂, …, Cₖ，使得同一簇内样本尽可能相似，不同簇间样本尽可能远离。

核心思想：
> “让簇内‘抱团’，让簇间‘疏远’。”

2. 目标函数 J：簇内误差平方和（WCSS）

K-Means 用几何距离衡量相似性，目标函数J定义为：
J=∑k=1K∑x∈Ck∥x−μk∥2 J = \sum_{k=1}^{K} \sum_{x \in C_k} \|x - \mu_k\|^2J=k=1∑Kx∈Ck∑∥x−μk∥2

μₖ：第k个簇的质心（centroid）
‖x − μₖ‖²：样本到所属质心的欧氏距离平方
J的物理意义：Within-Cluster Sum of Squares (WCSS)，即“簇内误差平方和”

>算法目标：找到使J最小的簇划分{C₁,…,Cₖ}与质心{μ₁,…,μₖ}。

3. 迭代两步：坐标下降求 J

K-Means 采用坐标下降策略，交替更新两个变量：

步骤	固定量	优化量	公式
E步(Assignment)	质心`μₖ`	样本归属`Cₖ`	`Cₖ = {x : ‖x − μₖ‖² ≤ ‖x − μⱼ‖², ∀j}`
M步(Update)	簇`Cₖ`	质心`μₖ`	`μₖ = (1/Cₖ) ∑_{x∈Cₖ} x`

示例：

defkmeans(X,K,max_iter=100):n,d=X.shape mu=X[torch.randperm(n)[:K]]# 随机初始化 K 个质心for_inrange(max_iter):# E步：计算距离并分配样本dist=torch.cdist(X,mu)# (n, K)labels=torch.argmin(dist,dim=1)# (n,)# M步：重新计算质心forkinrange(K):mask=labels==kifmask.sum()&gt;0:mu[k]=X[mask].mean(dim=0)returnlabels,mu

【信息科学与工程学】【数据中心】【容灾备份】第三十一篇云数据中心各类CPU计算型业务跨数据中心容灾设计方案

一、云数据中心各类CPU计算型业务跨数据中心指标 1. Web应用服务设计领域设计子类特征/函数参数/指标用途说明数据中心内设计数据中心间设计网络设计数据中心内网络 1. 负载均衡网络 2. 应用层网络 3. 数据库网络 4. 缓存网络 5. 管理网络 1. 带宽：>…

李华

Home Assistant前端架构设计：现代化智能家居界面的技术实现方案

Home Assistant前端架构设计：现代化智能家居界面的技术实现方案【免费下载链接】frontend :lollipop: Frontend for Home Assistant 项目地址: https://gitcode.com/gh_mirrors/frontend149/frontend 智能家居控制界面的用户体验直接影响着日常操作效率与系…

李华

MkDocs架构深度解析：高性能文档站点生成器的技术实现

MkDocs架构深度解析：高性能文档站点生成器的技术实现【免费下载链接】mkdocs Project documentation with Markdown. 项目地址: https://gitcode.com/gh_mirrors/mk/mkdocs MkDocs作为基于Python的静态站点生成器，其核心架构围绕Markdown文档转换…

李华

Cap开源屏幕录制工具完全指南：告别Loom的终极解决方案

Cap开源屏幕录制工具完全指南：告别Loom的终极解决方案【免费下载链接】Cap Open source Loom alternative. Beautiful, shareable screen recordings. 项目地址: https://gitcode.com/GitHub_Trending/cap1/Cap 你是否厌倦了昂贵的屏幕录制软件订阅费&#…

李华

让静态插画动起来：5分钟掌握实时动作捕捉技术Pose Animator

让静态插画动起来：5分钟掌握实时动作捕捉技术Pose Animator 【免费下载链接】pose-animator 项目地址: https://gitcode.com/gh_mirrors/po/pose-animator 你是否曾想过让静态的2D插画拥有生命？想象一下，你的卡通角色能够跟随你的动作…

李华