2024秋季-机器学习-第七章-聚类

VIP免费
2025-01-13 0 0 3.45MB 62 页 5.9玖币
侵权投诉
机器学习
非监督学习方法
北京航空航天大学 人工智能学院
School of Artificial IntelligenceBeihang University
2024年秋季学期
Autumn 2024
1
引言
Classification or
Categorization Clustering
Regression Dimensionality
Reduction
机器学习主要问题
2
8.1 什么是聚类?
聚类的定义
聚类的应用
3
什么是聚类?
聚类的定义
一种无监督学习任务
按照某个特定标准 (距离) ,将数据集中的无标注本划分为若干个不相交的子集,每个子
集称为一个“簇” (Cluster)
希望簇内样本的相似性尽可能大,簇间样本的差异性尽可能大。
数据集 
聚类
和簇
无标注样本
的样本

4
什么是聚类?
有标签数据集
汽车 汽车
汽车
自行车 自行车
自行车
训练
当数据集无标签时,如何划分类别?
分类(监督学习
分类器
测试样本 c.......
.......
汽车 自行车 自行车汽车
类别标签 c
分类器
5
什么是聚类?
无标签数据集
聚类 (汽车)测试样本
聚类(无监督学习)
(汽车)
(自行车)(自行车)
6
什么是聚类?
无标签数据集
聚类 (汽车)划分错误
聚类(无监督学习)
(汽车)
(自行车)(自行车)
聚类通常比分类的准确性低
但是聚类更加灵活,具有处理无标签据的能力;可以用于无标签数据处理中,辅助分析决策
7
聚类的形式化描述
假定样本集  包含无标记样本,每个样本
是一个维的特征向量,聚类算法将样本集划分成
不相交的簇   。其中  ,且 

 表示样本的“簇标记”(Cluster Label),即
 。于是,聚类的结果可用包含元素的簇标记向量 
表示。
8
聚类的应用
遥感图像分割
遥感图像分割是将遥感图像中的像素划分为具有相似特征的区域的过程。
统的图像分割通常基于聚类的思想实现。
应用于资源管理、环境监测、灾害评估、土地利用规划等。
水体
草地
建筑
道路
植被
农田
房屋
树木
建筑
道路
13
聚类的应用
遥感图像分割 聚类中心增多
将每个像素点视为一个无标注样本,进行聚类。每个样本(像素点)是维度为3
颜色向量。
除了利用颜色信息,也可以使用经过神经网络提取的特征向量作为样本,充分利
用语义信息进行聚类。 14
摘要:

机器学习非监督学习方法北京航空航天大学人工智能学院SchoolofArtificialIntelligence,BeihangUniversity2024年秋季学期Autumn20241引言ClassificationorCategorizationClusteringRegressionDimensionalityReduction机器学习主要问题28.1什么是聚类?•聚类的定义•聚类的应用3什么是聚类?⚫聚类的定义➢一种无监督学习任务◼按照某个特定标准(如距离),将数据集中的无标注样本划分为若干个不相交的子集,每个子集称为一个“簇”(Cluster)。◼希望簇内样本的相似性尽可能大,簇间样...

展开>> 收起<<
2024秋季-机器学习-第七章-聚类.pdf

共62页,预览13页

还剩页未读, 继续阅读

声明:本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。玖贝云文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知玖贝云文库,我们立即给予删除!
分类:计算机 价格:5.9玖币 属性:62 页 大小:3.45MB 格式:PDF 时间:2025-01-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 62
客服
关注