模式识别(10)非监督学习方法

VIP免费
2025-01-13 0 0 2.38MB 63 页 5.9玖币
侵权投诉
模式识别
第九章非监督学习方法
北京航空航天大学计算机学院
监督学习(supervised learning):用已知类
别的样本训练分类器,以求对训练集数据达
到某种最优,并能推广到对新数据的分类
非监督学习(unsupervised learning):样本
数据类别未知,需要根据样本间的相似性对
样本集进行分类(聚类,clustering
引言
监督学习方法必须要有训练集与测试样本。在训
练集中找规律,而对测试样本使用这种规律;而
非监督学习只有一组数据,在该组数据集内寻找
规律。
监督学习方法的目的是识别事物,给待识别数据
加上标注(label),因此训练样本集必须由带
标注的样本组成。而非监督学习方法只有要分析
的数据集本身,没有标注。如果发现数据集呈现
某种聚集性,则可按自然的聚集性分类,但不以
与某种预先的分类标注对上号为目的。
监督与非监督学习方法比
基于概率密度函数估计的直接方法:设法找
到各类别在特征空间的分布参数再进行分类,
如直方图方法。
基于样本间相似性度量的间接聚类方法:设
法定出不同类别的核心或初始类核,然后依
据样本与这些核心之间的相似性度量将样本
聚集成不同类别。
主要的非监督学习方法
划分整个空间为N个区域,使得每个区域的概率
密度函数是单峰的
例:玉米与杂草
基于概率密度函数估计的直接方法
基于概率密度函数估计的直接方法
多维分布
基于相似性度量的间接聚类方法
根据样本间的相似性,使某种准则函数最大(小)
C均值方法(K均值方法),使下述准则最小:
 = =1
∈
单峰子集的分离方法
思想:把特征空间分为若干个区域,在每个
区域上混合概率密度函数是单峰的,每个单
峰区域对应一个类别。
一维空间中的单峰分离: 对样本集KN={xi}应用
直方图/Parzen窗方法估计概率密度函数,找
到概率密度函数的峰以及峰之间的谷底,
谷底为阈值对数据进行分割。
 =argmin
=,…, ()
一维空间中的单峰子集分
灰度图像二值化算法示
摘要:

模式识别第九章非监督学习方法北京航空航天大学计算机学院监督学习(supervisedlearning):用已知类别的样本训练分类器,以求对训练集数据达到某种最优,并能推广到对新数据的分类非监督学习(unsupervisedlearning):样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)引言监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对测试样本使用这种规律;而非监督学习只有一组数据,在该组数据集内寻找规律。监督学习方法的目的是识别事物,给待识别数据加上标注(label),因此训练样本集必须由带标注的样本组成。而非监督学习方法只有要分...

展开>> 收起<<
模式识别(10)非监督学习方法.pdf

共63页,预览13页

还剩页未读, 继续阅读

声明:本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。玖贝云文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知玖贝云文库,我们立即给予删除!
分类:计算机 价格:5.9玖币 属性:63 页 大小:2.38MB 格式:PDF 时间:2025-01-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 63
客服
关注