2013模式识别练习题

VIP免费
2025-01-13 0 0 806.5KB 28 页 5.9玖币
侵权投诉
2013 模式识别练习题
. 填空题
1、模式识别系统的基本构成单元包括:模式 采集 、特征的选择和提取 模式分类
2统计模式识别中描述模式的方法一般使用 特征矢量 ;句法模式识别中模式描述方法一般有
3、影响层次聚类算法结果的主要因素有
计算模式距离的测度
、聚类准则、类间距离阈值、预定的类别数目
4、线性判别函数的正负和数值大小的几何意义是 正负表示样本点
位于判别界面法向量指向的
正负半空间中
绝对值正比于样本点与
判别界面
的距离。
5、感知器算法 1 H-K 算法 2
1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
6在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于 某一种 判别错误 较另一种 判别错误 更为重要的 情况;
最小最大判别准则主要用于 先验概率未知的 情况。
7、“特征个数越多越有利于分类”这种说法正确吗? 错误
特征选择的主要目的是
n
特征 选取最有利于分类的
m
个特征( m<n , 降低特征维数 一般在
分性判据对 特征个数 具有单调性 和( Cnm>>n )的条件下,可以使用分支定界法以减少计算量。
8 散度 Jij 越大,说明 wi类模式与 wj类模式的分布 差别越大
wi类模式与 wj类模式的分布相同时,Jij= 0
二、选择题
1、影响聚类算法结果的主要因素有(BCD )。
A.已知类别的样本质量;B.分类准则;C.特征选取;D.模式相似性测度
2、模式识别中,马式距离较之于欧式距离的优点是(CD)。
A.平移不变性;B.旋转不变性;C尺度不变性;D.考虑了模式的分布
3、影响基本 K-均值算法的主要因素有(ABD)。
A.样本输入顺序;B.模式相似性测度;C.聚类准则;D.初始类中心的选取
4、位势函数法的积累势函数 K(x)的作用相当于 Bayes 判决中的(B D)。
A. 先验概率;B. 后验概率;C. 类概率密度;D. 类概率密度与先验概率的乘积
5、在统计模式分类问题中,当先验概率未知时,可以使用(BD)。
A. 最小损失准则; B. 最小最大损失准则; C. 最小误判概率准则; D. N-P 判决
6、散度 JD是根据( C )构造的可分性判据。
A. 先验概率;B. 后验概率;C. 类概率密度;D. 信息熵;E. 几何距离
7、似然函数的概型已知且为单峰,则可用(ABCDE)估计该似然函数。
A. 矩估计;B. 最大似然估计;C. Bayes 估计;D. Bayes 学习;E. Parzen 窗法
8KN 近邻元法较之 Parzen 窗法的优点是(B)。
A. 所需样本数较少; B. 稳定性较好; C. 分辨率较高; D. 连续性较好
9、从分类的角度讲,用 DKLT 做特征提取主要利用了 DKLT 的性质:(A C )。
A.变换产生的新分量正交或不相关;B.以部分新的分量表示原矢量均方误差最小;C.使变换后的矢量能量
更集中
10、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(BC )。
A. 已知类别样本质量; B. 分类准则; C. 特征选取;D. 量纲
11、欧式距离具有( A B );马式距离具有( A B C D )。
A. 平移不变性; B. 旋转不变性; C. 尺度缩放不变性; D. 不受量纲影响的特性
12、聚类分析算法属于(A );判别域代数界面方程法属于( C
A.无监督分类; B.有监督分类; C.统计模式识别方法; D.句法模式识别方法
13、若描述模式的特征量为 0-1 二值特征量,则一般采用( D 进行相似性度量。
A. 距离测度; B. 测度; C. 相似测度; D. 匹配测度
14 函数可以作为聚类分析中的准则函数的有(ACD
A. B. C. D.
15Fisher 线性判别函数的求解过程是N维特征矢量影在( B )中进行
A.二维空间; B.一维空间; C. N-1 维空间
16、用 parzen 窗法估计类概率密度函数时,窗宽过窄导致波动过大的原因是(BC)。
A.窗函数小;B.窗函数大;C. 入的样本数少;D.入的样本数多。
17、如下聚类算法中,属于静态聚类算法的是 ( AB )
A. 最大最小距离聚类;B. 层次聚类; C. c-均值聚类。
18 一般,k-NN 最近邻方法在( B )的情况下果较好。
A.样本较多但典型性不好;B.样本较少但典型性好;C.样本呈团状分布;D.样本呈链状分布
19、影响 c均值聚类算法果的主要因素之一是初始类心的选取,相比较而言,( C c个样本作为初始类心
较好。
A. 输入顺序选 B. 选相距最的; C. 选分布密度最高的; D. 随机挑选。
20、类域界面方程法中,能线性不可分情况下分类问题近似或的方法是(BCD )。
A. 感知器算法; B. 伪逆法; C. 基于二次准则的 H-K 算法; D. 势函数法。
三、简答题
1说明 Mahalanobis 距离平方的定义到某点的 Mahalanobis 离平方为数的轨迹的几何意
义,与欧距离的别与系。
Mahalanobis 距离的平方定义为:
xu个数据, 是一个正定(一般为方差。根据定义,
点的 Mahalanobis 距离相点的超椭球,如果是单位矩Σ,则 Mahalanobis 距离
通常的欧距离。
2说明用监督学习与监督学习方法路图道路分的基本做法,以说明
种学习方法的定义与它们间的别。
监督学习方法用对数据实现分类,分类通过训练获得。该训练
分类
的数
据集成,因监督学习方法的训练过程是离线的。
监督学习方法不需要单的离线练过据集,一
对数据集进行分析,如聚类,
确定分布的主分量
道路图像的分割而,监督学习方法则先在图像路象素与非道路象集,
进行分类器计,然后用所计的分类器对道路图像进行
使督学习方法,道路道路之间的聚类分进行聚类算,
实现道路图像的分
3已知一数据的方差矩为 ,
(1) 方差矩元素的义。
(2) 该数个主分量。
(3) 主分量分析或K-L 变换,的最准则是什么
(4) 什么主分量分析后,消除分量之间的相关性。
 方差矩为 ,则
(1) 对角元素是分量的方差,对角元素是分量之间的方差。
(2) 主分量,通过求协方差矩的特征值,用 0,则
,相应地: ,对特征向量为 , ,对
个特征向量,为主分量。
(3) K-L 变换的最准则为:
  对一数据进行按
正交基分
,在只取相同数量分量的条件下,以均方误差计算截尾
差最小
(4) 主分量分后,
方差矩成为对角矩,因而各主分量间相关性消除
4说明以下问题求解是基于监督学习或是监督学习:
(1) 数据集的主分量
(2) 汉字识别
(3) 自组织特征映射
(4) CT 图像的分
(1) 数据集的主分量是监督学习方法;
(2) 汉字识别:识别字符加上类别有监督学习方法;
(3) 自组织特征映射—高维数组按保留近似度向低维映射—非监督学习;
(4) CT 图像割—数据然分布聚类—非监督学习方法;
5试列举线性分类器中最著名种最准则以及它们各自的原
线性分类器种最优准则:
Fisher 准则:根据类样本一般类密集,类间分离的特点,寻找线性分类器最的法线向量方
向,使类样本在该方向满足内尽可能密集,类间可能分
这种度量通过离散矩Sw 和类间离散矩Sb 实现
感知准则函数:准则函数以使错分类样本分界面距离之和最小为原则。
优点是通过错分类样本提的信息对分类器函数进行修,这种准则是人工神经元网
层感知器的基
支持向量机:基本思想是在类线性可分条件下,所计的分类器界面使类之间的间为最大,
的基本出发点是使期望泛化风险尽可能小。
6分析用决策规思想方法的同。
用决是:
1. 基于最小错误率的贝叶斯,利用概率中的贝叶斯公式,得出使错误率最小的分类
则。
2. 基于最风险贝叶斯入了损失函数,得出使决策风险最小的分类。当在 0-1
函数条件下,基于最小风险贝叶斯变成基于最小错误率的贝叶斯
3. 定一类错误率条件下使一类错误率最小的类别决
4. 最大最小决类先验概率未知,考先验概率变对错误率的影响,找出使最小贝叶斯奉
最大的先验概率,以这种最情况计分类器。
5. 分类方法了考虑分类造成的损失考虑特征取造成的代,先用一部分特征
分类,然后逐步加入性特征以减少分类损失,同时平衡总的损失,以求得最有效益
7 1. 什么是特征选择?
2. 什么Fisher 线性判别?
1. 特征选择从一特征中最有的特征达到降低特征空间维数的目的
2. Fisher 线性判别:可以考虑d维空间的样本线成一维空间,维数
一维,这在数学上容易办到,然使样本在 d维空间里形成若干紧凑相分得开
,如果把它们投一条意的线可能使几类样本在一起而无法识别。
是在一般情况下,可以找到某个方向,使在这个方向的线,样本的影能分开得最好。
问题是如何根据实际情况找到这条最好的、最于分类的影线,这Fisher 算法所要决的
基本问题。
8写出两类和多类情况下最小风险贝叶斯判别函数和决面方程。
类问题:判别函数
面方程:
C类问题:判别函数
面方程: , ,
9请论述模式识别系统的主要部分及其并简各组成部分中方法的主
信息通过测量、采样和量,可以用矩或向量表示二维图像波形
处理去除噪声加强有用的信息,对输入测量器或其他因素造成的退化现象进行复原。
特征选择和提取:为了效地实现分类识别要对原始数据进行变换,得到最能反映分类本
质的特征。
分类决在特征空间中用统计方法识别对象归一类
数据获取
数据获取 预处理
预处理 特征提取与选择
特征提取与选择
分类决策
分类决策
分类器设计
分类器设计
信号空间 特征空间
10述支向量的基本思想
SVM 从线性可分情况下的最优分类面发展而来
最优分类面是要分类线不将两类正确分(训练错误率为 0),且使分类间最大。
SVM 考虑寻找一个满足分类要平面,且使训练集中的点距离分类面可能的
也就寻找一个分类面使它两侧的空白区(margin)最大。
过两类样本中离分类面最近的点,且平于最优分类面的平面H1H2训练样本
向量。
四、计算题
1为 ,
m1=(2,0)T, m2=(2,2)T, fisher 准则求其面方程。
解:
写出面方程
2已知个一维模式类别的类概率密度函数为:
先验概率 P(w1)=0.6P(w2)=0.4
10-1 Bayes 判决函数;
摘要:

2013模式识别练习题一.填空题1、模式识别系统的基本构成单元包括:模式采集、特征的选择和提取和模式分类。2、统计模式识别中描述模式的方法一般使用特征矢量;句法模式识别中模式描述方法一般有串、树、网。3、影响层次聚类算法结果的主要因素有计算模式距离的测度、聚类准则、类间距离阈值、预定的类别数目。4、线性判别函数的正负和数值大小的几何意义是正负表示样本点位于判别界面法向量指向的正负半空间中,绝对值正比于样本点与判别界面的距离。5、感知器算法1,H-K算法2。(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。6、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于某一种判别错误较另一种判别...

展开>> 收起<<
2013模式识别练习题.doc

共28页,预览6页

还剩页未读, 继续阅读

声明:本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。玖贝云文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知玖贝云文库,我们立即给予删除!
分类:计算机 价格:5.9玖币 属性:28 页 大小:806.5KB 格式:DOC 时间:2025-01-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 28
客服
关注