研机器学习11-数据降维-陈佳鑫

VIP免费
2025-01-13 1 0 3.03MB 81 页 5.9玖币
侵权投诉
机器学习
Machine Learning
北京航空航天大学计算机学院
School of Computer Science and Engineering, Beihang University
黄 迪 刘庆杰 陈佳鑫
2024年秋季学期
Fall 2024
部分内容来源于C. BishopA. NG等人的课程以及互联网资源
降维
Dimension Reduction
机器学习算法
Classification or
Categorization Clustering
Regression Dimensionality
Reduction
机器学习主要问题
什么是降维?
降维的基本定义
为什么要降维?
降维的典型应用
代表性降维方法
降维的基本定义
维数 (又称维度)
数学中:独立参数的数目
物理中:独立时空坐标的数目
点是0
直线是1
平面是2
体是3
在点上定位一个点,不需要参数
在直线上定位一个点,需要1个参数
在平面上定位一个点,需要2个参数
在体上定位一个点,需要3个参数
降维的基本定义
维数
水平/垂直的平移变化
旋转变化
尺度变化
形状变化(不同人的写作习惯)
光照变化
6464像素数字放入100100像素白板
隐变量
(Latent Variables)
降维的基本定义
问题
称为“维数灾难
降维 (Dimensionality Reduction)
将高维数据转换为低维数据的技术同时尽量保留原始数据
的重要信息
观测收集的数据样本虽然
是高维的,但与学习任务
密切相关的也许仅是某个
低维分布,即高维空间中
的一个低维嵌入
三维空间中观察到的样本点 二维空间中的曲面
为什么要降维?
为什么要降维?
原始空间,包冗余和噪,会实际
应用中引入误差,影响准确率
降维可以提取数据内部的本质结构减少冗余信息和噪声信
息造成的误差,提高算法效率
一个简单的例子
沿x轴拉小球
高维观测存在冗余信息
降维的典型应用
高维特征可视化分析
人类无法直观理解高维度特征嵌入,通过降维算法将高维特
征投影至二维空间可视化分析,观察到相似内容的图像、文
本在低维可视化空间中具备更相近的空间位置,便于高维特
征的直观理解与科学分析。
降维的典型应用
金融数据分析
从大量的金融数据中,降维算法可以识别和提取出主要的、
潜在的驱动因子,这些因子能够解释资产价格变动的大部
分原因。通过该分析方法,投资者可以更准确地理解市场
动态,预测未来趋势,以及优化投资策略。
摘要:

机器学习MachineLearning北京航空航天大学计算机学院SchoolofComputerScienceandEngineering,BeihangUniversity黄迪刘庆杰陈佳鑫2024年秋季学期Fall2024部分内容来源于C.Bishop和A.NG等人的课程以及互联网资源降维DimensionReduction机器学习算法ClassificationorCategorizationClusteringRegressionDimensionalityReduction机器学习主要问题什么是降维?•降维的基本定义•为什么要降维?•降维的典型应用•代表性降维方法降维的基本定义⚫维数(...

展开>> 收起<<
研机器学习11-数据降维-陈佳鑫.pdf

共81页,预览17页

还剩页未读, 继续阅读

声明:本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。玖贝云文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知玖贝云文库,我们立即给予删除!
分类:计算机 价格:5.9玖币 属性:81 页 大小:3.03MB 格式:PDF 时间:2025-01-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 81
客服
关注