信息检索系统课件第3讲-信息检索模型

VIP免费
2025-01-13 0 0 1.5MB 91 页 5.9玖币
侵权投诉
《信息检索原理》课程
信息检索模型
2
《信息检索原理》课程
Beihang
提纲
模型定义与分
布尔模型
向量空间模型
概率模型
统计语言模型
3
《信息检索原理》课程
Beihang
什么是模型?
模型是采用数学工具,对现实世界某种事物或某
种运动的抽象描述
针对相同的输入,模型的输出应能够无限地逼近
现实世界的输出
举例:天气的预测模型
4
《信息检索原理》课程
Beihang
信息检索模型
信息检索模型是一个四元组[D, Q, F, R(qi, dj)]
D: 文档集
Q: 用户的查询需求
F: 文档表示、查询表示及其之间的关系的模型框架
R(qi, dj): 排序函数,给query qidocument dj评分
信息检索模型取决于:
从什么样的视角去看待查询式和文档
基于什么样的理论去看待查询式和文档的关系
如何计算查询式和文档之间的相似度
5
《信息检索原理》课程
Beihang
模型分类
信息检索模型
布尔
向量空间
概率
知识
模糊集
扩展的布尔模型
集合论
代数
扩展的向量空间
隐性语义索引
神经网络
语言模型
推理网络
信念网络
概率
基于本体论的模型
人工智能
6
《信息检索原理》课程
Beihang
提纲
模型定义与分
布尔模型
向量空间模型
概率模型
统计语言模型
7
《信息检索原理》课程
Beihang
布尔模型(Boolean Model)
8
《信息检索原理》课程
Beihang
布尔模型描述
文档D表示
一个文档被表示为关键词的集合
查询式Q表示
查询式(Queries)被表示为关键词的布尔组合,用“与、
或、非”连接起来,并用括弧指示优先次序
匹配F
一个文档当且仅当它能够满足布尔查询式时,才将其
检索出来
检索策略基于二值判定标准
算法R
根据匹配框架F判定相关
9
《信息检索原理》课程
Beihang
查询表示
在布尔模型中, 所有索引项的权值变量和
文档dj与查询q的相关度都是二值的
查询q被表述成一个常规的布尔表达式,为
方便计算查询q和文档d的相关度,一般将
查询q的布尔表达式转换成析取范式qDNF
析取范式由一系列 “或”(OR)操作
连接的子表达式,而这些子表达式则是由
“与”(AND)操作连接
10
《信息检索原理》课程
Beihang
示例
文档集包含两个文档
文档1a b c f g h
文档2a f b x y z
用户查询:文档中出a或者b,但一定要出现z
将查询表示为布尔表达式 ,并转换成析
取范式
q=(a ^ b ^ z) v (a ^ b ^ z) v (a ^ b ^ z)
文档1和文档2的三元组对应值分别为(1,1,0)(1,1,1)
经过匹配 ,将文档2返回
()q a b z=  
(1,0,1) (0,1,1) (1,1,1)
DNF
q=  
摘要:

《信息检索原理》课程信息检索模型2《信息检索原理》课程Beihang提纲•模型定义与分类•布尔模型•向量空间模型•概率模型•统计语言模型3《信息检索原理》课程Beihang什么是模型?•模型是采用数学工具,对现实世界某种事物或某种运动的抽象描述•针对相同的输入,模型的输出应能够无限地逼近现实世界的输出–举例:天气的预测模型4《信息检索原理》课程Beihang信息检索模型•信息检索模型是一个四元组[D,Q,F,R(qi,dj)]–D:文档集–Q:用户的查询需求–F:文档表示、查询表示及其之间的关系的模型框架–R(qi,dj):排序函数,给queryqi和documentdj评分•信息检索模型取决...

展开>> 收起<<
信息检索系统课件第3讲-信息检索模型.pdf

共91页,预览19页

还剩页未读, 继续阅读

声明:本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。玖贝云文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知玖贝云文库,我们立即给予删除!
分类:计算机 价格:5.9玖币 属性:91 页 大小:1.5MB 格式:PDF 时间:2025-01-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 91
客服
关注