在信息时代,快速、准确的找到目标数据是非常重要的,信息检索因此在各个领域得到广泛的应用。
在互联网生活中,搜索引擎正如火如荼的生长,他已成为人们在互联网生活当中必不可或缺的一种工具。但是这个工具看似简单,其实包括很多高深的技术。我正有打算了解搜索引擎领域的相关内容,然而面对这座“巨大的冰山”必须先了解他的整体结构。在《信息检索系统导论》一书中,似乎为我们绘制一套了解“信息检索”的“攻略图”,我对其进行自我个性化调整后权当自己的学习路线。
信息检索系统——学习线路
1.信息检索模型
﹂布尔模型
﹂向量空间模型
﹂概率模型
﹂扩展布尔模型
﹂统计语言模型
﹂隐性语义索引模型
﹂基于本体论的模型
2.信息检索系统的评价
﹂性能评价指标
﹂信息检索评价方法
3.文本操作技术
﹂英文分词技术
﹂中文分词技术
4.文本索引和搜索
﹂倒排文件
﹂词汇表的存储
﹂后缀数组
﹂签名文件
﹂文本搜索技术
5.查询处理技术
﹂查询构造方法
﹂相关反馈与查询重构
﹂自动查询扩展技术
﹂交互式查询扩展
6.web检索技术
﹂web检索的工作流程及系统结构
﹂web数据采集
﹂网页预处理
﹂相关性排序
7.分布式信息检索
﹂分布式信息检索系统体系结构
﹂文档集合的划分
﹂文档集合的选择
﹂检索结果合并
8.文本分类和聚类
﹂文本分类
﹂文本聚类
9.信息过滤技术
﹂信息过滤的概念及主要研究的内容
﹂信息过滤系统的结构及评价
﹂基于内容的信息过滤
﹂协作过滤
10.问答系统
﹂自然语言的数据库问答系统
﹂对话式问答系统
﹂基于常问问题的问答系统
﹂基于大规模文档的问答系统
﹂阅读理解系统
﹂基于知识的文档系统
————————————————————————————————
1.与信息检索相关的学科
自然语言处理
分布式计算
数据库
数据挖掘
情报学
社会学
2.信息检索需要解决的问题
处理海量数据量
评价检索
处理多源数据
3.信息检索中基础研究课题
信息检索理论与形式模型
信息检索系统的体系结构
内容表示
信息检索评价方法和评测数据
文本挖掘
4.信息检索中的关键技术
信息抽取
文本分类和聚类
自动文摘
链接分析
分布式信息检索
web信息检索
5.信息检索中的应用研究
话题检测和跟踪
信息过滤
垃圾邮件过滤
对抗式信息检索
企业搜索
数字图书馆
跨语言检索
基于内容的多媒体检索
基因信息检索
分享到:
相关推荐
一个用C++写的图像检索系统,内含图片数据集,运行程序有可视化界面,可以自己选择要检索的图片,然后有检索的图片快速闪场,功能也多
分布式检索技术——java实现 用java实现分布式资源检索的参考资料
毕业设计的系统项目源码,可用于毕业设计、课程设计、参考学习等
构建web服务,对校友目录进行修改、插入、检索、删除、统计等功能。 附有实验教程.md,记录了一些bug的解决方式,初学者可根据教程进行部署和调试
基于Java的全文索引检索引擎——Lucene,关于这个分词的自己还是很不懂,希望大家有好地资源一起分享一下
信息检索系统的相关知识 信息检索系统 统
大学—医学信息检索——考试题库与答案.pdf
描述纳米技术在生物医学领域的应用的文献检索报告
图像检索——纹理特征 基于共生矩阵纹理特征提取,d=1,θ=0°,45°,90°,135°共四个矩阵 所用图像灰度级均为256 参考《基于颜色空间和纹理特征的图像检索》
PHP实例开发源码——PHP+excel 通用图书信息模糊检索系统 PC网页版.zip
基于web of science的高级检索功能优化外文文献检索流程——以主题“水环境模型”为例 .docx
HX-2055信息检索系统方案 目录 一 项目意义 随着互联网的快速发展,每天有数千万条信息生成,包括文字信息、图片信息、视频信息、语音信息等,通过百度、谷歌等大型商业搜索引擎可以找到自己想要的信息,但是也存在...
信息管理系统模板系列-数据的操纵和检索——综合数据库管理系统.doc
本系统以知识图谱技术为基础,实现一个学术信息检索系统,主要实现学术信息定期爬取、学术信息更新、学术关联检索、知识化可视化界面等功能,分为服务器端和客户端两种用户。 服务器端可以在网站后台进行管理,用户...
哈尔滨工程大学——语料库智能检索系统——后端仓库
二、系统分析 2.1 用户需求分析 依照图书馆的工作性质和职能,本系统功能应满足如下需求 用户信息、图书信息的数据库的录入 图书目录检索 用户信息录入、删除、修改及查询 图书信息的录入、删除、修改及查询 图书...
摘 要 V ABSTRACT VI 第一章 绪论 1 第二章 编程环境基础知识 2 2.1 ASP简介 2 ...5.7 信息检索模块 29 第6章 测试和维护 32 6.1测试方法 32 6.2系统维护 32 结束语 33 致谢 34 参考文献 35 附 件 36
基于内容的图像检索系统设计与实现——数据集
中国科学院大学信息检索导论(李波)期末考试试题
网络信息检索系统实现 网页内容预处理实现,主要流程是从给定文件中读取url,获取url对应网页,从网页中提取正文,分词后存储到文件中。 AnalyzerImpl:实现对网页正文和网页关键词(标题与meta标签中的keywords)...