电子文档信息挖掘系统的研究

分享到

【作者】蔡立军
【学位年度】2003
【学位授予单位】湖南大学
【导师姓名】张大方，郭克俊
【关键词】数据挖掘电子文档 web日志挖掘 VSM 1_DEF方法无回溯搜索算法双栈结构电子邮件监控
【摘要】随着Internet及其信息服务的爆炸性增长，继数据挖掘技术成功地用于传统的数据库领域之后，人们对网络信息挖掘特别是Web数据挖掘技术也开始研究。本文首先介绍了数据挖掘的定义、功能、模型和算法；研究了数据挖掘的背景、技术演变过程和现状。接着描述了数据挖掘系统的原型框架，并着重对最常用的三种Web数据挖掘技术进行了分析：Web日志挖掘采用的模型有较大的缺陷：精度较低、模型代价太大、效率不高，不适合电子文档的数据挖掘；向量空间模型VSM法和基于示例学习的文档过...
更多 >>
【文献类型】学位论文