免费论文
收费论文
发表论文
我要投稿
设为首页 招标网
联系我们
经济学|管理学|法学|计算机|医学|教育|文学|政治|艺术|哲学|更多 经济学|管理学|法律|计算机|医学|教育|文学|政治|艺术|哲学|更多
 论文搜索
  推荐服务: 论文发表 收费论文
期刊论文格式
毕业论文格式
期刊论文范文
毕业论文范文
论文致谢
毕业论文答辩
开题报告
论文选题
英文摘要书写
浅析基于数据挖掘的数字档案信息管理研究
作者:许惠玮  时间:2012/12/13 9:53:00  来源:论文天下论文网

  论文关键词:数字化 图书管理 档案

  论文摘要:随着社会主义现代化的发展,计算机技术的进步,信息技术在社会发展的各个领域都扮演着极其重要的角色。信息化建设更是被我国列为经济社会发展的首要内容。网页档案化管理包括文档、文字翻译转换、图片资料、声像资料、多媒体远程会议等。尤其是大学档案馆更侧重教学与科研,网页档案化管理是必然的趋势。

  在信息化发展的今天,图书馆,特别是大学图书馆不仅要对信息进行简单的数字转换和管理,更要对新兴事物网络进行档案化管理和归档,包括文档、文字翻译转换、图片资料、声像资料、多媒体远程会议等。所以网络档案化管理,成为当今图书管理的必然趋势,这就必须对档案化管理的技术和法律相关问题进行深入阐述和探讨。
  所谓数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是涉及数据库、人工智能、数理统计、机械学、人工神经网络、可视化、并行计算等的交叉学科,是目前国际上数据库和决策支持领域的最前沿的研究方向之一。
  一、数据挖掘的功能
  数据挖掘通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,按其功能可分为以下几类。
  1、关联分析
  关联分析能寻找到数据库中大量数据的相关联系,常用的一种技术为关联规则和序列模式。关联规则是发现一个事物与其他事物间的相互关联性或相互依赖性。
  2、聚类
  输入的数据并无任何类型标记,聚类就是按一定的规则将数据划分为合理的集合,即将对象分组为多个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而在不同簇中的对象差别很大。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。
  3、自动预测趋势和行为
  数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。
  4、概念描述
  对于数据库中庞杂的数据,人们期望以简洁的描述形式来描述汇集的数据集。概念描述就是对某类对象的内涵进行描述并概括出这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。
  5、偏差检测
  数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。这常用于金融银行业中检测欺诈行为,或市场分析中分析特殊消费者的消费习惯。
  二、数据挖掘在建设现代化高校档案馆中的应用
  1、资源类数据包括馆藏档案经过数字化加工而产生的各类电子档案、电子文件中心中存储的各类电子档案、档案软件收集的信息、档案信息网建设和维护信息。我们从研究大学档案用户的信息需求出发,数据挖掘为大学档案馆全面掌握和准确理解档案用户的信息需求提供了方法。
  (1) 利用Web访问信息挖掘技术发现其中的关联模式、序列模式和Web访问趋势等,构建多维视图的用户兴趣模型。从而可以确定档案信息或服务受欢迎的程度,发现用户访问模式和用户需求的趋势,从不同侧面来研究用户的信息需求,为优化档案馆的档案信息资源建设提供了科学依据。
  (2) 收集大学档案网web服务器保留的用户注册信息、访问记录,以及有关用户与系统交互的信息等原始数据,经过清洗、浓缩和转换形成便于统计分析的用户查阅数据库、日志数据库、用户定制信息库、用户反馈信息等各种数据集合。

[1] [2]  下一页

 3000万硕士、博士、期刊论文全文下载  论文发表:快速、低价、优质
提供60万硕士论文、10万博士论文、2700万期刊论文全文下载服务,助您一臂之力! 十年的论文发表经验,快捷的论文发表服务,保证所发表的杂志均为正规合法的期刊,收费同行最低!
[本文关键字] 数字化 图书管理
[版权说明]《浅析基于数据挖掘的数字档案信息管理研究》论文版权属于作者本人,您可以参考本论文进行论文创作,但不得抄袭、复制!本站免费论文主要来源于用户投稿(投稿网址),如果涉及到侵权问题,请联系lunwentianxia_card@163.com删除。
  数字化论文   图书管理论文
·论数字化作品的知识产权问题
·中国电影的数字化生存
·数字化校园的规划设计
·浅谈利用MAPGIS进行数字化地形图图斑面积的量算
·开展档案数字化建设的实践与思考
·浅谈数字图书馆
·浅谈新世纪医学专业图书管理人员的素质
·浅析基于MVC三层体系结构的图书管理网站的设计与实
  推荐期刊投稿
·神剑
·国外电子元器件
·中国生物制品学杂志
·学前教育
·财会通讯(理财版)
·生物学杂志
·中华肝胆外科杂志
·行政与法
·国外医学.老年医学分册
·神经疾病与精神卫生
 
·中华肝脏病杂志
·情报探索
·华南理工大学学报(自然科学版)
·理论学习
·湖南师范大学教育科学学报
·云南电业
·中国注册会计师
·山东电力高等专科学校学报
·中国医院统计
·陕西气象
 
·民间传奇故事(A卷)
·佛学研究
·科技资讯
·文教资料(高中版)
·China Nonferrous Met
·中国出版
·会计师
·国际免疫学杂志
·河北教育(综合版)
·当代小书画家
   免费论文
公共管理 | 法学 | 理学 | 医药学
政治 | 社会学 | 文学 | 艺术 | 哲学
工学 | 计算机 | 文化 | 英语论文
经济学 | 财政 税收 | 证券金融
管理学 | 会计审计 | 工商管理 | 教育
财务管理 | 论文写作指导 | 应用文
   收费论文
马列毛邓 | 哲学宗教 | 社会科学
政治法律 | 军 事 | 经 济
文化科学教育体育 | 语言文字
文学 | 艺术 | 历史地理 | 自然科学
数理化 | 天文 | 生物科学 | 医药卫生
农业科学 | 工业技术 | 交通运输
航空航天 | 环境安全
   浏览历史

联系论文网 | 收费论文 | 发表论文 | 论文翻译 | 友情链接 | 全部分类 | 网站地图 | 期刊导航
版权所有 2008-2018 论文天下 www.lunwentianxia.com 京ICP备08104503号
.2363281