Weka平台设计的研究和其数据预处理功能的改进

Weka平台设计的研究和其数据预处理功能的改进

Windows编程 2013-10-18　版权投诉上传资料复制论文网址上传用户：a835303774

基予不同的模型和技术，彼瑟互鞠孤立，联系绞少；（２）缺少简明精确的问题描述方法，挖掘的语义通常是由实现方法决定的：（３）数据挖掘系统仅提供孤立的知识发现功能，娥于嵌入大型盛麓；（４）数据挖掘引擎与数据库系统是松散耦合批；（５）数据加载于内存，滩以处理大规模的数据；１．３本文工作和结构安排一个完整数据挖掘系统是怎样构建的，它有哪几部分组成，各部分之阗又是怎样豹缝合？本文镑对ｗｅｈ平螽，详缨豹分援了其絮穆帮备模块之间的关系。

    指出ｗ汰ａ数据预处壤的不足，并提出了增强和改进其数据预处理功能一些措旌。

    本文主舞工作和论文结构安排如下；３北京交通大学硕士学位沦文（１）首先主要探讨了课题背景，ｗｊｋａ的国内外发展现状，ｗ酞ａ面临的问题等。

     （２）其次在第二章的一、二节简要的介绍数据挖掘的相关基本概念。

    列举了数据挖掘和一些常用术语的关系和区别。

    分析了个数据挖掘工具的使用情况，数据挖掘工具的选择标准。

    第三节对数据预处理作了重点介绍。

    第四节介绍了ｗ酞ａ的功能，使用，ｗｅｋａ的相关扩展课题；探讨了如何在ｗｊｋａ上作二次开发，指出ｗｅｋａ在数据预处理方面的不足。

     （３）在此第四章对ｗｅｋａ设计架构进行分析，重要内核研究和解析，剖析了ｗｅｋａ的最小内核文件，每个内核文件的作用，重要函数，关键数据结构；分析了最小内核和最小分类器的关系，在ｗ哉ａ这个融合众多功能的环境中提取一个最小可用内核和分类器。

     （４）最后，第五章指出ｗ酞ａ在数据预处理功能上改进的方案，改进前后的流程对照，改进设计中的关键问题和解决方法。

    第六章做了全文的总结和展望。

     ４第２章相关理论知议第２章相关理论知识在剖析数据挖掘工具ｗ酞ａ的设计之前，先简单的介绍数据挖掘的基础知识，数据挖掘静流程，数据挖掘瀚关谜环节，容翁混淆的几个概念。

    ２．１数据挖掘下霆麸数捺挖据鹃意义、演变、避程、王｛笮囊分布耱数据挖掘工艇夯绍数据挖掘。

    ２．１．１数据挖掘的意义：ｉ琏十几年，随着科学技术飞速的发展，经济和社会都取褥了极大的进步，与此同对，在各个领域产生了大擞的数据，如人类对太空的探索，银行每天的巨额交易数据。

    显然在这些数据中蕴涵丰富的信怠，如何处理这些数据得到有蓣的信息，人们进行了肖益的探索。

    计算机技术的迅速发展使得楚遴数据成为酉筑，这赣攘动了数据库技术韵极大发震，健是蠢对不断增加如潮水般的数据，人们不再满足于数据库的查询功能，提出了深层次阚瑟；戆不麓麸数撂孛提取售患或豢知识秀决蓑ｌ受务。

    藏数攥痒技拳嚣言已经显得无能为力了，同样。

    传统的统计技术也面临了极大的挑战。

    这就急霰有耨豹方法来处理这些海量般的数据。

    予是，入稍结合统计学、数据库、机器学习等技术，提出数据挖掘来解决这一难题１１ｏｊ。

    ２．１．１数据挖掘的演变数据挖掘其实是一个逐渐演变的过程，毫子数据簸瑾的初期，入稻就试图通过某些方法来实现自动决策支持，当时机器学习成为人们关心的焦点．橇瓣学习豹过程裁燕将一些琶翔懿并已被成功瓣浚静褥题律为藏弼输入计算机，机器通过学习这些范例总结并生成相应的规则，这魑规则舆有北京交通大学硕士学位论文通用性，使用它们可以解决某一类的问题．随后，随着神经网络技术的形成和发展，人们的注意力转向知识工程，知识工程不同于机器学习那样给计算机输入范例，让它生成出规则，而是直接给计算机输入已被代码化的规则，而计算机是通过使用这些规则来解决某些问题。

    专家系统就是这种方法所得到的成果，但它有投资大、效果不甚理想等不足。

    ８０年代人们又在新的神经网络理论的指导下，重新回到机器学习的方法上，并将其成果应用于处理大型商业数据库。

    随着在８０年代末一个新的术语，它就是数据库中的知识发现，简称ＫＤＤ（Ｋｎｏｗｌｅｄｇｅｄｉｓｃｏｖｅｒｙｉｎｄａｔａｂａｓｅ）．它泛指所有从源数据中发掘模式或联系的方法，人们接受了这个术语，并用ＫＤＤ来描述整个数据发掘的过程，包括最开始的制定业务目标到最终的结果分析，而用数据挖掘ＤＭ（ｄａｔａｍｉｎｉｎｇ）来描述使用挖掘

首页上一页 1 2 345 6 下一页尾页
版权说明

【设为主页】【加入收藏】【打印本文】【回到顶部】【关闭此页】
- 相关文章
  
  ·2013年安徽省职业院校技能大赛中职组服
  ·培养高职学生创新能力的实践探索北京财贸职
  ·职业院校空乘专业学生英语词汇学习策略研究
  ·新建高等职业院校师资队伍建设的研究
  ·关于高等职业院校组织结构设计辨析【精品论
  ·基于需要理论的高职教师有效激励研究——以
  ·附件2：呼和浩特职业学院毕业论文（设计）
  ·附件3：呼和浩特职业学院毕业论文（设计）
  ·''国家示范性高等职业院校建设计划''骨
- 最新文件
  
  ·[初二作文]海西
  ·关于构建基于人本理念的高校教学管理制度探
  ·探析高职院校大学语文教学改革
  ·人工智能发展综述
  ·优秀组织奖
  ·2014国考申论备考申论真题解析助力备
  ·内控设计论文绩效管理论文
  ·图书馆流通服务工作中的矛盾与对策
  ·大学生励志:一位清华学子英语学习心得体会
特别推荐

免费论文,原创论文,参考论文,论文源代码-网学

Weka平台设计的研究和其数据预处理功能的改进