数据挖掘
开放分类:BI
  数据挖掘(DM):Data Mining,又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),数据挖掘(DM)指从数据库的大量数据中提取隐含的、先前未知的并有潜在价值的信息和知识的过程蠲。目的是从大量数据中挖掘对决策有价值的知识和规则。这些规则蕴含了数据库中一组对象之间的特定关系,可揭示出一些有用的信息,为管理层提供决策支持。数据挖掘系统结构包括用户界面、数据准备、挖掘、模式的解释和评价四个模块。
  从使用的技术角度。主要的数据挖掘方法有:
  1)决策树:利用树形结构来表示决策集合,这些决策集合通过对数据集的分类产生规则,国际上最有影响和最早的决策树方法是ID3。
  2)神经网络:从结构上模拟生物神经网络。以模型和学习规则为基础,建立神经网络模型,包括前馈式、反馈式和自组织网络。通过建立非线性预测模型.完成分类、聚类和特征挖掘等多种数据挖掘任务。
  3)遗传算法:模拟生物进化过程,由繁殖(选择)、交叉(重组)、变异(突变)三个基本算子组成。为了应用遗传算法,需要将数据挖掘任务表达为一种搜索问题,从而发挥遗传算法的优化搜索能力。
  4)粗糙集(Rough Set):Rough集理论由波兰数学家Pawlak提出的一种处理模糊和不精确性问题的新型数学工具,特别适合于数据简化、数据相关性、数据的相似或差别、数据模式和数据的近似分类等的发现。在数据挖掘和知识发现研究领域中已有所应用。


本词条对我有帮助0
参考资料:
贡献者(共 1 名):
爬树的小熊猫(1)
如果您认为本词条还需进一步完善,e-works辞海欢迎您也来参与编辑词条 在开始编辑前,您还可以先学习如何编辑词条

词条统计

浏览次数:
编辑次数:1
最近更新:2008/12/8 16:54:14
创建者:爬树的小熊猫