异常检验则主要是识别不同于其他数据的具有显著特征值的数据 。
6. 数据挖掘具体要做什么 最低0.27元开通文库会员,查看完整内容> 原发布者:谷子 数据挖掘的基本流程数据挖掘有很多不同的实施方法,如果只是把数据拉到Excel表格中计算一下,那只是数据分析,不是数据挖掘 。
本节主要讲解数据挖掘的基本规范流程 。CRISP-DM和SEMMA是两种常用的数据挖掘流程 。
2.5.1 数据挖掘的一般步骤从数据本身来考虑,数据挖掘通常需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模e69da5e887aa3231313335323631343130323136353331333433623762式评估和知识表示8个步骤 。步骤(1)信息收集:根据确定的数据分析对象,抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库 。
对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的 。步骤(2)数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享 。
步骤(3)数据规约:如果执行多数的数据挖掘算法,即使是在少量数据上也需要很长的时间,而做商业运营数据挖掘时数据量往往非常大 。数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同 。
步骤(4)数据清理:在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值)、含噪声的(包含错误的属性值),并且是不一致的(同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中 。不然,挖掘的结果会差强人意 。
步骤(5)数据变换:通过平 。
7. 数据仓库与数据挖掘 书 韩家炜的数据挖掘概念与技术,还有本数据挖掘原理 。优点是大家都说好,缺点是写的泛了点,看了还是很多不懂 。
如果你是CS出身的话,推荐一本Data mining introductory and advanced topics
还有你搜WEKA,一个有名的开源DM软件,有本教科书~
另外有本紫色封面的从统计方面讲的书也不错~
剩下的就大多是国产书了,一般的特点是从实用的角度去写,一上来直入主题开始分析XX算法~ 估计其中也有些好书~
【数据挖掘怎么写】
文章插图
- 轩的笔画顺序怎么写的
- 九里香盆景怎么养
- stop音标怎么写
- 一年级的书法怎么写
- 金银花怎么养,5步教你养好金银花
- 重要书怎么写
- 含羞草怎么养殖,老农总结最实用五个养殖要点
- 团员档案袋怎么写
- 新的篆字怎么写
- 学生序言怎么写