腾讯分分彩组三杀号 > 数据挖掘 >

数据挖掘入门小知识

2018-07-04 21:07

  数据挖掘(Data Mining)又称为:数据中的知识发现(KDD),也就是通过数据清理,数据集成,数据选择,数据变换,数据挖掘,模式评估,知识表示等一系列步骤,对数据进行分类,聚类,发现其中的关系或者离群点,来发现新的知识,新的价值。

  数据库系统,又称为数据库管理系统(DBMS),一种关系型数据库。有唯一的关键字标识来表示一个对象,每个对象有若干属性,又包括若干元组。

  前1,2,3点都是结构化数据,还包含非结构化数据,例如音频,超文本,地图等

  2 回归:相关性描述和预测、描述解释变量与被解释变量之间的相关性,并构造数学模型来预测被解释变量

  异常的值,有的时候需要抛弃异常值,但有时通过异常值可以发现问题,如欺诈行为

  对数据的管理,其包含的海量数据可以用来做OLTP,OLAP(这两个暂时不知道)

数据挖掘排行