数据挖掘,又译为资料探勘、数据采矿,它是数据库知识发现中的一个步骤。
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。
模式是“pattern”一词的翻译,也就是数据中蕴含的规律,或规律性的东西。
举个例子,从学生成绩表中发现“女生的成绩普遍都比男生好”,这就是成绩表中蕴含的一个模式,更专业的解释,可以参见《模式识别》等课程中对模式的定义。
作用:
1.存放16位地址,作为片外RAM寻址用的地址寄存器,故称数据指针;
2.也可以将外部RAM中地址的内容传送到内部RAM的地址所指向的内容中。
数据指针:是某些单片机中一个功能比较特殊的寄存器,是一个16位的特殊功能寄存器, 其高位字节寄存器用DPH表示,低位字节寄存器用DPL表示,数据指针既可以作为一个16位的寄存器来处理,也可以作为两个独立的8位寄存器来使用。
1.分类:与预测不同,因为前者的作用是构造一系列能描述和区分数据类型或概念的模型,而后者是建立一个模型去预测缺失的或无效并且通常是数字的数据值;
2.分类和预测的相似性:都是预测的工具,分类被用作预测目标数据的类的标签,而预测典型的应用是预测缺失的数字型数据的值;
3.聚类:数据对象不考虑已知的类标号,对象根据最大花蕾内部的相似性及最小化类之间的相似性的原则进行聚类或分组,形成的每一簇可以被看作一个对象类;
4.聚类也便于分类法组织形式,将观测组织成类分层结构,把类似的事件组织在一起;
5.数据演变分析描述和模型化随时间变化的对象的规律或趋势,尽管这可能包括时间相关数据的特征化、区分、关联和相关分析、分类、或预测,这种分析的明确特征包括时间序列数据分析、序列或周期模式匹配、和基于相似性的数据分析。