《大数据时代》,作者:[英]维克托・迈尔-舍恩伯格,[英]肯尼思・库克耶。
《大数据预测》,作者:埃里克・西格尔。
《为数据而生:大数据创新实践》,作者:周涛。
《爆发:大数据时代预见未来的新思维》,作者:艾伯特-拉斯洛・巴拉巴西。
《金融大数据》,作者:陈云。
1.侧重点:一般认为大数据与数据挖掘是两个平行的概念。
大数据侧重描述数据,数据挖掘侧重描述应用。
大数据是基础,是数据挖掘的“燃料”。
2.内涵:大数据的内涵,是从数据量,数据类型和数据增长速度的角度描述数据。
数据挖掘是指从大量数据中挖掘出有价值的潜藏规律和知识。
3.发展方向:由于大数据的特点,它的存储,传输,计算,处理,分析等,都是传统方式难以应对的,相关的技术就要升级,新的技术栈通常基于分布式架构解决。
由此批处理,流计算,图计算,即席查询等方向都有发展。
数据挖掘渴望完整而真实的原始数据,样本平衡很重要。
实施过程涉及机器学习,模式识别,统计学,分布式存储,分布式计算,可视化等,还需要掌握领域专业知识。
大数据,是指那些数据量特别大,数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。