计算一列数据方差超简单，跟着步骤一步步来，轻松搞定！

个人在阅读完这一章后，对数据挖掘的落地应用有了更深入的了解。我们选择、使用、学习这些大数据的技术，应该以结果为导向，清晰地选择技术、使用技术，并了解它们在实际场景中的应用。

关于Hadoop基础，大数据的特点如数据量大、数据类型复杂、数据处理速度快、数据真实性高等，已经被广泛认知。Hadoop已经成为了处理大数据的事实标准，其生态系统包括了许多工具，如Hive、HBase、Pig等，这些工具各自承担了不同的功能，共同构成了大数据处理的整体解决方案。

Hive是一个数据仓库系统，用于Hadoop上的大数据处理，它提供了类似SQL的查询语言，可以方便地进行数据汇总、特定查询以及分析。HBase是一个分布式数据库，支持随机、实时的读写访问。Pig是一种编程语言，简化了Hadoop常见的工作任务。其他工具如Sqoop、Flume、Zookeeper、HDFS等，都在Hadoop生态系统中扮演着重要的角色。

关于数据挖掘建模平台，这一章介绍了大数据平台的架构，以及数据挖掘建模的过程。在大数据时代，数据的价值显得尤为重要，而如何从海量的数据中提取有价值的信息，就需要依赖数据挖掘技术。数据挖掘建模平台就是为此而生，它提供了从数据探索、数据预处理到建模的全过程工具，使得数据挖掘变得更加容易。

这一章详细介绍了大数据的相关技术，以及数据挖掘建模的过程，让人对大数据有了更深入的了解。对于想要进入大数据领域的人来说，这是一份非常有价值的资料。通过这一章的学习，也可以了解到大数据技术的不断发展和进步，为未来的工作和学习指明了方向。