大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
开源大数据生态圈
1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
2. Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户。
一体机数据库/数据仓库
IBM PureData(Netezza), OracleExadata, SAP Hana等。
数据仓库
Teradata AsterData, EMC GreenPlum, HP Vertica等。
数据集市
Style Intelligence, QlikView, Tableau等。