大数据的特点有哪些

发布人:红松小e 发布时间:2020-11-27 11:48:12

之前我们介绍了大数据是什么,已经基本了解大数据,但是大数据的特点有哪些呢?通常会用3V或者4V来描述大数据的特点,本文4V描述大数据的特点。我们一起来看一下。

大数据的特点有哪些

 

1.规模性(Volume,耗费大量存储、计算资源)
 

大数据之“大”,体现在数据的存储和计算均需耗费海量规模的资源上:美国宇航局收集和处理的气候观察、模拟数据达到32PB;谷歌公司索引的网页总数超过1万亿;FICO的信用卡欺诈检测系统保护全世界超过18亿个活跃信用卡账户。
 

2.高速性(Velocity,增长迅速、急需实时处理)
 

大数据的另一特点在于速度快:大型强子对撞机实验设备中包含了15亿个传感器,平均每秒收集超过4亿条实验数据;每秒超过3万次用户查询提交到谷歌,3万条微博被新浪用户撰写。而在感知、传输、决策、控制这一闭环控制过程中的计算,对数据实时处理有着极高的要求,通过传统数据库查询方式得到的“当前结果”很可能已经没有价值,只有最新的数据才有价值。
 

3.多样性(Variety,来源广泛、形式多样)
 

在大数据背景下,数据在来源和形式上的多样性愈加凸显:除大量以非结构化形式存在的文本数据,也存在位置、图片、音频、视频等信息。除信息形式的多元化,信息的来源也表现出多样性:从网络日志、物联网、移动设备、传感器到基因图谱、医疗影像、天体运行轨迹、交通物流数据等。大数据中的多样性已经超越了数据管理中的异构数据库,其不仅仅是模式或模型的不一样,甚至数据本身的存在形式也完全不同,比如说存在文本、多媒体数据,也存在仪器采集来的完全是数字的数据,以及用户产生的用户行为的数据,这些数据有各种各样的存在形式,这些形式导致处理技术的差异,因此需要新的处理技术。
 

4.价值稀疏性(Value,价值总量大、知识密度低)
 

大数据以其高价值吸引了广泛关注。据全球著名咨询公司麦肯锡报告:“如果能够有效地利用大数据来提高效率和质量,预计美国医疗行业每年通过数据获得的潜在价值可超过3000亿美元,能够使美国医疗卫生支出降低8%。”虽然大数据价值高,但是知识密度非常低。谷歌公司首席经济学家Hal Varian指出“数据是广泛可用的,所缺乏的是从中提取出知识的能力”;IBM副总裁兼CTO Dietrich表示“可以利用Twitter数据获得用户对某个产品的评价,但是往往上百万条记录中只有很小的一部分真正讨论这款产品”。
 

只有经过高度分析的大数据才可以产生新的价值,需要设计能够适应上述特征的大数据处理算法来处理数据。

红松