新闻资讯  快讯  焦点  财经  政策  社会
互 联 网   电商  金融  数据  计算  技巧
生活百科  科技  职场  健康  法律  汽车
手机百科  知识  软件  修理  测评  微信
软件技术  应用  系统  图像  视频  经验
硬件技术  知识  技术  测评  选购  维修
网络技术  硬件  软件  设置  安全  技术
程序开发  语言  移动  数据  开源  百科
安全防护  资讯  黑客  木马  病毒  移动
站长技术  搜索  SEO  推广  媒体  移动
财经百科  股票  知识  理财  财务  金融
教育考试  育儿  小学  高考  考研  留学
您当前的位置:首页 > 互联网百科 > 大数据

每天都说大数据,构成大数据的4V你知道是什么吗?

时间:2019-08-05 13:11:35  来源:  作者:

过去的十年,我们经常听说的是互联网时代,而我们现在更经常听到的是大数据时代。大数据这个词,听起来高大上。但到底什么是大数据呢,优就业专业讲师给大家详细解读一番。

大数据首先是一个非常大的数据集,可以达到TB(万亿字节)甚至ZB(十万亿亿字节)。这里面的数据可能既有结构化的数据,也有半结构化和非结构化的数据,而且来自于不同的数据源。

结构化的数据是什么呢?对于接触过关系型数据库的小伙伴来说,应该一点都不陌生。对了,就是我们关系型数据库中的一张表,每行都具有相同的属性。如下面的一张表:
 

每天都说大数据,构成大数据的4V你知道是什么吗?

 

每行数据都有相同的属性,这就是结构化的数据。

我们再来看半结构化数据。XML或JSON格式的数据就是我们所常见的半结构的数据。如,下面所示的XML数据:

<book>

<name>大数据时代</name>

<author>赵牟</author>

<price>¥60.5</price>

</book>

子标签的次序和个数不一定完全一致。

那什么又是非结构化数据呢?这类数据没有预定义完整的数据结构,在我们日常工作生活中可能更多接触的就是这类数据,比如,图片、图像、音频、视频、办公文档等等。

知道了这三类结构的数据,我们再来看看大数据的数据源有哪些呢?归纳起来大致有五种数据源。

一是社交媒体平台,如有名气的Facebook、Twitter、YouTube和Instagram等。媒体是最受欢迎的大数据来源之一,因为它提供了关于消费者偏好和变化趋势的宝贵依据。并且因为媒体是自我传播的,可以跨越所有的物理和人口障碍,因此它是企业深入了解目标受众、得出模式和结论、增强决策能力的最快方式。

二是云平台,公有的、私有的和第三方的云平台。如今,越来越多的企业将数据转移到云上,超越了传统的数据源。云存储支持结构化和非结构化数据,并为业务提供实时信息和随需应变的依据。云计算的主要特性是灵活性和可伸缩性。由于大数据可以通过网络和服务器在公共或私有云上存储和获取,因此云是一种高效、经济的数据源。

三是Web资源。公共网络构成了广泛且易于访问的大数据,个人和公司都可以从网上或“互联网”上获得数据。此外,国内的大型购物网站,淘宝、京东、阿里巴巴,更是云集了海量的用户数据。

四是IoT(Internet of Things)物联网数据源。物联网目前正处于迅猛发展势头。有了物联网,我们不仅可以从电脑和智能手机获取数据,还可以从医疗设备、车辆流程、视频游戏、仪表、相机、家用电器等方面获取数据。这些都构成了大数据宝贵的数据来源。

五是来自于数据库的数据源。现今的企业都喜欢融合使用传统和现代数据库来获取相关的大数据。这些数据都是企业驱动业务利润的宝贵资源。常见的数据库有MS Access、DB2、Oracle、MySQL以及大数据的数据库Hbase、MongoDB等。

我们再来总结一下,什么样的数据就属于大数据呢?通常来大数据有4个特点,这就是业内人士常说的4V,volume容量、 variety多样性、velocity速度和veracity准确性。



Tags:大数据   点击:()  评论:()
声明:本站部分内容来自互联网,内容观点仅代表作者本人,如有任何版权侵犯请与我们联系,我们将立即删除。
▌相关评论
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
▌相关推荐
过去的十年,我们经常听说的是互联网时代,而我们现在更经常听到的是大数据时代。大数据这个词,听起来高大上。但到底什么是大数据呢,优就业专业讲师给大家详细解读一番。大数据首...【详细内容】
2019-08-05   大数据  点击:(0)  评论:(0)  加入收藏
近年来,短视频APP抖音占据了许多小伙伴们手机使用的最长时间。抖音的风生水起,甚至让我们预感到在未来的许多年内,短视频都将迎来黄金发展期。去年年末的一份《2018抖音大数据...【详细内容】
2019-08-05   大数据  点击:(2)  评论:(0)  加入收藏
大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传...【详细内容】
2019-07-25   大数据  点击:(10)  评论:(0)  加入收藏
Lambda Architecture 概念Mathan Marz的大作Big Data: Principles and best practices of scalable real-time data systems介绍了Lambda Architecture的概念,用于在大数据架...【详细内容】
2019-07-12   大数据  点击:(6)  评论:(0)  加入收藏
搜索是大数据领域里常见的需求。Splunk和ELK分别是该领域在非开源和开源领域里的领导者。本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家理解大数据搜索...【详细内容】
2019-07-12   大数据  点击:(7)  评论:(0)  加入收藏
人工智能、大数据等新兴行业人才需求量大,并且薪酬较高,有丰富从业经验的研发人员甚至可拿到百万年薪。在求职心态方面,多数人还是求稳为主,稳定的大公司仍然是就业首选;经验丰...【详细内容】
2019-07-12   大数据  点击:(7)  评论:(0)  加入收藏
一、MySQL 优点:体积小、速度快、总体拥有成本低,开源;支持多种操作系统;是开源数据库,提供的接口支持多种语言连接操作 ;MySQL的核心程序采用完全的多线程编程。线程是轻量级的进...【详细内容】
2019-07-11   大数据  点击:(7)  评论:(0)  加入收藏
Hadoop介绍 (直奔主题)开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括HDFS,Map...【详细内容】
2019-07-01   大数据  点击:(9)  评论:(0)  加入收藏
齐爱民:重庆大学网络与大数据战略研究院院长许 可:对外经济贸易大学数字经济与法律创新研究中心执行主任阿拉木斯:网规研究中心主任 中国网络空间安全协会理事周慧虹:银行...【详细内容】
2019-06-26   大数据  点击:(17)  评论:(0)  加入收藏
光明图片/视觉中国当前,网购、网约车、网上银行等互联网服务全方位地从虚拟数据世界介入到现实生活中。人们已经习惯为了获取便利高效的服务,录入自己的姓名、电话、住址、银...【详细内容】
2019-06-24   大数据  点击:(12)  评论:(0)  加入收藏
近期,一篇“90后超一半网贷”的文章引起了网络热议。看似90后的收入无法支撑他们的超前消费,然而,20多岁的90后真的比奔四的80后负债更多吗?就此,我们抽取了苏宁金融400万个1980...【详细内容】
2019-06-18   大数据  点击:(15)  评论:(0)  加入收藏
从交通、安全、气象到身边的快递、广告、电子商务,大数据已经成为任何一座城市都离不开的基础设施。其实,在科学研究领域,大数据也产生了很大影响,心理学的研究也因其发生了改变...【详细内容】
2019-06-17   大数据  点击:(13)  评论:(0)  加入收藏
网贷大数据风控,听上去很高大上,​它到底是个什么系统呢?今天小编带大家简单了解一下。一般的网贷风控系统是采取系统审核和人工审核两种方式,在判断一个人是否具备借款资质,常常...【详细内容】
2019-06-13   大数据  点击:(31)  评论:(0)  加入收藏
从移动支付到共享经济,大数据正在加速重塑着大众生活的诸多方面;从万物互联到智慧城市,大数据正在深刻影响着经济发展、社会治理、国家管理的各个领域。了解大数据、掌握大数据...【详细内容】
2019-06-06   大数据  点击:(42)  评论:(0)  加入收藏
大数据工程技术人员是人社部发布的13个新职业之一。据计算机专业论坛统计,目前全国大数据人才仅为46万,未来3-5年内,大数据人才缺口150万。各企业纷纷以高薪聘请大数据人才,国内...【详细内容】
2019-06-06   大数据  点击:(30)  评论:(0)  加入收藏
回顾2018年,降薪、裁员、互联网寒冬似乎成为主旋律,那实际上资本市场萎缩了吗?其实不然,2018年6月,蚂蚁金服还获得140亿融资,而热度较高的大数据行业,在2018年的融资额达到1273.1亿...【详细内容】
2019-06-05   大数据  点击:(26)  评论:(0)  加入收藏
在数据存储层,还有很多类似的系统和某些系统的变种,这里,仅仅列出较为出名的几个。 一、数据存储层宽泛地讲,据对一致性(consistency)要求的强弱不同,分布式数据存储策略,可分为AC...【详细内容】
2019-05-15   大数据  点击:(20)  评论:(0)  加入收藏
大数据的由来对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率...【详细内容】
2019-05-15   大数据  点击:(47)  评论:(0)  加入收藏
“21世纪什么最贵?”20年前,这个问题的答案是“人才”,今天,这个问题有了新的答案,那就是“数据”。在这个电子产品不离手的年代,只要连接了网络,我们就在留下行为数据,作为全球资...【详细内容】
2019-05-05   大数据  点击:(24)  评论:(0)  加入收藏
本文笔者将从数据采集层、数据计算层、数据服务层、数据应用层四大层次来带大家了解阿里大数据的产品技术架构。2014年,马云提出:“人类正从IT时代走向DT时代”。如...【详细内容】
2019-04-24   大数据  点击:(17)  评论:(0)  加入收藏
推荐资讯
相关文章
栏目更新
栏目热门