在某种程度上,大数据就是它听起来的样子——大量的数据。自从互联网出现以来,我们一直在生成数量惊人的数据。据估计,在2003年之前的所有时间里,只产生了5eb的数据——这等于50亿gb。但从2003年到2012年,这个数字达到了2.7泽字节(或2700艾字节,或2.7万亿gb)[来源:英特尔,隆德]。根据伯克利的研究人员,我们现在每两天产生大约5亿亿字节(或约4.3艾字节)的数据[来源:罗曼诺夫]。
“大数据”一词通常用来指大量、快速扩展、多样且通常是非结构化的数字化数据集,这些数据集难以使用传统数据库进行维护。它可以包括在互联网上漂浮的所有数字信息,与我们有业务往来的公司18luck手机登录的专有信息和官方政府记录,以及许多其他东西。还有一种暗示是,对数据进行分析是为了某种目的。
广告
通过在线购物和参与社交媒体,我们自己也产生了很多,但这只是冰山一角。大数据可以包括数字化文档、照片、视频、音频文件,微博以及其他社交网络帖子、电子邮件、短信、电话记录、搜索引擎查询、RFID标签和条形码扫描以及金融交易记录,尽管这些并不是唯一的来源。每当你在网上做任何事情时,你都在生成数据,留下数字痕迹,其他人可以跟随并挖掘有用的信息。18luck手机登录
产生数据的设备的数量和类型也在激增。除了家用电脑和零售商的销售点系统之外,我们还有联网的智能手机、能发布体重信息的wifi称、能跟踪并有时分享健康相关数据的健身传感器、能自动在网上发布照片和视频的摄像头,以及全球定位新利国际网站品牌官网卫星(全球定位系统(GPS))可以精确定位我们在地球上的位置的设备,等等。不要忘记天气和交通传感器、监控摄像头、汽车和飞机上的传感器以及其他与个人无关的东西,它们正在不断收集数据。大量生成和上传数据的电子设备产生了“物联网”一词。
你会发现大数据有多种定义,所以并不是每个人都完全同意它包括什么,但它可以是任何人都有兴趣知道的,可以进行计算机分析的任何东西。这些庞大而笨重的数据集需要新的方法来收集、存储、处理和分析它们。
广告