什么是大数据?这是我们认识大数据、应对大数据发展需要回答的首要问题。从一般意义上说,大数据是指那些超过传统数据库系统处理能力的数据,数据量通常在10TB(1TB=1024GB,为1万亿字节)以上。具体来说,大数据具有4个基本特征:一是数据体量巨大。百度资料表明,其新首页导航每天需要提供的数据超过1.5PB(1PB=1024TB),这些数据如果打印出来将超过5千亿张A4纸。有资料证实,到目前为止,人类生产的所有印刷材料的数据量仅为200PB。二是数据类型多样。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。三是处理速度快。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。四是价值密度低。以视频为例,一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。

  大数据是与智能制造、无线网络革命并行的又一次颠覆性的技术变革。其具体内容包括:海量数据分析技术、大数据处理技术、分布式计算技术、数据可视化技术。其中的分布式计算技术,也称云计算技术,可以同时满足海量数据处理需求,比如1000万人同时搜索某一数据,它会将这些数据交给分布于全世界的服务器并通过它们来进行处理,结果与1万人同时搜索这一数据没什么两样。

  大数据发展之快,已远远超出人们的想象。特别值得关注的是,2012年3月,奥巴马政府发布了“大数据研究与开发计划”,并宣布先期投资超过2亿美元的资金,用于研发大数据关键技术,以抢占数据资源开发利用的制高点。2012年5月,联合国“全球脉动”计划发布了《大数据开发:机遇与挑战》报告,英国、德国、法国、日本、加拿大等发达国家积极响应。我国也于2012年10月成立了中国通信学会大数据专家委员会。种种迹象表明,世界各国特别是发达国家都把大数据的发展摆到国家战略层面加以推动,使大数据正在成为世界新的战略资源争夺的一个新焦点。

  对于大数据的发展,全球知名咨询公司麦肯锡研究认为,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长浪潮的到来,在政府公共服务、民生医疗服务、维护社会安定、动态安全监管等领域的广泛应用,将产生巨大的社会价值和产业空间。有机构预测,大数据应用将使美国零售业净利润增长实现60%,可使制造业的产品开发和组装成本降低50%。这种影响和变化是革命性的,说明大数据蕴含着大价值。