当前位置: 时代头条 > 正文

每个人都在谈论大数据,但其实没人知道怎么做

每个人都在谈论大数据,但其实没人知道怎么做

传说中我们都活在上帝的眼皮底下。

在上帝眼里,苍蝇和人类一样都是他赤裸的孩子。

2011年以来,一种叫“大数据”的存在替代上帝,粗鲁地“盯”着你我。

我们打车的路线、网上的交易、计步的APP、去医院挂号、一张交通罚单、一次饭局等等,这些数据痕迹都被人收集起来,通过计算、重构,变成一个个应用,出售或免费让我们使用,同时我们产生新的数据作为回馈。

但这一庞大的投入与实际产出,目前并不匹配。现有的大数据搜集和处理能力,看上去很不着调。

比如,微信朋友圈的广告推送,一直是网民取笑的槽点。

比如,当你从一个电商平台购买甚至只是浏览了一些鲜花类产品后,下次再登录时,该平台可能粗暴地给你推送花圈甚至寿衣广告。

近5年来,大数据概念火热,传道者和求学者穿梭于众多会议和论坛,但能真正做深度挖掘的企业并不多。

美国杜克大学教授丹·艾瑞里曾将大数据技术比作未成年人的性行为:“每个人都在谈论它,每个人都宣称他们在做,每个人都以为别人在做,但没人知道怎么做。”

大数据领域正在等待着杀手级应用的出现。“估计还要等5年至10年。”清华大学统计学研究中心主任刘军说。

每个人都在谈论大数据,但其实没人知道怎么做

每个人都在谈论大数据,但其实没人知道怎么做

为什么大数据被行业关注,但实际能投入的应用并不多?手握海量数据的BAT(百度、阿里巴巴和腾讯),也尚未用大数据技术挖掘出扛鼎之作。

事实上,这个令人兴奋的新事物,仍处于摸索研究阶段。

谷歌的AlphaGo是一个突出的例子。这种接近人脑的学习方式,可以通过训练之后自行掌握概念,而且输出结果会随着数据处理量的增大而更加准确。

包括谷歌、IBM、微软、Facebook等科技巨头,在深度学习和大数据结合方面的投入越来越高。

精准营销、医疗和金融这三大领域,目前被视为大数据最具前景的应用领域。

美国加州大学伯克利分校教授迈克·乔丹认为,目前的大数据给出的结果可靠性太低,如果急于应用到实际中,就好比是土木工程还没学好就开始造桥,结果可想而知。

科大讯飞公司高级副总裁陈涛说,热炒大数据的背后,有IT行业在推动,为了出售服务器、存储、服务,过分渲染了大数据使用的急迫性。

每个人都在谈论大数据,但其实没人知道怎么做

每个人都在谈论大数据,但其实没人知道怎么做

当把不同来源、不同维度的数据关联在一起,交叉挖掘分析,就有可能发生“化学反应”,大数据因共享而增值。

高德的交通数据来源主要有两个,一是众包数据,5亿高德用户在使用交通导航服务时,既是信息使用者,又是信息的分享者。

第二个来源,全国几十万辆出租车,及几百万辆物流车辆的数据,这些数据经交通后台汇总、处理后,可实时计算出路况信息,反馈在用户终端上。

国内除了高德这样以数据为生的企业,BAT通过网民的网购、理财、搜索,以及社交网络等,也坐拥海量数据。

在移动互联时代,由于每台终端设备都“绑定”一个用户,一旦将数据分享,合作者也就长期拥有了这些用户,这导致整个业界的心态放不开,害怕用户流失。

其实,不像煤炭、石油等资源,用过之后不可再生,因而很难实现共享,数据资源可以重复使用,在共享中不断产生新的价值。

每个人都在谈论大数据,但其实没人知道怎么做

每个人都在谈论大数据,但其实没人知道怎么做

一位中外合资农业公司的市场总监就曾碰过钉子。

他数次联系国家气象局,希望拿到一些农业大省历年的气象数据和实时的观测数据。

然而,政府机构由于自身定位和责任机制,缺乏放开公共数据的动力。国家气象局婉拒了合作请求。

气象数据具有垄断因素,气象局如果不肯提供原始裸数据,商业机构是无计可施的。

公开报道显示,天气服务类软件墨迹天气上线之初,是从网上抓取的天气数据,后来气象局找上门来要求付费,开价一年几十万元。这对初创公司来说,是一笔大开销,只好另想办法。

即便用于研究,数据也并不易获取。

中国科协副主席,同时在清华大学、北京航空航天大学兼任教授的张勤在一次会议上抱怨说:“搞大数据的人,却时常感到没有数据可用。”

张勤的遭遇,也是中国不少研究者和产业界的感受,公共数据资源太封闭。

抛开主观意愿,官方机构能不能拿出高质量的数据资源,也是一个问题。

开放公共数据,意味着数据资源在政府、社会间实现自由流动,这是政府行为的一项重大变革。

涉及部门越多、范围越大,数据开放难度也就越大。重任千钧惟担当。

每个人都在谈论大数据,但其实没人知道怎么做

每个人都在谈论大数据,但其实没人知道怎么做

最新文章

取消
扫码支持 支付码