当前位置: 时代头条 > 正文

中润普达杜登斌:产业互联网+与大数据创新应用

2015年12月21日,中润普达(集团)公司董事长、九派全媒体信息技术股份有限公司总经理杜登斌先生来到浙江大学求是强鹰俱乐部“强鹰论道”主题活动,与在场的强鹰新老学员及其他参与人员就大数据与产业互联网创新等话题进行分享和讨论。以下为杜登斌先生《产业互联网+与大数据创新应用》演讲实录。

中润普达杜登斌:产业互联网+与大数据创新应用

▲ 杜登斌先生做客强鹰论道

主讲《产业互联网+与大数据创新应用》

大家晚上好。阮俊华老师和张旭光老师,是我非常敬佩的学者和专家,特别是张旭光老师是大数据行业的前辈。所以今天让我跟在座的各位领导、各位学长、各位同学探讨大数据,我有些诚惶诚恐。

刚才在来的路上,我和发改委产业金融办宋主任与几个朋友讨论了大数据到底是什么等问题。说实话我也不太懂什么是大数据,只是原来做过舆情和信息监控方面的工作,知道一些如何采集、挖掘和使用数据的方法,应该说还不是真正的大数据。

在和大家探讨之前,我想先和大家聊一聊数据的垂直采集和挖掘技术或者叫监控技术。最早,我们只能用国外的信息采集技术,但是中文有中文的特点,后来相关机构根据中文的特点,开发了中文采集挖掘技术,比如中科院的技术、北大方正的技术等等。很多人认为监控技术,和百度、谷歌、360的搜索引擎的技术差不多,其实并不一样。现在的搜索引擎技术也叫爬虫系统,它就像从太平洋这边拉一张网,一直拉到彼岸,把相关的数据采集过来,构建相关的词库,然后进行信息的筛选、分析。这种技术的搜索精准度一般仅为10%——30%左右,它并不是一种精准的数据采集和挖掘技术。但是如果要做情报、舆情或者维稳相关工作,需要在三到五分钟准确抓取信息,同时报送决策部门进行决策,这就需要一种更加精准、实时的信息检索和挖掘技术。但是,传统的爬虫技术很难实现我们的需求,它光采集数据的时间可能就需要半个小时、一个小时,我们在过滤信息的过程中时间又过去了一两个小时。我们要做舆情工作,需要第一时间了解突发事件并迅速采取措施,爬虫技术显然是不行的。中文采集挖掘要做到实时精准,看起来没有任何办法。

去年,武汉大学“未来计算机发展论坛”上,在讨论到中文数据精准实时采集挖掘的时候,很多专家都说几乎没有办法解决。我说过,传统计算机思维是数学和模型的思维,而大数据是中文和计算机思维。如果我们还是停留这种数学模型和计算机思维的话几乎没有办法做中文数据的采集和挖掘。我们在想,能不能换一种思路看问题?后来,我们把中文不同的分词构建成一个矩阵体系,把信息来源也构建一个矩阵体系,最后在分词和来源矩阵的基础上再构建一个规则矩阵体系,三个矩阵体系用一个动态平衡模型来统领,这就是一个实时采集、挖掘的动态平衡的系统。这套系统的实时精准度可达95%,实时延迟3到5分钟左右,它对于中文采集挖掘是非常有用、有效的解决办法。这个系统确保了人民网在2009年到2013年几乎所有的大的舆情维稳事件,确保了我们在第一时间掌握舆情、处置舆情。我工作期间,前后共部署了200多套系统,现在一些机构用的也还是这套系统。

2014年以后,我转职转向大数据相关业务的研究。2012年,我看到一本书,叫《大数据时代》,看完之后发现书中有70%左右预测的内容甚至五年前都已经实现了。于是我把工作重点转向中文大数据的运用,思考它和产业怎么融合,和金融怎么融合。所以我今天跟大家讨论的题目是“产业互联网+与大数据创新应用”,希望大家批评指正。

先和大家聊聊下一个百万亿商业时代在哪里。现在国家提出来的“互联网+”,我们认为它的核心是依托于消费互联网模式带动和引导传统产业升级改造。特别是现在的BAT三个巨头,它们合起来的市值有三万七千多亿,大于中国排名前一百家房地产总市值。那么在消费互联网继续存在和不断发展的情况下,下一个趋势是什么?我觉得应该是产业互联网。我们现在处于消费互联网向产业互联网的转型时代。这个时代的特征是:从消费扩展到生产,从用户扩展到产业或者企业。中国的经济一直是出口、消费、投资三驾马车拉动,但现在看来我们投资3、4万亿也没什么用,无论国家怎么补贴出口也不能带动经济增长。目前,我们国家的内需除了互联网消费在增长之外,其他的传统产业日子都非常艰难。大量的消费需求确实存在,但是不能有效带动消费。从经济角度上讲,原来做投资能够直接引导消费,甚至刺激消费,现在大家发现这个办法行不通,所以我们需要通过一种技术更新或变革,创造出一种新东西,这种新东西就是供给侧。

现在消费互联网的行业格局逐渐稳定,消费互联网产业投资热潮已过。实体经济企业与互联网企业相互融合,在创造一种新的价值经济来推动经济发展,这就是现在的产业互联网时代,产业互联网实际上就是创造消费。

怎么来认识大数据?我左手拿着一个瓷器,右手拿着一个大象,大家认为它们之间有关系吗?如果用传统的思维来看是没有关系的。我们思维再变一下,用瓷器做一个大象是不是有关系?我们做了一个新闻媒体叫做九派新闻,它把没有关系的新闻融在一起,就可能看到一个舆论导向。其实大数据未来创造出来的消费,就是在看起来风马牛不相及的事物之间寻找可能存在的联系,表面上看没有什么联系,但是实际上内在的关联很多很多。怎么要找出关联,再创造新关联,这就是大数据可以发挥作用的地方。好多人问我什么是大数据,举个例子,我把三五条新闻放在一起,就可能产生一条新的新闻,我们可以通过数据分析看到一个社会情绪,甚至是社会思潮,这就是大数据的应用。

我们刚提到了产业互联网,它实际上是一种新的创造。产业互联网主要通过在生产、交易、融资和流通等各个环节的网络渗透,从而达到创造出不仅限于流量的更高价值的产业形态。因为消费互联网主要是眼球经济,流量可以变现,假如我有一百万用户,一个用户评估十块钱,一个亿用户就是十亿元。但是产业互联网不是,它是在重塑价值,从价值里面再找出新的价值,这里面发挥作用的还是大数据。

我们回顾一下互联网发展的几个阶段。第一个阶段主要是互联网时代,主要包括门户网站、电子商务、电子政务等,这个时代有的企业做到了上百亿市值,几十亿市值的也有很多。到了互联网消费时代时代,因为有了互联网金融等工具,产品可以放在网上展示,消费者也可以在网上支付等。互联网消费的时代,实际上是金融工具的变化渗透到了互联网平台,由此带来了更便捷的消费,才成就了阿里巴巴、腾讯、百度等巨头。大家看到,当第三方支付、P2P等金融工具的变化并不能解决所有问题。比如艺术品怎么来变现,怎么来定价?我们的知识产权,商标权,科技成果怎么来定价?怎么来交易?这个时代,如果需要用大数据来支撑,需要产业来支撑,需要金融来支撑,这个时代就不是消费互联网时代了,它是产业互联网时代!下一个超过阿里巴巴、超过百度、超过腾讯的企业一定会在这个时代要产生。

前两天习近平总书记在乌镇讲话,提到了,随着经济的发展和互联网的快速发展,整个互联网开始从消费互联网将会转型为产业互联网。最高决策者也意识到这个问题,为什么?一个是大量的传统企业在互联网的冲击下过得非常艰难,需要转型升级;再者是大量的盈余经济散落在社会上,比如各种各样的知识产权、土地、林地、艺术品无法流通,需要变现。如果不能够流通和变现它们实际上就是不良资产,是一文不值的死资产,它们需要一种方式来创造,需要一种思维来引领,所以这个时代叫互联网产业时代。

再和大家聊聊以数据资产为核心的大数据产业金融技术创新与应用。我认为基于大数据的产业互联网金融也许能够真正使商业进入这个新时代。我们可以看到,债券、股权、艺术品这一系列商品的附加值极高、难以定价且属于特殊行业,所以这些商品的流通问题一直无法有效解决,流通不了,就都成了死资产。因此需要通过大数据的解决方案来实现产业和金融的融合。产业金融虽然基于大数据,却仍然保持着金融的概念,因为征信、评估、定价都是和金融密切相关的,只是它都要通过大数据来实现。产业与金融大数据融合,才能产生放大效应,才能解决问题。

说说文化金融的问题。现在文化是文化,金融是金融,国家出台了不少金融支持文化发展的政策,其实到现在也没有真正结合起来。然而,大数据的出现使这个问题得以解决。我们说,整个经济的核心血液是金融,而金融的实质是数据。产业可以数据化,企业可以数据化,产品也可以数据化。如果两个数据能融合实际上就形成了一个载体——数据。那么未来经济命脉的核心就是数据,只不过有些数据是金融数据,有些数据是实体经济数据。

再说到林权的问题,大家普遍认为下一个房地产的风口就是林权或土地。现在土地的流转,知识产权的转让都是海量的。这种权属、资产交易实际上可以加快推动百万亿商业时代的来临。我们可以构建一个林权、艺术品的大数据资产平台,同时构建一个包含文化产品、债券等一系列产品的平台,通过大数据的运用和分析,加上整个金融的定价,把整个金融的征信融合起来。虽然每个产业都是上千亿、上万亿,甚至是数十万亿、百万亿,但这一融合让事情就变得简单而易于操作。

基于此,只要能够树立以数据资产为核心的观念,就能够实现大数据产业金融创新与应用。

刚才我讲到要实现产业互联网金融的综合运用,我们必须转换一个观念,即要有数据资产的概念。因为这个概念不确立下来,就无法实现产业互联网或者产业互联网金融应用。所以要以数据资产为核心,来构架这样的系统,并通过大数据方式来实现。因此产业互联网必须围绕数据资产创新来实现。产业互联网时代,它的生产资料就是数据,如果数据还是由政府信息公开,是为了查询、为了公共服务,那么大家想一想这个数据还能不能变现。实际上这不是一个资产,只是一个公共服务而已。所以现在我们很多智慧城市,很多地方提出的云服务平台,我觉得就是一个数据库和数据的查询系统而已。

前年我们做艺术品金融方面的事务,对于艺术品来说,可以把所有价格数据采集过来进行加权定价。但是有的专家不这样认为,他们认为“每一幅字画,每一个艺术品都有很多智慧,不是一个价格可以决定的。”我认为不管它包含多少东西,不也是一个商品吗。既然是商品,就按照商品的属性来定价,商品就需要流通,需要交易。没有交易,不流通还怎么算是商品?所以我说,“只有哪一天艺术品真正按商品的规律、按照资产来定价,而不是由专家来定价,那么才能有效解决艺术品真正走向市场、走向老百姓的问题。”数据也是一样的,我们要做产业互联网平台,就必须把数据做成资产,而不是只停留在政府高大上的智慧城市上面。

要实现产业互联网,怎样在技术上进行架构呢?第一是要以数据资产金融应用为核心来构建。首先通过大数据技术采集和挖掘形成产业价格和产品价格的基础数据,据此完成基础的定价、评估、征信和交易。然后把产业的资产权属变现,其中变现不是要构建一套一套的系统,而是要真正完成从资产走向资本的过程:要变成数据资产,要变成数据资本、数据金融,一环套一环。

产业只有与金融和大数据融合才能产生放大效应,产生更大价值。产业互联网金融的关键是以大数据为核心手段,结合金融杠杆,实现包括互联网产业在内的全产业的规模化升级。这是一个环,从数据资产到数据资本到数据金融,涵盖全产业。因为产业和金融结合起来,必须依靠大数据方案先解决产业的评估、定价以及信用等一系列问题。产业互联网金融的翅膀是金融,核心是大数据,大数据意味着从无尽的产业和金融数据中看出上下游价值的能力。所以实体经济和金融结合起来才是升级转型的根本出路,金融需要跟产业融合,同时产业也需要跟金融融合。

第二要有六位一体的综合解决方案,就是要以数据为核心,来联结起云计算、云应用、云存储、云服务、云数据、云交易、云金融等环节。正因为有了数据,我才可以做计算和服务,把数据变成资产或资本,数据还可以交易,还可以定价,还可以搞出各种数据金融。因此,缺少哪一环,这个生态系统都很难维系。

第三是设计基于采集挖掘的梯级开发。在这里,我指的是垂直定向采集挖掘技术,要通过这个技术实现数据大集中,形成数据资产。这里面也包括用户共享,我们一方面可以自己采,另一方面还可以借助客户的贡献实现共享。

第四个是基于大数据产业金融应用的业务线。这里一共有三条线。首先,我们可以通过基于大数据的数据资产管理交易系统形成解决方案;可以通过对产业产权价值、产品价格等多维度采集、分析,形成大数据的评估平台,为金融机构、投资者提供投资决策依据;第二,基于大数据的全息信息融合系统形成解决方案,现在提出中央厨房,进行信息的原创和数据的二次、三次加工,同时与互联网信息和新闻舆论、媒体产业、金融相互融合,构建新媒体产业金融生态融合系统;第三,基于大数据产业金融的综合解决方案。通过大产业应用平台进行资产和权益的归集,开展大数据实时匹配和统计,建立大数据产业定价和指数系统,围绕产业指数进行金融创新和大数据金融量化交易。

从构建企业行业基础数据平台、行业大数据云服务平台,再到构建大数据云应用平台、大数据产业金融平台,再到构建量化交易平台。数据到最后就是量化交易,就是一种虚拟的数字交易。所有的产业和实业都可以量化,任何实体经济和虚拟经济之间的关系都可以用数据来进行解决。

让我们来说说我现在做的九派新闻,实际上这个平台就是以新闻信息资产为核心,通过集大数据云计算、云存储、云数据、云服务、云资产、云交易为一体的综合解决方案来规划九派新闻,九派和整个行业的新闻都是不一样的。现在九派真正用的技术,不到整个技术架构的5%,它是一个逐步递进的过程。虽然九派的技术实现了,但是还没有真正走向产业,团队对数据的理解和运营能力需要一个过程。过一段时间九派会越来越有市场,因为它可以提高生产效率,原来几十上百人的编辑团队,现在连采写、编辑只需要八个人,还可以24小时值班。原来大家做的新闻都是平面的新闻,而九派要从没有关联的新闻里面看出舆论导向。可能现在还达不到这个目标,但是大家可以看出未来会朝这个方向发展:通过数据的采集、挖掘,形成各种热点分析和舆论引导。

九派的产业是产业融合的平台,对外部的产品和服务可以创新应用,对内部的产品创新也可以应用。对外我们可以实现互联网金融、互联网产业金融,还有各种创新业务,通过这些数据构建基础的分析和挖掘系统,可以转向互联网金融、互联网自媒体等行业。对内我们想形成舆论引导,形成竞争分析、情报分析,形成各种内参,各种相关数据服务。对外有创新,对内也可以推动业务创新,归结起来是一个技术平台来整合并进行推动。九派新闻采集的新闻和前面匹配的数据都是实时分析,对每一块分析都会实时监控。在后台推送的时候任何一个平台都可以参与,这是一个完全融合的平台,所谓大数据的媒体融合我个人觉得就是这样融合的。

最后一个问题,跟各位再聊聊大数据产业金融应用现在需要突破的几个问题。未来,我们将走进“一切可量化,万物皆数据”的时代;未来,抢夺全球定价话语权是中国产业互联网发展的重要使命。

首先,可以用大数据解决产品的定价。艺术品的定价方式,一种是自报价,一种是拍卖价,再有就是画廊等机构的定价。市场其实是可以把艺术家和艺术品的基本价格确定下来的。我可以基于这个价格做初始评估,这个画是什么年代,再加权,又可以做一次评估,这个画品相怎么样,再加权又可以评估,这样可以基本上接近于市场。这个就是我们创造出来的“3阶段线性回归决策树模型”,该模型可以有效地解决当前国内艺术品的估价问题。

第二,用大数据技术解决人的价值评估。把区分度模型加上随机森林算法,改进个人信用算法来对个人的价值进行评估,基于一定预测目的和相关的历史数据建立数学模型,得到一个评分公式,按公式对某个预测对象进行评估。

第三,用大数据技术解决产业指数的问题,既然定价能做出来,指数就更简单了。综合性指数可以以拍卖指数、画廊指数、市场指数、评估指数为基础,分别进行加权计算得出,这样有产品的定价、产业的指数,我们就可以做产业的风险预警、产业的投资分析、产业的投资预警等。

第四,用大数据技术解决量化交易。从海量数据中找出价值数据,再到数据资产、数据资本、量化交易,最终是交易指数。数据是一种资产,也是一种服务,是一个超大的金融平台,有实体经济、产业经济支撑的超大平台,这就是大数据资产的管理,财富管理。

第五,用大数据技术解决预测。既可以进行产业的风险预警和预测,也可以完成股票涨停分析。

最后,向各位汇报一下中润普达(集团)的使命:让一切数据资产变现更简单,更容易。我们做的是产业互联网金融平台,是基于大数据应用的平台,是资产端+大数据+金融的平台。

谢谢大家!

(时代强鹰整理并发布)

最新文章

取消
扫码支持 支付码