作者:

赵敏 走向智能研究院
朱铎先 北京兰光创新科技有限公司
刘俊艳 青岛科技大学

20231231日,国家数据局等17部门正式发布《“数据要素×”三年行动计划(20242026年)》。文件要求,通过发挥数据要素的放大、叠加、倍增作用,构建以数据为关键要素的数字经济,是推动高质量发展的必然要求。深入贯彻党的二十大和中央经济工作会议精神,落实《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》,充分发挥数据要素乘数效应,赋能经济社会发展。

本文从数据的产生、应用、赋能、创新等多方面,总结数据的十二种特性,讨论数据要素乘数效应(赋能性),提出数据要素幂数效应(变革性),旨在充分发挥数据独有的价值属性,赋能数据经济,发展新质生产力,推进新工业革命。

汉语词典定义:数据就是数值,也就是我们通过观察、实验或计算得出的结果。数据有很多种,最简单的就是数字。数据也可以是文字、图像、声音等。

数据可以是连续的值,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元01的形式表示。

由上述定义,数据在属性或“标签”上,可以是连续的,也可以是离散的;可以是模拟化的,也可以是数字化的;可以是单数数据(datum,即资料),也可以是复数数据(data);可以是字母符号的,也可以是图形图像的;可以是观察到的,也可以是计算出的;可以是定性的,也可以是定量的;可以是未经处理的数据原料,也可以是经过处理的数据精品;可以是狭义的,也可以是广义的;可以是数据,也可以是信息,等等。总之,数据具有非常广泛的属性,具有广泛代表性

笔者认为狭义数据是数学意义上的数据,如十进制、八进制、二进制数据等。

笔者有时把数据要素简写为数据,但是严格说来,数据要素与数据具有不同内涵。数据要素是一个经济学术语,是指那些以硅基为载体存在的、通过芯片算力、软件算法方式参与到企业生产经营活动并发挥重要价值的数据资源,是建设数字经济的新生产要素

笔者认为,除了需要讨论数据自身的属性,还需要特别关注数据在全生命周期中多个关键阶段的时空背景。

在数据存储阶段,用什么介质存,存在哪里(单机、服务器、数据库、数据湖等),能存留多长时间,是存进去就不流动了(“进坑”),或是被遗留在哪个数据“孤岛”上找不到了。1985年,宝钢技术副厂长何麟生就专门提出,做好“具有宝钢特色的‘数据不落地’项目的开发工作”。今天看来,当年何老提出的“数据不落地”是一个非常先进的思想。笔者理解,“落地”是数据的一种不良状态,指数据静止了,停滞在某机、某库、某盘中,不能或不利于流动了,而流动,反复流动,高速反复流动,流动不落地,天(云)地(局域网)间疾驰,是数据应有的理想状态。

在数据传承阶段,数据携带哪些关键内容来做传承,数据会影响什么,有多大范围的影响?数据对企业数字文化的建设有何促进,对社会数字文明的形成有何影响?数据在各种先进技术手段的支持下,能够传承多久,是否永续传承?等等

3.数据的表征性

本文所说数据,泛指由比特数据构成、在电脑和网络中运算/存储/传输、表达数字化数据、信息、知识和决策的数据资料,包括软件、知识库、数字孪生体在内的数据构件。数字的,比特的,硅基的,说的是同一个意思。

比特数据作为最小信息单元,可以表达万事万物。正如彼得·J.宾利写的那本书的名字:《万物皆数》。笔者也称其为:数表万物。

4.数据的智能性

比特作为数字基因,最简约编码符号,可以通过符号的结构变化,来映射语义结构变化,由由语义映射的语句聚合而产生决策和预测(智能)。例如“石油”“桶”“50”“美元”等,这些数值和单词,都是广义数据。将数据组合后,“1桶”“50美元”等都是信息;将不同信息进一步组合,“1桶·石油·卖·50美元”,就组成了一个主谓宾完整语句;一个语句事实上是表征了一条知识;如果知识进一步组合,就可以激发出“智能(决策和预测)”。无论是人脑,还是电脑,智能的形成过程都是按照语义方式进行的。例如“胡赛武装在红海发射导弹,拦截货船”是陈述事实语句,“欧美货船不得不绕行好望角”是表示决策语句,两个语句组合,可以形成“货船运价即将上涨”的预测语句,甚至进一步推测出海运的石油、粮食等大宗货物必定涨价。无论在人脑还是在电脑中,都可以通过语义操作完成这个智能过程。

5.数据的生命周期性

万事万物皆有生命周期,数据也不例外,但是数据生命周期极其特殊。

笔者认为,从全生命周期视角来看,数据经历了一个“从无到有,从有到量,从量到乱,从乱到治,从治到优,从优到察,从察到价,从价到产,从产到传,从传到化”的生命周期过程。

从有到量——数据量不大时,很多事情都不是问题。但是当数据量大到一定程度,一个是大数据产生,另一个是对数据管理提出了挑战;

从乱到治——经过数据治理,在数据关系、质量、一致性、流动性和数据管理上,会有很大改善。华为工业软件云的一个数据数据管理模式是“乱而后治,不治而”;

从优到察——有了足够数量优质大数据,可以实现数据洞察,从数据中获得此前未曾获得的、隐藏的事物之间的关联和发展规律,支持人和机器的决策;

从价到产——数据体现出价值,还可以进一步变成数据资源,数据资源进一步提升为数据资本,即用数字、数据来增进利润的资本。最终,数据资本变成企业数据资产,与有形物质资产、无形非物质资产一道,组成企业高价值资产;

从传到化——在数据永续传承中,所有企业都注重数字资产,形成数字文化,对全社会数字文明的化育,将会实现于无形,作用于万物,润泽于人心,造福于社会。

6.数据的创新性

202049号发布的《关于构建更加完善的要素市场化配置体制机制的意见》中,明确了数据与土地、劳动力、资本、技术等一样,都是可市场化配置的生产要素。数据要素史无前例地成为了国家明确定义的“生产要素”。

当一个传统产品,有了数据产生与处理,有了数据输入与输出,有了数据计算与分析,有了数据利用与分享,有了数据融入与驱动,就可以认定传统产品实现了与数据要素的重新组合,即实现了熊彼得定义的创新。

7.数据的穿透性

工业互联网重要作用之一就是数据穿透屏障,促进协同创新。工业现场数据一直与其所依附的工业端发生着密不可分的高频互动,以复杂的数据种类映射着更为复杂的工业现场关系网络。数据按照所映射的工业现场关系网络进行传递、穿透和加载,形成从物理系统的边缘层采集数据,到工业互联网平台层运算数据,应用层使用数据,按照给定工业机理模型和算法进行计算、分析和推理,最终工业互联网做出解决工业现场实际问题的业务决策和预测,形成数据对物理系统的精准驱动,实现数据的完美闭环。

比特数据承载的数字化数据、信息、知识,可以穿透任意时空,打破物理屏障,快速、高频、不限时空大范围传递,触达任何人造系统,指导人和机器正确做事。

比特数据上的无损拷贝,带来了各种数据、信息、知识的便利复用性,使得各种数据要素具有良好的移植性,巨大的推广性。

数据要素的复用性,是基于复制性产生的。在实际应用场景中,我们既需要数据要素的复制性,又需要数据要素的复用性。
互联网+数据消灭了人类交往距离,3D打印+数据消灭了产品结构复杂性。其关键技术在于数据具有不限时空的无损复制性。如果一款3D打印驱动软件,开发定型后,被安装在同一型号的不同3D打印机上,体现了数据构件的复制性;当该驱动程序不用修改,或稍加修改就可以用于其他型号3D机,甚至可以用于其他厂商生产的3D打印机,体现了数据构件的复用性。复用性越好,数据构件在不同时空的可移植性和推广性就越好。

物理世界万事万物正在加速数字化,无论是通过传感器采集、人机交互还是机器自动计算,无以计数的数据,以数据洪流的形式涌入数字世界。数据正在被广泛收集和储存。有些数据从生成的时刻起,就有明确的时空背景,清晰的使用价值。但是,更多的高频大数据本身并没有太大的实用意义,需要从大数据中获得数据洞察,发现数据的实用价值。

数据洞察需要有足够大的数据集,分析对象是业务大数据。根据前文的数据智能性,数据洞察一般分为以下四个步骤:

·结合业务场景,对提炼出来的信息进行相互关联,将其组合成为主谓宾齐全的语句,表达为业务场景知识。

·根据上述数据分析结果,形成最终的数据洞察报告。

10.数据的资产性

有了数据,不一定能采集,不一定能存储,最终也不一定能成为数据资产。曾经有企业技术人员对笔者诉苦:我们的生产过程,很多数据无法记录下来,眼睁睁地看着它们流失了,因为记录数据是需要成本的!

数据资产是指由个人或企业拥有或者控制的,能够为企业带来未来经济利益的,以硅基方式记录的数据资源。数据资产是拥有数据权属(勘探权、使用权、所有权)、有价值、可计量、可读取的数字空间中的数据集。

11.数据的乘数性(赋能性)

数据要素不断应用在各个细分领域,激发出了细分领域的内生动力,加速了现代文明大厦崛起。

三种“极大”增加值相乘,带来了计算性能、网络带宽和网络规模“三套脚手架”的魔幻般持续增高,应用到各行各业,显现出数字经济的巨大乘数效应。

产业数字化,是让各个产业部门因用好数据要素而带来了产出增加和效率提升,其新增产出和效率获益构成数字经济的主战场,属于数据要素给农工服三大产业赋能,即数据要素×农工服三大产业

12.数据的幂数性(变革性)

被称为“数字化预言家”的尼古拉·尼葛洛庞帝在《数字化生存》一书写道:“从原子到比特的转变是不可逆转和无法阻挡的。因为变化是指数级的,即昨天的微小差异明天就很可能产生令人震惊的结果。”

每个行业,都在被数据解构和重构,都在优化创新,提质增效,都在产生“数据要素乘”效应。千行万业的“数据要素乘”效应,终将在社会层面相遇,相撞,相乘,爆发为社会层面的“数据要素幂”效应

笔者认为,数据要素可以改变、优化、推高、升级社会文明层级,创建并升维人类首次出现的数字文明

对数据要素的一个典型操作,是把物理实体的形、态、演变规律、关联关系等,以数字孪生的形式,精准映射到数字空间。

杨学山教授在为笔者所著《机·智》一书作序时写到:“生物智能基于遗传基因而延续,人类智能的各种产物和成果基于各种工具和记录的信息而传承。智能时代的传承和延续,与生物智能和人类智能的结晶相比有何特征?如果数字孪生超越产品的生命周期,这个特征就是数字孪生,数字孪生是智能时代智能的遗传基因。显然,数字孪生是可以跨越产品生命周期的。”

14.数据的脆弱性

在数据要素的生成、存储、传输、应用等不同环节的时空背景中,任何一个环节都会出现影响数据安全的问题。

基于数据的无损拷贝、不可控传播属性,数据必须通过企业制度的严格规定加上必要的技术手段做好预先防范,将数据严格地控制在企业许可范围内使用,否则一旦数据出了企业掌控范围,就是失控或失密,可能造成难以估量的损失。

彻底解决数据安全性问题,要在数据要素本身做文章,要在技术上做出重大创新,彻底改变数据的无损拷贝、不可控传播属性。笔者的基本设想是,在数据内植入特殊软件而形成新的数据构件,以不可篡改条件设置、控制数据的每一个属性,如控制阅读次数,只看一次(“阅后即焚”),还有谁能看,谁能复制,谁能编辑,什么时空条件能收发等,由改变数据属性而确保数据安全。

15.小结

数据要素具有包括表征性、智能性、生命周期性、创新性、穿透性、复用性、洞察性、资产性、乘数性、幂数性、传承性、脆弱性在内但是不限于此的十二种特性。深刻认识数据要素的多种特性,是做好新型工业化建设的技术前提,是实现数字化转型的必备功课。

数据要素是建设新世界的新维度。数据要素,从此世间不可或缺。


 

[1]赵敏,朱铎先,刘俊艳.人本:从工业互联网走向数字文明[M].北京:机械工业出版社,2023-2.

[3]朱铎先,赵敏.·智:从数字化车间走向智能制造[M].北京:机械工业出版社,2018-10.

图片