SERVICE PHONE

363050.com
NEWS 区块链娱乐
你的位置: 首页 > 区块链娱乐
【数字安徽新世纪】数字Casino USDT - 全球热门USDT游戏娱乐平台,安全稳定,极速出款新力量 北大特聘研究员徐克付:工业高质量数据集的建设与流通利用

发布时间:2026-01-02 17:35:39  点击量:

  Casino USDT 提供优质的加密数字娱乐体验,支持 USDT、比特币等数字资产参与游戏。平台安全稳定,极速出款,无门槛畅玩热门桌面游戏、电子竞技、体育竞猜等!立即注册,领取专属福利!casino usdt,USDT娱乐,加密货币游戏,区块链娱乐,数字货币投注,虚拟币游戏,去中心化平台,USDT竞猜,热门电子游戏,体育赛事竞猜在数字经济加速演进的当下,数据作为新型生产要素,已深度融入工业生产、分配、流通等各个环节,工业高质量数据集作为人工智能与实体经济融合的核心载体,成为工业领域数字化、智能化发展的重要基础。

  近日举行的2025“数字新力量”全国行活动(北京站)暨首席数据官制度与高质量数据集建设交流会上,北京大学大数据分析与应用技术国家工程实验室特聘研究员徐克付发表主题报告《工业高质量数据集的建设与流通应用》,基于政策导向、行业需求、技术创新及实践应用,系统梳理工业高质量数据集的发展现状、流通痛点及可信数据空间的构建路径,为行业高质量发展提供参考。

  近年来,我国高度重视数据产业发展,密集出台多项政策文件为高质量数据集建设保驾护航。

  2024 年 12 月,国家发展改革委、国家数据局等部门印发《关于促进数据产业高质量发展的指导意见》,首次明确 高质量数据集 概念,将其定位为人工智能与实体经济融合的核心载体。

  2025 年 2 月,国家数据局组织 27 个部委召开高质量数据集建设工作启动会,标志着我国高质量数据集建设进入系统化、规模化推进阶段。

  此外,《关于促进数据标注产业高质量发展的实施意见》、《关于促进企业数据资源开发利用的意见》以及《国家数据基础设施建设指引》等政策均提出建设行业“高质量数据集”, 数据集高质量发展成为行业发展重要目标。

  人工智能是引领新一轮科技革命和产业变革的战略性技术,也是新型工业化的重要推动力量。当前,人工智能发展正从以模型为中心转向数据与模型双轮驱动,以数据为中心的人工智能新范式成效显著,对高质量数据集的需求愈发迫切。

  与模型参数爆发同时发生的是模型训练数据集的指数式增长,从深度学习时代普遍以万为单位的训练数据集样本规模相比,当今主流语言与多模态大模型的训练数据集规模普遍达到十亿至百亿条样本乃至更高数量级。

  工业高质量数据集是通过各类工业设备及传感器采集经过加工处理的,可直接用于开发和训练人工智能模型,能有效提升模型性能的数据的集合。

  它是工业智能模型实现预测、推理、生成等核心要素,蕴含工业生产、运营、管理等各环节的关键信息,直接决定模型的性能上限与应用价值,是工业领域数字化、智能化发展的重要基础。

  全球主要工业强国均在工业高质量数据集建设方面积极布局,形成了各具特色的发展模式:

  随着人工智能技术的快速发展,不同应用领域对高质量数据集的需求呈现出层次化、专业化的特征。根据AI系统能力的发展路径和认知层次,高质量数据集的应用需求可以划分为基础认知层、场景理解层、行动规划层三个递进层次。从建立世界的基本认知,到解析复杂场景关系,再到规划执行具体行动,每一层都承载着不同的学习目标和能力要求。

  基础认知层聚焦 这是什么 的核心问题,以基础表征与模式识别为应用目标,需要海量覆盖、分布合理的数据,典型应用包括 GPT/BERT 语言模型、CLIP 多模态模型等;

  场景理解层围绕 这里发生了什么 展开,旨在实现结构解析与深层理解,要求数据精细化标注、语义丰富且逻辑一致,适用于机器阅读理解、目标检测等场景;

  行动规划层聚焦 怎么做 的实践问题,以推理决策与策略执行为核心,需要推理链完整、决策明确的数据,应用于数学推理、代码生成、机器人控制等领域。

  工业数据集的运营推广需紧密围绕业务场景与市场需求,通过科学的价值评估、高效的供需对接、明晰的权属划分、可靠的数据流通与增效的落地应用形成价值闭环,使数据集在工业场景中达成价值实现,形成可持续的运营机制。

  在政策指引下,我国高质量数据集建设成效明显。《建设指引》中发布的数据显示,截至2025年6月,全国建设高质量数据集超3.5万个、总量超400PB。

  虽然我国高质量数据集建设在国家统筹、推进模式和应用场景方面具有独特优势,但在数据开放度、标准体系、关键技术及国际影响力等方面仍有短板,在数据供给、技术工具、标准规范、安全合规、商业模式等方面还面临困难与挑战。

  工业数据(集)流通共享对打破信息壁垒、激发创新动能和推动工业转型升级具有关键支撑作用,它能促进数据要素价值释放,深化工业互联网创新应用,推动制造业向智能化、高端化、绿色化发展。但当前数据流通面临多重痛点,主要集中在四个方面:

  ● 环境安全问题(20%):保障数据流通中不泄露、不丢失,是数据流通的基础前提;

  ● 权属责任问题(20%):数据权属界定不清、责任划分不明,制约数据流通意愿;

  ● 过程可信问题(19%):用户身份可信、处理数据的应用程序可信缺乏有效保障;

  ● 数据可控问题(17%):数据共享中的主体、时间、地点、行为及客体可控性不足。

  此外,行业数据供给方、模型厂商与用户之间缺乏相互信任的体系,导致 AI 模型在跨系统、跨行业数据整合与流通中面临困境;企业和个人因担心信息安全,不敢将隐私文档输入大模型使用,制约了数据价值的充分释放。

  为破解数据流通难题,国家发展改革委与工业和信息化部等部门先后发布了《关于完善数据流通安全治理更好促进数据要素市场化价值化的实施方案》与《工业领域数据安全能力提升实施方案(2024-2026年)》等政策指导文件,以更好统筹发展和安全,建立健全数据流通安全治理机制,提升数据安全治理能力,促进数据要素合规高效流通利用,释放数据价值。

  《关于工业大数据发展的指导意见》也强调要推动工业数据开放共享,共建安全可信的工业数据空间,并建立互利共赢的共享机制。

  为规范数据流通秩序,我国探索建立数据资源持有权、数据加工使用权、数据产品经营权 三权分立 的权属制度:

  数据资源持有权强调数据来源合规与内循环安全保障,通过数据生命周期保护技术、隐私计算及相关政策协议实现权益保护;

  数据加工使用权注重跨域管控,借助匿名技术、隐私计算、区块链等手段,在保障数据资源持有权的前提下,实现数据加工利用;

  数据产品经营权聚焦产品经营权益保护,通过加工使用权的有效管控,确保经营权不失控,同时完善相关制度规范与标准体系。

  这一制度设计为数据确权、定价、交易等核心问题提供了明确解决方案,为数据要素合规高效流通奠定基础。

  同时,在数据的跨主体流通和跨域管控问题上,行业也在积极探索以数据“可用不可见、数据不出域、不交换数据交换数据价值”的方式,促进模型语料库、知识库和数据集的跨域共享与交换。

  在数据安全流通方向,基于硬件级系统隔离和可信根构建的可信执行环境(Trusted Execution Environment,TEE)是当前的关键技术之一。

  目前,国外主流TEE技术的社区和生态已较为成熟,我国国产化芯片厂商,如海光、飞腾、兆芯、鲲鹏、龙芯中科等也在TEE方向上集中发力,自主可控的完整社区和生态已经形成,为技术落地提供了坚实支撑。

  北京大学研发了一套千卡级TEE隐私计算集群系统,可以实现数据可用不可见、数据不动模型动、保留所有权、释放使用权、数据可控可计量 。

  其目标是在不侵犯个人隐私、确保数据安全的前提下,实现数据价值的流通,成为大规模数据集实现“连接” 和“开放”的基础,满足数据采集、清洗、标注、存储等各环节的数据安全需求,保证数据产品加工过程中数据资产可用不可见。

  支持国产GPU的机密计算。与国产GPU厂商合作,开发测试国产机密计算功能的GPU加速器,保证未经授权的实体无法查看或使用应用程序代码和数据,确保数据机密性。随着GPU的产品的迭代更新,其性能、算力、处理能力等多方面得到提升,也为可信执行环境技术的可落地性和可实践性带来突破性进展;

  支持多类型计算。支持通用计算、隐私计算与 AI 计算,适配智算中心处理海量数据的需求,符合国家数据要素化发展要求;

  支持数据的大规模处理。可以支撑百亿、千亿级大规模数据集的流通与利用,并保证密钥、训练数据和结果集的绝对安全性。

  根据《可信数据空间发展行动计划(2024—2028 年)》,可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。其核心是3种能力:可信管控能力、资源交互能力和价值共创能力。

  基于北京大学可信数据空间解决方案,可以实现数据的分类分级、资源管理、确权登记、大数据隐私保护加工处理、数据交易、监管运维等。

  可以实现对可用不可见数据的加工和产品开发,基于TEE的可信数据空间以解决数据挖掘和隐私保护之间的矛盾,分离数据使用权与所有权,以“逻辑封闭,进出审计,内部自由”为特点,降低跨域数据价值释放门槛。

  还可以实现数据的可控可计量,可信数据空间通过使用区块链技术,实现追踪和记录数据来源、流动路径、变化历史以及数据当前状态的能力,保证操作行为记录真实、不可纂改,也是数据计费与定价的基础。

  徐克付期待,能通过将技术与场景结合,构建并推动可信数据空间产业生态建设,实现数据跨行业跨区域的流通。

  江苏金旺智能科技有限公司是一家专业从事农化制剂装备链数智工厂(智能加工、智能包装、智能仓储、数据集基地、数字空间平台)的研发、制造、销售、服务于一体的智能装备制造服务型互联网平台、可信数据空间示范公司。

  公司注册资金2222万,占地面积100亩,各类专业技术人员超300人。金旺智能目前已经获得国家高新技术企业、两化融合企业、专精特新小巨人企业、数字化转型示范企业、大模型场景案例企业、全国优秀CIO企业,江苏省农化包装机械工程技术研究中心,江苏省企业技术中心、江苏省著名商标、江苏省服务型制造示范企业、常州市市长质量奖等荣誉和称号。

  金旺智能近20年来一直专注于农化行业数智化发展,通过多年的努力,已与安徽众邦生物、安徽华星、安徽尚禾沃达、上海生农、广西田园、河北威远、山东侨昌、四川沃野、富美实、清源农冠等国内企业达成战略合作关系。

  T/AIITRE 10001《数字化转型 参考架构》将数字化转型定义为:“数字化转型是深化应用新一代信息技术,激发数据要素创新驱动潜能,建设提升数字时代生存和发展的新型能力,加速业务优化、创新与重构,创造、传递并获取新价值,实现转型升级和创新发展的过程”。

  首席数据官(Chief Data Officer,简称CDO)是统筹管理数据资产、系统开展内外部数据开放共享和价值开发的首要负责人,是推动以数据为核心要素的创新转型、合法合规开辟价值增长新空间的关键领导角色。CDO制度是包括以CDO为首的数据人才队伍的岗位设置、职能职责体系、能力素质要求、选用育留机制等在内的整套制度体系,是一项复杂的系统性创新工程。企业推行CDO制度,有利于统筹推进数据全生命周期管理,挖掘数字资产价值,激活数据要素对于企业转型创新的驱动作用,保障规范健康运营,提升数字时代企业核心竞争力。

  根据GB/T 23011《信息化和工业化融合 数字化转型 价值效益参考模型》,按照业务创新转型的方向和价值空间大小,数字化转型带来的价值可分为三个方面:生产运营优化、产品/服务创新和业态转变。

  围绕价值体系创新和重构,数字化转型主要包含五项重点任务,可概括为5个“转”,即“转战略”、“转能力”、“转技术”、“转管理”、“转业务”。

  依据数字化转型成熟度模型,数字化转型可分为规范级、场景级、领域(企业)级、平台(产业链/供应链)级、生态级等五个螺旋式跃升的发展阶段,并按照转型的广度和深度将五个发展阶段细分为十个水平档次。

  价值导向。企业本质上是一个创造、传递和获取价值的系统。数字经济时代,企业需要以价值为导向,通过数字化转型重构价值体系,促进业务、技术共同围绕价值开展协同工作和优化,拓展价值增量发展空间,满足高质量发展新要求。

  线。随着从工业经济时代向数字经济时代的演进,未来企业的核心能力将转变为数字能力,企业应将能力与资源、业务剥离,能力更动态、更柔性、更依赖数据和知识的更新,更加能够支持业务模式和业态创新。

  数据驱动。数字经济时代,响应不确定性需求形成的动态、开放组织生态以及相关的个人或团队是主要经济单元,数据成为资源汇聚的主导要素,经验技能(尤其是不确定性部分)的承载、传播和使用主要靠人工智能。返回搜狐,查看更多

地址:Casino USDT永久网址【363050.com】  电话:363050.com 手机:363050.com
Copyright © 2012-2025 Casino USDT 版权所有 非商用版本 ICP备案编: