发布 | 2024数据智能十大关键词
2024年6月19-20日举行的“2024数据智能大会”主论坛上,中国信息通信研究院云计算与大数据研究所所长何宝宏发布了 “2024 数据智能十大关键词” 。
01 高质量数据供给,数据智能实践的重要基础
首先,企业作为产业运行的主体,在数据供给方面承担了重要作用。其中,数据要素型企业拥有大量数据,是数据市场的主要供给方,需要在安全合规的基础上,实现数据整合贯通与流通赋能。数商具备专业技术能力,是数据市场的服务方,需要持续创新数据技术并挖掘数据应用,不断开拓新的业务模式以适应市场变化。
此外,提高数据质量的一大关键还在干技术创新与模式优化,针对性的技术能够更有效的识别、提升数据供给的质量,比如通过应用合成数据、自动化智能化的数据标注建设高质量数据集,并通过建立数据质量全流程评估标准来满足大模型对高质量数据的需求。
02 面向人工智能的数据治理,提升人工智能效果的关键
通用人工智能的发展,使得数据与算法的边界更加模糊,数据嵌入到了模型的生成中,数据质量与安全直接影响模型结果,通过对人工智能所需数据进行治理,可以有效的提升人工智能应用效果与研发效率,提升安全与隐私保护水位。 然而面向人工智能的数据治理刚刚开始,面临诸多挑战,需要关注四个方面的问题,一是方法论的缺失,二是数据质量的评价和提升,三是数据安全与隐私保护,四是数据伦理。
03 数据资源估值与入表,助力数据价值显性化
自2023年8月以来,随着《企业数据资源相关会计处理暂行规定》、《数据资产评估指导意见》等相关政策发布,国家积极引导企业开展数据资源估值与入表工作,促进企业准确把握数据价值脉络流向,提高数据赋能程度,充分参与数据要素市场建设。
数据资源估值重在感知和量化数据价值,数据资源入表关键在于精准核算数据相关的财务信息。在实践中,按照“先有价值,再有交易”、“先有业务,再算财务”的思路,数据资源估值是入表的基础,为入表前的历史成本归集、预期收益分析等确认条件提供重要依据。
2024年是数据资源估值和入表的“起步年”,以央国企为代表的机构逐步探索构建数据资源估值体系,并同步开展数据资源入表试点工作。据统计,今年第一季度已经有20余家上市公司披露了数据资源入表情况。
04 数据智能平台,支撑上层数据与模型开发,推动Data+AI深度融合
数据智能平台在数据平台的基础上提供了AI模型开发全链路能力,同时在AI的赋能下,平台整体的管理能力、安全能力和资源利用效率得到提升,推动 Data+AI进一步融合。当前, Databricks 、Snowflake、阿里云、华为云等国内外大数据厂商均推出具备数据存储、计算、开发能力的Data+AI解决方案,具备多模数据统一存储、数据编排和缓存加速海量资源统一管理、多模态计算引擎、统一安全管理、统一模型管理等能力,为上层数据开发及模型训练提供支撑。
05 索增强生成(RAG),数据检索助力企业大模型高质量落地
RAG是一种通过数据检索来改进模型内容生成效果的技术方案,通过引入来自外挂向量数据库、知识图谱或网络的数据,对原有问题进行补充增强后再输入给大模型,有效缓解大模型的幻觉问题,提高知识更新速度,增强内容生成的多样性和可追溯性。 现阶段RAG技术已融入最 常见的大模型应用架构,大大降低企业在大模型训练、微调方面的资源投入,为企业大模型落地提供了更加稳定、可控、低成本的思路。
06 “大模型+”,大模型快速落地,催生数据智能应用新范式
数据层面,大模型可以准确理解用户数据分析需求,将自然语言转化为可执行的数据査询语句和分析任务,降低数据使用门槛。知识层面,大模型可以高效完成知识的归纳、加工、解读,并通过外挂知识库为用户提供更加精准、高效的知识检索服务,极大的提升了知识管理和利用的效率。创意层面,大模型技术正推动辅助设计向智能生成的阶段演进,大模型所具备的文字、图片、代码、音视频生成能力为设计与研发带来无限可能。决策层面,大模型驱动的智能体能够模仿人类的决策过程,通过与环境的感知交互来规划决策并执行,很大程度上提高了决策的效率和自动化程度。
07 营销数智化,企业数据智能价值释放的头号场景
数智化技术为营销带来了诸多革新和突破。一是赋能决策:精准客群定位、敏捷预测等技术的应用,让企业能够更精准地把握市场脉搏,更高效精确地做出业务决策。二是增强体验:通过用户画像实现精细化的用户体验管理,利用大模型技术定制化生成用户感兴趣的内容,在营销的同时兼顾用户体验。三是驱动创新:从社交媒体运营到视频运营,再到内容运营和直播运营,营销数智化已经是推动业务创新的重要动力。
08 数据安全风险评估,场景化数据安全评估备受关注
随着数据要素市场化发展的持续深入,尤其是在数据驱动的智能化场景应用逐步落地过程中,数据安全也正面临着更加严峻的挑战。新技术的应用在带来新机遇的同时也将引入新的风险。数据安全风险的识别、评估与应对是数据处理者面临的最紧迫问题,也是我国监管部门、产业多方高度重视与关注的焦点问题。国家在标准化工作、实践指引等方面做出了相应探索,众多行业领域发布了数据安全风险评估的管理要求与实施指导。
09 数据安全运营,智能化时代到来,为数据安全运营带来挑战与机遇
智能化时代的到来,数据安全运营也迎来了新的机遇与挑战。一方面,A技术赋能数据安全运营智能化。通过人工智能等技术,对数据安全运营工作进行智能分析、预测和响应,不仅能够提高运营的效率和准确性,还能帮助企业构建更加完善的安全防御体系。另一方面,A技术的引入可能给企业带来新的数据安全风险,也可能引发合规管理、责任划分等新问题。
10 数智素养,推进数字人才发展,赋能企业数智化转型
随着国家大力推进数字经济、数字中国的决策部署,各行各业对数字人才的需求也愈发迫切,据《产业数字人才研究与发展报告》指出,当前数字人才总体缺口约为2500至3000万。2024年人社部、中组部、中央网信办、工信部等部委联合发布《加快数字人才培养支撑数字经济发展行动方案》,明确要求扎实开展数字人才育、引、留、用等专项行动,增加数字人才有效供给。