“数·算·网”交融发展暨粤港澳大湾区(南山·前海)算力就业定约第一期调换洽商会近日在南山举行。会上,深圳数据往还所发布了大模子锤真金不怕火数据门道图,并迎阿盛开算料定约发布500个垂直行业多模态算料集。
会上,深圳数据往还所(以下简称“深数所”)东说念主工智能行业把握王吴越进行了主旨发言,并展示了深数所助力粤港澳大湾区东说念主工智能锤真金不怕火场建立的行业践诺。
王吴越暗意,在数字经济时期,“数据身分×”与“东说念主工智能+”成为鼓舞新质出产力的双轮初始,共同引颈着经济社会的朝上与发展。数据当作一个高效的“乘法”因子,草率与不同业业结合,显耀升迁行业的出产达成或篡改才气,而东说念主工智能手艺则通过“加法”容颜为传统产业带来渐进式的检阅和优化,两者互相交汇,共同成为数字经济发展的双翼。
王吴越先容了以数据为中心的东说念主工智能(Data-Centric AI)发展理念并发布了大模子锤真金不怕火数据门道图。深数所将按照大模子期骗的不同阶段(锤真金不怕火、推理、调优),有的放矢地提供数据源,使得国产大模子厂商“寻数有路”。
本日,深数所与盛开算料定约迎阿发布了由37家不同的数据商提供的、首批500个东说念主工智能大模子高质地锤真金不怕火数据集,涵盖12个“数据身分×”范围、3家说念外数据商、7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等)。本批数据集初度集聚了来自中国欢畅局、中国知网、中译语通、万邦同和、微梦数据(新浪微博)、前海数据、海天瑞声、拓尔念念、数据堂、聪惠芽、网智天元、柏川数据、确信科技等数据商的数据集当作大模子算料。其中大部分算料为寰宇首发。
会上,深圳数据往还所公开了高质地数据集的信得过流畅渠说念。改日,深数所将坚执篡改引颈,为国产大模子厂商提供燃料,并联袂大模子厂商在数据身分×重心行动范围共建垂直行业大模子数据期骗。