助力AI数据标准化体系建设 云测数据从实践者向赋能者进化
来源:
王小琉 自媒体号
日期:2022-05-19
责编:
殷绪江
近日,中国信通院发布了全国首个AI模型开发管理标准——《人工智能研发运营一体化(Model/MLOps)能力成熟度模型第一部分:开发管理》。本次标准由中国信通院和人工智能产业发展联盟AIIA牵头组织编写,联合金融企业、运营商、领先科技企业、创新企业等30余家单位从准确性、完备性、普适性等维度共同编制标准。作为首个《人工智能研发运营一体化(Model/MLOps)能力成熟度模型》系列标准,这填补了国内外机器学习项目开发管理标准的空白。
值得注意的是,专注于高质量场景化的人工智能训练数据服务厂商——云测数据受邀与百度、华为、京东等30余+业内知名企业共同参与了该系列标准的制定工作。该标准从需求管理、数据工程和模型开发等3个能力子域切入,包括10个能力项和28个能力子项,对机器学习开发管理过程提出了五个级别的能力要求,分别为基础级、专业级、优秀级、卓越级和领航级。同时该标准从模型全生命周期治理等角度助力为企业中各类角色高效协作提供了指导意见,可以帮助企业提升AI研发运营效能,赋能业务价值提升,促进企业智能化转型。
作为人工智能数据服务厂商的代表,云测数据主要参与的该项标准的关键一环—— “数据处理”部分。根据标准的介绍,数据处理包括数据预处理,数据标注和数据管理版本等三个部分。在数据处理分级要求方面,数据标注能力子项分级要求一共分为五级,覆盖了人工开展数据标注,使用离线标注工具对视频、图像等数据进行标注,具备智能化数据标注能力等内容,而且这些能力按照要求都需要层层递进。
众所周知,作为人工智能产业的内部驱动力,数据、算法和算力三大要素对人工智能技术的升级发展一直至关重要。以数据为例,由于人工智能技术以有监督学习的模型训练方式为主,在产业蓬勃发展的背后,数据作为技术发展的基石,不断发挥着越来越重要的作用。数据精准程度、数据维度和样本复杂性的等角度提升AI训练数据的价值,可以最大限度地提升人工智能推进落地的效率。其推动行业标准化工作的建设为公司级AI算法生态提供了宝贵的数据价值,可以赋能政府和企业实现ModelOps应用落地,助力政府和企业数智化升级。而另一方面,能将在工作与实践中探索具有共享价值的经验,为促进相关规范标准化贡献一份自己的力量已并非易事。参与《人工智能研发运营一体化(Model/MLOps)能力成熟度模型第一部分:开发管理》的编制也从侧面也佐证了云测数据行业的影响力与实力所在。
以高质量+场景化规范AI数据服务未来发展
随着国家政策的倾斜和5G等相关基础技术的发展,中国人工智能产业进入快速增长阶段,AI领域专业化和细分化程度将进一步提升,人工智能广泛应用的商业化落地阶段来临。在人工智能概念热度和巨大的市场前景背后,一个成功的AI应用势必更多的来自于精准大量的训练数据。尤其当AI用户对于AI数据标注质量的要求越来越高、越来越精细化和专业化,诸如自动驾驶、工业制造等智能应用场景越来越复杂,因而,高质量、精细化的数据将直接影响未来AI的工程化实践。
作为人工智能数据服务领域头部代表厂商,云测数据在早期就已关注到AI数据服务的需求缺口和潜在的应用市场,立足高质量、场景化的AI训练数据服务,率先形成AI训练数据的“采、标、管、存”一站式服务,实现了从“数据原料”到最后的“数据成品”全链条打通并通过数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值,为人工智能场景化落地输送更多数据支撑。
当下,很多新技术正在全链条的重塑产业生态的每一个环节。对于新的技术趋势的理解需要跨部门、跨公司、跨领域的协作,环环相扣,步步衔接。这是一个共同进化的过程,如同生物进化一样。而这一点也体现在云测数据身上,目前,云测数据深度合作伙伴覆盖了汽车、手机、工业、家居、金融、安防、教育、新零售、地产、生态系统等行业。
疯狂扩充“朋友圈”之际,云测数据也在覆盖尽可能多的AI客户的不同需求,满足场景要求多样化、数据标注复杂度提升和标注精度更高的AI数据处理需求,从源头提升数据准确率和适用性,为AI企业赋能。
在云测数据的构想中,在保障数据安全与交付效率之外,保证数据的精准度、场景化,才能真正帮助企业打造数据核心壁垒。而这场规范行业未来发展的进阶过程,也让云测数据自身的角色也由此完成从实践者到赋能者角色的华丽蜕变——不仅仅是AI数据服务的提供商,而是能支撑业务与应用数智化需求,规范AI数据行业发展、长远赋能企业创新的伙伴。
相信接下来,云测数据也会持续投入,在不断丰富自身能力建设和生态建设的同时,也将以硬核实力叩开AI数据服务的新未来之门,成为助力政府和企业数智化升级征程上的长期赋能者。