说说数据标注这件事
政府网站
转自:韶关发布
或许你曾感到好奇,当你打开百度地图,用粤语说出“导航去韶关东站”,人工智能是怎么听懂的?家里的智能门锁如何识别出谁是主人,谁是陌生人?智能驾驶又是如何准确判断路况的?
答案就在“数据标注”这个人工智能训练的关键环节里。据悉,百度将与广东韶关数据产业投资发展有限公司积极开展深入广泛的持续性合作,成立百度智能云(韶关)人工智能基础数据产业基地(以下简称为“百度智能云韶关数据产业基地”)。这将为韶关打造粤港澳大湾区数据标注基地,推动人工智能产业高质量发展注入强劲动能。
数据标注:人工智能的老师
数字经济时代,算力是核心生产力,算法是重要生产工具,数据是关键生产资料。数据标注作为数字经济产业链的基础服务商,将进一步筑牢数字经济产业链条。
“人工智能就像一个学生,数据标注师带领它们识别万物。举一个最简单的例子,一开始百度地图的人工智能是听不懂粤语的,通过数据标注师把粤语转化成机器能够识别的数据要素,让机器学习、理解和利用这些数据进行模型训练,人工智能才能听懂不同语速、语调的粤语。”百度智能云韶关数据产业基地相关负责人告诉记者,数据的数量和质量很大程度上决定了大模型的“智商”,没有数据标注,人工智能就无法在智能化场景中应用、迭代。
不仅限于语音类标注,在智能驾驶领域,数据标注帮助自动驾驶系统准确识别道路上的信号灯、交通标志、车辆、行人等各种对象,助力自动驾驶更加安全高效;在智能安防领域,数据标注为城市安防扩大了现有的系统感知范围,数据标注师通过对车辆、行人、道路标识、车道线等的标注,帮助安防系统在不同环境中追踪目标更快速、更准确……
随着人工智能的技术不断进阶,对数据的要求也变得更加精细化、专业化,以数据标注为代表的基础数据服务连结上游数据来源方和下游人工智能算法研发方,其发展和服务水平直接决定了人工智能产业的发展速度和质量。引进百度等行业龙头企业,打造粤港澳大湾区数据标注基地,正是韶关推动数据中心集群建设以及人工智能产业发展的关键一环。
乘“数”而上筑基新质生产力
据了解,百度智能云韶关数据产业基地位于韶关市粤港澳大湾区数据应用产业园,建设规模约2000平方米,计划于今年6月底启动运营,现场可容纳办公人员200多人,预计数据标注相关产值将达到千万元以上。
粤港澳大湾区数据应用产业园。张伟杰 摄
过去两年,韶关在国家“东数西算”战略风口乘风而上,围绕数据中心集群建设大力布局新兴产业,广东省第一批数据要素集聚发展区在韶关设立,为数据要素相关产业发展塑造良好生态。
“韶关具备丰富的人力资源,营商环境优越,充满生机活力,当地政府重视数字经济,重视新质生产力,为基地的落成提供了高质量的支撑。”百度智能云韶关数据产业基地相关负责人表示,韶关展现了大力发展人工智能产业的决心和行动力,这也为企业在韶发展注入了强大动力和坚定信心。
同时,数据标注作为高附加值产业,将有力推动韶关数据服务产业集聚和数据人才培育。“依靠业内领先的规模效应优势和资源整合优势,百度智能云可充分发挥龙头企业的带动效应,助力区域打造产业生态。”百度智能云韶关数据产业基地相关负责人表示,百度将通过吸引、培训大量数据标注师及行业相关人才,孵化科技服务领域初创企业,逐渐形成上下游及周边产业集聚效应,实现数实融合,助推韶关形成从基础支撑、核心技术到行业应用较为完整的人工智能产业链。
“得数据者,得人工智能”。作为人工智能产业的关键一环,数据标注已经潜移默化地影响着我们的工作和生活。未来,随着粤港澳大湾区数据标注基地的建立和完善,韶关将依托该基地,培育构建集数据采集、数据清洗、数据标注、数据交易、数据应用为一体的基础数据服务体系,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,打造成为全省乃至全国的数据标注试点样板,不断挖掘激活数据要素价值,加快培育发展更多新质生产力。
文字:韶关日报全媒体记者 熊恬
部分来源:视觉中国
编辑:陈艳 校对:陈忆文
责编:冯春华