今天,數據標註基地先行先試現場會在成都舉行。我國七個數據標註基地資料標註規模再創新高。七個資料標註基地分別位於四川成都、遼寧瀋陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,資料標註總規模達17282TB,相當於中國國家圖書館數位資源總量的6倍左右。目前已形成醫療、工業、教育等產業的高品質資料集335個;賦能121個國產人工智慧大模型研發;引進及培育標註企業223家;標註從業人員達5.8萬人;帶動數據標註產業相關產值超過83億元。

資料標註是將資料添加標記、說明、解釋、分類和編碼的過程,是提升人工智慧演算法、模型核心能力的關鍵環節。
國家數據局表示,未來將進一步暢通數據採集、標註、人工智慧應用產業鏈,重點推動工業、金融、醫療、交通、教育等幾大領域的高品質數據集建設,促進數據標註產業高品質發展。