在2月14日舉行的2025海淀區經濟社會高品質發展大會上,北京市高端數據標註示範基地正式揭牌成立。
該基地的建立,旨在推動高品質數據標註產業的集聚發展,助力數據要素產業生態體系的構建,進一步鞏固北京市在人工智慧和數位經濟領域的領先地位。
據了解,為積極響應國家關於資料要素市場化配置改革的號召,在北京市政務服務和資料管理局指導下,海淀區政府攜手火山引擎,擬在東昇科技園三期(東畔科創中心)建設全國首個高端資料標註示範基地-北京市高端資料標註示範基地。

海淀區作為北京市乃至全國的人工智慧、數位技術和科技創新高地,具備發展高端數據標註產業的顯著優勢。目前,海淀區擁有全國高新技術企業超過1萬家,形成了軟體與資訊服務、科技服務、人工智慧、智慧製造、醫藥健康等五大千億級產業群聚。其中,人工智慧企業數量達到1,300餘家,佔全市的七成以上。此外,海淀區備案的大模型數量達74款,同樣佔全市的七成以上。
記者從區數據局了解到,本次揭牌成立的高端數據標註示範基地具有四大亮點,分別是:形成數據要素產業生態示範引領、支撐數據要素流通賦能產業創新、加速高品質數據集開發利用、培育數據工作高級複合人才。
01形成資料要素產業生態示範引領方面
由於資料標註產業是資料要素產業的核心領域,因此高階資料標註示範基地透過遴選、重點扶持高階資料標註領域具有突顯技術優勢與創新模式的企業,樹立產業標桿,可以帶動產業上下游協同發展,形成集聚效應,進而帶動輻射全國。
02支撐資料要素流通賦能產業創新方面
透過打造高階資料標註平台與工具服務,高階資料標註示範基地可整合政府、企業、社會等多源資料融通共享,拓寬資料流通管道,為資料供需雙方提供便利、高效率的對接服務,加速資料要素市場化配置改革。
03加速高品質資料集開發利用方面
高階資料標註示範基地可引入先進的自動化資料擷取設備、智慧化標註工具,結合機器學習演算法優化資料清洗、分類等流程,提升資料集開發的品質與效率。
04培養數據工作高級複合人才方面
高階數據標註示範基地為高階數據標註產業人才提供跨領域知識融合的實訓平台,參與複雜多元的數據標註計畫中,理論結合實作培育高端複合人才。