中共四川省委台灣工作辦公室
四川省人民政府台灣事務辦公室
四川線上記者 段玉清 薛維睿
人工智慧火了。但要讓其更聰明、更懂人類,就要採集更多數據,為人工智慧“劃重點”。隨後訓練師將這些數據“投喂”給人工智慧,對其進行高效訓練。其中,“劃重點”的過程就是數據標注。
如何為人工智慧“餵養”更多高品質數據?未來又將如何在數據標注産業發力?3月20日,由工業和資訊化部電子第五研究所、中國行動通訊集團資訊技術中心、航太科工網路資訊發展有限公司聯合主辦的2025年數據標注産業供需對接會(成都)上,相關專家、業內人士進行探討。
發佈産業圖譜
這些成都企業、機構可為人工智慧製作數據“營養餐”
已建成7萬平方米産業載體,包括數據標注産業聚集區、“數據標注+”産業聚集區、産業服務機構聚集區……會議前,與會人員前往成都市新津區,到剛開園不久的成都市國家數據標注基地牧山園區進行參觀。
“幾天前,園區還現場發佈四川方言高品質數據集、四川方言大模型、四川方言AI+政務服務熱線應用等。”成都市新津區數據局相關負責人介紹。
其實,不光這一園區。隨著技術的不斷進步,人工智慧對高品質數據的需求越來越大。
去年,我國發佈首批數據標注試點基地,包括成都在內的7個城市入圍。同年,成都將數據標注産業納入人工智慧産業規劃佈局,積極推動數據標注産業生態構建、能力提升和場景應用。
除了政策優勢,業內人士介紹,成都相關高校院所多,同時四川還有12款已備案或已登記的大模型。“這些都為成都發展數據標注産業提供了人才和市場優勢。目前,成都高新區、新津區、金牛區以及彭州市等地都在積極發展數據標注産業。”
如何為這些數據標注企業尋找更多合作機遇?當天現場發佈成都市數據標注産業圖譜,全景呈現成都數據標注産業發展現狀。
該圖譜匯聚數據採集、數據標注服務平臺等12個數據標注産業細分賽道,收錄成都全市100余家行業相關重點企業、機構,清晰展示成都市數據標注産業的系統佈局和發展現狀。“通俗地説,圖譜中的企業、機構都可為人工智慧製作數據‘營養餐’。”成都數據集團相關負責人介紹。
值得一提的是,在大模型及數據標注領域,圖譜還收錄輊崖鐸鋒科技、向己科技、索貝運維數位等22家成都企業。這些企業在智慧駕駛、智慧金融、智慧製造等領域形成了特色化標注能力。
同時,成都數據標注公共服務平臺——“蓉數·智慧數據標注生成管理平臺”已完成一期建設,並服務成都市國家數據標注基地牧山園區多個數據標注企業,構建數據集超1T。”成都市數據集團相關負責人表示。
尋找供需“合夥人”
現場達成12億元意向訂單
“以前主要為北京的企業做數據標注,現在首批6家杭州數據企業已入駐保定。”會上,河北省保定市數據局局長張闖分享了數據標注産業從京津冀走向全國的案例。
作為7個數據標注試點基地之一,河北保定已構建“數據金庫-數據産品共用工廠-數據流通交易平臺”全鏈條服務體系,同時“杭州數商産業(保定)基地”已經正式揭牌運營。
同樣,成都數據標注産業也在積極“走出去”。“成都數據標注産業不僅服務本地市場。”業內人士表示,目前,成都的高品質數據集、大量的中文語料集可為國內大模型訓練提供更豐富充足的語料。
記者注意到,當天對接會匯聚了入選首批數據標注試點基地7座城市的眾多企業、科研機構及地方政府,涉及交通、金融、醫療、網路安全、科學、製造、政務等重點行業領域,簽約12億元數據標注業務合作意向訂單。
“此前,長沙已向全國徵集標注基地建設‘合夥人’71家。” 長沙市數據局黨組書記、局長周娟平介紹,“音視頻文創産業是長沙的特色。目前,長沙已形成文旅數據集1萬餘TB。同時,湖南大數據交易所也已上線數據集交易專板,上架省內外數據集産品284個。成都文旅資源豐富,希望能與成都相關機構、企業進一步合作,互通有無,協同發展。”
來源:四川線上
主辦:四川省人民政府台灣事務辦公室
華夏經緯網路版權所有