本報北京7月22日電(記者王云杉)記者從國家數(shù)據(jù)局獲悉:國家數(shù)據(jù)局指導(dǎo)合肥、成都等7個城市建設(shè)數(shù)據(jù)標注基地,先行先試探索數(shù)據(jù)標注產(chǎn)業(yè)發(fā)展經(jīng)驗,截至今年上半年,7個數(shù)據(jù)標注基地建設(shè)數(shù)據(jù)集524個,服務(wù)大模型163個。
高質(zhì)量數(shù)據(jù)集是經(jīng)過采集、加工等數(shù)據(jù)處理,可以直接用于開發(fā)和訓(xùn)練人工智能模型,能夠有效地提升模型性能的高質(zhì)量數(shù)據(jù)集合。
據(jù)了解,國家數(shù)據(jù)局著力構(gòu)建“部門協(xié)同、央地聯(lián)動”的工作機制,全面加速高質(zhì)量數(shù)據(jù)集建設(shè)和應(yīng)用落地,組織開展生態(tài)培育專項行動,主要包括三個方面:一是組織開展高質(zhì)量數(shù)據(jù)集典型案例征集和示范推廣,挖掘醫(yī)療、工業(yè)、交通等重點領(lǐng)域標桿實踐;二是定期舉辦技術(shù)交流活動,圍繞數(shù)據(jù)標注、合成、高質(zhì)量數(shù)據(jù)集建設(shè)方法論等開展深度研討;三是搭建常態(tài)化供需對接平臺,促進數(shù)據(jù)供給方、技術(shù)提供方、場景應(yīng)用方精準匹配。