智能時(shí)代,數(shù)字生產(chǎn)力正在逐步成為推動(dòng)經(jīng)濟(jì)發(fā)展和社會(huì)進(jìn)步的核心引擎。當(dāng)下正值ChatGPT引發(fā)的“千模大戰(zhàn)”打響,大模型在辦公軟件、教育、電商、管理軟件、財(cái)稅管理、金融、工業(yè)自動(dòng)化轉(zhuǎn)型等眾多垂直行業(yè)領(lǐng)域的應(yīng)用探索,為各行各業(yè)帶來(lái)新的效率革命和體驗(yàn)升級(jí)。隨著北京市政府發(fā)布《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)》,緊貼通用人工智能(大模型)產(chǎn)業(yè)化發(fā)展提出的專項(xiàng)措施,打響了地方大模型競(jìng)賽的第一槍。
2023年5月17日,習(xí)近平總書記在聽(tīng)取省委省政府工作匯報(bào)時(shí)強(qiáng)調(diào):著眼全國(guó)大局發(fā)揮自身優(yōu)勢(shì)明確主攻方向、奮力譜寫中國(guó)式現(xiàn)代化建設(shè)的陜西篇章。陜西要實(shí)現(xiàn)追趕超越,一是必須在加強(qiáng)科技創(chuàng)新、建設(shè)現(xiàn)代化產(chǎn)業(yè)體系上取得新突破。二是著眼國(guó)家戰(zhàn)略需求和國(guó)際競(jìng)爭(zhēng)前沿,實(shí)施國(guó)家重大科技項(xiàng)目,攻克更多關(guān)鍵核心技術(shù),打造更多“國(guó)之重器”。三是強(qiáng)化企業(yè)科技創(chuàng)新的主體地位,推動(dòng)創(chuàng)新鏈產(chǎn)業(yè)鏈資金鏈人才鏈深度融合,加快科技成果產(chǎn)業(yè)化進(jìn)程。四是建好西安綜合性國(guó)家科學(xué)中心和科技創(chuàng)新中心,努力打造國(guó)家重要科研和文教中心、高新技術(shù)產(chǎn)業(yè)和制造業(yè)基地。
隨著“東數(shù)西算”的啟動(dòng)建設(shè),標(biāo)志著全國(guó)一體化大數(shù)據(jù)中心體系完成總體布局設(shè)計(jì),將提升國(guó)家整體算力水平、促進(jìn)綠色發(fā)展、擴(kuò)大有效投資、推動(dòng)區(qū)域協(xié)調(diào)發(fā)展。
在國(guó)家及省市政策引導(dǎo)與推動(dòng)下,我省構(gòu)建在數(shù)據(jù)資源匯聚利用、大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新培育、大數(shù)據(jù)公共平臺(tái)建設(shè)、大數(shù)據(jù)基礎(chǔ)設(shè)施完善、產(chǎn)業(yè)發(fā)展環(huán)境優(yōu)化以及大數(shù)據(jù)融合創(chuàng)新應(yīng)用方面取得初步成效,具備構(gòu)建大模型產(chǎn)業(yè)生態(tài)的先發(fā)優(yōu)勢(shì)。然而,問(wèn)題也十分突出:一是缺少充足的智能算力支撐,表現(xiàn)在大模型訓(xùn)練和運(yùn)營(yíng)算力成本過(guò)高、缺乏大規(guī)模并行計(jì)算工程能力、人工智能算力市場(chǎng)和服務(wù)市場(chǎng)“碎片化”加劇等問(wèn)題。二是缺少高質(zhì)量訓(xùn)練數(shù)據(jù),中文開(kāi)源高質(zhì)量數(shù)據(jù)少,特別是構(gòu)建通用領(lǐng)域大模型的百科類、問(wèn)答類、圖書文獻(xiàn)、學(xué)術(shù)論文、報(bào)紙雜志等高質(zhì)量中文內(nèi)容。同時(shí),國(guó)內(nèi)專業(yè)數(shù)據(jù)服務(wù)還處于起步階段,可用于人工智能模型訓(xùn)練的經(jīng)過(guò)加工、清洗、標(biāo)注的高質(zhì)量數(shù)據(jù)集還相對(duì)匱乏;三是缺少適合大模型研發(fā)特點(diǎn)的機(jī)制。表現(xiàn)在應(yīng)用場(chǎng)景創(chuàng)新能力不足、力量分散、資金投入不足、領(lǐng)軍人才和核心團(tuán)隊(duì)缺乏等問(wèn)題。
在上述背景下,為抓住大模型產(chǎn)業(yè)發(fā)展的歷史機(jī)遇,促進(jìn)我省經(jīng)濟(jì)追趕超越,我們建議:
一是加強(qiáng)算力資源統(tǒng)籌供給能力,夯實(shí)大模型產(chǎn)業(yè)數(shù)字新基建。通過(guò)推進(jìn)人工智能算力基礎(chǔ)設(shè)施建設(shè)和搭建公共人工智能算力服務(wù)平臺(tái)等舉措,推動(dòng)全省算力資源共享與算力設(shè)施協(xié)同,加強(qiáng)算力資源統(tǒng)籌供給能力。
二是提升高質(zhì)量數(shù)據(jù)要素供給能力,強(qiáng)化大模型產(chǎn)業(yè)數(shù)字基礎(chǔ)。通過(guò)推動(dòng)數(shù)據(jù)資源匯聚、提升數(shù)據(jù)治理能力、發(fā)展數(shù)據(jù)交易服務(wù),強(qiáng)化促進(jìn)數(shù)據(jù)要素流通和發(fā)展數(shù)據(jù)交易服務(wù)等措施,提升高質(zhì)量數(shù)據(jù)要素供給能力,強(qiáng)化大模型產(chǎn)業(yè)數(shù)字基礎(chǔ)。
三是系統(tǒng)布局大模型技術(shù)體系,持續(xù)探索通用人工智能路徑。集中優(yōu)勢(shì)力量攻克以創(chuàng)新算法及關(guān)鍵技術(shù)、訓(xùn)練數(shù)據(jù)采集及治理工具、開(kāi)放評(píng)測(cè)基準(zhǔn)及工具和基礎(chǔ)軟硬件體系研發(fā)為核心的大數(shù)據(jù)模型技術(shù)體系,持續(xù)探索通用人工智能路徑。
四是推動(dòng)大模型應(yīng)用場(chǎng)景挖掘及應(yīng)用,提升數(shù)字生產(chǎn)力。推動(dòng)大模型在政務(wù)、基層治理、安全應(yīng)急、生態(tài)環(huán)保、衛(wèi)生健康、語(yǔ)言服務(wù)等領(lǐng)域的創(chuàng)新性應(yīng)用場(chǎng)景挖掘和應(yīng)用,提升數(shù)字生產(chǎn)力。
五是優(yōu)化大模型產(chǎn)業(yè)生態(tài)發(fā)展環(huán)境,強(qiáng)化內(nèi)生發(fā)展動(dòng)力。強(qiáng)化建設(shè)資金補(bǔ)貼、算力使用補(bǔ)貼、政府融資擔(dān)保、產(chǎn)業(yè)基金幫扶等金融支持力量;對(duì)于積極引進(jìn)大模型領(lǐng)域領(lǐng)軍人才和核心團(tuán)隊(duì),給與資金獎(jiǎng)勵(lì)和政策支持;探索營(yíng)造包容審慎的監(jiān)管環(huán)境,優(yōu)化大模型產(chǎn)業(yè)生態(tài)發(fā)展環(huán)境,強(qiáng)化內(nèi)生發(fā)展動(dòng)力。
?。ㄗ髡撸菏≌f(xié)常委、教育科技委員會(huì)副主任,西安天和防務(wù)技術(shù)有限公司董事長(zhǎng)兼總經(jīng)理 賀增林)