行業(yè)資訊
人工智能需要關(guān)注場景和應(yīng)用
斯坦福大學(xué)今年4月發(fā)布的人工智能指數(shù)報告稱,2023年,著名人工智能模型中有61個源自美國,中國則有15個。業(yè)內(nèi)人士指出,中美是全球人工智能發(fā)展的“領(lǐng)頭羊”,展現(xiàn)出了不同的發(fā)展趨勢和戰(zhàn)略重點(diǎn)。美國在高端芯片制造、基礎(chǔ)研究和技術(shù)創(chuàng)新上優(yōu)勢明顯;而中國擁有龐大的互聯(lián)網(wǎng)用戶基數(shù),提供了豐富的場景等方面數(shù)據(jù)資源,這對于訓(xùn)練大模型來說是重要優(yōu)勢。
“大模型的競賽可以分為幾個階段,第一個階段是‘卷指標(biāo)’,在參數(shù)和指標(biāo)的提升中重點(diǎn)關(guān)注性能問題,但這也造成了目前的一個行業(yè)通病問題——大模型性能和應(yīng)用嚴(yán)重分離,也就是大家所討論的‘拿著錘子找釘子’的問題。因此,發(fā)展至第二個階段‘卷場景和體驗(yàn)’,成為一種必然。”陶明說。
2024年5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會” 上,參會者頭戴腦神經(jīng)檢測器在人工智能藝術(shù)表演上演奏小提琴。新華社記者 連漪 攝
上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在接受新華社記者采訪時指出,應(yīng)該看到這一輪競爭中應(yīng)用場景的重要性。中國企業(yè)可以先從應(yīng)用層面切入,反哺和推動基礎(chǔ)模型性能提升。
在談到數(shù)據(jù)問題時,肖仰華說,GPT等大模型仍然是主要基于互聯(lián)網(wǎng)通用開放語料進(jìn)行訓(xùn)練。這類通用大模型一旦用于千行百業(yè),可能存在領(lǐng)域知識匱乏的根本性問題,從而限制了大模型在具體領(lǐng)域的價值發(fā)揮。
零一萬物公司模型訓(xùn)練負(fù)責(zé)人黃文灝表示,他看到GPT-4o更新了分詞器的詞表,但其中和中文相關(guān)的詞元質(zhì)量還是沒跟上。他認(rèn)為這可能是由于他們?nèi)狈Ω哔|(zhì)量的中文語料,這對中國企業(yè)是一個機(jī)會?!皣鴥?nèi)的工程師可以更沉下心來對數(shù)據(jù)進(jìn)行研究、分析,將數(shù)據(jù)質(zhì)量做到非常高的水平?!?/p>
面臨能源、安全等諸多挑戰(zhàn)
能源成為人工智能發(fā)展中的重要問題。有研究顯示,ChatGPT每日約消耗超過50萬度電,相當(dāng)于一個美國家庭每天平均用電量的1.7萬倍。美國“元”公司首席執(zhí)行官扎克伯格、OpenAI首席執(zhí)行官奧爾特曼等人今年在不同場合都強(qiáng)調(diào)了能源在人工智能下一步發(fā)展中的關(guān)鍵作用。微軟、OpenAI、谷歌、亞馬遜等企業(yè)紛紛通過直接入股核電或向核電公司購買電力等方式,加強(qiáng)能源供應(yīng)。
中國云基礎(chǔ)設(shè)施服務(wù)提供商中聯(lián)數(shù)據(jù)集團(tuán)副總裁馬超日前接受新華社記者采訪時也表示,算力和大數(shù)據(jù)產(chǎn)業(yè)對能源的需求快速增加,產(chǎn)業(yè)競爭日益重視能源。
來源:新華網(wǎng)