新聞中心
18
2023
-
04
大模型競爭升溫,AI芯片管制難以限制發(fā)展
知名研究機構(gòu)國際戰(zhàn)略研究所(IISS)日前發(fā)布報告,指出盡管美國限制高性能AI芯片對華出口,但這些控制措施可能會促使中國人工智能研究人員朝著“計算要求較低的領(lǐng)域”,并引導(dǎo)他們發(fā)展“新的競爭優(yōu)勢”。
來源:
知名研究機構(gòu)國際戰(zhàn)略研究所(IISS)日前發(fā)布報告,指出盡管美國限制高性能AI芯片對華出口,但這些控制措施可能會促使中國人工智能研究人員朝著“計算要求較低的領(lǐng)域”,并引導(dǎo)他們發(fā)展“新的競爭優(yōu)勢”。
報告稱,近年來,大型語言模型的能力有了顯著提升,OpenAI在2020年創(chuàng)建GPT-3是一個重要的里程碑。這些改進歸因于更大、更通用的模型架構(gòu)的創(chuàng)建以及數(shù)據(jù)集大小的增加以及技術(shù)公司為增加訓(xùn)練模型的計算能力所花費的金額。實證研究表明,給定模型的數(shù)據(jù)集大小、計算開銷和參數(shù)計數(shù)之間存在密切關(guān)系,并且在實踐中,計算開銷是模型改進的最強約束。
此外,越來越多的參與者正在開發(fā)大型語言模型,并在多個維度上出現(xiàn)擴散。如大型語言模型的研究主要發(fā)生在美國,但其他國家的研究人員——尤其是中國,以及其他地方的特定研究機構(gòu),如英國的 DeepMind——已經(jīng)投入了大量資源建立自己的模型。此外,開發(fā)語言模型的機構(gòu)類型已經(jīng)擴展到既包括谷歌和微軟等大型科技公司,也包括分散的研究人員集體。
報告認為,大模型技術(shù)的擴散對安全有兩個近期影響:這些模型可能會為虛假信息生產(chǎn)更高質(zhì)量和更多的內(nèi)容,而對大模型開發(fā)的競爭可能會加劇地緣z治緊張局勢。
報告還分析了去年10月,美國政府宣布對流向中國的先進半導(dǎo)體芯片實行新的出口管制,部分原因是這些芯片對人工智能發(fā)展至關(guān)重要。雖然出口管制的既定意圖是限制用于監(jiān)視或軍事應(yīng)用的人工智能系統(tǒng)的發(fā)展,但語言模型也高度依賴于這些先進的半導(dǎo)體。實施出口管制的部分真實動機可能是為了保持美國在語言模型方面的優(yōu)勢,無論是作為更廣泛的人工智能技術(shù)競爭戰(zhàn)略的一部分,還是因為政府特別想抑制中國在語言模型方面的發(fā)展。
報告還懷疑這些措施是否有效。盡管由于計算能力的提高,大語言模型得到了改進,但它們不能以目前的速度繼續(xù)這樣做。研究人員正在積極尋求開發(fā)計算效率更高的方法來訓(xùn)練類似模型。一個國家試圖限制另一個國家的計算能力作為競爭人工智能發(fā)展的一種手段,可能會激勵目標國家在這些計算效率更高的人工智能方法中發(fā)展競爭優(yōu)勢。
此外,高質(zhì)量文本如書籍和學(xué)術(shù)期刊文章可能很快成為語言模型發(fā)展的一個比計算能力可用性更緊迫的限制。
各國也可能越來越多地將大模型的開發(fā)視為一種民族自豪感,這種看法可能會加劇對其開發(fā)的競爭。報告擔(dān)心,隨著大模型越來越接近國家技術(shù)競爭的中心,政府可能會更積極地切斷本國居民對競爭國家開發(fā)的語言模型的訪問,從而進一步分裂互聯(lián)網(wǎng)。
關(guān)鍵詞:
相關(guān)新聞
2023-05-24
2023-05-12
2023-05-06
2023-04-26
2023-04-18