(美通社頭條)《國(guó)際人工智能安全報(bào)告》首次關(guān)鍵更新已發(fā)布,就先進(jìn)人工智能的能力與風(fēng)險(xiǎn)提供了最新信息。該報(bào)告由圖靈獎(jiǎng)得主、計(jì)算機(jī)科學(xué)家Yoshua Bengio總體負(fù)責(zé),匯集了100多位國(guó)際專(zhuān)家,并得到30多個(gè)國(guó)家以及包括歐盟、經(jīng)合組織和聯(lián)合國(guó)在內(nèi)的國(guó)際組織的支持。
首個(gè)《關(guān)鍵更新》涵蓋能力提升和風(fēng)險(xiǎn)影響:
人工智能模型在復(fù)雜問(wèn)題解決能力上持續(xù)提升:例如,領(lǐng)先的系統(tǒng)現(xiàn)已能完成一組現(xiàn)實(shí)世界軟件工程問(wèn)題中超60%的任務(wù)。到2025年初,他們只能解決約40%的相關(guān)問(wèn)題,而在2024年初他們尚無(wú)法解決任何問(wèn)題。
行業(yè)參與者已經(jīng)采取了新的預(yù)防性保障措施:多家主要人工智能開(kāi)發(fā)商在無(wú)法完全排除其新模型可能被用于協(xié)助開(kāi)發(fā)化學(xué)、生物、放射和核風(fēng)險(xiǎn)的情況下,主動(dòng)為最新模型增加了額外安全措施后發(fā)布。
人工智能模型在評(píng)估過(guò)程中日益表現(xiàn)出策略性行為,給監(jiān)管帶來(lái)挑戰(zhàn):人工智能模型越來(lái)越可能意識(shí)到自己正在接受評(píng)估,并據(jù)此調(diào)整輸出結(jié)果,這對(duì)開(kāi)發(fā)人員和測(cè)試人員在部署新模型之前準(zhǔn)確評(píng)估新模型能力的能力提出了重大質(zhì)疑。