版權(quán)申明:本站為公益科普網(wǎng)站,版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們
發(fā)布時(shí)間:2026-01-20 10:24 來(lái)源:科普中國(guó)創(chuàng)作培育計(jì)劃
當(dāng)AI開始“創(chuàng)造”:理解還是模仿?
“創(chuàng)意只是將事物連接起來(lái)。”當(dāng)喬布斯說(shuō)出這句話時(shí),他描述的是人類獨(dú)有的創(chuàng)造過(guò)程。如今,當(dāng)GPT-4V、DALL-E 3等AI系統(tǒng)開始展現(xiàn)出令人驚訝的創(chuàng)意表現(xiàn)——能夠理解變形金剛(跑車+機(jī)器人)的巧妙設(shè)計(jì),能夠創(chuàng)作出融合不同概念的藝術(shù)作品時(shí),一個(gè)關(guān)鍵問(wèn)題浮現(xiàn):這些AI真的“理解”創(chuàng)造力嗎?它們的創(chuàng)意表現(xiàn)背后,究竟是深層的認(rèn)知理解,還是精巧的模式匹配?
在眾多創(chuàng)造力形式中,組合創(chuàng)造力(combinational creativity)被心理學(xué)家Margaret Boden視為最基礎(chǔ)的一種——通過(guò)有意義地結(jié)合熟悉的概念來(lái)產(chǎn)生新想法。從帶輪行李箱(手推車+硬殼箱)到獅身人面像(人臉+獅身),這種“連接事物”的能力創(chuàng)造了人類文明中無(wú)數(shù)的創(chuàng)新作品,如圖1所示。
傳統(tǒng)的AI評(píng)估主要關(guān)注最終產(chǎn)出——生成的圖像是否新穎,文案是否有趣。但這種“黑箱評(píng)估”方法無(wú)法回答一個(gè)根本問(wèn)題:AI是否真的理解了創(chuàng)造的過(guò)程本身?我們迫切需要一種能夠“透視”AI創(chuàng)造過(guò)程的分析方法。
為了回答這個(gè)問(wèn)題,我們不能只看AI創(chuàng)造了什么,更要看它們是“如何”創(chuàng)造的。這就需要將抽象的創(chuàng)造過(guò)程分解為可觀察、可測(cè)量的認(rèn)知步驟。
“解剖”AI的創(chuàng)造思維過(guò)程
為了科學(xué)地評(píng)估AI的創(chuàng)造力理解能力,北京大學(xué)的研究團(tuán)隊(duì)開發(fā)了IEI框架(識(shí)別—解釋—暗示)[1],首次將復(fù)雜的組合創(chuàng)造力分解為三個(gè)遞進(jìn)的認(rèn)知層次。這一框架基于認(rèn)知科學(xué)的概念融合理論,實(shí)現(xiàn)了從抽象理論到可操作測(cè)量的關(guān)鍵轉(zhuǎn)換。
IEI框架的核心創(chuàng)新在于將AI的創(chuàng)造力評(píng)估從“產(chǎn)品質(zhì)量”轉(zhuǎn)向“過(guò)程理解”。通過(guò)三層遞進(jìn)的分析,我們能夠精確診斷AI系統(tǒng)在創(chuàng)造力認(rèn)知流程中的真實(shí)水平和具體局限。
識(shí)別層(Identification):基礎(chǔ)概念提取能力
第一層考察AI是否能準(zhǔn)確識(shí)別創(chuàng)意作品中的基本構(gòu)成元素。當(dāng)面對(duì)一個(gè)作品時(shí),AI首先需要激活正確的概念表征。以變形金剛為例,系統(tǒng)需要同時(shí)識(shí)別出“汽車”和“機(jī)器人”兩個(gè)核心概念。
這一層雖然看似基礎(chǔ),但準(zhǔn)確的元素識(shí)別是理解創(chuàng)造力的關(guān)鍵前提。如果AI連基本元素都無(wú)法正確提取,那么后續(xù)的創(chuàng)造性理解就無(wú)從談起。
解釋層(Explanation):關(guān)系發(fā)現(xiàn)與連接能力
第二層深入考察AI是否真正理解“為什么這些元素能夠組合”。系統(tǒng)需要發(fā)現(xiàn)概念間的深層聯(lián)系——汽車和機(jī)器人都有機(jī)械結(jié)構(gòu)、都能運(yùn)動(dòng)、都具有功能性,這些共同特征構(gòu)成了創(chuàng)意融合的認(rèn)知基礎(chǔ)。
這一過(guò)程類似于人類進(jìn)行類比推理時(shí)的思維活動(dòng):在表面不同的事物中發(fā)現(xiàn)深層的相似性。AI是否具備這種結(jié)構(gòu)化的關(guān)系理解能力,直接關(guān)系到它對(duì)創(chuàng)造力本質(zhì)的把握程度。
暗示層(Implication):深層意義建構(gòu)能力
最高層次考察AI能否理解創(chuàng)意組合的文化內(nèi)涵和深層寓意。變形金剛不僅是物理層面的機(jī)械組合,它還承載著科技與人性融合、保護(hù)與戰(zhàn)斗并存等豐富的文化內(nèi)涵。
這種意義理解需要廣泛的文化知識(shí)和深層的語(yǔ)境推理能力。AI是否具備這種高級(jí)的意義建構(gòu)能力,是判斷其是否真正“理解”創(chuàng)造力的關(guān)鍵指標(biāo)。
構(gòu)建AI創(chuàng)造力的“認(rèn)知體檢”平臺(tái)
為了系統(tǒng)化評(píng)估AI的創(chuàng)造力理解能力,研究團(tuán)隊(duì)開發(fā)了一個(gè)新的評(píng)估基準(zhǔn)(benchmark)。該基準(zhǔn)包含從Pinterest等開源圖片庫(kù)收集的666個(gè)專業(yè)藝術(shù)家視覺(jué)拼貼(visual mashup)作品,每件作品都經(jīng)過(guò)了基于IEI框架三個(gè)認(rèn)知層次的專業(yè)標(biāo)注。
這種設(shè)計(jì)具有重要的科學(xué)價(jià)值:
? 標(biāo)準(zhǔn)化測(cè)試:確保所有AI系統(tǒng)面對(duì)完全相同的測(cè)試材料,消除了評(píng)估中的變量干擾。
? 專業(yè)基準(zhǔn):由專業(yè)藝術(shù)家創(chuàng)作并標(biāo)注,為AI能力評(píng)估提供了可靠的“金標(biāo)準(zhǔn)”。
? 層次化診斷:三層測(cè)試體系能夠精確定位AI在創(chuàng)造力認(rèn)知流程中的具體強(qiáng)弱環(huán)節(jié)。
? 識(shí)別層測(cè)試:AI能否正確識(shí)別出“魚類”和“垃圾”兩個(gè)基本概念?
? 解釋層測(cè)試:AI能否理解兩者的共同屬性——都有相似的形狀特征?
? 暗示層測(cè)試:AI能否理解這一組合對(duì)海洋污染問(wèn)題的批判寓意?
這種精細(xì)化的測(cè)試框架,使得我們能夠像進(jìn)行醫(yī)學(xué)檢查一樣,全面診斷AI系統(tǒng)的創(chuàng)造力和理解能力。
AI創(chuàng)造力的“認(rèn)知體檢報(bào)告”
通過(guò)對(duì)11個(gè)主流AI模型的系統(tǒng)測(cè)試,研究團(tuán)隊(duì)繪制出了一幅詳細(xì)的“AI創(chuàng)造力能力圖譜”,揭示了機(jī)器智能在創(chuàng)造力理解上的真實(shí)水平。
基礎(chǔ)識(shí)別:AI的明顯優(yōu)勢(shì)
在識(shí)別層面,頂級(jí)AI模型(GPT-4o)表現(xiàn)出了顯著優(yōu)勢(shì):在評(píng)估“回答的對(duì)不對(duì)”的精確率方面可以達(dá)到75.67%,在評(píng)估“識(shí)別的全不全”的召回率方面可以達(dá)到85.00%,明顯超越普通人類的53.42%和70.33%,多數(shù)主流AI模型也都超越了普通人類表現(xiàn),這表明AI在基礎(chǔ)概念提取方面確實(shí)具備了可靠的能力。這種優(yōu)勢(shì)可能源于AI接觸的大規(guī)模視覺(jué)訓(xùn)練數(shù)據(jù),使其在物體識(shí)別方面具備了超人的穩(wěn)定性和準(zhǔn)確性。
關(guān)系理解:AI保持競(jìng)爭(zhēng)力
在解釋層面,AI的優(yōu)勢(shì)開始縮小。GPT-4o和Claude-3.5-Sonnet并列第一(74.19%),而普通人類達(dá)到69.89%。這種相對(duì)較小的差距表明,AI在理解概念間深層關(guān)系方面仍面臨挑戰(zhàn)。
此外,不同AI模型表現(xiàn)出明顯的“認(rèn)知偏好”差異——Gemini-1.5-Pro在識(shí)別任務(wù)中表現(xiàn)強(qiáng)勁,但在關(guān)系解釋方面相對(duì)較弱,這暗示了不同AI系統(tǒng)可能采用了不同的信息處理策略。
意義理解:專家略勝,頂級(jí)AI緊追
在暗示層面,人類專家以78.3%的勝率領(lǐng)先所有測(cè)試對(duì)象,而AI系統(tǒng)的表現(xiàn)出現(xiàn)了明顯分化:最佳AI模型(GPT-4o)達(dá)到73.5%,GPT-4V和Gemini-1.5-Pro也都超過(guò)了71%,這些頂級(jí)AI系統(tǒng)的表現(xiàn)顯著超越了普通人類的51%。然而,表現(xiàn)較弱的AI模型(如LLaVA系列和MiniCPM)的勝率大多在20%~40%區(qū)間,明顯低于普通人水平。
這種復(fù)雜的能力分布揭示了幾個(gè)重要發(fā)現(xiàn):首先,頂級(jí)AI系統(tǒng)在創(chuàng)意理解方面確實(shí)超越了普通人的水平;其次,AI系統(tǒng)間存在巨大的能力差異;最后,雖然人類專家仍保持領(lǐng)先優(yōu)勢(shì),但頂級(jí)AI已經(jīng)展現(xiàn)出接近專家水平的創(chuàng)意理解能力,這種差距正在不斷縮小。
跨模型的共同模式
研究還發(fā)現(xiàn)了AI系統(tǒng)的一個(gè)有趣共性:在處理不同類型的創(chuàng)意組合時(shí),AI和人類表現(xiàn)出相似的偏好模式。融合型組合(如魚-牙膏的特征融合)比替換型組合(如用汽水罐替換炸藥)更容易被理解,這一規(guī)律在11個(gè)AI模型中的9個(gè)以及人類參與者中都得到證實(shí)。這種一致性暗示了在處理視覺(jué)創(chuàng)意時(shí),可能存在某些普遍的認(rèn)知難度梯度。
過(guò)程理解如何指導(dǎo)創(chuàng)意生成?
既然我們已經(jīng)分析了AI在創(chuàng)造力理解上的表現(xiàn),那么一個(gè)自然的問(wèn)題是:這種過(guò)程分析的洞察能否反過(guò)來(lái)幫助AI生成更好的創(chuàng)意作品?在創(chuàng)意生成實(shí)驗(yàn)中,研究團(tuán)隊(duì)測(cè)試了這一假設(shè):基于IEI框架的結(jié)構(gòu)化思維指導(dǎo)是否能提升AI的創(chuàng)意生成質(zhì)量?
他們比較了兩種方法:傳統(tǒng)的開放式創(chuàng)作指導(dǎo)與基于IEI框架的結(jié)構(gòu)化過(guò)程指導(dǎo)。結(jié)果顯示,在所有測(cè)試的圖像生成模型中,IEI結(jié)構(gòu)化方法都顯著提升了創(chuàng)意質(zhì)量。以表現(xiàn)最佳的Midjourney為例,平均排名從2.40提升至1.98。
改進(jìn)的本質(zhì)
關(guān)鍵發(fā)現(xiàn)是這種提升的性質(zhì):統(tǒng)計(jì)分析顯示兩種方法的提示詞長(zhǎng)度并無(wú)顯著差異,在IEI方法表現(xiàn)優(yōu)異的案例中,46%的情況下提示詞甚至更短。
這證明了改進(jìn)源于認(rèn)知步驟的完整性而非信息量的增加。兩種方法的唯一區(qū)別在于IEI方法增加了“解釋”環(huán)節(jié)的思考指導(dǎo)——引導(dǎo)AI明確分析為什么兩個(gè)概念能夠組合。這一額外的認(rèn)知步驟顯著提升了最終的創(chuàng)意生成質(zhì)量。
這一發(fā)現(xiàn)表明,完整的創(chuàng)意認(rèn)知流程(識(shí)別+解釋+暗示)比跳過(guò)中間步驟的簡(jiǎn)化流程(識(shí)別+暗示)更能激發(fā)AI的創(chuàng)造潛力。
AI創(chuàng)造力的關(guān)鍵瓶頸
當(dāng)前多模態(tài)創(chuàng)意流程呈現(xiàn)出一個(gè)突出瓶頸:文字概念到視覺(jué)實(shí)現(xiàn)的轉(zhuǎn)換階段。我們觀察到,絕大多數(shù)生成的概念描述已經(jīng)能較完整地傳達(dá)主題,但其中仍有相當(dāng)一部分在轉(zhuǎn)成圖像時(shí)質(zhì)量未達(dá)預(yù)期,顯示“概念構(gòu)思”與“視覺(jué)落地”之間存在性能落差。引入從識(shí)別到解釋、再到暗示的IEI框架后,較強(qiáng)的圖像模型獲得更明顯的偏好提升:例如 Midjourney 的相關(guān)勝率提升顯著(0.26→0.36),而 Stable-Diffusion-3 的提升較溫和(0.15→0.18)。這表明指令解析與語(yǔ)義對(duì)齊能力越成熟的模型,越能從像IEI框架這種精細(xì)化的測(cè)試框架中受益。
重新思考機(jī)器智能的邊界
當(dāng)我們用科學(xué)的方法“解剖”AI的創(chuàng)造力時(shí),得到的答案遠(yuǎn)比想象中更加復(fù)雜。這項(xiàng)研究告訴我們:AI的創(chuàng)造力既真實(shí)存在,又有著清晰的邊界。
在理解層面,頂級(jí)AI的表現(xiàn)令人矚目:它們?cè)谧R(shí)別基礎(chǔ)概念元素方面表現(xiàn)優(yōu)異,在解釋概念間關(guān)系方面具備強(qiáng)大能力,在暗示深層意義理解方面也展現(xiàn)出接近專家的水準(zhǔn)。在生成層面,AI展現(xiàn)出了可優(yōu)化的潛力,但其作品質(zhì)量仍然明顯遜色于人類專家的藝術(shù)創(chuàng)作。
這些發(fā)現(xiàn)最有價(jià)值的地方,不在于給AI“打分”,而在于讓我們有了一個(gè)全新的觀察角度。過(guò)去我們總是看AI做出了什么,現(xiàn)在我們開始關(guān)注它是如何思考的。這種轉(zhuǎn)變讓我們發(fā)現(xiàn),創(chuàng)造力原來(lái)可以被拆解成這樣具體的認(rèn)知步驟,這對(duì)理解人類自己的創(chuàng)造過(guò)程也有啟發(fā)。
有趣的是,這些研究結(jié)果揭示了一個(gè)幾乎完美的互補(bǔ)關(guān)系:AI擅長(zhǎng)快速分析和邏輯梳理,人類則在情感表達(dá)和文化洞察上有著天然優(yōu)勢(shì)。這讓人想到,也許創(chuàng)造從來(lái)就不是單打獨(dú)斗的事情,而是需要不同智慧的碰撞和融合。
或許我們一直問(wèn)錯(cuò)了問(wèn)題。與其擔(dān)心“AI會(huì)不會(huì)取代人類創(chuàng)造力”,不如思考“AI如何幫助我們成為更好的創(chuàng)造者”。當(dāng)我們真正了解了AI能做什么、做不了什么,我們反而能更清楚地認(rèn)識(shí)人類創(chuàng)造力的珍貴之處——那些源于生活體驗(yàn)的洞察,那些無(wú)法被算法復(fù)制的文化感悟,那些只有人類才能賦予作品的溫度。創(chuàng)造力從來(lái)不是零和游戲,而是可以相互啟發(fā)的。在這個(gè)AI快速發(fā)展的時(shí)代,學(xué)會(huì)與機(jī)器協(xié)作創(chuàng)造,可能正是我們重新發(fā)現(xiàn)人類創(chuàng)造本質(zhì)的機(jī)會(huì)。
參考文獻(xiàn):
1. Peng, Yongqian and Ma, Yuxi and Wang, Mengmeng and Wang, Yuxuan and Wang, Yizhou and Zhang, Chi and Zhu, Yixin and Zheng, Zilong. "Probing and Inducing Combinational Creativity in Vision-Language Models." CogSci, 2025. https://escholarship.org/uc/item/4fj0m0cw