網(wǎng)站首頁(yè) 科協(xié)動(dòng)態(tài) 科學(xué)辟謠應(yīng)急科普荊楚科普大講堂陣地科普科普微直播科學(xué)大觀園健康咨詢吧科普100問(wèn) 科學(xué)競(jìng)技場(chǎng) 熱點(diǎn)科普

當(dāng)前位置：科普湖北云 > 科學(xué)大觀園

研究 | AI的組合創(chuàng)造力：機(jī)器能否真正理解創(chuàng)意的誕生過(guò)程？

版權(quán)申明：本站為公益科普網(wǎng)站，版權(quán)歸原作者所有，如有侵權(quán)，請(qǐng)聯(lián)系我們

發(fā)布時(shí)間：2026-01-20 10:24 來(lái)源：科普中國(guó)創(chuàng)作培育計(jì)劃

　　當(dāng)AI開始“創(chuàng)造”：理解還是模仿？

　　“創(chuàng)意只是將事物連接起來(lái)。”當(dāng)喬布斯說(shuō)出這句話時(shí)，他描述的是人類獨(dú)有的創(chuàng)造過(guò)程。如今，當(dāng)GPT-4V、DALL-E 3等AI系統(tǒng)開始展現(xiàn)出令人驚訝的創(chuàng)意表現(xiàn)——能夠理解變形金剛（跑車+機(jī)器人）的巧妙設(shè)計(jì)，能夠創(chuàng)作出融合不同概念的藝術(shù)作品時(shí)，一個(gè)關(guān)鍵問(wèn)題浮現(xiàn)：這些AI真的“理解”創(chuàng)造力嗎？它們的創(chuàng)意表現(xiàn)背后，究竟是深層的認(rèn)知理解，還是精巧的模式匹配？

　　在眾多創(chuàng)造力形式中，組合創(chuàng)造力（combinational creativity）被心理學(xué)家Margaret Boden視為最基礎(chǔ)的一種——通過(guò)有意義地結(jié)合熟悉的概念來(lái)產(chǎn)生新想法。從帶輪行李箱（手推車+硬殼箱）到獅身人面像（人臉+獅身），這種“連接事物”的能力創(chuàng)造了人類文明中無(wú)數(shù)的創(chuàng)新作品，如圖1所示。

　　傳統(tǒng)的AI評(píng)估主要關(guān)注最終產(chǎn)出——生成的圖像是否新穎，文案是否有趣。但這種“黑箱評(píng)估”方法無(wú)法回答一個(gè)根本問(wèn)題：AI是否真的理解了創(chuàng)造的過(guò)程本身？我們迫切需要一種能夠“透視”AI創(chuàng)造過(guò)程的分析方法。

　　為了回答這個(gè)問(wèn)題，我們不能只看AI創(chuàng)造了什么，更要看它們是“如何”創(chuàng)造的。這就需要將抽象的創(chuàng)造過(guò)程分解為可觀察、可測(cè)量的認(rèn)知步驟。

　　“解剖”AI的創(chuàng)造思維過(guò)程

　　為了科學(xué)地評(píng)估AI的創(chuàng)造力理解能力，北京大學(xué)的研究團(tuán)隊(duì)開發(fā)了IEI框架（識(shí)別—解釋—暗示）[1]，首次將復(fù)雜的組合創(chuàng)造力分解為三個(gè)遞進(jìn)的認(rèn)知層次。這一框架基于認(rèn)知科學(xué)的概念融合理論，實(shí)現(xiàn)了從抽象理論到可操作測(cè)量的關(guān)鍵轉(zhuǎn)換。

　　IEI框架的核心創(chuàng)新在于將AI的創(chuàng)造力評(píng)估從“產(chǎn)品質(zhì)量”轉(zhuǎn)向“過(guò)程理解”。通過(guò)三層遞進(jìn)的分析，我們能夠精確診斷AI系統(tǒng)在創(chuàng)造力認(rèn)知流程中的真實(shí)水平和具體局限。

　　識(shí)別層（Identification）：基礎(chǔ)概念提取能力

　　第一層考察AI是否能準(zhǔn)確識(shí)別創(chuàng)意作品中的基本構(gòu)成元素。當(dāng)面對(duì)一個(gè)作品時(shí)，AI首先需要激活正確的概念表征。以變形金剛為例，系統(tǒng)需要同時(shí)識(shí)別出“汽車”和“機(jī)器人”兩個(gè)核心概念。

　　這一層雖然看似基礎(chǔ)，但準(zhǔn)確的元素識(shí)別是理解創(chuàng)造力的關(guān)鍵前提。如果AI連基本元素都無(wú)法正確提取，那么后續(xù)的創(chuàng)造性理解就無(wú)從談起。

　　解釋層（Explanation）：關(guān)系發(fā)現(xiàn)與連接能力

　　第二層深入考察AI是否真正理解“為什么這些元素能夠組合”。系統(tǒng)需要發(fā)現(xiàn)概念間的深層聯(lián)系——汽車和機(jī)器人都有機(jī)械結(jié)構(gòu)、都能運(yùn)動(dòng)、都具有功能性，這些共同特征構(gòu)成了創(chuàng)意融合的認(rèn)知基礎(chǔ)。

　　這一過(guò)程類似于人類進(jìn)行類比推理時(shí)的思維活動(dòng)：在表面不同的事物中發(fā)現(xiàn)深層的相似性。AI是否具備這種結(jié)構(gòu)化的關(guān)系理解能力，直接關(guān)系到它對(duì)創(chuàng)造力本質(zhì)的把握程度。

　　暗示層（Implication）：深層意義建構(gòu)能力

　　最高層次考察AI能否理解創(chuàng)意組合的文化內(nèi)涵和深層寓意。變形金剛不僅是物理層面的機(jī)械組合，它還承載著科技與人性融合、保護(hù)與戰(zhàn)斗并存等豐富的文化內(nèi)涵。

　　這種意義理解需要廣泛的文化知識(shí)和深層的語(yǔ)境推理能力。AI是否具備這種高級(jí)的意義建構(gòu)能力，是判斷其是否真正“理解”創(chuàng)造力的關(guān)鍵指標(biāo)。

　　構(gòu)建AI創(chuàng)造力的“認(rèn)知體檢”平臺(tái)

　　為了系統(tǒng)化評(píng)估AI的創(chuàng)造力理解能力，研究團(tuán)隊(duì)開發(fā)了一個(gè)新的評(píng)估基準(zhǔn)（benchmark）。該基準(zhǔn)包含從Pinterest等開源圖片庫(kù)收集的666個(gè)專業(yè)藝術(shù)家視覺(jué)拼貼（visual mashup）作品，每件作品都經(jīng)過(guò)了基于IEI框架三個(gè)認(rèn)知層次的專業(yè)標(biāo)注。

　　這種設(shè)計(jì)具有重要的科學(xué)價(jià)值：

　　? 標(biāo)準(zhǔn)化測(cè)試：確保所有AI系統(tǒng)面對(duì)完全相同的測(cè)試材料，消除了評(píng)估中的變量干擾。

　　? 專業(yè)基準(zhǔn)：由專業(yè)藝術(shù)家創(chuàng)作并標(biāo)注，為AI能力評(píng)估提供了可靠的“金標(biāo)準(zhǔn)”。

　　? 層次化診斷：三層測(cè)試體系能夠精確定位AI在創(chuàng)造力認(rèn)知流程中的具體強(qiáng)弱環(huán)節(jié)。

　　? 識(shí)別層測(cè)試：AI能否正確識(shí)別出“魚類”和“垃圾”兩個(gè)基本概念？

　　? 解釋層測(cè)試：AI能否理解兩者的共同屬性——都有相似的形狀特征？

　　? 暗示層測(cè)試：AI能否理解這一組合對(duì)海洋污染問(wèn)題的批判寓意？

　　這種精細(xì)化的測(cè)試框架，使得我們能夠像進(jìn)行醫(yī)學(xué)檢查一樣，全面診斷AI系統(tǒng)的創(chuàng)造力和理解能力。

　　AI創(chuàng)造力的“認(rèn)知體檢報(bào)告”

　　通過(guò)對(duì)11個(gè)主流AI模型的系統(tǒng)測(cè)試，研究團(tuán)隊(duì)繪制出了一幅詳細(xì)的“AI創(chuàng)造力能力圖譜”，揭示了機(jī)器智能在創(chuàng)造力理解上的真實(shí)水平。

　　基礎(chǔ)識(shí)別：AI的明顯優(yōu)勢(shì)

　　在識(shí)別層面，頂級(jí)AI模型（GPT-4o）表現(xiàn)出了顯著優(yōu)勢(shì)：在評(píng)估“回答的對(duì)不對(duì)”的精確率方面可以達(dá)到75.67%，在評(píng)估“識(shí)別的全不全”的召回率方面可以達(dá)到85.00%，明顯超越普通人類的53.42%和70.33%，多數(shù)主流AI模型也都超越了普通人類表現(xiàn)，這表明AI在基礎(chǔ)概念提取方面確實(shí)具備了可靠的能力。這種優(yōu)勢(shì)可能源于AI接觸的大規(guī)模視覺(jué)訓(xùn)練數(shù)據(jù)，使其在物體識(shí)別方面具備了超人的穩(wěn)定性和準(zhǔn)確性。

　　關(guān)系理解：AI保持競(jìng)爭(zhēng)力

　　在解釋層面，AI的優(yōu)勢(shì)開始縮小。GPT-4o和Claude-3.5-Sonnet并列第一（74.19%），而普通人類達(dá)到69.89%。這種相對(duì)較小的差距表明，AI在理解概念間深層關(guān)系方面仍面臨挑戰(zhàn)。

　　此外，不同AI模型表現(xiàn)出明顯的“認(rèn)知偏好”差異——Gemini-1.5-Pro在識(shí)別任務(wù)中表現(xiàn)強(qiáng)勁，但在關(guān)系解釋方面相對(duì)較弱，這暗示了不同AI系統(tǒng)可能采用了不同的信息處理策略。

　　意義理解：專家略勝，頂級(jí)AI緊追

　　在暗示層面，人類專家以78.3%的勝率領(lǐng)先所有測(cè)試對(duì)象，而AI系統(tǒng)的表現(xiàn)出現(xiàn)了明顯分化：最佳AI模型（GPT-4o）達(dá)到73.5%，GPT-4V和Gemini-1.5-Pro也都超過(guò)了71%，這些頂級(jí)AI系統(tǒng)的表現(xiàn)顯著超越了普通人類的51%。然而，表現(xiàn)較弱的AI模型（如LLaVA系列和MiniCPM）的勝率大多在20%~40%區(qū)間，明顯低于普通人水平。

　　這種復(fù)雜的能力分布揭示了幾個(gè)重要發(fā)現(xiàn)：首先，頂級(jí)AI系統(tǒng)在創(chuàng)意理解方面確實(shí)超越了普通人的水平；其次，AI系統(tǒng)間存在巨大的能力差異；最后，雖然人類專家仍保持領(lǐng)先優(yōu)勢(shì)，但頂級(jí)AI已經(jīng)展現(xiàn)出接近專家水平的創(chuàng)意理解能力，這種差距正在不斷縮小。

　　跨模型的共同模式

　　研究還發(fā)現(xiàn)了AI系統(tǒng)的一個(gè)有趣共性：在處理不同類型的創(chuàng)意組合時(shí)，AI和人類表現(xiàn)出相似的偏好模式。融合型組合（如魚-牙膏的特征融合）比替換型組合（如用汽水罐替換炸藥）更容易被理解，這一規(guī)律在11個(gè)AI模型中的9個(gè)以及人類參與者中都得到證實(shí)。這種一致性暗示了在處理視覺(jué)創(chuàng)意時(shí)，可能存在某些普遍的認(rèn)知難度梯度。

　　過(guò)程理解如何指導(dǎo)創(chuàng)意生成？

　　既然我們已經(jīng)分析了AI在創(chuàng)造力理解上的表現(xiàn)，那么一個(gè)自然的問(wèn)題是：這種過(guò)程分析的洞察能否反過(guò)來(lái)幫助AI生成更好的創(chuàng)意作品？在創(chuàng)意生成實(shí)驗(yàn)中，研究團(tuán)隊(duì)測(cè)試了這一假設(shè)：基于IEI框架的結(jié)構(gòu)化思維指導(dǎo)是否能提升AI的創(chuàng)意生成質(zhì)量？

　　他們比較了兩種方法：傳統(tǒng)的開放式創(chuàng)作指導(dǎo)與基于IEI框架的結(jié)構(gòu)化過(guò)程指導(dǎo)。結(jié)果顯示，在所有測(cè)試的圖像生成模型中，IEI結(jié)構(gòu)化方法都顯著提升了創(chuàng)意質(zhì)量。以表現(xiàn)最佳的Midjourney為例，平均排名從2.40提升至1.98。

　　改進(jìn)的本質(zhì)

　　關(guān)鍵發(fā)現(xiàn)是這種提升的性質(zhì)：統(tǒng)計(jì)分析顯示兩種方法的提示詞長(zhǎng)度并無(wú)顯著差異，在IEI方法表現(xiàn)優(yōu)異的案例中，46%的情況下提示詞甚至更短。

　　這證明了改進(jìn)源于認(rèn)知步驟的完整性而非信息量的增加。兩種方法的唯一區(qū)別在于IEI方法增加了“解釋”環(huán)節(jié)的思考指導(dǎo)——引導(dǎo)AI明確分析為什么兩個(gè)概念能夠組合。這一額外的認(rèn)知步驟顯著提升了最終的創(chuàng)意生成質(zhì)量。

　　這一發(fā)現(xiàn)表明，完整的創(chuàng)意認(rèn)知流程（識(shí)別+解釋+暗示）比跳過(guò)中間步驟的簡(jiǎn)化流程（識(shí)別+暗示）更能激發(fā)AI的創(chuàng)造潛力。

　　AI創(chuàng)造力的關(guān)鍵瓶頸

　　當(dāng)前多模態(tài)創(chuàng)意流程呈現(xiàn)出一個(gè)突出瓶頸：文字概念到視覺(jué)實(shí)現(xiàn)的轉(zhuǎn)換階段。我們觀察到，絕大多數(shù)生成的概念描述已經(jīng)能較完整地傳達(dá)主題，但其中仍有相當(dāng)一部分在轉(zhuǎn)成圖像時(shí)質(zhì)量未達(dá)預(yù)期，顯示“概念構(gòu)思”與“視覺(jué)落地”之間存在性能落差。引入從識(shí)別到解釋、再到暗示的IEI框架后，較強(qiáng)的圖像模型獲得更明顯的偏好提升：例如 Midjourney 的相關(guān)勝率提升顯著（0.26→0.36），而 Stable-Diffusion-3 的提升較溫和（0.15→0.18）。這表明指令解析與語(yǔ)義對(duì)齊能力越成熟的模型，越能從像IEI框架這種精細(xì)化的測(cè)試框架中受益。

　　重新思考機(jī)器智能的邊界

　　當(dāng)我們用科學(xué)的方法“解剖”AI的創(chuàng)造力時(shí)，得到的答案遠(yuǎn)比想象中更加復(fù)雜。這項(xiàng)研究告訴我們：AI的創(chuàng)造力既真實(shí)存在，又有著清晰的邊界。

　　在理解層面，頂級(jí)AI的表現(xiàn)令人矚目：它們?cè)谧R(shí)別基礎(chǔ)概念元素方面表現(xiàn)優(yōu)異，在解釋概念間關(guān)系方面具備強(qiáng)大能力，在暗示深層意義理解方面也展現(xiàn)出接近專家的水準(zhǔn)。在生成層面，AI展現(xiàn)出了可優(yōu)化的潛力，但其作品質(zhì)量仍然明顯遜色于人類專家的藝術(shù)創(chuàng)作。

　　這些發(fā)現(xiàn)最有價(jià)值的地方，不在于給AI“打分”，而在于讓我們有了一個(gè)全新的觀察角度。過(guò)去我們總是看AI做出了什么，現(xiàn)在我們開始關(guān)注它是如何思考的。這種轉(zhuǎn)變讓我們發(fā)現(xiàn)，創(chuàng)造力原來(lái)可以被拆解成這樣具體的認(rèn)知步驟，這對(duì)理解人類自己的創(chuàng)造過(guò)程也有啟發(fā)。

　　有趣的是，這些研究結(jié)果揭示了一個(gè)幾乎完美的互補(bǔ)關(guān)系：AI擅長(zhǎng)快速分析和邏輯梳理，人類則在情感表達(dá)和文化洞察上有著天然優(yōu)勢(shì)。這讓人想到，也許創(chuàng)造從來(lái)就不是單打獨(dú)斗的事情，而是需要不同智慧的碰撞和融合。

　　或許我們一直問(wèn)錯(cuò)了問(wèn)題。與其擔(dān)心“AI會(huì)不會(huì)取代人類創(chuàng)造力”，不如思考“AI如何幫助我們成為更好的創(chuàng)造者”。當(dāng)我們真正了解了AI能做什么、做不了什么，我們反而能更清楚地認(rèn)識(shí)人類創(chuàng)造力的珍貴之處——那些源于生活體驗(yàn)的洞察，那些無(wú)法被算法復(fù)制的文化感悟，那些只有人類才能賦予作品的溫度。創(chuàng)造力從來(lái)不是零和游戲，而是可以相互啟發(fā)的。在這個(gè)AI快速發(fā)展的時(shí)代，學(xué)會(huì)與機(jī)器協(xié)作創(chuàng)造，可能正是我們重新發(fā)現(xiàn)人類創(chuàng)造本質(zhì)的機(jī)會(huì)。

　　參考文獻(xiàn)：

　　1. Peng, Yongqian and Ma, Yuxi and Wang, Mengmeng and Wang, Yuxuan and Wang, Yizhou and Zhang, Chi and Zhu, Yixin and Zheng, Zilong. "Probing and Inducing Combinational Creativity in Vision-Language Models." CogSci, 2025. https://escholarship.org/uc/item/4fj0m0cw

編輯：趙雪婷

科普動(dòng)態(tài)

科普大觀園

視頻推薦

友情鏈接

科普中國(guó)中國(guó)數(shù)字科技館中國(guó)公眾科技網(wǎng)中國(guó)科普網(wǎng)中國(guó)科普博覽蝌蚪五線譜湖北省科學(xué)技術(shù)協(xié)會(huì)上海科普網(wǎng)科普天津吉林公眾科學(xué)網(wǎng)河北科普網(wǎng)河南科普在線科普貴州甘肅大眾科普網(wǎng)科普湖南在線江蘇科普云山西科普網(wǎng)安徽科普神農(nóng)架國(guó)家公園

日产精品久久久一区二区_丝袜美腿精品国产二区_国产裸体写真av一区二区_品久久久久久久久久96高清

研究 | AI的組合創(chuàng)造力：機(jī)器能否真正理解創(chuàng)意的誕生過(guò)程？