優寶購物《ubao.Tw》特貨品商城,黑貓宅配,取貨付款,「只懂古典物理的LLM,無法提出相對論!」學者解密AI思維鏈:為何光寫提示詞,配不上「工程」兩字?
數位時代

「只懂古典物理的LLM,無法提出相對論!」學者解密AI思維鏈:為何光寫提示詞,配不上「工程」兩字?

數位時代

大型語言模型(LLM)究竟只是懂得模仿人類說話的「隨機鸚鵡」,還是通往通用人工智慧(AGI)的基石?這個問題在科技界引發了無數討論與猜想。當我們驚嘆於 ChatGPT 或 Claude 的強大能力時,也難免對其運作的黑盒子感到困惑:它們究竟如何「思考」?能力邊界又在哪裡?

最近,在 a16z Podcast 節目中,美國哥倫比亞大學電腦科學與電機工程學系教授 Vishal Misra 提出了一套極具洞察力的理論框架,幫助我們理解 LLM 的運作方式、能力邊界及未來發展。

見解一:LLM 的「思考」模式,其實與人類驚人地相似

Misra 的核心觀點是,LLM 會將這個複雜、高維度的世界資訊壓縮成較低維度的「幾何流形」(geometric manifold)。這個流形本質上是模型從海量訓練資料中學到的一張「知識地圖」,而它沿著這張地圖推理的過程,是一種基於訓練數據的「貝氏推論」(Bayesian reasoning)。

廣告

用比喻來說:當 LLM 生成內容時,它就像沿著這張已知的「知識地圖」行走。只要走在既有的路徑上,產出的內容就會自信且合乎邏輯;然而,一旦「偏離了流形」(veers away from the manifold),就會開始「產生幻覺」,用同樣自信的語氣說出看似合理卻完全錯誤的內容。

Misra 指出:「一旦偏離了流形,AI 就開始產生幻覺,開始胡說八道。」因此,模型的「自信」程度與其內部地圖上路徑的清晰度直接相關:路徑越明確,回答就越自信。

那麼,模型的「幻覺」(hallucination)是什麼?沿用上述比喻,幻覺就是 LLM 偏離地圖上的已知路徑,進入未知領域。

這個觀點有趣之處在於,它恰好反映了人類的推理方式: 人類同樣會將複雜世界簡化為內心的認知模型,並在這個模型內進行思考與推理。

a16z 合夥人 Martin Casado 在節目中巧妙總結了這個想法:「我們將這個極其複雜、充滿隨機性的宇宙,簡化為某種幾何流形;當我們推理時,我們只是沿著這個流形移動。」

見解二:「思維鏈」之所以有效,關鍵在於找到地圖上的安全路徑

要讓 LLM 產生更可預測、更準確的輸出,關鍵在於理解兩個概念:「資訊熵」(information entropy)和「預測熵」(prediction entropy)。前者關乎你的提示(prompt),後者關乎模型的輸出。

Misra 用了幾個例子說明:

  • 低資訊提示 :「我要出去吃晚餐。」這句話非常普遍(資訊熵低),因此可能的後續發展非常多(預測熵高),模型可能會接「去麥當勞」、「和朋友一起」或「在今晚」。

  • 高資訊提示 :「我要和 Martin Casado 共進晚餐。」這句話非常具體且罕見(資訊熵高)。模型會利用這個充滿資訊的上下文,大幅縮小可能性的範圍(例如,傾向米其林星級餐廳而非麥當勞),從而降低預測熵。

Misra 接著以「769 × 1025」的乘法為例:直接要求 LLM 給出答案,是一個「高熵」任務,等同於在地圖上進行一次不可能的長距離跳躍,難以準確到達目的地。

但如果引導 AI 像人類一樣分解為筆算的步驟(先算 5×9、再算 5×6……),每一步都是「低熵」且明確的任務。這就像找到一條鋪設完善、眾所周知的安全路徑,每一步都清晰可見,最終可自信抵達正確答案。

這正是「思維鏈」(Chain of Thought)提示法的核心原理:把複雜的高熵問題,轉化為一系列模型熟悉的低熵小步驟,幫助模型在地圖上找到穩妥的前行路徑,大幅提高準確率。

對一般用戶而言,啟示很清楚: 在提示中提供越具體、資訊越豐富的上下文,或把任務分解得越細,就越能把 LLM 約束在其流形上的低熵路徑(更可預測、更準確)。

見解三:LLM 是優秀的探索者,但無法發現新大陸

如果 LLM 是精通現有地圖的導航者,那麼 AGI 應該是什麼?

Misra 提出了一個極高標準:AGI 的能力是「創造新的流形」,也就是繪製全新的地圖,而不僅是在已知地圖上導航。這意味著 AGI 必須能創造出全新的科學理論、數學分支或思想範式。

他進一步指出,LLM 的所有產出,都是其訓練資料的「歸納閉包」(inductive closure)——本文中所謂「知識地圖」邊界的正式名稱。亦即,LLM 極擅長連接地圖上已知的知識點、找出最佳路徑,但無法創造出地圖之外的全新知識點。

為了強化這個觀點,Misra 舉了愛因斯坦的例子:

「任何一個在 1915 年前的物理學資料上訓練的 LLM,永遠不可能提出相對論。愛因斯坦必須否定牛頓物理學,提出時空連續體的概念,他完全重寫了規則。當我們能夠創造新科學、新成果、新數學時,AGI 才會出現。」

總結來說,當前的 LLM 無法透過遞迴式自我改進來產生真正的新知識,因為資訊從未離開過最初由訓練資料所劃定的地圖邊界。它們或許能解出極其困難的數學競賽題目,但不會發明全新的數學分支。

Misra 強調: 「一個只學習了古典物理學的 LLM,永遠不可能想出量子力學。」

見解四:AI 進展正在趨緩,單靠更多資料無法通往 AGI

許多人認為,只要不斷投入更多資料和算力,LLM 最終就能進化成 AGI。但 Misra 提出反對意見。他指出,LLM 的發展好比 iPhone 的迭代:「第一代 iPhone 的問世是革命性的……近年更新多半是相機更好、記憶體更大等漸進式改良,核心能力並未根本改變。」

為何「更多資料與算力」並非萬靈丹?依據流形理論,增加資料只會讓現有的「知識地圖」更平滑、更精細、解析度更高,但終究無法幫助模型發現一個全新的、不在地圖上的大陸。

Misra 與 Casado 進一步闡述,即便賦予 LLM「眼睛與耳朵」,讓它從現實世界持續學習,也無法改變上述本質。因為用來訓練初始模型的資料量過於天文,任何後續的增量數據都只是滄海一粟,無法演化或創造出全新的流形。

這個觀點為當前 AI 發展的「規模論」提供了重要反思(編按:即認為只要不斷擴大模型規模、訓練資料與運算能力,就能實現 AGI 的主張)。

Misra 的意思是,要達到 AGI,所需的可能不是規模的無限擴張,而是一場「架構上的躍進」(architectural leap),例如讓 AI 真正模擬人類思考,而不僅僅是語言處理。

見解五:鑽研 Prompt 稱不上是一種工程

此外,Misra 在訪談中表示,認為鑽研 Prompt 稱不上是一種工程。他主張「提示工程」(prompt engineering)這個術語是誤稱,因為「工程」一詞在過去代表極高標準的成就——工程學曾意味著把人類送上月球。

而所謂的提示工程,其實只是東改西改的「提示撥弄」(prompt twiddling):針對提示詞進行調整或修改,以觀察模型輸出(推論)的變化。

他直言,目前的 AI 社群中存在過多的經驗主義(empiricism),而「提示工程」正是其體現。現在有數百篇論文以不同方式改變 Prompt、進行實驗,然後寫下觀察結果。由於人們不理解 LLM 系統如何運作,只能不斷測量與試驗,導致大量此類經驗性工作(empirical work)的產生。

因此,在他看來,這種缺乏嚴謹理論與模型支撐、僅依靠反覆試驗來調整輸入以改變輸出的做法,不應被冠以「工程」之名。

結論:AI 現階段仍是昂貴的知識骰子機,AGI 還早

總結來說,Misra 的觀點提供了一個清晰且統一的框架:LLM 是基於龐大訓練資料進行貝氏推論的強大工具,是知識的導航者,能在人類已知的知識地圖上高效探索與連接;但其能力有由「歸納閉包」所定義的明確邊界,並非直通 AGI 的康莊大道。

需要強調的是,這並非貶低 LLM 的價值——它們正以前所未有的方式提升生產力。但理解其根本限制,能幫助我們更理性地看待 AI 的未來。

延伸閱讀:Gemini、ChatGPT、Perplexity免費版哪個好用?5大常用AI工具特色、適用情境完整整理
可以瑟瑟!OpenAI將開放「成人版ChatGPT」解禁鹹濕對話,最快12月上線對尬Grok

資料來源:a16z

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導
從高壓行銷戰場到山林靜心!前滾石經理轉行森林療癒師:這門「療癒副業」如何規模化?
特力屋要興櫃了!特力集團上市逾30年,為什麼這時才讓「小金雞」出征投資人市場?

其他人也在看

MLB》大谷翔平代表作13歷史紀錄 只有1個缺憾

MLB》大谷翔平代表作13歷史紀錄 只有1個缺憾

洛杉磯道奇球星大谷翔平昨天在國聯冠軍賽第4戰有驚人表現,史無前例的投10三振同時轟3全壘打表現,已經被許多人譽為大聯盟史上單場最佳表現,不過也有人認為有1個缺憾而無法在運動史上名列前茅。

TSNA ・ 3 小時前
輝達新總部大逆轉!傳點頭改駐北士科T12 新壽T17、T18結局曝

輝達新總部大逆轉!傳點頭改駐北士科T12 新壽T17、T18結局曝

[FTNN新聞網]記者莊蕙如/綜合報導原本由新光人壽主導、引爆台北市政風暴的北士科T17與T18開發案,風向急轉。根據《三立新聞網》報導,輝達(NVIDIA)已經鬆...

FTNN新聞網 ・ 1 小時前
太魯閣為堰塞湖封園 他轟政府:愚蠢蠻橫

太魯閣為堰塞湖封園 他轟政府:愚蠢蠻橫

[NOWnews今日新聞]花蓮馬太鞍溪堰塞湖潰壩後,導致下游光復鄉災情慘重,滿目瘡痍。不過立霧溪近日在燕子口附近也出現堰塞湖,溪水漲至與路面齊高,畫面曝光後讓人感到不可思議。太魯閣國家公園為安全起見,...

今日新聞NOWNEWS ・ 2 小時前
鄭麗文當選藍營「挫咧等」?王家俊直言:盧秀燕2028掰了、戰鬥藍倒閉...祝福國民

鄭麗文當選藍營「挫咧等」?王家俊直言:盧秀燕2028掰了、戰鬥藍倒閉...祝福國民

王家俊表示,還需要代理人選總統嗎?鄭麗文就是最好的代理人。他說,若鄭出不來,就韓國瑜出來;盧秀燕勢必為這次棄選,在選舉過程中保持模糊、等距,付出慘痛的政治代價。

放言 Fount Media ・ 14 小時前
輝達不等了?北士科總部選址出現新轉折 轉攻T12地號

輝達不等了?北士科總部選址出現新轉折 轉攻T12地號

根據《東森新聞》報導,原先被視為首選的新壽T17、T18基地,因北市府與新光人壽協商進度卡關,先前輝達看中北士科的T17、T18土地作為總部預定地,但因地主新光人壽與台北市政府雙方在土地鑑價機制與解約條件上意見分歧,協商陷入僵局,外界甚至揣測該案可能觸礁。隨著其他縣...

CTWANT ・ 13 小時前
鄭麗文當選魁!民進「兩期盼一提醒」惹火國民 美女發言人「超嗆4字」回應了

鄭麗文當選魁!民進「兩期盼一提醒」惹火國民 美女發言人「超嗆4字」回應了

[FTNN新聞網]記者莊蕙如/綜合報導國民主席選舉結果剛出爐,藍營新任魁鄭麗文尚未正式展開布局,就迎來民進的「開場警語」。民進發言人吳崢在選後火...

FTNN新聞網 ・ 2 小時前
100球不是極限!「投手大谷」解除封印力拚率隊橫掃釀酒人闖世界大賽

100球不是極限!「投手大谷」解除封印力拚率隊橫掃釀酒人闖世界大賽

體育中心/綜合報導道奇日籍巨星大谷翔平明(10/18)將掛帥先發,雙刀出鞘,力拚以「投打二刀流」身分率隊4:0橫掃釀酒人,劍指世界大賽,主帥羅伯斯(Dave Roberts)今受訪透露,「投手大谷」明天將解除封印,沒有任何投球限制。

FTV Sports ・ 1 天前
MLB季後賽》大谷翔平先發6局飆10K、打擊三響砲史上第一人 領道奇進軍世界大賽拚連霸

MLB季後賽》大谷翔平先發6局飆10K、打擊三響砲史上第一人 領道奇進軍世界大賽拚連霸

MLB美國職棒大聯盟季後賽國聯冠軍賽,洛杉磯道奇對決密爾瓦基釀酒人賽事,今天(18日)第4戰於道奇主場Dodger Stadium進行,G4推派「二刀流」大谷翔平掛帥先發,這也是大谷在季後賽中第2場先發。

Yahoo奇摩運動 ・ 23 小時前
綠營給鄭麗文2期盼1提醒 國民嗆「3字」內急喊別嚇跑中間選民

綠營給鄭麗文2期盼1提醒 國民嗆「3字」內急喊別嚇跑中間選民

[Newtalk新聞] 國民主席選舉18日落幕,由前立委鄭麗文勝選,預計11月1日完成交接後正式上任。對此,民進發言人發言人吳崢表示,民進對新任國民主席有兩個期盼、一個提醒,希望國民能回歸理性問政,將國家利益置於政之上,共同面對當前國家安全的挑戰,國民則以3個字「您哪位?」回應,有網友傻眼直呼:「國民發言這麼沒禮貌嗎?」 對於鄭麗文的當選,吳崢說,期盼鄭麗文能堅守主權立場,將守護台灣安全置於政利益之上;也期盼國民在國會理性監督、積極問政,不要提出傷害台灣、違憲違法的法案。也提醒國民防範中國勢力滲透,更不應因政私利與中國唱和,做認知作戰的在地協力者。 吳崢也提到,這次國民主席選舉過程中,已明確顯示中國勢力的介入與滲透,新任主席以及國民全上下都應審慎防範,國家安全零容忍、沒有灰色地帶,朝野應共同加強國安防護,抵抗中國各種滲透行為,更不應因政私利與中國唱和,甘做認知作戰的在地協力者。 國民隨後在臉書發文寫道:「有關本主席選舉,國民對民進相關評論的一個提醒:您哪位?」立刻有疑似中國人的網友以簡體字留言高喊:「你看,趙少康sb說大陸介入選舉,民進

新頭殼 ・ 3 小時前
外星人為何不聯繫人類? NASA科學家爆「他們早就覺得無聊了!」

外星人為何不聯繫人類? NASA科學家爆「他們早就覺得無聊了!」

人類長久以來探索外太空,也好奇,若宇宙真的有外星生物,為什麼他們始終不與我們聯繫?美國太空總署NASA天體物理學家羅賓柯貝特(Dr. Robin Corbet)近日提出一個新理論,指外星人其實曾經試著尋找過我們,但後來「覺得太無聊」,就放棄了。

鏡週刊Mirror Media ・ 1 天前
MLB》大谷翔平連投3K後 首打席開轟創紀錄

MLB》大谷翔平連投3K後 首打席開轟創紀錄

休息12天後首度投球出賽的洛杉磯道奇球星大谷翔平,今天雖然一開賽就投出保送,但隨後連飆3次三振,下半局更轟出首打席全壘打,為道奇在對密爾瓦基釀酒人的國聯冠軍賽第4戰取得1比0領先。

TSNA ・ 1 天前
44歲女星撞臉韓國神顏還登時裝周走秀!網友狂刷留言「被歌手耽誤的名模」

44歲女星撞臉韓國神顏還登時裝周走秀!網友狂刷留言「被歌手耽誤的名模」

霸氣走上時裝周伸展台辣秀馬甲線驚豔全場原來是44歲的孫淑媚近日登上《台北時裝周》伸展台,一現身就讓現場尖叫聲不斷!她以淡黃色西裝搭配綠色Bra top造型走秀,露出緊實馬甲線與纖細腰身,氣勢完全不輸專業名模,從眼神到姿態都散發強烈舞台感,網友留言狂刷「太美了吧」、...

styletc ・ 1 天前
劇烈降雨預警「1地區連3天紫爆」!粉專曝最糟情況:大家要有心理準備

劇烈降雨預警「1地區連3天紫爆」!粉專曝最糟情況:大家要有心理準備

今年編號第24號輕度颱風「風神」,今(18)日2時的中心位置在北緯12.9度,東經127.4度,以每小時18公里速度,向西進行。氣象粉專也提醒,共伴效應劇烈降雨預警,並曬出輝達AI模式未來4天降雨模擬,示警恐怕會出現最糟的1狀況,雨量會更加驚人。

三立新聞網 setn.com ・ 1 天前
快檢查!家中這2用品恐暗藏重金屬 長期用恐傷腎還致癌

快檢查!家中這2用品恐暗藏重金屬 長期用恐傷腎還致癌

在現代生活中,許多家庭重視健康飲食,卻可能無意間從日常家居用品中攝入重金屬,造成身體的危害,外媒就點名兩種家中常見的用品,看似光亮、方便,但如果選擇錯誤,可能成為潛在的健康隱患。

三立新聞網 setn.com ・ 19 小時前
風神颱風將生成!東北季風南下「明起大變天」 雨彈連炸一整週

風神颱風將生成!東北季風南下「明起大變天」 雨彈連炸一整週

今(17)日環境仍為偏東風,中央氣象署也於今日凌晨2時將96W升格為熱帶性低氣壓TD-27,表示其在24小時內有機會成為颱風風神。氣象粉專「天氣風險 WeatherRisk」說明,明日晚間起北部至東半部會轉陰雨天氣,且週日起至下週四北部至東部容易有豪大雨,須留意較大雨勢現象。

三立新聞網 setn.com ・ 1 天前
美國經濟陷入寒冬?蔡正元警告下一波「崩盤產業」:川普關稅政策一無所得

美國經濟陷入寒冬?蔡正元警告下一波「崩盤產業」:川普關稅政策一無所得

美國金融市場再度動盪,儘管摩根大通、高盛、富國銀行與花旗等大型銀行第3季財報亮眼,整體業績優於市場預期,但2家地區性銀行卻爆出財務危機,導致市場信心瞬間崩盤。對此,前立委蔡正元直言,「當銀行收緊銀根,老百姓借不到錢,經濟就更加凍結。」蔡正元在節目《中天辣晚報》表示,美國經濟現在「是一個光明的時代,也是黑暗的時代」。他指出,美國的AI產業確實帶動部分富豪暴利成......

風傳媒 ・ 16 小時前
才拿下20億大單!這「線纜大廠」股價大起大落 遭三大法人出貨2萬張...股民哀:又被套住了

才拿下20億大單!這「線纜大廠」股價大起大落 遭三大法人出貨2萬張...股民哀:又被套住了

[FTNN新聞網]記者周雅琦/綜合報導台股今(17)日終場加權指數收在27,302.37點,跌345.50點,跌幅1.25%。據證交所盤後籌碼動向,三大法人今日合計賣超316.16...

FTNN新聞網 ・ 1 天前
立霧溪堰塞湖水漲飛快!超狂對比圖曝光

立霧溪堰塞湖水漲飛快!超狂對比圖曝光

花蓮立霧溪燕子口段昨晚間發生崩塌,今天早上公路局施工人員發現時已形成堰塞湖,水位更是快速上升!早上10點鐘林保署、公路局前往查看時,水位距離路面還有10公尺,但是到下午4點左右已經淹到燕子口步道,由於步道與公路有1到2米落差,因此約5點左右水已經淹上台8線公路!

自由時報 ・ 1 天前
好天氣沒了!颱風+東北季風雙夾擊 明起變天「豪雨強風齊炸」

好天氣沒了!颱風+東北季風雙夾擊 明起變天「豪雨強風齊炸」

好天氣要沒了!受到東北季風增強與「風神」颱風外圍環流影響,明(19日)起全台天氣驟變,北部、東半部地區率先迎來豪雨與強風,部分山區恐有豪雨;中南部雖仍有陽光,但午後也會有局部短暫陣雨。中央氣象署提醒,這波變天不僅雨勢強,風勢也大,全台氣溫將明顯下降,秋意更濃。

三立新聞網 setn.com ・ 14 小時前
MLB/他剛剛還在投球...大谷翔平3響砲 山本由伸腦袋跟不上

MLB/他剛剛還在投球...大谷翔平3響砲 山本由伸腦袋跟不上

道奇日籍二刀流球星大谷翔平今(18日)在國聯冠軍賽G4繳出史詩級表現,不僅主投6局無失分飆出10K,打擊更是轟出3發全壘打,成為大聯盟史上首位單場3轟10K的球員,隊友山本由伸賽後也對大谷的表現感到腦子一度短路。

中天新聞網 ・ 20 小時前
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86