優寶購物《ubao.Tw》特貨品商城,黑貓宅配,取貨付款,xAI發布Grok 4.1!性能「打趴Gemini」登頂榜首:跟前一代差在哪?為何幻覺更少了?
數位時代

xAI發布Grok 4.1!性能「打趴Gemini」登頂榜首:跟前一代差在哪?為何幻覺更少了?

數位時代

重點一:xAI 推出 Grok 4.1 與 Grok 4.1 Thinking,免費開放且宣稱大幅降低幻覺。

重點二:依 LMArena Text Arena 榜單,Grok 4.1 Thinking 榜首(1510 分),Grok 4.1 排第 19(1437 分)。

重點三:付費用戶可獲較少限制;xAI稱 Grok 4.1 較前版幻覺率降至三分之一。

Elon Musk 旗下 xAI 宣布推出兩款模型:Grok 4.1 與 Grok 4.1 Thinking(思考版),並以免費形式開放使用,付費用戶則享有較低使用限制。

廣告

官方強調,此次升級在品質與速度均有進展,其中最重要的指標是「降低幻覺」:xAI 表示 Grok 4.1 相較前代模型,產生錯誤內容的機率下降至約三分之一,為近期最具代表性的版本之一。

雖然頁面以「顯著降低」描述成果,但尚未同步公開具體數值、區間、或統計顯著性檢定方法。整體訊息傳達方向是:在非推理(fast)模型加入搜尋工具、並透過後訓練,能提升面向事實的回答穩定度,降低重大與次要錯誤的出現機率。

至於新模型表現如何?

根據 lmarena.ai(LMSYS Chatbot Arena)在 X 公布最新「Text Arena」排行榜,Grok 4.1(thinking)以總分1483 登上榜首;在難度更高的「Arena Expert」榜單,該版本同樣以總分1510 奪冠,顯示其於綜合語言理解、推理與生成品質的競爭力。

同系列的 Grok 4.1(一般版)在「Text Arena」位居第2、總分1465,「Expert」榜第19、總分1437

lmarena.ai 並指出,相較兩個月前進入 Arena 的 Grok 4 fast,最新成績「提升超過 40 分」,意味模型在對話穩定性、指令遵循與高難度提示(Hard Prompts)等面向有明顯躍升。

lmarena.ai補充,Grok 4.1(thinking)在「高難度提示詞、編碼、指令執行、創意寫作」等概覽類別表現亮眼,且在「職業排行榜」多數職業領域顯示強勢,

Grok 4.1為何幻覺更少了?

頁面明確交代評測框架:採用「非推理模型+網路搜尋工具」進行回答,並以「幻覺率」作為核心品質指標。

白話來說,就是讓「不做深度推理的快速模型」搭配「網路搜尋工具」去回答問題,然後把回答裡每一句可被查證的小事實(原子主張)逐一比對,看有沒有重大或次要錯誤,最後把各題的錯誤比例平均,這個平均值就是「幻覺率」。

此做法符合目前檢核事實一致性的主流思路,但細節如原子主張切分準則、標註者一致性(IAA)、與錯誤分級標準,頁面未見公開;因此,外界暫時只能根據定義理解方向,尚無法重現驗證。

強敵環伺!Gemini 3.0成關注焦點

此次雙版本免費釋出,明確強化 xAI 在用戶擴張上的策略,為開發者與一般用戶提供入門門檻更低的使用選項;同時透過付費方案降低頻率與容量限制,維持商業化的可持續性。

從產品訊息來看,Grok 4.1 的訴求為「更可靠、更快速」,核心賣點鎖定降低幻覺與整體表現提升。「Thinking」版則展現更高階的推理與對話品質,反映出 xAI 對多場景推理能力的重視。

另一方面,競品壓力不減:OpenAI 持續迭代至 GPT 5.1,Google 亦可能以 Gemini 3.0 再度抬高性能天花板。對使用者而言,短期可將 Grok 4.1 視為一個在可靠性上有所強化、且擁有可觀基準成績的免費選項;中期則關注其在更廣泛任務中的真實表現與資源限制的影響。

延伸閱讀:馬斯克又出手!SpaceX豪擲20億美元投資xAI,估值衝上3.3兆元

「地表最強模型」來了!Grok-3挾3種模式發布,馬斯克:你100%會愛上它

資料來源:xAILMarenaBleep Computer

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導
貝佐斯參戰!出任AI新創「普羅米修斯計畫」CEO:自掏腰包投資62億美元,全為了「實體任務」?
加入黃仁勳麾下!台積電前副總李文如傳11/18降落輝達:她有何資歷?為何蘋果、高通⋯都要延攬她?

其他人也在看

輪椅不是限制而是力量!台灣自辦輪椅技巧障礙挑戰賽登國際舞台,吸引多國選手越洋參賽

輪椅不是限制而是力量!台灣自辦輪椅技巧障礙挑戰賽登國際舞台,吸引多國選手越洋參賽

由民間自籌自辦的「輪椅技巧障礙挑戰賽」,今年將於11/29-30再度登場。藉由鼓勵輪椅人走出家門、嘗試不可能挑戰的精神,第二屆「輪椅技巧障礙挑戰賽」甚至還受到國際輪椅人的矚目,來自馬來西亞、香港等團隊組隊共12位輪椅人跨海前來參加,即將藉由活動展開無礙外交。

今周刊 ・ 1 天前
赴美留學免托福!教育部攜手美國4所名校試辦,修EMI全英課程可讀頂尖高校…創非英語母語國家首例

赴美留學免托福!教育部攜手美國4所名校試辦,修EMI全英課程可讀頂尖高校…創非英語母語國家首例

教育部17日舉辦「大專校院學生雙語化學習計畫」記者會,宣布啟動「EMI 免試托福試辦計畫」。未來學生在臺灣修習一定比例的全英語授課(EMI)課程後,申請至合作美國大學就學,即可豁免托福成績,使臺灣成為全球第一個非英語母語國家獲美國頂尖大學正式採認EMI修課成果的國家。 此突破打破美國大學過往僅對英語系國家或新加坡提供豁免的慣例,象徵臺灣EMI教學品質與雙語教育推動五年的成果已獲國際信任,對提升臺灣高教的能見度與國際連結具有重大意義。

今周刊 ・ 1 天前
景氣不可只看台積電、漲幅集中特定類股不會變!資深投資人的年末提醒

景氣不可只看台積電、漲幅集中特定類股不會變!資深投資人的年末提醒

行情的確已步入大幅震盪階段,市場上對AI是否泡沫化的疑慮愈發高調,加上聯準會的降息看法出現分歧。 AI類股或龍頭股的漲幅過大,而漲多就是最大的利空,其餘因素多半只是附帶反應。市場遲早須面對過度龐大的獲利回吐賣壓。猶如堰塞湖,若能提前釋放水量反而是好事。 從近期大型避險基金與主動式基金揭露的持倉變化來...

商業周刊 ・ 1 天前
Anthropic最新報告:史上首次!中國以 AI 發動的大規模網路間諜攻擊曝光

Anthropic最新報告:史上首次!中國以 AI 發動的大規模網路間諜攻擊曝光

Anthropic指出,中國支持的駭客透過Claude AI 完成自動化高達 80%–90% 的網路攻擊。

數位時代 ・ 1 天前
xAI突襲發表Grok 4.1,幻覺大幅降低、劍指Google Gemini 3.0

xAI突襲發表Grok 4.1,幻覺大幅降低、劍指Google Gemini 3.0

Elon Musk 旗下的人工智慧公司 xAI 採突襲戰術,悄然上線了全新的 Grok 4.1 模型系列。此次更新分為標準版的 Grok 4.1 ,以及支援深度推理的 Grok 4.1 Thinking,兩者目前均向使用者免費開放。

Mashdigi ・ 19 小時前
台幣後續怎麼走?中信金高麗雪:年底前在30元上下震盪,中長期仍偏升值趨勢

台幣後續怎麼走?中信金高麗雪:年底前在30元上下震盪,中長期仍偏升值趨勢

近日因為台美匯率聯合聲明、《經濟學人》雜誌指出台灣出現「台灣病」等議題,讓新台幣走勢再度成為市場熱議話題。由於匯率走勢對金控業與壽險業來說,是相當重要的影響因素,在週一(11/17)舉行的中信金法說會上,中信金控總經理高麗雪分享集團內的看法表示,預估年底前新台幣將在30元上下震盪,惟中長期仍偏升值趨勢。

今周刊 ・ 1 天前
常聽音樂療癒失智?最新研究:罹病風險降低39%

常聽音樂療癒失智?最新研究:罹病風險降低39%

最新研究指出,經常聽音樂的長者,罹患失智症的風險可降低39%。研究分析逾萬名70歲以上長者的資料顯示,音樂有助於維持認知能力與記憶力。雖尚無法證實因果關係,但研究強調,音樂可能是延緩大腦老化的有效生活工具。許多人習慣在散步、開車或工作時,播放喜愛的音樂,但音樂的益處可能遠超過你的想像。《國際老年精神

遠見雜誌 ・ 1 天前
營運谷底確立 M31迎來2026大爆發!

營運谷底確立 M31迎來2026大爆發!

在全球AI與高速運算需求全面升溫的背景下,矽智財M31(6643)正迎來關鍵轉折點。雖然今年第三季受到客戶開案遞延與先進製程導入時間拉長影響,使營收短期承壓,但從法說會釋出的訊號來看,M31的基本面正走向「谷底翻揚」,明年與後年更被法人視為全新的成長周期起點。

理財周刊 ・ 1 天前
錼創、沛爾生醫、愛爾達今起可當沖!創新板獨角獸tibit正式登場,加速推動資本市場變身亞洲那斯達克

錼創、沛爾生醫、愛爾達今起可當沖!創新板獨角獸tibit正式登場,加速推動資本市場變身亞洲那斯達克

臺灣證券交易所於週一(11/17)舉辦「創新板3.0」發表會,董事長林修銘宣布創新板邁入新階段,並正式發表全新象徵角色──臺灣創新板獨角獸「tibit」。 林修銘表示,自2021年創新板成立以來,歷經四年努力,終於迎來「3.0時代」,象徵臺灣新創市場邁向國際的重要里程碑。

今周刊 ・ 1 天前
黃國昌列貪汙被告,北檢分他字案調查!被爆金流回流、金主有成衣大廠?律師:收賄罪會比徐永明7年更重

黃國昌列貪汙被告,北檢分他字案調查!被爆金流回流、金主有成衣大廠?律師:收賄罪會比徐永明7年更重

國民主席鄭麗文與民眾主席黃國昌將於11/19會面,黃國昌11/18被《鏡週刊》繼續爆料,支付狗仔薪資的「凱思國際」,有資金回流到黃國昌口袋,資金來源則包括臺雅集團旗下寀奕公司、《鏡電視》前零元股東陳建平及黃安捷,黃國昌都曾對此質詢,等於金主把錢匯入凱思國際後,黃國昌拿錢辦事,確立貪汙的對價關係。 黃國昌11/18在公聽會前對此回應,週刊之前的烏龍爆料都沒有道歉,現在又繼續潑糞、抹黑,「有什麼話到法院講,不會隨之起舞。」 至於黃國昌涉嫌透過「凱斯國際」收到臺雅集團二代挹注資金200萬元,有民眾認為黃國昌涉嫌利用立委職權收受好處,告發黃國昌涉嫌貪污。 北檢已分「他案」將列黃國昌為貪汙罪被告,交由正在偵辦黃國昌涉組織狗仔跟監政要的專責檢察官進行調查。

今周刊 ・ 16 小時前
藍白二度強修財劃法,卓榮泰喊無法接受違法編列預算:國會勿一意孤行「未到最後關頭絕不輕言抵制」

藍白二度強修財劃法,卓榮泰喊無法接受違法編列預算:國會勿一意孤行「未到最後關頭絕不輕言抵制」

在藍白聯手下,立法院二度強修《財政收支劃分法》。行政院長卓榮泰周二(11/18)受訪表示,自去年520以來,國民及民眾主導的國會持續對行政院步步進逼,企圖迫使行政院接受違憲法案與預算案。 卓揆直言,國會上周五逕付二讀火速通過國民版「財劃法」,不僅無法解決長期存在的水平分配與垂直劃分不公問題,更將造成中央需再舉債2600億元,總舉債規模達5600億元,已違反「公債法」規定。 卓揆強調中央政府無法接受此次修法,也無法違法編列預算,並預告行政院將於周四院會通過院版「財劃法」,以五大原則全面照顧中央、地方與全民。 他表示行政院在協商未達絕望前不會放棄,未到最後關頭也不會輕言抵制。​​​​​​​​​​​​​​​​

今周刊 ・ 16 小時前
黃董又贏?記憶體供貨吃緊 SanDisk點名外包給力積電

黃董又贏?記憶體供貨吃緊 SanDisk點名外包給力積電

力積電(6770)已非吳下阿蒙了嗎?黃董的秘密武器已經慢慢亮出!又是市場消息,美國大廠SanDisk在日前大幅調漲NAND報價逾五成後,正積極尋求外包產能,並點名與台廠力積電(6770)合作。消息指出,SanDisk將自備機台、進駐力積電銅鑼新廠,由力積電代工生產NAND晶片,最快於明年上半年正式啟動。

理財周刊 ・ 1 天前
KPMG全球汽車產業報告 68%企業正在重組供應鏈

KPMG全球汽車產業報告 68%企業正在重組供應鏈

KPMG今(18)日發布《2025全球汽車產業高階主管調查報告》,報告顯示,36%的高階主管預期未來3年內,公司商業模式、產品或營運將出現重大改變;此外,68%的企業已著手重組供應鏈,77%認為策略聯盟與合作夥伴關係已對業務成長具實質貢獻。

太報 ・ 1 天前

波克夏砸43億美元大買,Alphabet週一急彈3.11%,今年漲幅在七雄稱王

【財訊快報/陳孟朔】「股神」巴菲特(Warren Buffett)掌舵的波克夏海瑟威(Berkshire Hathaway)在最新提交的監管文件中披露,今年第三季斥資約43億美元買入谷歌母公司Alphabet(美股代碼GOOG),持有1785萬股Alphabet A類股,Alphabet一舉躍升為波克夏第十大持股,顯示波克夏在科技股配置上正明顯向AI與雲端長線主題傾斜。在波克夏加持與資金追捧下,Alphabet股價連續三個交易日累跌14.9美元或5.1%後,週一急彈8.61美元或3.11%,收報285.02美元,盤中最多飆升6.5%至294.48美元,創歷史新高,亦拿下標普500與那指100指數成份股單日漲幅冠軍。今年以來Alphabet累計上漲約50.57%,成為科技七雄中表現最亮眼的一檔。市場解讀,波克夏此番大手筆加碼Alphabet、同時調降蘋果持股權重,頗有巴菲特對「科技股陣容」進行臨別布局之意,一方面將資金自過度集中的蘋果部分挪向另一家美國科網巨頭Alphabet,藉此分散單一標的風險;另一方面也看好Alphabet在生成式AI、雲端服務與數據中心投資上具備長週期成長紅利。巴

財訊快報 ・ 1 天前

巴菲特8年前喊「錯過了」 突砸1500億買進Google母公司怪怪的?

波克夏近來提交的申報文件顯示,斥資近50億美元買入Google母公司Alphabet,引發市場高度關注。這筆交易揭露後,帶動Alphabet股價於周一逆勢上漲超過3%。由於波克夏長期以來以價值投資聞名,偏好獲利穩定但不受市場追捧的企業,此次選擇進場股價已大幅上漲的科技巨頭,特別受到矚目。

中時財經即時 ・ 1 天前

《通網股》友訊Wi-Fi 7旗艦路由器 獲台灣精品獎

【時報記者王逸芯台北報導】友訊(2332)今日宣布,旗下AQUILA PRO AI M95 BE9500 Wi-Fi 7三頻無線旗艦路由器憑藉技術創新、設計美學與卓越使用體驗,榮獲第34屆台灣精品獎。此殊榮不僅肯定友訊在品質與創新上的持續投入,也再度擦亮MIT台灣製造的國際形象。M95此前已獲2025德國紅點設計大獎(Red Dot Design Award),此次再度在設計與功能性方面受獎,展現品牌「台灣品質、智慧創新、一站整合、永續設計」的核心理念。 在網通技術高速發展的趨勢下,友訊指出,隨著雲端娛樂、VR/AR與多設備連線需求大幅成長,新世代Wi-Fi 7技術的重要性日益提升。M95採用最新Wi-Fi 7三頻標準(2.4GHz/5GHz/6GHz),支援320MHz超寬頻道,並搭載高通1.5GHz四核心晶片,提供更高速且穩定的資料傳輸。產品支援多連接模式(MLO)與MESH網路,可降低延遲與干擾,並具備2.5Gbps全埠傳輸能力,兼顧無線及有線網速,打造全屋無縫連網環境。 M95在安全性方面亦強化升級,通過歐盟最新EN18031無線安全標準及WPA3加密協定,提供家庭與商用等級的

時報資訊 ・ 1 天前
籃籃首發聲「沒發覺被胡瓜誤觸胸部」 被爆有男友急澄清

籃籃首發聲「沒發覺被胡瓜誤觸胸部」 被爆有男友急澄清

胡瓜最近在《綜藝大集合》上誤觸籃籃胸部一事,引起網友討論,小禎19日受訪時,坦言爸爸心情有受到影響,還脫口說出籃籃有男朋友一事,跟籃籃男友很熟。對此,籃籃透過經紀公司回應,強調自己目前單身。

簡子喬|Yahoo名人娛樂特派記者 ・ 2 小時前
台股紅翻黑!43萬散戶昨搶短…今天套牢了

台股紅翻黑!43萬散戶昨搶短…今天套牢了

台股反彈無力,收復2萬7點失敗,空軍氣焰大增,接近中午指數由紅翻黑,一度下跌近140點,據證交所資料顯示,昨天趁台股下跌691點,短短一天有43.7萬散戶進場「搶短」,但今天若收盤時指數未拉起,恐怕「搶反彈不成反住套房」,慘遭套牢。

Yahoo奇摩股市 ・ 9 小時前
胡瓜遭控襲胸籃籃「心情低落」 小禎曝私下交情:我是大義滅親型

胡瓜遭控襲胸籃籃「心情低落」 小禎曝私下交情:我是大義滅親型

小禎19日出席保養品牌10週年記者會,爸爸胡瓜最近在《綜藝大集合》上誤觸籃籃胸部一事,被網友炎上,她表示有和爸爸通電話,不曉得為何事情會變成這樣,因為胡瓜真的把籃籃當作乾女兒,跟籃籃男友也熟識,「但如果籃籃覺得不舒服,我也完全支持她,我是屬於大義滅親型 。」

簡子喬|Yahoo名人娛樂特派記者 ・ 5 小時前
惹到道奇巨星大谷翔平?因為「這件事」不再向教士隊致意!

惹到道奇巨星大谷翔平?因為「這件事」不再向教士隊致意!

體育中心/綜合報導MLB美國職棒洛杉磯道奇日籍巨星大谷翔平在比賽首次上場打擊前都會向敵隊摸一下頭盔致意,不過近日在網路上出現大谷翔平不和教士隊致意的話題,原因竟和「這件事」有關。

FTV Sports ・ 1 天前
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86