網路 2026-05-07

導讀:如果你現在問身邊做技術的朋友“平時用什麼AI寫代碼”,大概率會聽到一個名字:Claude。 不是ChatGPT不夠好,而是在過去一年多的時間裏,Anthropic這家公司硬生生靠Claude殺出了一條血路——不僅年化收入突破300億美元超過OpenAI,還成了全球估值第二高的AI獨角獸。 但如果你再問深一層“最近Claude用得怎麼樣”,可能會聽到另一個聲調——有人誇它“百萬token上下文真好用”,也有人在罵“降智了”“縮水了”。 Claude到底是誰?它在做什麼?爲什麼有人追捧、有人失望? 這篇文章,我想從幾個切面聊聊Claude——不是那種“總分總”的官方介紹,而是一個普通用戶視角的“看懂Claude”。

一、Claude是誰?一個“另類”的AI

先說名字的來源。Claude的命名靈感來自法國數學家、計算機科學的先驅之一克勞德·香農(Claude Shannon)——信息論的奠基人。這個名字本身就暗示着Anthropic的野心:用好的信息理論,造出安全、可控的AI。

Anthropic這家公司成立於2021年,創始人是達裏奧·阿莫迪(Dario Amodei)和他的妹妹丹妮拉·阿莫迪(Daniela Amodei)。兄妹倆都曾在OpenAI工作,深度參與了GPT-2和GPT-3的早期研發。

爲什麼離開OpenAI自己幹?核心分歧在於安全理念。OpenAI傾向於“先做出來再說”,而阿莫迪兄妹更擔心AI失控。Anthropic的核心使命就是“打造可靠、可解釋、可控的AI系統”——說得直白點,就是造一個“不那麼讓人害怕”的AI。

這種理念也體現在Claude的設計哲學上:它有一套名爲“憲法AI”的安全框架,讓模型在訓練過程中學會遵循一套基本原則(比如“避免傷害”“尊重人類價值觀”),而不是簡單地模仿人類對話數據。

正是這種“安全優先”的定位,讓Claude在toB市場獲得了獨特的信任——尤其是在金融、法律、醫療等對容錯率要求極高的行業。

二、Claude家族:旗艦Opus、主力Sonnet、輕量Haiku

Anthropic將Claude模型分爲三個層次,有點像汽車品牌的旗艦、中端和入門:

Opus——旗艦中的旗艦

Opus是Claude家族的“天花板”,定位是“最聰明、最強推理”。目前最新版本是2026年2月發布的Opus 4.6,以及2026年4月發布的Opus 4.7(視覺能力大幅提升的版本)。

Opus適合的任務是:復雜代碼重構、多步驟Agent規劃、長文檔分析、科研推理。

Sonnet——性價比之王

Sonnet是Claude家族的中堅力量,定位“性能接近Opus,價格只有五分之一”。2026年2月發布的Sonnet 4.6,在多項基準測試中表現逼近Opus 4.6,但輸入價格僅爲每百萬token 3美元(Opus是5美元)。

Anthropic官方將Sonnet定位爲“智慧體的理想基礎模型”。在Agent金融分析、辦公任務測評中,Sonnet 4.6的得分甚至超過了Opus 4.6——這意味着對大多數日常任務來說,Sonnet其實是更聰明的選擇。

Haiku——輕量快速

Haiku是Claude家族最輕量、最快速的版本,適合高頻率、低延遲的場景(比如客服機器人、實時翻譯)。

目前Anthropic已經將Sonnet 4.6設置爲claude.ai和Claude Cowork平臺對免費及Pro用戶的默認模型。 換句話說,大多數普通用戶日常接觸到的,其實是Sonnet,而不是那個“聽起來更厲害”的Opus。

三、百萬token上下文:Claude的“殺手鐧”

Claude在2026年3月做了一件讓所有開發者歡呼的事:將Opus 4.6和Sonnet 4.6的上下文窗口全面升級到100萬token,且不加價。 

這個數位有多大?100萬token大約相當於750萬個英文單詞,或者一整套《哈利·波特》系列小說的7倍。你可以把整個代碼庫、幾千頁合同、或者一個長時間運行的AI智慧體的完整執行軌跡,一次性塞給Claude,然後直接開始工作。

過去,開發者不得不人工挑文件、壓縮上下文、反復清理對話歷史。現在這扇門被拆掉了。

更關鍵的是,Claude的“長上下文理解能力”不只停留在營銷話術上。在MRCR v2測試(專門考驗超長文本“大海撈針”能力的基準)中,Opus 4.6拿到了78.3%的高分,在同等上下文長度的前沿模型中排名第一。

作爲對比,上一代模型Sonnet 4.5在同一測試中只拿到了18.5%。這意味着Claude是真的能“記住”塞進去的東西,而不是“看到後面就忘了前面”。

與此同時,多模態能力也大幅提升——單次請求最多支持600張圖片或600頁PDF,是此前的6倍。企業用戶可以一次性分析整套設計系統的截圖,或者一份數百頁的合同掃描件。

四、算力“軍備競賽”:牽手SpaceX,用22萬張GPU撐起用戶量

你可能聽說過AI公司“燒錢”的故事,但Anthropic的算力布局值得單獨拿出來說說。

2026年5月,Anthropiс宣布與SpaceX達成重磅合作,將全權使用SpaceX Colossus 1數據中心的全部算力資源。這筆交易讓Anthropic在本月內新增超過300兆瓦的算力容量,包含22萬張英偉達GPU

22萬張是什麼概念?相當於把幾十個中型數據中心的算力濃縮到一個項目中。新增算力將用於提升Claude Pro和Claude Max訂閱用戶的服務承載與使用體驗——說的直白點,就是“用戶基數大了,需要的服務器也多了”。

在同一場開發者大會上,Anthropic還放寬了Claude Code的調用限制:Pro、Max、團隊版等套餐的五小時調用限額翻倍至10小時,同時取消了高峯時段限制。

這些動作背後是一個清晰的信號:Anthropic正在爲大規模用戶增長做準備,而算力是那道最硬的“門檻”。

五、智慧體的“大腦”:Claude Code與託管智慧體

如果說通用對話是大模型的基礎能力,那麼“智慧體”(Agent)就是大模型的終極形態——能規劃、能執行、能復盤。而Claude正在這個方向上瘋狂堆料。

Claude Code:開發者的“AI同事”

Claude Code是Anthropic專門爲編程場景打造的智慧體工具。它不僅能補全代碼、回答問題,還能真正“動手”完成復雜任務——閱讀整個代碼庫、規劃修改方案、執行重構、跑測試、修復bug。

2026年5月的更新中,Claude Code一口氣發布了十餘項新功能,我挑幾個最亮眼的:

  • 遠程式控制制:你可以把任務留在電腦端後臺運行,外出時用手機繼續接續同一會話、同一開發環境。不用守在電腦前等它跑完。

  • 自動記憶:Claude可以跨會話累積知識,記住關鍵構建命令、調試心得、項目偏好設置。它會自動判斷信息是否對未來有用,從而決定是否保存。

  • 任務例行程式:只需一次性配置好提示詞、代碼倉庫和相關連接項,再選擇定時Cron任務或GitHub Webhook觸發,就能由Claude全自動運行——比如每天早上8點自動跑一遍測試。

  • 多階段、多智慧體代碼評審:系統會拉起一組評審智慧體,分別從不同維度獨立審查代碼,再對所有評審結果進行核驗確認。這套機制能揪出很多原本要花數小時才能發現的問題。

託管智慧體:Claude正在進化成“能自我復盤”的AI

2026年5月發布的託管智慧體升級中,有三項能力值得重點提一下:

多智慧體編排:開發者可以組建智慧體集羣,協同完成超高復雜度的任務。一個“總指揮”智慧體負責統籌全局,多個子智慧體各自執行專屬任務,互不幹擾。

目標結果:這個功能允許開發者精準定義任務的成功標準,Claude會自動反復迭代,直到把任務完成達標。你不需要告訴它“怎麼做”,只需要告訴它“做成什麼樣算成功”。

自主推演——這是最令人興奮的。借助這個能力,Claude可以實現自主復盤。它能主動翻閱過往會話記錄,梳理自身欠缺的能力與本該吸取的經驗教訓,並自主將這些沉澱直接寫入記憶中。

它學會了“復盤”,然後在下一次做得更好。

在開發者大會的現場演示中,工程師們基於這些能力現場“創建”了一家新創企Lumara,爲其開發了一套基因算法軟件,實現無人機在月球的自主着陸——整個過程僅用了幾十分鍾。

六、降智風波:站在風口浪尖的爭議

但Claude最近的日子並不全是“高光時刻”。進入2026年4月,一場“降智門”風波把Anthropic推到了輿論的風口浪尖。

事情的導火索是AMD的AI總監Stella Laurenzo在GitHub上發布了一份詳細的審計報告。她分析了近三個月內6852次真實會話日志,發現Claude在處理復雜工程任務時的表現出現了明顯下滑。

核心數據讓人觸目驚心:2月底,模型的推理深度(可以理解爲模型的“努力程度”)暴跌了67%。代碼閱讀次數從每編輯6.6次驟降至2.0次——這意味着Claude在文件接觸之前就不再仔細研究了。3月8日後,“懶惰鉤子”觸發了173次,而此前從未觸發過。

更早的第三方測試也印證了這一點:Claude Opus 4.6在BridgeBench測試中的準確率從83.3%跌至68.3%,排名從全球第二滑落到第十。

面對質疑,Anthropic官方作出了回應,並確認了兩件事:

第一,2026年2月9日,“自適應思考”默認引入。第二,3月3日,Opus 4.6的默認思考等級被調到“中等”(medium)。

官方解釋說,這是在“智慧、延遲、成本”之間找到一個“平衡點”。但對重度用戶來說,這不是“平衡”,這是“縮水”。尤其是那些購買了Max計劃、支付了20倍價格的用戶,他們以爲自己買的是最頂級的智慧,結果發現默認配置被偷偷調低了。

這件事真正值得思考的不是“Claude變笨了”這個結論本身,而是它揭示了一個行業趨勢:當大模型變成一門生意,平臺就有了一個天然的衝動——在不被用戶察覺的地方,偷偷優化成本。

它還能回答問題,還能寫代碼,甚至還更流暢。但你已經不敢把關鍵任務交給它了。因爲你不知道下一次調用時,它是“滿血版”還是“降智版”。

七、Claude能做什麼?一些具體的場景

聊完了技術細節和爭議,回到一個更實用的問題:如果你是普通用戶,Claude到底能幫你做什麼?

編程開發

這是Claude最擅長的領域。你可以把整個代碼庫丟給它,讓它分析結構、找bug、寫測試、甚至完成一次重構。配合Claude Code的遠程式控制制功能,你甚至可以出門喝杯咖啡,讓它在服務器上替你跑完所有任務。

長文檔處理

100萬token的上下文意味着你可以把一份幾百頁的PDF(比如年度財報、技術白皮書、合同)直接扔給Claude,讓它幫你摘要、提取關鍵條款、回答具體問題。不用分段,不用壓縮,一次搞定。

復雜任務規劃

利用託管智慧體的目標結果功能,你只需要告訴Claude“我需要完成什麼事情”,它可以自行拆解步驟、調用工具、迭代優化。比如“幫我整理過去一周的客戶反饋,分類標注優先級,生成一份周報”——Claude能獨立完成從數據搜集到報告輸出的全過程。

數據分析和圖表解讀

Opus 4.7的視覺能力大幅提升後,Claude可以看懂更復雜的圖表、流程圖、UI設計稿。你可以拍一張白板上的架構圖,讓Claude幫你翻譯成文字描述;也可以給它一張密密麻麻的數據表格截圖,讓它提取關鍵數據點。

日常辦公輔助

從潤色郵件、改寫文案、翻譯文檔,到整理會議紀要、生成PPT大綱——這些常規任務對Claude來說已經是“基本功”。

下一篇: 很抱歉沒有了

免責聲明:凡注明來源中國制造網的所有作品,均爲中國制造網合法擁有版權或有權使用的作品,歡迎轉載並注明出處。非本網站作品均來自互聯網,僅代表作者本人的觀點,中國制造網轉載目的在於傳遞信息,並不代表本網贊同其觀點或對其真實性負責。因作者信息不明等原因,中國制造網使用的部分作品報酬未及時支付,相關權利人可與本網聯系。

分享到: