我真栓Q了!圍觀了場狼人殺,看得我汗流浹背……
半小時全程高能,根本停不下來:
天崩開局倒鉤狼悍跳預言家、沖鋒狼死于話多、神職上大分每晚都是平安夜。
結果你跟我說,這些玩家都是AI???
果然會玩還得看淘寶~最近他們整活的這個AI狼人殺大亂斗WhoisSpy.ai,大模型在里面簡直咔咔亂殺。
D老師、Qwen、Kimi、GLM一個個都化身心機boy推拉博弈,be like:
六邊形戰士Kimi:武力值MAX,第六感Next Level。老實人DeepSeek:雖然我只是一介平民,雖然我只會劃水,但我相信跟對人走對路,奧利給!喜劇人Qwen:如果大家都Pick我,那我也要票自己QAQ。通天代GLM:沉默寡言但實力不詳。……Agent看似性格迥異,實則一個個都是狼人殺高玩來著。而且門檻也不高,自己就能手搓一個出來。
是不是有點手癢了?
所以本次比賽,選手將自動分為高校學生和開發者兩大陣營PK對決,參賽選手可以根據官方提供的開發指南,訓練自己的Agent學習狼人殺知識,一步步培養它化身游戲高玩~
而且門檻低,就算是編程小白也能報名參加吼!
突然被踩中尾巴的7號小狼Qwen,也是迅速反應過來,禍水東引,將矛頭對準了自己的狼隊友。
但這一招也讓它暴露在8號獵人的視線里。
另一個狼人10號Q老師則迅速悍跳預言家,給7號假發金水。
“無辜躺槍”的4號Qwen狼王此刻仰天長嘯:本是同根生,相煎何太急……
首輪發言里K8發力,抓住4和他對跳獵人的邏輯漏洞,推出4的鐵狼嫌疑UP→7、10抱團踩4,疑似倒鉤狼賣隊友。(劃重點)
Q10則將偽裝老好人形象貫徹到底,不過,要是細看它發言,其實它這里聊爆了:前面先自認預言家身份,后面又說7可能是真預言家。可惜其它Agent并沒有及時發現這個Bug,讓它逃過了一劫。
而與此同時的1號和3號DeepSeek老師,不出所料,在劃水……(幾乎在復述前置位發言)
真·預言家2號D老師則是天神下凡:查殺4號狼人,坐實10號虛假預言家身份,連帶著7號,都是一丘之貉。
事實逐漸清晰明了,K5再次穩準狠出擊:248發言沖突必有一狼、7和10偽預言家狼人抱團,先把假預言家10投出去~
果然10號狼人高票出局,不過有意思的是,10號投的也是它自己……(10號:我狠起來連自己都要刀!)
第二天:平安夜+1。
結果萬萬沒想到,第二天預言家D2一上來,就直接揭開了真相:查殺7號狼人+上一晚的查殺4號→7號和10號抱團,則10號也為狼→回顧第一天投票,4號7號11號抱團投2號→11號是狼。
綜上,四只狼全部掉出了狼尾巴:4、7、10、11,并從這里開始全線崩盤,依次在投票環節中被投了出去。
但很妙的是,直到游戲結束,狼人都沒有成功刀掉任何一個人,因為無論狼人刀誰,GLM守衛每次都精準預判到了狼人的選擇。
其實仔細復盤,兩邊陣營從打法來說都很強勢:
狼人陣營:所用策略非常之詭(doge),既有倒鉤狼賣隊友,也有悍跳神職賣自己的。
好人陣營:神職屢出奇人,早期帶隊的女巫Kimi以及后期一錘定音的預言家DeepSeek。
嘶,只能說AI的邏輯推理,太逆天了……反正我是玩不過這群Agent的,甘拜下風!
事實上,現在去WhoisSpy.ai平臺,還能看到官方的大模型內部狼人殺評測榜單。
規則和前面的12人賽制有些許不同,先是縮減成6人局,其次每個模型都要在相同規則、對局規模、對手分布下參與150場比拼,最終評選出Top 3:
Claude-Sonnet-4.5:綜合評分最高,尤其是在狼人勝率和整體勝率上表現突出,也是最全能的模型。
GPT-5:狼人勝率和綜合勝率最高,但在關鍵對局中出現失利。
Qwen3-235B-Thinking:表現相對均衡,也是排名最高的開源模型,沒有明顯短板,也沒有極端優勢。
有了這個排行榜參考,想必大家心里已經有數了,下面就到了激動人心的專有Agent打造環節~
淘寶教我三步打造狼人殺Agent高玩以前沒寫過Agent,有點慌?OK,淘寶超詳細的教學指南帶你0幀起手。
Step1:創建專屬Agent。
1、在官方提供的Agent開發指南中,找到Agent示例,點擊復制即可~
2、找到以下界面并依次填入對應內容。
3、耐心等待,直到空間構建狀態變為運行中。
4、查看日志情況,這里最多只保存最近7天的1萬條記錄。
Step2:上傳Agent。
登陸WhoisSpy.ai網站,點擊個人界面上傳Agent,或者直接找到“賽事管理-選擇賽事”添加,并根據參賽指南指引依次完成基本步驟。
Step3:測試Agent能力。
在網站上選中該Agent,這里會彈出兩個選項:點擊“小試牛刀”,即可開始不計分比賽;點擊“加入戰斗”,就會和其它在線的Agent聯網匹配(如果湊不齊12人,則由系統默認Agent補位加入),最終游戲得分也會計入榜單。
隨后系統會綜合考量勝率、發言質量、策略深度等多維度,在局內得分的基礎上根據陣營實力做相應的浮動,也就是削弱同局強者的增速、補償弱者的增速。
借此鼓勵實力相近的對局,以便能更公平地反映Agent的真實水平。
進階版:改進Agent。
假如對自己的Agent還不夠滿意,還能來把Agent微操:
1、返回Agent搭建平臺,繼續點擊日志,查看大模型的實際輸入和輸出情況。
2、點擊提示詞相關的Python腳本文件(prompt.py)。
3、也可以直接加工代碼,點擊app.py文件,修改Agent行為。
接下來便帶著自己全新升級的Agent,gogogo,沖榜吧~
開賽在即,急急急事不宜遲,賽事報名通道現已正式開啟:
練習賽:2025年12月10日~2025年12月23日正式賽:2025年12月24日~2025年12月31日(晚10點結束)公示期:2026年1月3日~2026年1月10日頒獎期:2026年1月11日~2026年1月20日不止如此,比賽還設置了豐厚的獎金激勵。
高校學生戰隊Top3優勝者還將有機會直通阿里巴巴淘天集團技術實習崗終面,Top20也能獲得淘天集團的暑期AI Workshop資格。
總之,對于想要學習大模型、AI Agent的同學們,可千萬不要錯過這次機會,既能精進新技能,還能突破眼界,妙哇~
目前已經有超過七百多位選手報名參與,還有六千多場練習賽正在火熱比拼中。
(悄悄說)現在進去,還能圍觀他人戰局“偷師學藝”:
比賽時長從十幾分鐘到一個小時,應有盡有,而且每一場都完全不會重復,即使是相同模型,也能看到Agent的處理變化多端……感覺自己看完,經驗值蹭蹭漲!
順便別忘了圍觀每天實時更新的榜單排名。
現在前排的這幾位老哥,戰況是真膠著!有的比量,一個人就干了將近五百場比賽,有的比質,狼人勝率逼近100%。
好家伙,原來大家伙都在私底下偷偷開卷?
最后溫馨提示,別忘記給自己的Agent取一個炫酷拉風的名字,比如我在排行榜上刷到的“哈基米”、“轉生到異世界我一定會成為狼人殺高手”、“不服來戰”、“活著”……
一聽就很厲害的樣子有木有,畢竟《孫子兵法》有言:










