編輯:傾傾
不到1000天,AI已從會聊天,進(jìn)化到能讀文件、跑任務(wù)、寫論文。它開始介入實際工作流程,人類與AI的分工,也在悄悄重寫。
AI走進(jìn)大眾視野,其實也不到1000天。
可就在這短短1000天里,很多事已經(jīng)徹底換了樣。
三年前,人們用GPT-3寫詩、講段子,它能把一句話寫順就是奇跡。
現(xiàn)在的Gemini 3,會讀文件、查資料、跑代碼、建網(wǎng)站,甚至能把十年前的舊數(shù)據(jù)整理成一篇14頁的學(xué)術(shù)論文。
在沒有具體研究題目的情況下,它也能自己確定研究切口。
AI不再等人開口提問,它開始主動把事情做完;而人與AI之間的關(guān)系,也悄悄進(jìn)入了新位置。
三年前的「驚艷」,現(xiàn)在回看只是序章
如果把時間倒回2022年底,那個節(jié)點(diǎn)幾乎是AI發(fā)展的起跑線。
就在ChatGPT剛上線前夕,Ethan Mollick寫下了他在Substack上的第一篇GPT-3測試文章。
彼時的他還在感嘆:
AI能寫出一段順暢的文字,已經(jīng)足夠改變世界。
在那篇文章里,他舉的例子成了那個時代的代表性畫面——讓GPT-3寫一首關(guān)于「糖果驅(qū)動的超光速引擎逃離水獺追捕」的詩。
這種輕巧、荒誕又略帶才氣的創(chuàng)意輸出,曾讓無數(shù)人第一次意識到:機(jī)器不只是補(bǔ)全文字,它真的能像在寫作。
那一年,全網(wǎng)都在傳播類似的故事。
媒體強(qiáng)調(diào)「AI會寫作」「AI會講段子」「AI模仿莎士比亞寫詩」,技術(shù)論壇里也充斥著GPT-3的各種玩法,從寫故事、寫求職信,到寫簡單的Python函數(shù)。
GPT-3生成的一篇關(guān)于眾籌如何助力創(chuàng)業(yè)的學(xué)術(shù)綜述論文
但那時的能力短板:它能寫,也只能寫。
你給提示,它完成一句;你給框架,它模仿結(jié)構(gòu)寫一段。
再聰明,它也像是一個被困在文字框里的大型自動補(bǔ)全系統(tǒng)。
Mollick之后在文中也承認(rèn),當(dāng)年他第一次感到震撼,是因為「AI 居然能寫得這么順」。
可他沒想到的是,僅僅過了三年,Gemini 3只需給它一張截圖,AI就能直接「做給你看」。
回頭看,GPT-3的所有驚訝都像是時代的開場白。
真正的能力躍遷,還在后面。
AI不止是回應(yīng),它還會把事情做完
真正讓人意識到時代變了的,是Gemini 3。
Mollick做了一個簡單的實驗:他把自己三年前寫GPT-3的截圖扔給Gemini 3,只給了一句提示:
用實際行動來展示人工智能自這篇文章發(fā)布以來取得了多大進(jìn)步。
然后事情失控了。
在Mollick的測試?yán)铮珿emini 3直接構(gòu)建了一個可交互的小游戲:
一個用糖果驅(qū)動的星艦,要逃離水獺追擊,還配了動態(tài)文本、小詩和實時狀態(tài)更新。
三年前只能在文本里描述游戲,如今它直接把游戲做出來。
但小游戲只是預(yù)告片。真正的核心在Google同期發(fā)布的Antigravity。
這是一個能讀取本地文件、運(yùn)行代碼、規(guī)劃任務(wù)、執(zhí)行項目的通用型行動代理。
用戶不需要寫代碼,只用中文或英文告訴它要做的事,AI自己把步驟拆開,然后一點(diǎn)點(diǎn)推進(jìn)。
Mollick做了一個非常典型的測試:他給Antigravity訪問權(quán)限,讓它讀取自己電腦里存著的所有newsletter舊稿。接著只下達(dá)一句話:
幫我做一個漂亮的網(wǎng)站,匯總我過去所有關(guān)于AI的預(yù)測,并去網(wǎng)上查查哪些預(yù)測準(zhǔn)了、哪些錯了。
Gemini 3接過任務(wù)后,開始自動讀取文件、掃描內(nèi)容、比對上下文,然后彈出一個行動計劃讓你確認(rèn)——
包含網(wǎng)頁結(jié)構(gòu)、數(shù)據(jù)整理方式、需要額外搜索的點(diǎn)、交互形式,甚至包括可能遇到的技術(shù)問題。
人工智能第一次詢問有關(guān)項目的問題,它對需求的理解得非常透徹,給人留下了深刻的印象
只有在需要判斷方向時,AI才會ping他:「這里有兩個可能路徑,你想讓我選哪一個?」
Mollick測試時,AI自動生成并部署的demo頁面
Mollick的評價很直白:
這不像在prompt一個模型,更像在管理一個隊友。
這句話說明了一個事實:Gemini 3已不再停留在語言模型階段,它正在成為一個能執(zhí)行任務(wù)、推進(jìn)流程、判斷路徑的數(shù)字行動體。
對普通用戶來說,這意味著過去三年最本質(zhì)的變化不是模型更強(qiáng),而是AI終于從「只說不做」進(jìn)入了「又說又做」的時代。
當(dāng)AI會做科研,人類的任務(wù)只剩下審核
在Mollick的測試?yán)铮珿emini 3在測試中呈現(xiàn)出接近研究生水平的科研工作流程。
他沒有給AI任何干凈、整齊的數(shù)據(jù),而是一份自己十年前做眾籌研究時留下的舊文件夾。
各種格式混在一起,命名混亂,甚至包括——
「project_final_seriously_this_time_done.xls」這種文件名。
他把這一整包東西直接丟給Gemini 3,并給了它一句話:
先搞清楚這些數(shù)據(jù)的結(jié)構(gòu),把能修的修一修,清理干凈,準(zhǔn)備做新的分析。
然后AI開始自己工作。沒有催促,沒有提示,也不需要你告訴它STATA是什么。
它會自動識別文件格式、修復(fù)損壞數(shù)據(jù)、統(tǒng)一字段、重建可讀結(jié)構(gòu),并按照研究常規(guī)流程整理出可分析的數(shù)據(jù)集。
這一步過去通常需要研究生級別的耐心和經(jīng)驗。
Mollick看到結(jié)果后,提出了第二個要求:
寫一篇新的論文。用這些數(shù)據(jù),找一個創(chuàng)業(yè)或戰(zhàn)略領(lǐng)域有意義的理論問題,自己設(shè)計分析方法,寫成一篇可投稿的學(xué)術(shù)文章。
他沒有告訴AI要研究什么、沒有給任何方向、也沒有限定主題。Gemini 3自己就能決定研究切口,
它提出了一個能與現(xiàn)有文獻(xiàn)對話的假設(shè),設(shè)計合適的統(tǒng)計模型,跑完數(shù)據(jù),生成結(jié)果,再把整套內(nèi)容寫成了一篇14頁的完整論文,包含摘要、理論、方法、數(shù)據(jù)描述、回歸表格、討論與局限。
最讓人意外的,是論文里出現(xiàn)了一個AI自創(chuàng)的指標(biāo)。
它利用NLP方法計算「項目創(chuàng)意的獨(dú)特性」,通過文本相似度量化「一個眾籌項目到底有多特別」。
在這個案例里,它不只是模仿已有做法,而是嘗試做方法層面的擴(kuò)展。
當(dāng)然,它并不是完美的。Mollick也指出AI有一些典型問題:模型有的地方過擬合,解釋略顯自信,理論段落寫得有點(diǎn)「太努力」。
但這些問題并非幻覺或混亂,而是更接近研究生寫作時的判斷偏差和方法細(xì)節(jié)不足。
當(dāng)Mollick給出方向性建議,例如「理論部分補(bǔ)充文獻(xiàn)」「方法段落寫得更穩(wěn)妥一些」時,Gemini 3能根據(jù)這些反饋進(jìn)行有效修訂。
從整個過程可以看出,Gemini 3可以承擔(dān)科研工作里大量「執(zhí)行性任務(wù)」,而人類在其中的角色更像是審稿人、研究負(fù)責(zé)人、方向決策者。
回看這三年,GPT-3 時代,人類負(fù)責(zé)「提出問題、設(shè)計方向」AI 負(fù)責(zé)生成一段文字。
到了Gemini 3,人類提出粗略目標(biāo),AI會把數(shù)據(jù)整理、建模、寫作、執(zhí)行流程全部推進(jìn)到位,再讓你做最終判斷。
AI不再停留在對話窗口里,它開始執(zhí)行項目、處理文件、構(gòu)建研究環(huán)境,甚至能獨(dú)立做出研究選擇。
而人類也不再是修正AI錯誤的人,而是在逐漸轉(zhuǎn)向「給AI下達(dá)任務(wù)并審核結(jié)果的人」。
這就是1000天帶來的變化。
不是某個模型更強(qiáng),而是整個協(xié)作方式已經(jīng)重寫。
AI的位置往前走了一步,人類的角色也隨之調(diào)整。
這種位移正在成為新的常態(tài)。









