在OpenAI的技術團隊中,有位被同事稱為“Bob”的神秘工程師,他主導開發的CUDA注意力內核成為公司核心基礎設施的重要組成部分。該內核每天在數十萬張GPU上運行數萬億次,其性能穩定性直接影響模型訓練效率。據內部人士透露,一旦內核出現故障導致需要回滾模型訓練,將造成數百萬美元的算力資源浪費。
這位工程師的非凡能力在公司內部引發廣泛討論。前員工回憶稱,某次復雜的技術故障導致團隊耗時一周未能解決,而Bob僅用數分鐘就完成修復。這種“巫師級”的技術實力使他在公司Slack頻道擁有專屬的“Bob魔法”表情包,成為技術團隊膜拜的對象。甚至有員工半開玩笑地表示,若Bob突然休假一周,整個公司的研發進度都將面臨嚴峻考驗。
硅谷科技圈近期流傳著有趣傳聞:meta首席執行官扎克伯格在得知該工程師的存在后,立即將“查明Bob真實身份”列為招聘會議首要議題。知情人士戲稱,扎克伯格為此罕見動怒,質疑公司每年支付1400萬美元高薪聘請的技術專家,為何未能及早發現這類關鍵人才。這場人才爭奪戰折射出當前AI領域對底層技術專家的激烈競爭。
隨著討論深入,技術社區逐漸將目光聚焦在OpenAI資深研究員Scott Gray身上。這位伊利諾伊大學香檳分校畢業的物理與計算機科學雙學位持有者,自2016年加入公司以來已參與撰寫51篇機器學習論文,累計被引用超過8萬次。其代表作包括《GPT-4技術報告》和《神經語言模型縮放定律》等重量級研究。
Scott的技術軌跡與“Bob內核”存在顯著關聯。2017年,他作為第一作者在OpenAI官方博客發表《塊稀疏GPU內核》,該研究開發的優化算法在特定稀疏度設置下可使全連接層和卷積層運算速度提升數倍。這種針對塊稀疏權重設計的高性能內核,與大規模GPU推理所需的注意力機制優化高度契合。更引人注目的是,Scott曾在Reddit詳細披露其在OpenAI開發的CUDA內核技術細節,包括FP16/FP32混合精度計算和P100/P102 GPU架構適配方案。
當前AI領域的人才競爭已進入白熱化階段。業內普遍認為,顯卡儲備固然重要,但頂尖技術專家的爭奪才是決定企業競爭力的關鍵。meta近期從OpenAI連續挖走趙晟佳、Lucas Beyer、Alexander Kolesnikov等核心研究員,已對OpenAI造成顯著沖擊。此次“Bob內核”事件再次暴露出硅谷科技巨頭在底層技術人才方面的激烈角力。
據技術論壇討論,像Scott這樣同時具備深厚理論功底和工程實現能力的專家,全球范圍內不超過百人。這類人才不僅能夠優化現有算法效率,更能通過底層創新推動整個領域的技術突破。隨著各大實驗室持續加大投入,未來類似的技術人才爭奪戰或將更加頻繁地出現在公眾視野。