他是阿里巴巴最年輕的P10級技術(shù)負(fù)責(zé)人,也是全球最強(qiáng)開源模型之一——通義千問(Qwen)的核心推動者。他就是年僅 32 歲的AI界領(lǐng)軍人物——林俊旸。從北大課堂到達(dá)摩院實驗室,從算法代碼到開源生態(tài),他用十年時間完成了從“讓機(jī)器懂語言”到“讓智能走進(jìn)世界”的躍遷。

2025 年春,當(dāng)全行業(yè)仍在爭論“開源還是閉源”“Agent 還是模型”“具身智能(Embodied Intelligence)是否為下一戰(zhàn)場”時,林俊旸已帶領(lǐng)團(tuán)隊悄然開啟新一輪進(jìn)化——讓智能從虛擬世界走向真實世界,從理解語言到學(xué)會行動。

與許多“算法天才”不同,他的成長路徑是一條更不尋常但極具邏輯的路線:北大本科學(xué)計算機(jī),研究生卻選擇語言學(xué)與應(yīng)用語言學(xué)——不是逃離理工,而是試圖回答一個更難的問題:“要讓機(jī)器懂人類語言、理解人類意圖,它首先要學(xué)會什么?”正是這段語言學(xué)訓(xùn)練,為他后來在大模型語義理解、多模態(tài)對齊,以及人機(jī)協(xié)同智能方向的突破,打下了別人少見的底層邏輯。

2019年畢業(yè)后,他沒有選擇學(xué)術(shù),而是進(jìn)入阿里達(dá)摩院智能計算實驗室,加入仍處于初期的多模態(tài)預(yù)訓(xùn)練項目M6。一年后,通義千問立項,他成為核心架構(gòu)成員;2022年正式升任技術(shù)負(fù)責(zé)人;2024年帶隊開源Qwen系列,在全球模型排行榜上與GPT、Claude正面交鋒;2025年,他又親自宣布組建機(jī)器人與具身智能團(tuán)隊,試圖讓模型走出屏幕,去“看世界、動手、行動”。

圖片來源:DataFun 2023

圖片來源:DataFun 2023

從語言學(xué)到大模型:一次詞匯測試中的AI啟蒙

公開資料顯示,他在本科階段主修計算機(jī)科學(xué),打下了扎實的算法與編程基礎(chǔ)。但在碩士階段,他選擇進(jìn)入北大外國語學(xué)院攻讀語言學(xué)及應(yīng)用語言學(xué)相關(guān)方向。雖然他本人從未在公開采訪中解釋過為何跨入語言學(xué)領(lǐng)域,但不少業(yè)內(nèi)人士認(rèn)為,這并不是“離開技術(shù)”,而是將語言視為理解智能的入口——機(jī)器如果要懂人,它首先要懂語言背后的結(jié)構(gòu)、語義和意圖。

從那時起,他的研究興趣逐漸從“語言是什么”轉(zhuǎn)向“語言如何被機(jī)器理解”。在碩士期間,他參與多維度文本分類、注意力機(jī)制建模等項目,并申請了國家發(fā)明專利(CN109582789B),這是他首次將語言理論轉(zhuǎn)化為可計算框架的嘗試。外界據(jù)此推測,他后來在大模型時代迅速成為核心研發(fā)力量,正是源于這種“語言邏輯 + 工程實現(xiàn)”并存的底層思維方式。這段兼具理論與工程的積累,使他在2019年碩士畢業(yè)時,果斷放棄語言學(xué)學(xué)術(shù)道路,轉(zhuǎn)而投身人工智能研發(fā)的前沿領(lǐng)域。

圖片來源:林俊旸領(lǐng)英

圖片來源:林俊旸領(lǐng)英

入局多模態(tài):達(dá)摩院的技術(shù)筑基與賽馬突圍

畢業(yè)后的林俊旸徑直加入阿里巴巴達(dá)摩院,正式開啟職業(yè)生涯,擔(dān)任高級算法工程師。當(dāng)時的人工智能領(lǐng)域正處于技術(shù)爆發(fā)的前夜。2020年,OpenAI發(fā)布GPT-3引發(fā)全球熱議后,阿里巴巴迅速啟動內(nèi)部大模型研發(fā)的“賽馬機(jī)制”,同步推進(jìn)兩條技術(shù)路線:主攻文本的AliceMind,以及側(cè)重多模態(tài)融合的M6。憑借“語言學(xué)+技術(shù)”的復(fù)合背景,林俊旸被分配至周靖人領(lǐng)導(dǎo)的智能計算實驗室,成為M6模型團(tuán)隊的核心開發(fā)者。

這支團(tuán)隊在成立初期規(guī)模極小,僅由幾位資深工程師和實習(xí)生組成,卻承擔(dān)著國內(nèi)少有的技術(shù)挑戰(zhàn)——如何讓模型同時理解文本、圖像等多模態(tài)信息,并實現(xiàn)高效訓(xùn)練與落地。林俊旸主導(dǎo)的模型效率優(yōu)化模塊成為關(guān)鍵突破點。他帶領(lǐng)小組攻克了大參數(shù)模型訓(xùn)練中的資源調(diào)度與收斂難題,為M6的快速迭代奠定了基礎(chǔ)。

2021年,M6模型迎來三次重要躍遷:1月首發(fā)時達(dá)到百億參數(shù)規(guī)模,5月躍升至萬億級,10月再度突破至十萬億參數(shù),成為當(dāng)時國內(nèi)參數(shù)規(guī)模最大的多模態(tài)預(yù)訓(xùn)練模型。而支撐這一系列躍遷的核心架構(gòu)優(yōu)化,正出自林俊旸團(tuán)隊之手。

2022年,阿里啟動AI資源整合,AliceMind團(tuán)隊在內(nèi)部賽馬中出局,M6技術(shù)路線被正式確立為集團(tuán)通用大模型的核心方向。憑借在模型架構(gòu)設(shè)計與工程落地中的突出表現(xiàn),林俊旸在阿里實現(xiàn)了快速晉升,從核心開發(fā)者升任項目主管,主導(dǎo)研發(fā)了通用統(tǒng)一多模態(tài)預(yù)訓(xùn)練模型OFA(One-For-All,一體化多模態(tài)預(yù)訓(xùn)練框架)與中文預(yù)訓(xùn)練模型Chinese CLIP(中文視覺-文本匹配模型),進(jìn)一步強(qiáng)化了阿里在多模態(tài)領(lǐng)域的技術(shù)壁壘。而這段早期經(jīng)歷讓他切身領(lǐng)悟到“技術(shù)需與場景共生”的重要性,也為他后來主導(dǎo)通義千問系列的研發(fā)打下了堅實基礎(chǔ)。

圖片來源:林俊旸領(lǐng)英

圖片來源:林俊旸領(lǐng)英

掌舵通義:從旗艦?zāi)P偷介_源生態(tài)的戰(zhàn)略躍遷

2022年底,阿里巴巴將達(dá)摩院的語言、視覺等AI團(tuán)隊整體并入阿里云,成立通義實驗室。林俊旸被正式任命為通義千問系列大模型的技術(shù)負(fù)責(zé)人,全面負(fù)責(zé)核心模型研發(fā)與戰(zhàn)略規(guī)劃。他接手時面對的挑戰(zhàn)頗具代表性:如何把實驗室階段的技術(shù)成果轉(zhuǎn)化為真正可規(guī)模落地的商業(yè)產(chǎn)品,打破“技術(shù)先進(jìn)卻難以應(yīng)用”的困局。

2023年4月,阿里云正式發(fā)布“通義千問”。其底層架構(gòu)融合了林俊旸主導(dǎo)優(yōu)化的多模態(tài)技術(shù),這也是他在阿里多年來研究積累的成果。但他并未滿足于此。兩年后,在他的推動下,阿里推出Qwen3系列開源模型。旗艦版本Qwen3-Max擁有超萬億參數(shù)和36T預(yù)訓(xùn)練數(shù)據(jù),在GPQA、LiveCodeBench等權(quán)威評測中超越GPT-5、Claude Opus 4,躋身全球前三。

林俊旸在社交平臺上寫道,團(tuán)隊為此花費近一年時間,攻克了三項核心難題:“讓強(qiáng)化學(xué)習(xí)框架能穩(wěn)定支撐長時序推理,平衡跨領(lǐng)域數(shù)據(jù)分布以避免模型偏科,并強(qiáng)化多語言能力以服務(wù)全球開發(fā)者。”如果說“開源”是通義千問在大模型競爭中撕開的關(guān)鍵突破口,那么截至2025年10月的一組數(shù)據(jù),正印證了這步棋的深遠(yuǎn)影響——阿里已累計開源300余個通義系列模型,從小參數(shù)到超大模型全覆蓋,囊括文本、圖像、視頻等多模態(tài)能力;下載量突破6億次,衍生模型超過17萬個,中國企業(yè)大模型選用率達(dá)17.7%,穩(wěn)居市場首位。

圖片來源:新浪科技

圖片來源:新浪科技

這些成果的背后,是林俊旸主導(dǎo)的“全尺寸覆蓋策略”。他深知,大模型的意義不僅在于“做大”,更在于“用好”。針對機(jī)器人、手機(jī)等算力受限的終端場景,他帶領(lǐng)團(tuán)隊在2025年10月推出Qwen3-VL系列,專門設(shè)計了4B和8B兩個輕量化版本。令人意外的是,這些“小模型”的空間理解能力并不遜色于大模型,一經(jīng)推出便成為具身智能公司爭相采用的核心基座,解決了“終端場景用不起大模型”的長期痛點。

在林俊旸看來,開源并非單純的代碼共享,而是一種面向未來的生態(tài)策略。當(dāng)同行仍在權(quán)衡“是否該閉源保密”時,通義千問已通過全尺寸模型布局,把技術(shù)的“種子”撒向機(jī)器人、移動端等不同場景。隨著越來越多企業(yè)基于通義進(jìn)行二次開發(fā),“用通義、改通義”正在成為行業(yè)習(xí)慣。一條獨特的生態(tài)護(hù)城河也在悄然形成——它不是靠技術(shù)壟斷維系,而是通過讓更多人受益,實現(xiàn)技術(shù)生態(tài)的自我循環(huán)與生長。

真正讓外界認(rèn)識林俊旸的,是2024年的通義千問(Qwen)。那一年,隨著多版本模型相繼開源、阿里內(nèi)部AI團(tuán)隊的重組,以及GitHub風(fēng)波引發(fā)的輿論關(guān)注,這位原本低調(diào)的技術(shù)負(fù)責(zé)人突然站到了聚光燈下。當(dāng)Qwen項目代碼因誤標(biāo)被GitHub“下架”引發(fā)外界質(zhì)疑時,林俊旸親自出面回應(yīng):“團(tuán)隊沒有跑路,我們還在,只是組織賬號被誤標(biāo)記。”這句話,比任何公關(guān)聲明更能說明問題——冷靜、克制、真實。

圖片來源:X

圖片來源:X

如今,隨著AI行業(yè)從“大模型競速”進(jìn)入“生態(tài)與Agent能力”競爭的新階段,林俊旸依然站在變革的中心。他牽頭整合行業(yè)生態(tài)資源,聚焦Agent的人機(jī)協(xié)同能力打磨,將多年沉淀的人文思維與技術(shù)經(jīng)驗融入其中,讓Agent更貼合真實場景下人的需求。他的經(jīng)歷不僅是個人的成長史,也映照出新一代中國技術(shù)人的選擇:在喧囂的浪潮中,以長期專注和清晰目標(biāo),走出一條穩(wěn)健、獨立的道路。

跨界物理世界:具身智能的閉環(huán)布局與生態(tài)構(gòu)建

2025年10月8日,阿里Qwen團(tuán)隊核心負(fù)責(zé)人林俊旸在社交媒體上發(fā)布了一條簡短動態(tài):“已在Qwen內(nèi)部親手組建機(jī)器人與具身智能小組。”沒有隆重的發(fā)布會,也沒有冗長的技術(shù)白皮書,這一句話,足以在科技圈引發(fā)震動。它意味著阿里AI戰(zhàn)略正式轉(zhuǎn)向——從深耕多年的虛擬智能,邁向以“行動智能”為核心的物理世界。

圖片來源:華爾街見聞

圖片來源:華爾街見聞

這一步并非倉促決定。自2019年加入阿里巴巴達(dá)摩院以來,林俊旸一直站在公司AI研發(fā)的最前沿,主導(dǎo)了從語言模型訓(xùn)練框架到多模態(tài)系統(tǒng)優(yōu)化的多個關(guān)鍵項目,是通義千問(Qwen)體系的重要推動者之一。他長期專注于模型架構(gòu)、跨模態(tài)理解與推理能力等前沿方向,其多篇論文發(fā)表于自然語言處理頂級會議(ACL、EMNLP、COLING等),并在學(xué)術(shù)界獲得廣泛引用。其中,《Scaling Laws for Multimodal Models》在Google Scholar上的引用量已超過千次,成為多模態(tài)模型效率研究的重要參考文獻(xiàn)。

正是這種從算法到底層應(yīng)用的長期積累,讓林俊旸在通義千問取得階段性成果后,將目光從“讓機(jī)器理解文字”轉(zhuǎn)向“讓機(jī)器理解世界”。在他看來,具身智能是語言模型走出屏幕、進(jìn)入現(xiàn)實的必然方向。正如他在一次內(nèi)部會議中所說:“當(dāng)語言模型真正具備感知與行動能力時,智能的邊界才算被重新定義。”

外界普遍認(rèn)為,林俊旸此舉標(biāo)志著阿里在大模型競爭格局趨穩(wěn)后的一次主動求變;但對他本人而言,這更像是科研路徑的自然延伸——從語言理解到具身智能,從虛擬語義空間到真實世界的動作學(xué)習(xí),他始終在追問同一個問題:AI的“智能”,究竟能走多遠(yuǎn)?

林俊旸清楚地看到,行業(yè)正處在從“工具”邁向“Agent”的關(guān)鍵節(jié)點。“多模態(tài)基礎(chǔ)模型不再只是被動的回答系統(tǒng),而正在成長為能調(diào)用工具、依托記憶、通過強(qiáng)化學(xué)習(xí)完成復(fù)雜推理的基礎(chǔ)Agent。”他曾在內(nèi)部總結(jié)道,“這樣的智能,不該困在屏幕里,它必須走向物理世界——去動手,去行動。”也正是這種對技術(shù)趨勢的敏銳判斷,成為阿里叩開“行動智能”時代大門的底層邏輯。

林俊旸的布局,從一開始就帶著“軟硬協(xié)同、生態(tài)閉環(huán)”的清晰藍(lán)圖,每一步都踩在技術(shù)與產(chǎn)業(yè)的銜接點上。要讓AI在物理世界“行動”,首先得解決“怎么想”的問題。林俊旸主導(dǎo)下的Qwen3系列,正在經(jīng)歷一場“具身化改造”,目標(biāo)是成為機(jī)器人的“核心決策中樞”:

?Qwen3-Max:化身“任務(wù)指揮官”。重點強(qiáng)化“復(fù)雜任務(wù)分解能力”,面對“拆快遞—分類物品—擺放收納”這類需要多步驟銜接的現(xiàn)實場景,它能像人類一樣拆解目標(biāo)、規(guī)劃流程,確保機(jī)器人每一步操作都有明確指令,避免“卡殼”;

?Qwen3-VL:升級“立體視覺中樞”。專攻3D空間感知與動態(tài)物體追蹤技術(shù)——當(dāng)機(jī)器人面對雜亂的桌面、移動的物體時,它能精準(zhǔn)定位每一件物品的坐標(biāo),預(yù)判物體運(yùn)動軌跡,就像給機(jī)器人裝上了一雙“能看懂空間的眼睛”,完美匹配“視覺大腦”的核心需求。

林俊旸的這套布局之所以能讓阿里在短時間內(nèi)躋身具身智能賽道的核心玩家,關(guān)鍵在于他抓住了行業(yè)最真實的痛點。在正式組建團(tuán)隊前,林俊旸帶隊走訪了三十多家具身智能企業(yè),一個意外的發(fā)現(xiàn)讓他迅速確定了方向:幾乎所有公司都在使用Qwen-VL模型做后訓(xùn)練。這意味著,阿里憑借Qwen系列積累的技術(shù)優(yōu)勢,已經(jīng)在行業(yè)生態(tài)中占據(jù)了“入口”位置——當(dāng)這些企業(yè)需要進(jìn)一步提升具身化能力時,阿里自然成為首選合作伙伴。

更重要的是,林俊旸并沒有停留在算法層面的突破,而是親自推動阿里構(gòu)建出獨特的“具身智能生態(tài)閉環(huán)”。他主導(dǎo)將Qwen模型的能力延伸至阿里內(nèi)部的真實業(yè)務(wù)場景——從淘寶的物流分揀、菜鳥的倉儲配送,到制造業(yè)生產(chǎn)線上的自動協(xié)作機(jī)器人——這些場景每天都在持續(xù)生成來自物理世界的高價值數(shù)據(jù)。

按照林俊旸的規(guī)劃,這些數(shù)據(jù)會被匯入阿里云,為Qwen3模型的訓(xùn)練與優(yōu)化提供“養(yǎng)料”;經(jīng)過更新的通義大腦再反向指揮機(jī)器人執(zhí)行任務(wù);而機(jī)器人完成任務(wù)后的反饋,又會重新進(jìn)入模型訓(xùn)練體系,形成一個自我進(jìn)化的“智能飛輪”。這套機(jī)制讓阿里從具身智能的“探索者”迅速成長為“核心玩家”,也讓林俊旸在公司內(nèi)部的技術(shù)布局中確立了關(guān)鍵地位。從主導(dǎo)Qwen系列研發(fā),到開辟“行動智能”的新方向,他始終堅持“技術(shù)先行、生態(tài)驅(qū)動”的理念,推動阿里完成了從虛擬智能到現(xiàn)實行動的跨越。對他來說,這不只是一次技術(shù)升級,更是一次認(rèn)知轉(zhuǎn)變——讓模型真正“走進(jìn)現(xiàn)實”,去理解、感知并改變物理世界。

Agent時代的“創(chuàng)新-約束”平衡挑戰(zhàn)

當(dāng)AI從“工具”進(jìn)化為能自主決策的“Agent”,林俊旸深知,技術(shù)跑得越快,越需要倫理的“剎車系統(tǒng)”。這既是行業(yè)共性挑戰(zhàn),也是他帶領(lǐng)通義千問邁向未來必須解答的命題——如何讓具身智能在“行動自由”與“安全可控”之間找到平衡點。

他認(rèn)為,“讓機(jī)器變聰明”并不難,難的是“讓它做正確的事”。為此,他主導(dǎo)團(tuán)隊建立了一套貫穿模型研發(fā)全流程的安全機(jī)制:在模型訓(xùn)練階段引入人類偏好數(shù)據(jù),確保行為決策不過界;在高風(fēng)險領(lǐng)域(如醫(yī)療、工業(yè))接入專家知識庫,為機(jī)器人劃定“禁區(qū)”;所有物理世界的操作都能被追溯,做到可解釋、可問責(zé)。

而隱私同樣是他關(guān)注的重點。“技術(shù)沒有邊界,但應(yīng)用必須有底線”是他常掛在嘴邊的一句話。林俊旸推動阿里在菜鳥、盒馬等內(nèi)部場景中采用“聯(lián)邦學(xué)習(xí)+數(shù)據(jù)脫敏”方案,讓模型在學(xué)習(xí)數(shù)據(jù)的同時不觸碰個人或企業(yè)的隱私信息。所有新模型必須通過團(tuán)隊內(nèi)部“AI倫理委員會”的一系列安全測試才能上線。林俊旸始終認(rèn)為倫理并不是創(chuàng)新的障礙,而是智能走向成熟的前提。

對林俊旸而言,AI的未來不是做出更大的模型,而是讓它更“可用”。做大的不是參數(shù),而是可用性;贏下的不是競速,而是生態(tài)。當(dāng)智能真正能“看見、伸手、行動”時,現(xiàn)實世界將成為它最好的測試場。讓機(jī)器能動手,去行動——這正是智能擁抱真實世界的第一步。