大會結束,月之暗面創始人楊植麟被觀眾層層圍住,有人舉著手機想加他微信,有人追到茶歇區要簽名。投資這家公司的機構,拉一整大巴的投資人去拜訪他,“讓一線投資人見見好的創業者是什么樣子”。
MiniMax 創始人閆俊杰很少公開露面,網上能搜到的照片沒幾張。這無礙他在投資行業的熱度。MiniMax 估值長期排在中國大模型創業公司前列,投資人要靠 “搶” 才能拿到份額。
這一切發生在 DeepSeek 爆火前。今年初,兩家明星創業公司一起被擠到聚光燈邊緣。
春節后的第一個工作周,兩家公司的二號位各自召開了內部會議,討論 DeepSeek 之后該怎么做增長。月之暗面在長達 6 個小時的會議后,決定暫緩投放,回歸產品和技術本身。在 MiniMax,DAU 被稱為 “虛榮指標”。
兩家公司有員工覺得,這是一種 “解脫”:不用再絕望地消耗資源與字節等巨頭競爭,也無需拼命證明 “中國能誕生 OpenAI”。問題已經失去意義。
在這之后,兩家公司取得更好的技術進展。MiniMax 的視頻生成模型,宣稱在一些場景超過 Google 的 Veo3;其開源的 M2 文本模型,在部分測評中位列全球開源模型第一。月之暗面的 K2 模型,被稱為 “中國又一個 DeepSeek”;近期發布的 K2 Thinking,宣稱部分基準測試得分超過 GPT-5。
他們的壓力并沒有消失。MiniMax 和月之暗面曾用較少的資源證明過增長潛力。兩家公司因此拿到中國大模型創投領域大多數資金,總計超過 200 億元人民幣。
這筆錢很少,讓他們難與字節、阿里,甚至是 DeepSeek 正面競爭,或者是對標 OpenAI、Anthropic 這些海外同行。但這筆錢又足夠多,讓他們無法收斂野心。
閆俊杰和楊植麟是中國大模型領域的 “雙子星”。他們幾乎在同一時間走進公眾視野,講著相似的理想——相信技術,追求 AGI;也都在融資、流量、爭議與期待中長期被同一個問題拷問:中國的 OpenAI,會誕生在哪?
兩人的相同之處并不多。閆俊杰崇尚 “系統理性”,想要在龐雜的約束中尋找最優解。他把公司視作可以設計和優化的函數,堅信組織的力量能夠催生創新與增長。
他敢于決斷,然后接受沖突,迅速迭代。他創辦的 MiniMax,在技術路線上選擇多模態模型,是中國最早推出 MoE 模型的團隊之一。
楊植麟則相信人才的力量,公司的核心產品 “Kimi” 也是他的英文名,個人光環與公司品牌深度綁定。
他看重 “共識驅動”,相信少數精英能引領方向。與 MiniMax 不同,他創辦的月之暗面更執著于無損的語言模型本身的力量,一度不怎么在意 MoE。
現在他們要解決的問題是一樣的。之前三年過山車般的經歷表明,一時的技術成果或者用戶增長,很難成為競爭優勢。他們還要建立讓技術和用戶增長持續產生的組織能力。
技術 CEO、管家二號位
2017 年,在商湯擔任 CEO 助理的贠燁祎,就向云啟資本合伙人、也是她在約翰霍普金斯的師兄陳昱提出過創業設想,但因為缺合伙人沒能推進。四年后,她再次找到陳昱:“我終于找到創業搭子了。”
這個搭子,就是閆俊杰。
閆俊杰是典型的 “系統內優勝者”。他出生于 1989 年,在河南的縣城長大,博士就讀于中國科學院自動化所。
2014 年博士畢業后,閆俊杰加入商湯,在這家核心成員大多來自香港中文大學和海外高校博士生的公司中,他只用了五年時間,就從算法工程師一路做到最年輕的副總裁、研究院副院長,負責智慧城市、游戲等多個業務。他參與了商湯底層算法到工程落地的體系建設,發表上百篇論文。

MiniMax 創始人閆俊杰。圖片來自視覺中國。
閆俊杰第一次見陳昱,就給對方留下深刻印象:一是光頭,“一看就是絕頂聰明”;二是閆俊杰跟他講,可以用基礎模型,解決更加通用和泛化的問題。
“現在看來當然是常識,但在行業都還在講用若干小模型解決復雜問題的 2021 年,令人耳目一新。” 陳昱說。
2021 年底,閆俊杰離職創辦 MiniMax。閆俊杰負責技術,贠燁祎負責技術之外的產品、融資等事務。一位 MiniMax 早期人士說:“閆俊杰想要做全世界最偉大的技術,贠燁祎想做全世界最偉大的公司。”
閆俊杰把 AGI 視為 “普通人每天都會用的一個產品、一個服務”。一位 MiniMax 前員工說,他加入 MiniMax,是被會議室墻上的一行字打動——Intelligence for Everyone。
MiniMax 的第一輪融資印證了這套故事的吸引力:閆俊杰在與高瓴創始人張磊聊過后,高瓴直接取代云啟,拿下首輪 2000 萬美元融資的領投。MiniMax 投后估值達到 2 億美元。
月之暗面起步沒那么順利。2023 年初,剛成立的月之暗面想融資 2000 萬美元還不順利。在投資人眼里,楊植麟只有 “技術” 標簽,缺少產品、管理、融資經驗。
出生于 1992 年的楊植麟是廣東汕頭人,頭發茂密,他在卡耐基梅隆讀博期間,發布的大語言模型相關論文 XLNet 和 Transformer-XL,現在引用接近兩萬。

月之暗面創始人楊植麟。圖片來自視覺中國。
同樣在讀博士期間,27 歲的楊植麟參與創辦 AI 公司循環智能。他在自己的個人主頁上寫道:“我所有工作的目標,包括研究和商業,都是最大化人工智能的價值。”
月之暗面的起點,是楊植麟在循環智能負責的團隊。2021 年,楊植麟主導了華為云合作的千億級盤古大模型,團隊就叫 “Moonshot”。兩年后,他推動 “Moonshot” 從循環獨立,成立月之暗面。他認為要 “專門建一家公司,而不是從別的業務里拐出一條支線。”
起步融資遇挫,楊植麟想到循環智能的投資人、也是他的清華學姐張予彤。在 2019 年,還在金沙江創投的張予彤就主導投資了循環智能。
在張予彤的推動下,月之暗面最終在 2023 年上半年完成第一筆融資,紅杉、真格、Monolith 的下注讓楊植麟趕上了窗口期。張予彤如今在月之暗面的角色是二號位,與贠燁祎在 MiniMax 類似,負責融資、增長等業務。不過張予彤的加入,后來也讓月之暗面陷入潛在的利益沖突與仲裁風波。
雖然起步方式不同,兩位創始人在公司的發展上做出了類似的選擇:用大半年時間研發基礎模型后,嘗試做 C 端產品,并迎來了第一個爆發點。
2022 年中,MiniMax 投入數名員工,用一個月的時間做出了 AI 對話產品 Glow,用戶可以在這個產品上自由創建角色,并和角色對話。他們本想用游戲化的方式收集數據,“沒人想到這個產品會一炮而紅”。Glow 上線 4 個月后注冊用戶超過五百萬。
“Glow 出乎意料的成功讓公司的重心轉向了 C 端產品。” 一位 MiniMax 員工說。2023 年底,MiniMax 有約 300 名員工,其中近 200 人在產品線,遠超同類大模型創業公司。
月之暗面的故事類似。2023 年 8 月,他們第一個模型訓練到后期,開始立項做 AI 助理 Kimi,當時整個公司只有 50 人,預期只是 “展示模型能力”。上線之后,Kimi 連續數月月活用戶環比增長超過 100%。
“用了最少的錢,最少的人,最少的卡,做到了最好的狀態。” Monolith 創始合伙人曹曦曾如此評價月之暗面,他的基金跟進了月之暗面三輪融資。
到 2023 底再融資時,月之暗面成為資本追捧的對象。小紅書投前 9 億美元估值的價格很快被阿里壓過:投資近 8 億美元,將月之暗面的估值抬升到 23.4 億美元。
這讓它的估值與 2021 年就成立的 MiniMax 并駕齊驅,膨脹速度遠超上一代 AI 公司。同一時間,MiniMax 也拿到阿里投資的 6 億美元資源,估值又超過月之暗面。
兩筆融資 2024 年初完成,合計超 14 億美元(100 億元人民幣),超過中國大模型創投領域上一年公開融資總額,改寫了行業格局。
早期增長吸引大額投資,也成了競爭中的弱點
大額資本的注入放大了兩位創始人的野心。2024 年初,閆俊杰定下激進目標:技術達到 GPT-4 的水平,把產品用戶規模翻十倍,單個產品能突破千萬 DAU。
這一年的 MiniMax 很像字節跳動:同時推進多條產品線,從 Talkie、星野到海螺 AI,還有幾個沒有上線過就放棄的產品。年中,MiniMax 員工總數增長到 400 左右。
公司成立剛一年,楊植麟定下覆蓋多個方向的目標:技術上深入無損長文本、視頻生成、多階段推理;產品上追求 DAU 增長、出海;并加大商業化力度。到年中,信奉精英策略的月之暗面,員工也翻了一番。
問題跟著爆發。MiniMax 陷入糾結與搖擺,這年 1 月,MiniMax 視覺模型團隊開始押注視頻模型;3 月,他們抽調星野 /Talkie 和開放平臺的一部分研發人員,做產品形態類似即夢的視頻生成項目;5 月,他們放棄這個產品形態項目。
到了 8 月,高層要求在一周內讓模型 “能用”,要趕上公司的 Open Day。一位員工回憶,那時模型生成的人物 “手腳還在亂飛”,而承載視頻模型的產品項目早已放棄。
最終團隊先做了網頁版上線,讓用戶測試,移動端往后延,嫁接到原本主打語音交互的海螺 AI 上。不過就像 Glow 一樣,他們對這個產品期望不高。但第二個月,其網頁端訪問量就接近 500 萬。
一位 MiniMax 員工回憶,2024 年的大部分時間,他們都被這種 “既要又要” 的氣氛影響——公司既想增長,又不想將模型往 “軟色情” 方向調整,但 “一健康就不增長”。高層一度要求暫停在 Talkie、星野等產品上增加廣告位,但收入下滑后又陷入焦慮。
閆俊杰說,他經歷過技術被資本裹挾的過程:“如果一家企業必須靠不斷融資才能前進,那它優化的就不再是產品,而是如何說服投資人繼續給錢。”
月之暗面的精英策略也沒有在新方向上發揮太多效果。他們想要復現 Sora 的視頻模型,但效果一直未及預期,唯一的 “亮相”,是幾位聯合創始人在朋友圈里發布的幾條視頻,稱由自家視頻模型生成;月之暗面低調上線的兩款出海產品 Ohai 和 Noisee,幾個月后便停止運營。
在這期間,月之暗面創始團隊出售股份,迅速在創投領域引發風波。關鍵不在于賣股份,而在于月之暗面背后的敘事失調。產品未定型、格局未穩固的時刻,創始團隊出售股份,很容易被理解為 “急于落袋為安”。
風波之中,我們曾問他此事,他以一句 “Fake news” 簡短作答。
2024 年中,“大模型進展放緩” 的論調開始流行。當技術可能很難帶來巨大突破時,市場和投資人衡量公司增長潛力的指標,轉向最直接的 DAU 數據。
在月之暗面,張予彤主導大規模投流,拉高了 B 站等平臺的 AI 產品投流價格。MiniMax 也在高層反復的糾結后,最終決定跟進。
他們再一次被資本看好。MiniMax 拿到騰訊等機構的投資;8 月,月之暗面獲得騰訊、高榕創投等 3 億美元融資。資本意志開始更深地介入公司經營,部分投資人頻繁給他們提供增長 “建議”:哪些海外 AI 應用公司增長更快,哪些投流策略更高效,哪類產品功能更能帶來留存。
可一同出現的還有更強的對手。字節跳動發動了飽和式進攻:產品線覆蓋一切,從生產力到娛樂,從助手到硬件。我們了解到,字節還嚴格控制外部 AI 產品在抖音上的投放,而豆包等作為字節系產品,還能享受折扣。
一位月之暗面員工回憶,那是公司的士氣低谷,“面對字節這樣的敵人,是打不過的。” 一位投資人稱,如果不推動公司轉型,“除了硬著頭皮跟字節拼消耗,似乎別無他法”。
到這一年 10 月,一場數位投了大模型的投資人參加的聚會中,他們開始討論 “如何能賣掉部分手里的大模型創業公司股份?”
追求技術可以是一種選擇,但空間越來越小
DeepSeek “解救” 了 MiniMax 和月之暗面。他們靠著遠超市場預期的模型,沒花一分錢投流,就在一周內吸引了數千萬用戶,制造了中國自己的 ChatGPT 時刻。
“如果你在對手更強的賽道,那你就沒有勝的可能。” 一位月之暗面員工說,DeepSeek 帶來的熱潮,讓他明顯感覺到公司內部情緒有了好轉,“只要技術夠強,就有機會逆天改命。”
月之暗面不再更新 K1 系列的模型,集中資源投入基礎算法與新模型 K2。這個新模型被寄予厚望,月之暗面研發團隊幾乎全員參與,楊植麟本人也親自下場寫代碼。
張予彤在社交平臺上寫道,“小伙伴為了這次發布直接睡在公司里”,配圖是一個帶有 “離發布還有 0 天” 標語的圖片,標語下是一張沙發床。
幾個月高強度開發后,月之暗面在 7 月發布并開源萬億參數的 MoE 模型 Kimi K2,宣稱在自主編程、工具調用和數學推理等維度上超過 DeepSeek-V3 和阿里 Qwen3。在這之前,楊植麟相信 “閉源是正確的路”。《自然》雜志網站的一篇文章稱其為 “中國的又一個 DeepSeek 時刻”。
MiniMax 也完成了類似的聚焦。他們將重點從 “模型與產品并重” 收縮到 “模型優先”。視頻、語音等多模態模型依然在研究,這是他們有優勢的方向。我們了解到,閆俊杰還把一部分產品的員工轉到模型團隊,并為文本模型重新分配算力,核心資源集中到語言模型的基礎能力上,增加數學與編程數據的比重。他之前說,MiniMax 沒必要為了一篇新聞稿,就訓練一個類似 o1 那樣的推理模型。
他們 10 月開源語言模型 M2 時,強調它的編程和推理能力突出,使用量在 OpenRouter 上已經增長到了前五。“應該創業第一天就開源。” 閆俊杰年初說。
兩家公司似乎回到了剛創業時的狀態,都把提升模型的能力當作主線,投資方也不再過多給公司提建議。公司的經營依賴創業者本身管理能力。
閆俊杰看上去溫和,但一旦做出決定,執行起來極為堅決。在 MiniMax 創業初期,團隊曾嘗試過 3D 數字人方向。項目尚未上線,閆俊杰判斷這條路與公司長期技術路線不符,就立即叫停。項目解散,剛組建的團隊經歷第一輪震蕩。
2024 年起,MiniMax 的中層開始密集流動:產品負責人、商務負責人、數據科學負責人、增長負責人、戰投負責人等陸續離開。比如 MiniMax 對齊團隊兩年內換了三任負責人——第一任因與閆俊杰激烈爭論技術進展,被降為普通工程師;第二任由下屬提拔,半年后離職。MiniMax 早期的一百名員工,如今已走了一半。
“不是同路人的這些同事,我會請他們離開。我已經請走了幾位。” 閆俊杰曾在公司全員會上說。
在他看來,好的成果不是某個人靈光一現的產物,而是科學方法和團隊配合下的必然發現,哪怕個人能力不算頂尖,只要能讓團隊跑得更快,就是合適的人才。
閆俊杰認為,管理公司就是優化函數,目標是商業化效率、調用量等變量,管理的核心任務就是找到 “梯度下降最快的方向”,不斷逼近最優解。
MiniMax 的很多決策,比如不做 3D、選擇 MoE 架構、做視頻模型,都屬于 “算出來的結果”。甚至 MiniMax 每兩周一次的全員分享會,也叫 “CD”(Coordinate Decent 算法)。
楊植麟相信那些能提出新想法的人才,“因為在這個領域,創新本身最有價值”。他愿意為了招攬一名自己欣賞的技術人才,從北京飛到深圳,聊上十個小時,第二天趕早班機返回;也會讓優秀的研究者自己一個人在異地自由工作。
他傾向于先達成共識,再迅速行動。月之暗面的第一款模型亮相時,主打 20 萬長文本上下文。但一開始,核心團隊有人并不看好這個方向。一位月之暗面早期員工回憶,2023 年 5 月公司就有人提過做長文本,卻被其他人否決,理由是算法視角里,這只是壓縮問題,是工程活,不是技術突破。這個方向就沒有推進。
兩個月后,Anthropic 發布處理 50 萬文本的 Claude 模型,引發行業震動。長文本成為月之暗面內部共識。“Lossless long context is everything” 成了楊植麟經常提的一句話。
但如今 AI 公司把追求模型能力當做公司經營的核心變得愈發困難。早期的 OpenAI 是一個參考答案。他們的團隊延續了 “學術式” 的工作節奏,用實驗和試錯推動技術研究,領先技術成果誕生后加上山姆·阿爾特曼(Sam Altman)從 YC 帶來的增長策略,推動公司持續發展。DeepSeek 的 “學術循環” 模式——批判性思考、原子化創新、推動科學邊界——也是一種策略,但它不用太過于關注商業化和用戶增長。
MiniMax 和月之暗面很難找到這樣的空間和資源。這場資本密集游戲里,資金、算力和生態支持至關重要。OpenAI 的估值已達到 5000 億美元,要頂著萬億美元估值上市;xAI 和 Anthropic 的估值也都逼近 2000 億美元。而 MiniMax 和月之暗面的估值都在 40 億美元左右。這讓誰能成為中國 OpenAI 的問題變得沒有意義。
體量較大的美元基金退潮后,中國擁有大規模資金的巨頭不愿為創業公司持續輸血,反而成為 AI 公司的競爭對手。阿里、字節、騰訊,甚至是 DeepSeek,研發基礎模型都有主營業務(電商、廣告、量化)供血,短期沒有盈利壓力。
MiniMax 和月之暗面都在嘗試用更專業的功能(月之暗面的 OK Computer、深度研究;MiniMax 的專業模式)吸引用戶付費訂閱。但只要字節等公司的同類產品免費,去年下半年的競爭問題必然會再次出現。
他們還在繼續找錢。市場消息稱,MiniMax 正籌備赴港上市。月之暗面又開了一輪新融資。
大模型注定是需要幾百億美元,甚至上千億美元投入的游戲。創業公司想要走完這條路,創始人們必須證明,這是一場需要他們參與的長期探索,才能獲得更多的理解和支持。
這是一道更難的證明題:在巨頭林立、算力稀缺、資本收縮的市場中,是否還有空間容納一種既做基礎研究、又不屬于任何巨頭的 AI 公司?
這不僅需要更多技術突破,也需要一種在當前中國環境下罕見的能力——靠投資機構和業務收入,維持一支高密度的研究團隊持續產出。
- 1024程序員節京東開放“零幀起手”數字人技術
- 捷尼賽思GV90或推雙版本車門布局 旗艦級純電SUV預計2026年末亮相
- 新款問界M7無偽諜照曝光!采用全新家族式前臉,尾部造型更精致
- 卡樂馳CARLOCS:都說新車別貼隱形車衣,到底是為什么?
- 長安福特新蒙迪歐12月4日上市:全新進氣格柵、隱藏式門把手
- 北京汽車制造廠212 T01混動版發布,外觀復古硬朗,明年一季度上市
- 銀河航天徐鳴:太空基建加速跑 6G通信與新場景引領產業新變革
- 高中生跳高視頻因酷似易烊千璽爆火
- 宛如畫卷!黑龍江一湖面現龍鱗冰奇觀
- 正直播NBA:鵜鶘vs勇士
- 電動自行車新國標將全面落地
- 2026年國考371.8萬人參加
- 村民用了多年的墊腳石竟是恐龍化石
- 跳水式降溫來了!全國多地冷到發紫
- 國考打破35歲門檻后 他們決定去考公
- 2026年國考開考 熱門崗位六千挑一
- 年賣10億的鳳爪大王培養侄子上位
- 內置24000轉/分鐘風扇!紅魔11 Pro圖賞
- W47單品銷量,小米17 Pro Max真牛,同檔國產全沒上榜
- 紅魔11 Air證件照公布:驍龍8至尊版、7000mAh電池