2025 年上半年,各種現象級智能體應用層出不窮,Manus、Flowith、扣子空間、Lovart、MiniMax Agent、Kimi Deep Research 等等。
智能體應用爆發背后,證明了大模型的智能水平已經達到相當可靠、可用的階段。
其中,開源模型發展迅速,在性能上已經整體逼近甚至追平閉源模型,以 DeepSeek R1、Qwen3-235B-A22B 、Kimi K2 為代表的模型已經躋身全球 top 級模型。同時,開源模型大大降低了模型成本,AI 推理成本正以每年 10 倍的速度降低。
PPIO 提供國內主流開源模型服務,包括 DeepSeek、阿里 Qwen、MiniMax、Kimi、智譜 GLM 等,是國內開源模型服務最全面的 AI 推理云平臺之一。根據 PPIO 平臺的大模型 tokens 調用量,我們總結了 2025 上半年國內大模型十大趨勢。

去年開源模型的影響力遠沒有今年大,很多人也并不認為開源模型的性能可以與閉源模型媲美。但 DeepSeek 的出現改變了這一局面。
DeepSeek 有兩個大版本,一是 base 模型 V3,首發于 2024 年 12 月,并在 2025 年 3 月 24 日發布更新版本;二是推理模型 R1,首發于 2025 年 1 月,并在 2025 年 5 月 28 日發布更新版本。2025 年第一季度,DeepSeek 模型一枝獨秀,在 PPIO 的使用占比高達 99%。直到 5 月份后,DeepSeek 的使用量占比開始有所下降,主要是因為更多優秀模型出現,用戶對于模型的選擇更加多元化了。
Qwen 就是其中的一個代表。PPIO 目前上線了 Qwen 的三個系列—— Qwen2、Qwen2.5 和 Qwen3,前兩者是 2024 年發布的模型,Qwen3 在今年 4 月 29 日首發上線 PPIO 。從 2025 年第二季度開始,PPIO 平臺的 Qwen 模型的使用量開始高速增長,到 5 月下旬時調用量占比超過一半,最高時達 56%,與 DeepSeek 一同稱為最受歡迎的兩大開源模型。

推理模型始于 OpenAI o1 模型,特指使用強化學習、思維鏈(CoT)等技術來訓練的模型,可以將復雜任務場景通過多步驟推理生成答案,思考時間越長,模型性能越強。PPIO 平臺上線的推理模型包括 DeepSeek R1、Qwen QwQ、Qwen3 系列、GLM Z1 等。
2025 年 2 月份,推理模型受到廣大 AI 開發者的青睞,其全平臺的使用量占比保持在 50% 以上。但從 3 月份開始,非推理模型的使用量反超推理模型,并一直延續至今。


DeepSeek V3 這一類基礎模型適用于日常對話、文本生成、多語言處理等高頻需求,用戶面廣,使用門檻低,而且這一類應用場景通常并不需要復雜的推理過程;而 DeepSeek R1 專攻數學競賽、代碼邏輯等深度推理任務,而且由于深度推理需要消耗更多算力,輸出成本更高,R1 百萬 tokens 成本大約是 V3 的 2 倍左右。
趨勢三:DeepSeek 的數學模型、蒸餾模型的用戶使用量較小,更大的意義在于推動行業研究
在 V3 與 R1 兩大主力模型之外,DeepSeek 還開源了 Prover V2 數學模型,以及基于 Qwen 等基礎模型的 R1 蒸餾模型。
Prover 是 DeepSeek 專門為數理邏輯與高復雜度任務而設計的數學模型,PPIO 在 4 月 30 日 首發上線了 Prover V2 671B;R1 蒸餾模型則是基于 Qwen 模型而蒸餾的 1.5B、7B、14B、32B 四個不同型號的模型,在數學基準測試上優于 GPT-4 和 Claude-3.5-Sonnet,甚至在多項能力上對標 o1-mini,PPIO 也在第一時間部署上線。
由于這兩個系列的模型面向的用戶場景較為垂直,相比 V3 與 R1 的使用量較小,僅占 DeepSeek 系列的 1% 。不過,這兩款模型對于推動 AI 行業的基礎研究有著重要的意義。

Qwen 是國內最早的開源模型,生態布局廣泛。在 2025 年 Hugging Face 的全球開源大模型榜單中,排名前十位的模型全是基于 Qwen 系列二次開發的。
在 PPIO 平臺的 Qwen 模型中,最受歡迎的是 Qwen2.5。PPIO 在 4 月下旬針對 Qwen2.5-7B-instruct 等模型開放限時免費活動,該系列模型的 tokens 消耗激增,整體消耗占 Qwen 系列整體的 90% 以上。即使在 Qwen3 發布后,Qwen 2.5 依然保持了強勁的用戶需求。
如果拋開免費模型,Qwen3 的 tokens 消耗量占據 Qwen 付費模型的 23.48%,在 5 月中旬的使用量一度達到 37%。Qwen3 在業內率先支持混合思考模式,支持 119 種語言和方言,針對模型編碼和代理能力做了重點優化,并增強了對 MCP 的支持。

PPIO 平臺不僅提供大語言模型 API 服務,也提供圖像與視頻生成等多模態 API 服務,但在不同場景用戶有不同的使用偏好。
在生圖領域,用戶更喜歡使用文生圖模型而非圖生圖模型。2025 年上半年,文生圖模型的使用占比從 1 月份的 70% 增長到 6 月份的 90%。
相比圖生圖,文生圖的創作門檻更低,文字描述可以更加精準地傳達用戶的想法與創意,并為用戶提供更多的創意靈感。而且,文生圖模型經過大量的數據訓練,能夠生成具有較高美學價值和質量的圖像。

視頻生成模型的用戶使用習慣與圖片生成模型恰恰相反,用戶更加側重于圖生視頻而非文生視頻。圖生視頻模型的使用占比從 1 月份的 20% 左右,增到到 6 月份的 90% 以上。
圖片生成視頻模型的優勢在于可控性更高,穩定性更好。相比文生視頻常見的不確定性和難以控制的結果,圖生視頻模型能夠更好地保證視頻生成的質量和連貫性,同時也符合視頻創作者的從業習慣和工作流程。在視頻生成領域常見的工作流是,先用文生圖模型生成圖片,再用該圖片生成視頻。
趨勢七:Stable Diffusion XL 逐漸替代 Stable Diffusion 1.5,成為最受歡迎的圖片生成模型基礎架構
在生圖領域,Stable Diffusion 1.5 與 Stable Diffusion XL 是兩大最受歡迎的生圖模型基礎架構,有大量模型基于這兩大架構進行二次微調,合計占據平臺使用量的 80% 以上。其中,SD1.5 可支持二次元、卡通與寫實風格,SDXL 更適合寫實、攝影、插畫等細膩風格。
從 3 月下旬開始,SDXL 系列模型使用量迅速增長,反超 SD 1.5 系列模型。SD 1.5 系列模型的使用量在 2 月份高達 65% 左右,但到 5 月份已經降低到 22% 左右;SDXL 系列模型的使用量在 2 月份為 18% 左右,到 5 月份已經增長到 70%。
究其原因,SDXL 由于參數量更大且采用 Base 模型和 Refiner 模型組合,生成圖像細節、色彩、對比度更優,生成圖片細節豐富,對自然語言理解更強,社區支持和插件兼容性也逐漸提升。
Flux.1 模型的整體占比在 3% 左右,未見有明顯的增長。
趨勢八:阿里萬相是國內最受歡迎的開源視頻模型
在 2 月份,視頻生成模型主要有兩類:一是文生視頻的 AnimateDiff,這是基于 Stable Diffusion 的動畫生成工具,使用量占比大約在 70% 左右;二是圖生視頻的 Stable Video Diffusion,使用量占比大約在 20% 左右。
從 3 月份開始,騰訊的開源視頻模型 Hunyuan Video 與阿里的開源視頻模型 Wanxiang(萬相)上線后,國內開源視頻模型開始高速增長。到 6 月份,阿里 Wanxiang 使用量占全平臺的 80% 以上,成為 PPIO 平臺最受歡迎的國產視頻開源模型。
6 月份,PPIO 首發上線 MiniMax-Hailuo-02 視頻模型,這是全球范圍內圖生視頻領域排名第二的 SOTA 模型,上線第一周就斬獲了 1.5% 的使用量。
趨勢九:出海需求高漲,約 20% 用戶的 AI 應用場景面向海外
全球 AI 市場空間是國內的幾倍,海外用戶對 AIGC 產品的創造性和付費意愿可能比國內更強,如東南亞、非洲等地區市場潛力大。國內 AI 領域的創業團隊和獨立開發者更靈活、更迅速地在全球市場崛起。
在 PPIO 平臺,有不少客戶 " 立足國內,服務全球 ",有大約 20% 的 AI 應用場景面向海外。、
趨勢十:2025,智能體大爆發
大模型的業務場景分布在各行各業。可以說,從國有銀行到街邊奶茶店,從手術臺到煉鋼爐,大模型已沒有行業死角。
在 PPIO 平臺。情感陪伴類應用、創意內容生產類工具、辦公效率類工具以及高校科研項目是對 AI 最大需求方。
同時,2025 年上半年智能體應用也在快速爆發,Manus、Flowith、扣子空間、Lovart、MiniMax Agent、Kimi Deep Research 等智能體獲得了非常高的關注度。
針對智能體應用,PPIO 平臺將在 WAIC 期間正式發布 Agent Sandbox(沙箱)產品,敬請期待。
來源:獵云網
