
兩位知情人士表示,這款代號為V4的新模型,是DeepSeek于2024年12月發布的V3模型的迭代版本。DeepSeek員工基于公司內部基準開展的初步測試顯示,該模型在代碼生成領域的表現優于Anthropic、Claude、生成式預訓練變換器系列(OpenAI GPT)等現有主流模型。
上述人士透露,DeepSeek計劃于2月中旬農歷新年前后推出V4模型,不過具體時間仍可能調整。
V3模型的推出幫助DeepSeek在全球人工智能領域嶄露頭角,而R1模型的發布則震動了硅谷與華爾街,一舉將DeepSeek推向全球舞臺。R1是一款開源“推理型”模型,其設計邏輯是在給出答案前,先針對用戶的查詢需求進行深度“思考”,以此解決復雜問題。該模型之所以引發廣泛關注,是因為相較于美國研發的頭部模型,DeepSeek投入的訓練成本相對較低,但模型性能卻十分亮眼。
在國內市場,DeepSeek還推出了一款融合R1與V3雙模型能力的聊天機器人,該產品迅速走紅。
2024年12月,DeepSeek曾發布V3.2版本,該版本在部分基準測試中表現優于OpenAI的GPT-5以及的Gemini3.0Pro。但此后該公司一直未推出重量級的迭代模型,這也使得即將到來的V4模型備受業界矚目。
截至目前,DeepSeek未就此事回應置評請求。
兩位知情人士表示,V4模型在超長代碼提示詞的處理與解析方面實現了技術突破,這對于從事復雜軟件項目開發的工程師而言,具備顯著的應用優勢。此外,該模型在訓練全流程中對數據模式的理解能力也得到優化,且未出現性能衰減的問題。
人工智能模型的訓練需要基于海量數據集開展反復學習,但在多輪次訓練過程中,數據模式的識別精度往往會出現衰減。擁有大規模人工智能芯片集群的研發機構,通常可以通過增加訓練輪次來解決這一問題。
其中一位知情人士表示,用戶或許會發現,V4模型輸出的答案邏輯更為嚴謹清晰,這一特征體現出該版本模型具備更強的推理能力,在執行復雜任務時的可靠性也將大幅提升。
上周,DeepSeek發表了一篇由公司首席執行官梁文鋒聯合署名的研究論文,文中提出了一種全新的訓練架構。該架構能夠支持研發人員在不按比例增加芯片投入的前提下,構建參數規模更大的人工智能模型。這一系列技術進展表明,DeepSeek的技術創新步伐仍在持續邁進。
薩勒馬科爾斯:在AC米蘭感覺就像在家,我得到了阿萊格里的信任
體育播報1月14日宣 近日,AC米蘭中場薩勒馬科爾斯出席了AC米蘭官方商店的見面會,期間他接受了媒體的采訪。薩勒...
2026-01-16
這是大腿!斯基拉:斯帕萊蒂施壓尤文,要求與麥肯尼續約
體育播報1月14日宣 據斯基拉報道稱,斯帕萊蒂要求尤文跟麥肯尼續約。斯基拉說:“斯帕萊蒂正向尤文圖斯施壓,要求...
2026-01-16
方鏡淇告別津門虎:我身后從來不只是有球門,我一輩子都記在心里
體育播報1月14日宣 冬訓進行期間,天津津門虎的門將方鏡淇最終確定離隊。臨別之際,方鏡淇更新微博向津門虎道別...
2026-01-16
球迷談卡里克:他就是測試版!可以簽阿隆索啊他會三后衛打法
體育播報1月14日宣 曼聯名宿卡里克即將正式成為球隊新任主帥,在“進球網”相關消息的評論區,一些國外球迷對此...
2026-01-16
阿隆索社媒告別皇馬+杰拉德評論,球迷熱議:來執教利物浦吧
體育播報01月13日宣 今日哈維·阿隆索在社媒告別了皇馬,昔日利物浦隊長杰拉德評論道:??...
2026-01-16