打破蒸餾質疑!梁文鋒論文登上《自然》封面

神马作文网 教育资讯 14

快科技9月18日消息,據媒體報道,由DeepSeek團隊共同完成、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,近日登上國際頂級學術期刊《自然》(Nature)的封面,引發廣泛關注。

與今年1月發布的初版論文相比,本次正式發表的版本披露了更多模型訓練的技術細節,並對發布初期外界有關「蒸餾」方法的質疑作出了正面回應。

DeepSeek-R1也因此成為全球首個經過嚴格同行評審的主流大語言模型。《自然》在評論中指出,當前絕大多數主流大模型尚未經過獨立的同行評審,而這一重要空白「終於被DeepSeek打破」。

公開資料顯示,DeepSeek創始人梁文鋒畢業於浙江大學電子信息與通信工程專業,獲本科及碩士學位。他於2023年7月創立DeepSeek,公司在2024年5月推出DeepSeek-V2,同年12月27日發布DeepSeek-V3。

2025年1月20日,DeepSeek正式發布DeepSeek-R1模型。該模型猶如一顆投入平靜湖面的巨石,在國際AI界激起千層浪,不僅顛覆了「AI研發必須高投入、長周期」的傳統認知,也打破了美國在AI領域的話語壟斷。


抱歉,评论功能暂时关闭!