XM外匯官網(wǎng)訊——
【DeepSeek首次回應對OpenAI蒸餾的首次質(zhì)疑】
9月18日,DeepSeek再度引發(fā)廣泛關(guān)注。蒸質(zhì)疑由DeepSeek團隊完成的首次研究論文DeepSeek-R1,通訊作者為梁文鋒,蒸質(zhì)疑登上了國際知名期刊《Nature》的首次封面。該論文的蒸質(zhì)疑最新版本相較于今年1月在arxiv上發(fā)布的初版,增加了更多模型細節,首次并減少了擬人化的蒸質(zhì)疑描述。在補充材料中,首次DeepSeek指出,蒸質(zhì)疑R1模型的首次訓練成本為29.4萬(wàn)美元,同時(shí)對早期關(guān)于蒸餾OpenAI的蒸質(zhì)疑質(zhì)疑做出了回應。今年1月,首次有研究指出,蒸質(zhì)疑OpenAI的首次研究人員擔心DeepSeek可能借助OpenAI模型的輸出進(jìn)行R1的訓練,從而以較低的資源消耗提升模型性能。DeepSeek在補充資料中明確表示,DeepSeek-V3-Base的訓練數據完全來(lái)源于普通網(wǎng)頁(yè)和電子書(shū),沒(méi)有使用任何合成數據,并強調在預訓練階段并未故意加入OpenAI生成的數據,所有數據均為通過(guò)網(wǎng)頁(yè)抓取獲得。