智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          DeepSeek團(tuán)隊(duì)揭秘:清北應(yīng)屆生領(lǐng)銜,年輕力量如何撐起AI大模型新篇章?

             發(fā)布時(shí)間:2025-01-04 16:11 作者:任飛揚(yáng)

          在人工智能領(lǐng)域,一支年輕的團(tuán)隊(duì)正以驚人的速度崛起,他們的名字叫做DeepSeek。近期,DeepSeek發(fā)布的DeepSeek-v3大模型,以僅為Llama 3 405B模型1/11的算力,實(shí)現(xiàn)了超越前者的性能,這一成就迅速在AI圈內(nèi)引起了轟動(dòng)。

          隨著DeepSeek-v3的發(fā)布,關(guān)于該團(tuán)隊(duì)的各種傳聞也隨之而來,其中最為引人注目的是“雷軍開出千萬年薪挖角DeepSeek研究員羅福莉”的消息。這一傳聞不僅讓科技圈沸騰,更讓全網(wǎng)都對(duì)這支神秘的團(tuán)隊(duì)充滿了好奇。

          DeepSeek究竟有何魅力?為何能吸引如此多的關(guān)注?從各種資料中,我們可以發(fā)現(xiàn),這支團(tuán)隊(duì)的最大特點(diǎn)就是年輕和充滿活力。團(tuán)隊(duì)成員中,應(yīng)屆生、在讀生占據(jù)了相當(dāng)大的比例,特別是來自清華大學(xué)和北京大學(xué)的應(yīng)屆生,更是團(tuán)隊(duì)中的佼佼者。

          在這些年輕的面孔中,不乏已經(jīng)在學(xué)術(shù)界嶄露頭角的佼佼者。例如,有的成員在DeepSeek搞研究的同時(shí),其博士學(xué)位論文還獲得了獎(jiǎng)項(xiàng)的認(rèn)可。他們中的一些人,從DeepSeek LLM v1開始,就參與了團(tuán)隊(duì)的工作,一直到現(xiàn)在,已經(jīng)成為了團(tuán)隊(duì)中的中堅(jiān)力量。

          DeepSeek的核心成員中,高華佐和曾旺丁是MLA架構(gòu)的關(guān)鍵創(chuàng)新者。MLA(Multi-head Latent Attention)是DeepSeek-V2中的一項(xiàng)重要?jiǎng)?chuàng)新,它大幅減少了計(jì)算量和推理顯存,為DeepSeek-V2的成功奠定了堅(jiān)實(shí)的基礎(chǔ)。而曾旺丁,則來自北京郵電大學(xué),其導(dǎo)師是北郵人工智能與網(wǎng)絡(luò)搜索教研中心主任張洪剛。

          除了MLA,DeepSeek-V2還涉及到了另一項(xiàng)關(guān)鍵成果——GRPO。GRPO是PPO的一種變體RL算法,它顯著減少了訓(xùn)練資源的需求,受到了業(yè)內(nèi)的廣泛關(guān)注。這一成果的背后,也有著年輕研究員的辛勤付出。邵智宏、朱琪豪和Peiyi Wang等核心作者,在DeepSeek實(shí)習(xí)期間就完成了這一工作。

          邵智宏是清華大學(xué)交互式人工智能(CoAI)課題組博士生,師從黃民烈教授。他的研究領(lǐng)域包括自然語言處理和深度學(xué)習(xí),對(duì)構(gòu)建一個(gè)穩(wěn)健且可擴(kuò)展的AI系統(tǒng)有著濃厚的興趣。朱琪豪則是北京大學(xué)計(jì)算機(jī)學(xué)院軟件研究所的博士畢業(yè)生,他的研究方向是深度代碼學(xué)習(xí),曾發(fā)表多篇CCF-A類論文。

          DeepSeek的創(chuàng)始人梁文鋒,在團(tuán)隊(duì)的建設(shè)上有著獨(dú)到的見解。他強(qiáng)調(diào),團(tuán)隊(duì)的核心技術(shù)崗位主要以應(yīng)屆和畢業(yè)一兩年的人為主,看能力而不是看經(jīng)驗(yàn)。這一理念貫穿了整個(gè)團(tuán)隊(duì)的招聘和人才培養(yǎng)過程,使得團(tuán)隊(duì)能夠吸引并留住大量的年輕才俊。

          除了團(tuán)隊(duì)成員的年輕化,DeepSeek在國內(nèi)AI公司中還有著另一個(gè)突出的特點(diǎn):非常重視模型算法和硬件工程的配合。在DeepSeek-v3的論文中,有200位作者參與了這一工作,他們不僅負(fù)責(zé)AI算法和數(shù)據(jù),還參與了硬件的優(yōu)化和算力的提升。

          這種軟硬件協(xié)同的設(shè)計(jì),使得DeepSeek能夠以極低的算力實(shí)現(xiàn)高性能的大模型訓(xùn)練。而這一切的背后,離不開團(tuán)隊(duì)中那些既懂算法又懂硬件的年輕工程師們的辛勤付出。

          DeepSeek的運(yùn)作模式也讓人想起了另一家AI界的巨頭——OpenAI。同樣不看經(jīng)驗(yàn)、重用新人,同樣面對(duì)潛力方向時(shí)從頂層開始設(shè)計(jì)布局和資源推動(dòng)。或許,在未來的某一天,DeepSeek會(huì)成為組織形態(tài)上最像OpenAI的中國AI公司。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          日韩av无码一区二区三区| 日本精品视频一区二区三区| 伊人久久精品无码av一区| 成人精品综合免费视频| 国产日韩精品无码区免费专区国产| 精品无码久久久久久国产| 国产精品成人在线| 91精品国产综合久| 欧洲精品色在线观看| 久久亚洲精品中文字幕无码| 国产午夜福利精品一区二区三区 | 日韩av无码成人无码免费| 国产成人啪精品午夜在线播放 | 精品福利视频第一| 亚洲?V无码成人精品区日韩| 国产成人精品午夜在线播放| 国产精品久久久久久网站| 国产精品久久久久网站| 国产真实乱子伦精品视频| 国产伦精品一区二区三区在线观看 | 国产精品成人久久久久| 国内精品在线播放| 精品国产18久久久久久 | 精品久久香蕉国产线看观看亚洲| 国内精品久久久久久麻豆 | 2022国产精品视频| 精品无码人妻一区二区免费蜜桃| 91久久精品午夜一区二区| 亚洲精品视频在线免费| 精品无码免费专区毛片| 99国产精品永久免费视频| 国产精品一区在线麻豆| 精品熟女少妇AV免费观看| 老色鬼永久精品网站| 精品久久久久久亚洲中文字幕| 另类ts人妖精品影院| 国产精品亚洲专区一区| 久久精品无码一区二区三区日韩| 亚洲欧洲日韩综合| 九九九国产精品成人免费视频| 精品国产污污免费网站入口在线|