4月1日,在2025賽迪論壇創新驅動分論壇上,哈爾濱工業大學商學院教授、香港中文大學(深圳)深圳數據經濟研究院客座教授馬濤發表了《DeepSeek技術路線與創新淺析》的主題演講,深入探討DeepSeek的技術創新與能力,分析其在AI領域的最新進展及對產業的影響。
DeepSeek作為國內領先的人工智能模型,其技術創新得到了業內廣泛關注。根據DROP、FRAMES、LongBench v2等多項測評結果,DeepSeek-V3準確率和響應速度均優于GPT-4o和Claude-3.5-Sonnet,這是國內大模型技術第一次在綜合能力上達到國際領先水平。
同時,DeepSeek在處理數學、工具使用、指令遵循等復雜邏輯推理任務時,表現出更強的理解能力和推理能力。這意味著,中國的技術仍在持續進化,能夠應對更多復雜的任務。
增強AI領域的國際話語權
DeepSeek目前已經形成了多種類型的大型模型,包括通用模型(DeepSeek V3)、復雜推理模型(DeepSeek R1)等。特別是在復雜推理任務上,DeepSeek R1首次公開了深度思考模型的訓練過程。其在數學、代碼和推理任務上的表現可以與OpenAI的o1模型相媲美,這標志著我國在復雜推理模型的研發上取得了巨大進展。
馬濤表示,國內復雜推理模型進展迅速,迅速追趕國外TOP模型,但在綜合能力上仍有差距,尤其OpenAI發布的o1-preview,在復雜問題的求解能力上名列前茅,國內大模型在中文問題上的表現優勢并不明顯。
馬濤指出,DeepSeek在模型架構和訓練方法上進行了多個創新。首先,通過優化模型架構顯著降低大模型訓練和推理的成本。此外,DeepSeek還采用了混合精度訓練(FP8 Training),并引入了群體相關的策略優化算法(GRPO),這使得大模型的訓練更加高效。
在計算平臺的優化方面,DeepSeek實現了任務級分時調度共享AI算力,支持在上千個計算節點上穩定運行,且日常算力占用率超過95%。通過這種方式,DeepSeek能夠根據資源需求和集群狀態進行動態管理,以確保計算平臺的高效利用。
開源策略是DeepSeek技術發展的一個重要支撐。通過開源,DeepSeek不僅加速了技術創新,還有效推動了AI技術標準的落地。2024年,DeepSeek R1的開源模型受到了全球開發者的廣泛關注,GitHub數據表明,DeepSeek R1的開源熱度居高不下,吸引了大量開發者的參與。
值得一提的是,DeepSeek通過開源的方式,不僅促進了AI生態的成熟化發展,還有效降低了研發門檻,推動了大模型的快速應用落地。許多海外AI芯片企業和云服務商(如亞馬遜云和微軟Azure)紛紛宣布支持DeepSeek R1模型,進一步增強了其在全球AI領域的話語權。
推動AI產業的多元化發展
DeepSeek的技術不僅影響了國內AI產業的發展,還在全球范圍內產生了深遠的影響。截至2025年2月,DeepSeek的全球累計下載量已經接近4000萬次,位居全球各大AI模型前列。相比之下,ChatGPT的下載量為4100萬,而豆包的下載量約為570萬。更令人驚訝的是,DeepSeek在發布20天內就超越了包括ChatGPT和豆包在內的多個AI助手,成功登頂中美免費APP下載排行榜。
馬濤提到,隨著DeepSeek在各類平臺的廣泛應用,它已經成為了一個公共品,為全球開發者提供了強大的技術支持。許多國內外企業紛紛接入并支持DeepSeek作為其AI技術的核心。通過大模型的應用,企業能夠提升自身產品的智能能力,推動技術創新。
隨著AI技術的快速發展,市場對于大模型的需求日益增長,特別是在企業數據隱私和安全的背景下,DeepSeek也在推動私有化部署的趨勢。超過35家大型企業和技術公司(如華為、百度)紛紛發布了DeepSeek的一體機產品,推動了大模型在醫療、金融、教育等多個行業的深度應用。
在全球范圍內,DeepSeek正在通過技術創新推動AI產業的多元化發展。盡管美國在基礎研究、芯片設計和頂尖人才數量上仍占據優勢地位,但我國在部分領域,尤其是在大模型技術和應用方面,已經實現了超越。
馬濤表示,DeepSeek的成功證明了我國在全球AI格局中逐漸占據了重要的位置。未來,我們應該持續推動技術創新,強化產業鏈的合作,以實現我國在全球AI領域的技術領先地位。盡管目前DeepSeek在大模型技術上取得了顯著進展,但實現AGI(通用人工智能)和ASI(超人工智能)的目標仍需要更多的技術創新。未來,隨著DeepSeek不斷推動開源生態和技術標準的制定,AI行業將迎來更多的創新突破。