本報訊 (記者袁傳璽)1月20日,國內兩家備受關注的人工智能大模型創業公司北京月之暗面科技有限公司(以下簡稱“月之暗面”)(Kimi)和杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”)(DeepSeek)均發布了最新模型。
在月之暗面發布的k1.5多模態思考模型中,多模態思考模型實現了SOTA級別多模態推理和通用推理能力。在short-CoT模式下,Kimik1.5的數學、代碼、視覺多模態和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet。在long-CoT模式下,Kimi k1.5的數學、代碼、多模態推理能力達到了OpenAI o1正式版的水平。月之暗面表示,這應該是全球范圍內,首次有OpenAI之外的公司實現o1正式版的多模態推理性能。
深度求索發布的DeepSeek-R1在后訓練階段大規模使用強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼和自然語言推理等任務上,R1的性能也可以比肩o1正式版。同時根據DeepSeek公布的測試數據,R1在美國AIME 2024、MATH-500和SWE-bench Verified測試中的比分均高于OpenAI o1。
與OpenAI不同,這兩家公司都公開了原理及技術報告:Kimik1.5發布原創技術long2short,高效思維鏈+原生多模,DeepSeek-R1則繼續主打高性價比。
中央民族大學教授郭全中表示:“中國AI公司之前基本都在摸著OpenAI的石頭過河,但從K1.5等國產大模型開始,以硅谷為中心的格局已悄然發生變動。國產大模型的突破不僅在于技術指標的提升,也展示了中國AI技術正在走向自主創新的新階段。期待看到更多中國企業在全球AI舞臺上展現實力,推動人工智能技術向著更高水平邁進。”
(編輯 張鈺鵬)
12:31 | 傳化集團與浙江人形機器人創新中心... |
12:12 | 協鑫能科虛擬電廠調節能力突破550M... |
12:11 | 海特高新召開業績說明會:加強研發... |
11:01 | 工銀瑞信基金董事長趙桂才:提高權... |
11:00 | 嵐圖汽車正式登陸中東 |
10:59 | 第二屆電力行業科技創新大會在廣州... |
10:49 | 中金廈門安居REIT擴募獲受理 |
09:58 | 賀普藥業:公司在研新藥的二期臨床... |
09:56 | 直擊同力股份年度股東大會:加速海... |
09:56 | 國芯科技聚焦核心方向 推動AI與量... |
09:55 | 行業景氣度提升驅動高速光模塊需求... |
09:55 | 老牌券商資管總經理人選落定,成飛... |
版權所有證券日報網
互聯網新聞信息服務許可證 10120180014增值電信業務經營許可證B2-20181903
京公網安備 11010202007567號京ICP備17054264號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注