成人性色生活片免费看爆迷你毛片,亚洲中文二区三区,国产成人亚洲精品无码A大片,色欲网中文字幕日本美女快播一区,黑人粗进欧美白妞在线直播,久久久久久曰本av免费免费,最近中文字幕高清字幕mv,黑人玩弄人妻中文在线,国模无码视频一区

當(dāng)前位置: 網(wǎng)站首頁(yè) 先鋒資訊 DeepSeek 沖擊之下,大模型六小強(qiáng)如何「回應(yīng)」?

DeepSeek 沖擊之下,大模型六小強(qiáng)如何「回應(yīng)」?

來(lái)源:互聯(lián)網(wǎng) 發(fā)布時(shí)間:2025-02-18 15:14:09

馬上整整 1 個(gè)月了!這一個(gè)月以來(lái),全球大模型市場(chǎng)受 DeepSeek 攪動(dòng),無(wú)不方寸大亂。

中外大廠、初創(chuàng)公司都頭好禿,全被追著問(wèn):你們對(duì) DeepSeek 怎么看?DeepSeek 出來(lái)你們?cè)趺崔k?

有避而不談的,也有主動(dòng)回應(yīng)的。

國(guó)內(nèi),比如騰訊,剛剛在微信開(kāi)啟灰度測(cè)試“AI 搜索”功能,接入的就是 DeepSeek-R1;比如百度,當(dāng)即宣布 4 月起文心一言免費(fèi)用,下一代文心模型決定開(kāi)源……

國(guó)外,比如 OpenAI,緊急發(fā)布 o3-mini、上新深度搜索、公開(kāi) o3 思維鏈條;比如谷歌 DeepMind,新發(fā)布的 Gemini 2.0 系列,新增模型型號(hào) Gemini 2.0 Flash-Lite,其 API 砍價(jià)能力比 DeepSeek 還狠;

然而正當(dāng)全球 AI 大模型格局重塑之際,放眼國(guó)內(nèi),不少人還很關(guān)心一件事:

六家已成為獨(dú)角獸的大模型創(chuàng)業(yè)公司,零一萬(wàn)物、百川智能、階躍星辰、智譜華章、月之暗面、MiniMax 江湖人稱(chēng)大模型六小強(qiáng)。

在 DeepSeek 猛烈的沖擊波下,他們正在如何應(yīng)對(duì)?

沖擊之下,六小強(qiáng)都有啥“回應(yīng)”

六小強(qiáng)中,沒(méi)有任何一家站出來(lái),正面表達(dá)對(duì) DeepSeek 的看法。

但這不代表它們沒(méi)有行動(dòng) —— 畢竟比起高談闊論,落地的實(shí)際行動(dòng)更值得用來(lái)證明。

注:以下均為六小強(qiáng) 1 月 20 日(含)后的動(dòng)態(tài)

零一萬(wàn)物

DeepSeek-R1 問(wèn)世之前,創(chuàng)始人李開(kāi)復(fù)博士已公開(kāi)表示,零一萬(wàn)物將不再追求訓(xùn)練超級(jí)大模型。

經(jīng)過(guò)為期半年多的探索驗(yàn)證,他們明確表示,參數(shù)適中同時(shí)性能優(yōu)異、推理速度更快、推理成本更低的輕量化模型更適合商用場(chǎng)景,“會(huì)成為 AI-First 應(yīng)用爆發(fā)的催化劑”。

而 DeepSeek 問(wèn)世之后,零一萬(wàn)物對(duì)外曝光的首個(gè)動(dòng)作,選擇了攜手蘇州 ——

2 月 14 日,零一萬(wàn)物與蘇州高新區(qū)聯(lián)合成立的產(chǎn)業(yè)大模型基地正式授牌。

該大模型基地聚焦垂直產(chǎn)業(yè),重點(diǎn)打造制造、金融、醫(yī)療、政務(wù)、生物、具身等多個(gè)領(lǐng)域的行業(yè)大模型解決方案,聯(lián)合產(chǎn)業(yè)鏈上下 7 家企業(yè),“探索大模型技術(shù)從實(shí)驗(yàn)室走向生產(chǎn)線的產(chǎn)業(yè)化路徑”。

在現(xiàn)場(chǎng),李開(kāi)復(fù)談道,在人工智能技術(shù)重構(gòu)產(chǎn)業(yè)的關(guān)鍵節(jié)點(diǎn),大模型絕非“空中樓閣”,而是驅(qū)動(dòng)實(shí)體經(jīng)濟(jì)的核心引擎。

而零一萬(wàn)物官方表示:

繼 1 月 2 日與阿里云聯(lián)合成立“產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室”之后,零一萬(wàn)物再度于產(chǎn)業(yè)大模型方向落子。

此次于蘇州高新區(qū)落地的“產(chǎn)業(yè)大模型基地”進(jìn)一步加速了零一萬(wàn)物模型能力商業(yè)落地的進(jìn)程。

百川智能

DeepSeek-R1 發(fā)布 5 天后,1 月 25 日,百川智能發(fā)布新模型 Baichuan-M1-preview。

這是百川第一個(gè)全場(chǎng)景推理大模型。所謂全場(chǎng)景,指的是該模型同時(shí)具備語(yǔ)言、視覺(jué)和搜索三個(gè)領(lǐng)域的推理能力。

與此同時(shí),百川依然奔赴轉(zhuǎn)向醫(yī)療的道路上:

Baichuan-M1-preview 解鎖了醫(yī)療循證模式,官方解釋它“實(shí)現(xiàn)了從醫(yī)療證據(jù)檢索到深度推理的完整端到端服務(wù),能夠快速、精準(zhǔn)地回答醫(yī)療臨床、科研問(wèn)題”。

2 月 13 日,以 Baichuan-M1 為底座打造的「AI 兒科醫(yī)生」經(jīng)過(guò)近一個(gè)月的內(nèi)測(cè)后,在京“上崗”。

針對(duì)臨床推理,它首先會(huì)基于一訴五史生成診療假設(shè),繼而通過(guò)檢驗(yàn)檢查數(shù)據(jù)進(jìn)行假設(shè)證偽與排除,最終經(jīng)由自反思機(jī)制對(duì)剩余假設(shè)進(jìn)行概率排序,輸出符合臨床思維路徑的診療建議。

官方消息顯示,當(dāng)天,北京兒童醫(yī)院開(kāi)展了國(guó)內(nèi)首次“AI 兒科醫(yī)生 + 多學(xué)科專(zhuān)家”的雙醫(yī)并行多學(xué)科會(huì)診。與會(huì)人員除了多科室 13 位專(zhuān)家,還有該醫(yī)院與百川智能、小兒方健康科技(這家是百川投資的醫(yī)療數(shù)據(jù)公司)聯(lián)合研發(fā)的「AI 兒科醫(yī)生」。

與會(huì)者對(duì)一位顱底腫物伴隨抽動(dòng)癥狀的患兒進(jìn)行了多學(xué)科會(huì)診,另一邊,工程師將患者的主訴和病歷資料輸入模型。

AI 兒科醫(yī)生也給出了與專(zhuān)家組會(huì)診結(jié)果高度吻合的建議。

階躍星辰

DeepSeek-R1 發(fā)布當(dāng)天,階躍星辰正處于模型上新進(jìn)程中。

1 月 20 日當(dāng)天發(fā)布的兩款模型均為語(yǔ)言模型,一款是輕量級(jí)、響應(yīng)快、性?xún)r(jià)比高的 Step-2-mini,與自家模型玩意參數(shù)的 Step-2 相比,Step-2-mini 以 3% 左右的參數(shù)量保有 80% 以上的性能。

另一款是主打文學(xué)創(chuàng)作的 Step-2 文學(xué)大師版,“專(zhuān)為創(chuàng)作而生”。

而后兩天內(nèi),階躍繼續(xù)保持節(jié)奏對(duì)外發(fā)布。

21 日,升級(jí)語(yǔ)音模型 Step-1o Audio,又上新多模態(tài)理解大模型 Step-1o Vision。后者發(fā)布首測(cè)就沖上來(lái)了大模型競(jìng)技場(chǎng)前 10,位列視覺(jué)領(lǐng)域國(guó)產(chǎn)第 1。

22 日,發(fā)布視頻生成模型 Step-Video V2 版本,該版本在前代 V1 基礎(chǔ)上,從 VAE 模型、DiT 架構(gòu)與 RL 融合、多模態(tài)大模型應(yīng)用三方面基礎(chǔ)上升級(jí)而來(lái)。

模型側(cè)更新外,階躍星辰旗下應(yīng)用「躍問(wèn)」也在 1 月 24 日推出了全新功能,躍問(wèn) AI 創(chuàng)意板。

它的功能是“不用代碼就能在 3 步內(nèi)實(shí)現(xiàn)想法,開(kāi)發(fā)應(yīng)用”,并且將成果全平臺(tái)分享。

BTW,量子位發(fā)現(xiàn),躍問(wèn)不知何時(shí)已經(jīng)偷偷接入了 DeepSeek-R1……

以及農(nóng)歷新年前頻繁動(dòng)作之時(shí),階躍星辰系統(tǒng)負(fù)責(zé)人朱亦博就在朋友圈小小劇透,年后階躍有大動(dòng)作。

而“大動(dòng)作”本身,或許會(huì)在 2 月 21 日階躍星辰舉辦的首屆“Step Up 生態(tài)開(kāi)放日”上揭曉。至于有無(wú)針對(duì) DeepSeek-R1 的回應(yīng)性動(dòng)作或戰(zhàn)略,也要等到下周會(huì)上才見(jiàn)分曉了。

智譜華章

2 月 11 日,清華大學(xué)計(jì)算機(jī)系教授、智譜創(chuàng)立發(fā)起人唐杰在巴黎大王宮舉行的第三屆人工智能行動(dòng)峰會(huì)邊會(huì)“人工智能技術(shù)進(jìn)步與應(yīng)用”上發(fā)言。

也是唯一參加該峰會(huì)的大模型代表。

在闡述對(duì) AGI 的 5 個(gè)階段劃分后,唐杰表示現(xiàn)在正處于 L2 和 L3 交匯處,即“對(duì)齊機(jī)器與人類(lèi)的意圖”和“機(jī)器自我學(xué)習(xí)”的交匯處。

而 2025 年的關(guān)鍵詞,部分摘錄如下:

    自主的、具有 Agent 能力的大型語(yǔ)言模型(Agentic LLMs)將成為日常生活和工作的核心。

    通過(guò)給定高層次目標(biāo),自主的 LLMs 將制定計(jì)劃、利用數(shù)字設(shè)備并執(zhí)行復(fù)雜項(xiàng)目,而所需的人類(lèi)干預(yù)極少。

    這些自主系統(tǒng)將不再僅僅是孤立的實(shí)體,而是將協(xié)同工作,互補(bǔ)優(yōu)勢(shì),以更高效地完成任務(wù)。

    此外,面對(duì) DeepSeek 攪動(dòng)風(fēng)云,智譜的“回應(yīng)”更多落實(shí)在開(kāi)年頻頻落地上。

    首先是 2 月 11 日,繼續(xù)開(kāi)展和三星的合作。

    具體表現(xiàn)為讓 Agentic GLM(智譜專(zhuān)為手機(jī)研發(fā)的系統(tǒng)級(jí)大模型)登陸三星最新款 Galaxy S25 系列手機(jī),提供基于 AI 的實(shí)時(shí)語(yǔ)音和視頻通話,以及實(shí)現(xiàn)視覺(jué)理解和系統(tǒng)功能調(diào)用、AI 搜索、文案寫(xiě)作等功能。

    (此處確與同日唐杰發(fā)言部分內(nèi)容相呼應(yīng))

    其次是量子位注意到,雖未對(duì)外官宣,但智譜近日悄悄開(kāi)始和二次元很火熱的 AI 畫(huà)圖捏角色的應(yīng)用軟件「捏 ta」展開(kāi)合作。

    一方面,智譜在自家視頻模型上線了捏 ta;另一方面,二家基于智譜的 CogVideoX-2 模型等,在涅 ta 發(fā)起聯(lián)名活動(dòng)。

    月之暗面

    你說(shuō)巧不巧?DeepSeek-R1 發(fā)布一個(gè)半小時(shí)后,月之暗面官方公眾號(hào)宣布了旗下 Kimi k1.5 多模態(tài)思考模型。

    相關(guān)論文《Kimi k1.5:Scaling Reinforcement Learning With LLMs》中顯示,k1.5 模型設(shè)計(jì)和訓(xùn)練有幾個(gè)關(guān)鍵要素:

    長(zhǎng)上下文展開(kāi)。

    k1.5 團(tuán)隊(duì)將 RL 的上下文窗口擴(kuò)展到 128k,背后的一個(gè)關(guān)鍵思想是使用部分展開(kāi)(partial rollouts)來(lái)提高訓(xùn)練效率。

    策略?xún)?yōu)化改進(jìn)。

    k1.5 團(tuán)隊(duì)推導(dǎo)出 long-CoT 的 RL 公式,并采用在線鏡像下降的變體進(jìn)行穩(wěn)健的策略?xún)?yōu)化。

    簡(jiǎn)潔框架。

    上述二者的結(jié)合為通過(guò) LLMs 學(xué)習(xí)簡(jiǎn)歷了一個(gè)簡(jiǎn)潔的 RL 框架,最終實(shí)現(xiàn)在不依賴(lài)蒙特卡洛樹(shù)搜索、價(jià)值函數(shù)和過(guò)程獎(jiǎng)勵(lì)模型等情況下實(shí)現(xiàn)更強(qiáng)性能。

    多模態(tài)能力。

    即具備聯(lián)合推理文本和視覺(jué)兩種模態(tài)的能力。

    2 月 12 日,OpenAI 展示 o3 輕松拿下 IOI 2024 金牌的那篇最新報(bào)告論文中,介紹部分就提及了 DeepSeek-R1 和 Kimi k1.5 分別通過(guò) CoT 提升大模型在數(shù)學(xué)和編程上的性能。

    MiniMax

    現(xiàn)在回頭看 1 月 20 日,真的是神仙打架熱鬧非凡 ——

    當(dāng)天,MiniMax 也有模型上新。

    升級(jí)發(fā)布 T2A-01 系列語(yǔ)音模型,并上線了海螺語(yǔ)音產(chǎn)品(同樣兼顧模型與產(chǎn)品的推動(dòng))。

    T2A-01 系列包含 T2A-01-HD、T2A-01-Turbo 兩款模型,API 服務(wù)同步上線 MiniMax 開(kāi)放平臺(tái)。該系列模型支持 17 種語(yǔ)言及上百種預(yù)置音色。

    依托該系列模型,在海螺 AI,用戶(hù)僅需輸入文字即可生成自然、流暢的超擬人人聲,最長(zhǎng)可輸入多達(dá) 10000 字符。且可根據(jù)需要自由配置輸出語(yǔ)音的情緒、語(yǔ)速、音高,甚至調(diào)整音色效果。

    這里特別提及一個(gè) 1 月 20 日前發(fā)生的事情,那就是 1 月 15 日,MiniMax 創(chuàng)始人兼 CEO 閆俊杰對(duì)談《晚點(diǎn)》稿件發(fā)出,其中展示和透露出 MiniMax 在當(dāng)時(shí)對(duì) 2025 年的調(diào)整和計(jì)劃。

    最重要的一點(diǎn)就是“開(kāi)源”。

    如果重新選,第一天就應(yīng)該開(kāi)源。因?yàn)殚_(kāi)源能加速技術(shù)進(jìn)化。

    這一點(diǎn)呼應(yīng)了當(dāng)日 MiniMax 官宣 MiniMax-01 系列模型,且發(fā)布即開(kāi)源。

    其中,MiniMax-01 首次大規(guī)模擴(kuò)展了新型 Lightning Attention 架構(gòu),替代了傳統(tǒng) Transformer 架構(gòu),使模型能夠高效處理 4M token 上下文。

    綜上,截至推送,六小強(qiáng)近期動(dòng)態(tài)如下:

    被沖擊的不只是六小強(qiáng)

    當(dāng)然了,DeepSeek 這頭深海巨鯨此次扔出 R1,攪動(dòng)的不僅僅是國(guó)內(nèi)六家大模型獨(dú)角獸的圈子。

    也就是說(shuō),放眼國(guó)內(nèi),被沖擊的不只是六小強(qiáng),沒(méi)有一家科技巨頭或 AI 大模型公司置身事外。

    沖擊之下有新的視角,新的轉(zhuǎn)變。

    譬如 DeepSeek「大膽啟用業(yè)界經(jīng)驗(yàn)不夠豐富的年輕技術(shù)人才,以此作為追求突破性技術(shù)創(chuàng)新一環(huán)」的故事,就在街頭巷尾廣為流傳,重新叩問(wèn)了每一個(gè)企業(yè)對(duì)用人標(biāo)準(zhǔn)的定義。

    譬如百度,在放出宣布文心一言即將免費(fèi)的消息后,緊跟著宣布了決定背叛閉源大模型的決定 —— 將在未來(lái)幾個(gè)月中陸續(xù)推出文心大模型 4.5 系列,并于 6 月 30 日起正式開(kāi)源。

    在被問(wèn)到 DeepSeek 是否是意料之中時(shí),李彥宏也在日前的迪拜 AI 峰會(huì)上坦言:

    我認(rèn)為,創(chuàng)新是不能被計(jì)劃的。

    你不知道創(chuàng)新何時(shí)何地到來(lái),你所能做的是,營(yíng)造一個(gè)有利于創(chuàng)新的環(huán)境。

    沖擊之下有新的發(fā)展,新的機(jī)遇。

    云計(jì)算廠商和 AI Infra 平臺(tái) / 公司,第一時(shí)間上線 DeepSeek API,不僅陸續(xù)搭載上 671B 滿血版,還爭(zhēng)相優(yōu)化截?cái)嗦省⒒貜?fù)速度、準(zhǔn)確率等等,有的還推出利好本地部署的框架,再破大模型推理門(mén)檻。

    為涌入巨量用戶(hù)的 DeepSeek 分流,讓更多用戶(hù)從不同渠道把 AI 用起來(lái)。

    另一邊,以騰訊為例,從云平臺(tái)騰訊云、騰訊云旗下大模型知識(shí)應(yīng)用開(kāi)發(fā)平臺(tái)知識(shí)引擎、國(guó)民應(yīng)用微信、AI 智能工作臺(tái) ima、主力 AI 應(yīng)用元寶全方位擁抱 DeepSeek,紛紛宣布接入 R1 模型,還用自身能力為其使用體驗(yàn)添磚加瓦。

    而華為、阿里、字節(jié)等大廠們及旗下應(yīng)用、團(tuán)隊(duì)們,也都在這樣做。

    它們開(kāi)放兼容,擁抱的不光是 DeepSeek,更是用戶(hù)體驗(yàn)最佳的模型 —— 不管是否是“純自研”。

    還是那句話,神仙競(jìng)技,凡人撿漏,AI 普惠,多多益善。

    當(dāng)然,被攪動(dòng)的池水里,不止航行著國(guó)內(nèi)的船只。

    放眼國(guó)際,DeepSeek 的名字已經(jīng)成為華爾街分析師會(huì)議上最高頻提到的 AI 公司。

    隨著 Alphabet(谷歌母公司)、AMD、Palantir 和亞馬遜等科技巨頭公布收益,DeepSeek 被提及的次數(shù)還在增長(zhǎng)。

    外媒用很簡(jiǎn)短的一句話形容這一“盛況”:

    “DeepSeek, DeepSeek, DeepSeek。”

    具體到國(guó)外大模型玩家身上,面對(duì)“DeepSeek 沖擊波”,有急得跳腳的,也有反思與擷取精粹的。

    單舉一個(gè)例子,就能看到頂尖巨頭對(duì)此作出“回應(yīng)”的態(tài)度之綜合:

    OpenAI,緊急地首次向用戶(hù)免費(fèi)推出推理模型 o3-mini,CEO 奧爾特曼還在 Reddit“有問(wèn)必答”活動(dòng)中罕見(jiàn)公開(kāi)反思:

    在開(kāi)源權(quán)重 AI 模型這個(gè)問(wèn)題上,(個(gè)人認(rèn)為)我們站在了歷史錯(cuò)誤的一邊。

    去年 12 月底穩(wěn)坐高臺(tái),拉長(zhǎng)戰(zhàn)線連續(xù)直播 12 天的擠牙膏式打法不見(jiàn)了。

    OpenAI 現(xiàn)在已經(jīng)能在一日之內(nèi)連續(xù)官宣 GPT-4.5 幾周內(nèi)上線,GPT-5 幾月內(nèi)面世,以及關(guān)于模型路線規(guī)劃調(diào)整、既有模型迭代更新的多個(gè)新消息。

    而在大模型賽道之外,DeepSeek 沖擊帶來(lái)的影響力如何,大家肉眼可見(jiàn) ——

    DeepSeek 逢山開(kāi)路,無(wú)數(shù)第三方爭(zhēng)先恐后接入合作 R1、V3 等模型。

    據(jù)不完全統(tǒng)計(jì),目前接入 DeepSeek 模型的第三方,包括 infra 平臺(tái)、手機(jī)廠商、Web / App 應(yīng)用、智駕終端等在內(nèi),已超百家。

    GitHub 上,V3 / R1 不斷攀升的星標(biāo)數(shù)量,代表著更多人可以把 DeepSeek 用起來(lái)。

    然后生態(tài)繁榮,生生不息。

    由是深海巨鯨向 AGI 更深處求索,丟下 R1 這枚深水炮彈后,坊間開(kāi)始流傳一個(gè)新梗。

    DeepSeek 沖擊帶來(lái)的是什么?

    是「一鯨起,萬(wàn)物生」。

    本文來(lái)自微信公眾號(hào):量子位(ID:QbitAI),作者:衡宇

相關(guān)攻略