DeepSeek 反思潮：AGI 既被从新审阅，又被连续低估_沙巴官网入口网站正式版

科学研究

科研动态

科研动态

DeepSeek 反思潮：AGI 既被从新审阅，又被连续低估

作者：[db:作者]日期：2025/03/01 浏览：

2 月很有意思。一、DeepSeek 反思潮在 DeepSeek 的群体反思潮中，无论是年夜厂外部的“AGI 创业团队”、仍是 AGI 的明星创业公司，都停止了策略调剂。很显然，DeepSeek 的暴击让全部行业都停止了一次深入的反思，值得留神的多少个变更是：起首，年夜模子创业公司从新将技巧冲破晋升到一个新的高度、超出产物更新成为公司策略开展的优先级。据克日与张予彤打仗过的 VC 反应，DeepSeek 不花一分钱投流的突起启发了 AGI 的技巧高度，也让 Moonshot 反思了从前一年类互联网打法、适度器重产物投流的战略范围性。在将来的一年，Moonshot 要将基本模子的冲破作为重点，将更多资本投到技巧而非研发上。现实上，这不只仅是月之暗面的论断，也是这波 AGI 创业潮中卡技巧生态位的年夜模子公司的广泛改变。与此绝对应的，是产物团队的资本比重降落，由于 DeepSeek 的胜利曾经正面证实了：AGI 时期可能不须要产物司理，也不须要投流，只有技巧气力晋升后就会有效户增加。2024 年的投流年夜战，以 DeepSeek 不花一分钱、DAU 最高时达 4000 万落下帷幕，而受创最重的天然是投流团队，由于钱相称于白花了。投流越多、损害越年夜，如 Moonshot；投流越少，损害越小，如 MiniMax。据 AI 科技批评得悉，MiniMax 前产物一号位离任的起因之一，就是曾与开创人在投流上产生不合。MiniMax 的构造架构之前是互联网打法，依照差别产物停止分组，产物团队一度到达 200 人，但 2024 年年中开端就始终在调剂产物团队，接上去可能会进一步扩充产物职员。雷峰网其次，是字节与腾讯的攻守异位，以及字节年夜模子技巧团队的架构调剂。从前一周，腾讯元宝接入 DeepSeek 后在中国区苹果收费 APP 下载排行榜上超越豆包，排名第二、仅次于 DeepSeek。在“DeepSeek+”的风潮下，比拟百度、阿里、字节等有技巧累赘的年夜厂来说，腾讯的元宝与微信等利用敏捷捉住了机遇，毫无累赘地接入了 DeepSeek，一会儿由从前两年的主动防卫转为自动反击，变守为攻，改变下场势。业内周知，在从前的两年，腾讯在年夜模子、AIGC 相干技巧与产物上固然尽力追逐，但一直不温不火。又因为将算力与人才等资本更多投入基本模子，文生视频等偏向的研讨资开元游戏大厅官网本被影响，团队中心主干从腾讯流向快手、字节等团队。能够说，DeepSeek 救了腾讯年夜模子一把。也因而，有业内子士以为：基本模子的研讨终极只要要 DeepSeek 一家即可。随之激发的，是克日传出的年夜模子公司有老股东开端筹措退股的声响，以为“智谱、阶跃乃至字节、阿里等公司的年夜模子都没戏了”。——对这种声响，笔者不敢苟同，以为应当连续张望。有一个比方能很好地描述以后中国年夜模子创业潮的格式：一个富二代学霸做了一份濒临满分的卷子，并把谜底颁布了出来。但这份谜底的进修有必定的资本本钱与体面本钱，另一个能承当起这两种本钱的富二代学渣直接拿来抄了、也考了濒临满分的成就。当初留下一群从乡村经由过程援助退学、平常考七八非常的先生，以及同是富二代但尽力偏向错了的先生，手足无措。他们终将意识到，开放社会的竞争纷歧定公正，但必定残暴。攻破这种构造性窘境很难，或者须要“一命二运三风水四积阴德五念书”，但他们不其余抉择。回到事实，字节的年夜模子团队停止调剂，也是由于 AGI 的竞争格式产生了变更——DeepSeek 冲出来之前，业内多少乎全部人都在夸字节的豆包，豆包也回升非常迅猛，给 kimi 形成极年夜的围剿；但 DeepSeek 霸屏全部春节后，字节认识到，AGI 还是一个高度的果实，必需换一个更能打的将领。据 AI 科技批评验证，此前字节的基本模子技巧研讨由白文佳率领，春节落后行了一次年夜的职员调剂，基本模子技巧研发的一号位换成了由吴永辉，黄文灏等在 2024 年新参加的年夜模子主干都向吴永辉报告，而白文佳则转向了模子利用一号位，吴永辉与白文佳都向梁汝波报告。经 AI 科技批评梳理，2023 年字节刚组建年夜模子团队时，团队职员重要来自字节外部，包含搜寻、抖音、西瓜、TikTok 等等多条著名营业线，在字节过往产物上有过年夜巨细小的败仗，白文佳上面各个小组中一号位人选从表面招入的人才并未几。从 2024 年年中开端，越来越多 AGI 偏向的著名人才被招入字节，团队开端换血。据知恋人士剖析，这背地的起因是：白文佳等人来自搜推广技巧配景，而年夜模子是新的范式，两者纷歧定合适。字节、MiniMax 等公司此前低估 RL 技巧道路就是麻将胡了官方网站入口一个例证。吴永辉取代白文佳成为基本模子研讨一号位，象征着字节换血的信心更彻底。雷峰网(大众号：雷峰网)吴永辉此前在谷歌的职级仅次于 Jeff Dean，是谷歌 Gemini 的中心奉献者之一。而据多少位硅谷华人的信源，吴永辉善于模子工程。谷歌自 2017 年宣布 Transformer 后始终在年夜模子赛道上连续翻新，且谷歌研讨年夜模子始终是从底层框架、算力到下层算法的体系性推动，从常识面上吴永辉确更合适年夜模子技巧一号位的脚色。（谷歌 Gemini 能否被低估？欢送感兴致的读者增加作者微信 Fiona190913 交换）据知恋人士流露，白文佳此前在率领字节年夜模子技巧研发时，在人才任用上更重用以往一同打过仗的心腹乔木等人，同时在年夜模子基本研讨的翻新 idea 采取上不敷开放。这背地的逻辑不难懂得：AGI 的技巧有极高不断定性、用熟习的队友能增加相同本钱。假如 AGI 是一个很低的桃子，“钱多人傻”的打法兴许能够，但现实或者并非如斯。据懂得，新参加字节的技巧职员曾向白文佳提过诸如 SPPO 等强化进修偏向、火星优化器等高效练习偏向的技巧计划，“一些计划明显本人验证了 work、但被白文佳移交给身边的人验证后被反应不 work 而弃失落”。此前字节外部跑马文生视频，其余团队赛赢，但后续结果被白文佳划到了 Seed 团队。（更多字节年夜模子外部的研讨细节，欢送天街作者微信 Fiona190913 交换）年夜模子是一项有门槛的翻新技巧，无论在年夜厂仍是创业公司，现实上都须要创业者的心态。第一批低估 AGI 的人曾经被摁倒，但并非全部人都汲取了经验。雷峰网二、AGI 的壁垒在哪？“算法是不壁垒的。”一位年夜模子 VC 如许批评道。与此同时，另有类似的声响：“DeepSeek 景象只是过眼云烟，过 6 个月就会被追上”，以及“年夜模子创业公司必定会逝世，最后赢家只有 DeepSeek 与年夜厂，你看腾讯元宝”。笔者以为，鄙人结论之前，起首要答复一个成绩：DeepSeek 曾经实现最终 AGI 了吗？谜底显然能否定的，即便是 DeepSeek 官方都否认，R1 模子仍有一些致命缺点，比方通用才能缺乏、言语混杂、提醒词敏感以及软件工程才能缺乏。假如这个成绩告竣了共鸣，那么咱们就要思考下一层：第一，DeepSeek 是不是必定能处理 AGI 的全部技巧成绩？第二，DeepSeek 是不是只要一家之力就能实现最终 AGI？第三，中国事不是只有 DeepSeek 一家有气力处理 AGI 的各个技巧成绩？同样以腾讯元宝为例。固然元宝接入 DeepSeek 后能够博得一时的成功，但不人能保障 DeepSeek 永久满分。假如有一天 DeepSeek 不开卷、竞争的规矩被改写，又将攻守异位。对上述成绩，笔者均持猜忌立场，起因很简略：DeepSeek 并非凑集了中国以致寰球全部的 AGI 技巧人才。即便已经明星如云的 OpenAI，也由于2023、2024 年阅历了大量中心人才出奔，开展碰壁。对于 AGI，假如不将其当成只是 DeepSeek 一家的义务，而bet356体育官方网站是作为全部 AI 行业的必定结局，那么就不难有一种朴实的感到：AGI 的年夜帆海，须要的不仅是一个“DeepSeek”，也不会只有一个“DeepSeek”。AGI 是一个行业，而不是一个产物。在 2 月的交换中，笔者总结，形成 AGI 从业者这种“既器重又低估”的抵触心思的一个主要起因，或者是互联网头脑的惯性。阅历过互联网年夜战的从业者向 AI 科技批评举例，“互联网产物就是竞争到最后每每就是只有一家胜出，比方出行年夜战、3Q 年夜战等等。”但笔者以为，这品种比不太适当，由于互联网产物的技巧如搜推广从谷歌开端、再到海内时，大要的技巧天花板曾经断定，而 DeepSeek 证实了 AGI 的天花板比 OpenAI 所获得的成就还高。与 AGI 或年夜模子能在统一个层面类比的技巧分支，或者用主动驾驶的 L4、英伟达芯片等高难度的技巧来类比更适合。固然 L4 至今不实现，但主动驾驶技巧从 L2 到 L4 的进程中曾衍生了差别维度的产物贸易化（如扫地呆板人），同样，AGI 也是一个逐渐获得成功、逐渐催生贸易技巧产物的进程。有些团队本就不具有竞争 AGI 的技巧气力，但这并不克不及揣摸出“DeepSeek 是独一能竞争 AGI 的创业团队”或“中国只要要一家 AGI 公司”的论断。哪怕是海内的各家基本模子，也在才能上各有分工，如 GPT 更善于听指令、Claude 更善于代码。再回想更年夜的行业法则：假如说搜广推技巧由谷歌开启、字节抖音推至顶峰，那么年夜模子技巧由 OpenAI 开启，由将由谁推至顶峰？互联网时期阅历了 20 年才得出谜底、旁边也阅历了很多故事，那么 AGI 时期也弗成能只在 2 年内验证最初的赢家与最后的赢家。那么，AGI 的壁垒在哪？笔者以为，AGI 的壁垒现实是：算法的上风、技巧的翻新固然无奈形成坚如盘石的壁垒，但能够博得时光差。以月之暗面为例。现实上，Moonshot 与 DeepSeek 都是在 2023 年的上半年景破、前后相差只有一个月。在 2021 年智源的“悟道”年夜模子名目中，杨植麟也是悟道 2.0 年夜模子的中心开辟者之一，从底层 Transformer 到下层年夜模子的算法练习都有完全、体系的研讨背书。比拟之下，DeepSeek 开创团队、包含梁文锋虽是盘算机专业配景，但在 NLP、Transformer 与预练习等年夜模子的要害技巧上与 Moonshot 团队必定存在技巧进修的时光差。假如以 Moonshot 在建立时就具有练习千亿年夜模子的才能开端算起，到 DeepSeek 在 2024 年 5 月宣布 V2，那么这个时光差大略盘算大概是 1 年；假如严厉斟酌 V2 练习本钱年夜幅下降的研发时光，这个时光差也至少是 6 个月以上。但因为 Moonshot 在从前两年更器重产物增加、而非基本模子的底层技巧翻新，Moonshot 与 DeepSeek 的基本模子时光差也从 2023 年“DeepSeek 至少比 Moonshot 落伍半年”酿成了 2025 年“Moonshot 至少比 DeepSeek 落伍 XXX 年”。在互联网头脑的适度领导下，前后相减，Moonshot 至少得到了一年的上风，自动变主动。据知恋人士流露，DeepSeek 外部打算往年 3 月宣布 V3.5，6 月之前宣布 V4。换言之，假设其余团队的基本模子能在 6 月遇上 V3 与 R1，作为先行者，DeepSeek 曾经应用时光差博得了当先的技巧研发期，以及这半年内的生态护城河。模子的后果轻易晋升，但生态不轻易盘据。是不劳而获，仍是参加竞争，亦或看清局面、早早转向本身的上风地点，不轻易断定。只管 DeepSeek 以后风头正盛，但 AGI 依然是一个挂在高处的果子，须要连续的底层技巧翻新。在跋涉的进程中，必定会有人退出，无论是 VC 也好、创业者也好、技巧职员也好，但无论怎样，这条路上不会只有 DeepSeek，也盼望不会只有 DeepSeek。

上一篇：被摈弃的五星级旅店
下一篇：2025 CCEE雨果跨境展美满闭幕，EJEAS闪烁全场