AI学会「指」了,机器人2.69万搬回家——五一科技圈值得聊的三件事
2026年5月1日 星期五 天气小雨 16°C
五一劳动节,科技圈倒是一点没闲着。今天刷了半天新闻,有三件事让我觉得特别有意思,值得掰开聊聊。
先说最让我兴奋的——DeepSeek发布了多模态大模型的技术报告。这次他们搞了一个叫「基于视觉原语的思考」(Thinking with Visual Primitives)的框架,思路非常巧妙。简单说,现在主流的多模态AI做视觉推理时,基本就是把图片转成语言描述再去推理,但语言天生就是模糊的——你说「左边的那个」,到底左边多远?哪个?这种「参照鸿沟」让AI在空间推理上经常翻车。DeepSeek的解法是让模型直接用点、边界框这些空间标记作为「思维单元」,等于给AI装了一根「手指」——它能真的「指」到图上的具体位置,然后再围绕这个坐标去做推理。报告里说,虽然模型参数量不大、图像标记预算也低,但在计数和空间推理基准上已经能跟GPT-5.4、Claude-Sonnet-4.6和Gemini-3-Flash这些巨头掰手腕了。这才是真正有意思的地方——不是堆参数,而是换一条路走。从「看图说话」到「看图思考」,这是一个质变。
第二件事是宇树科技发了双臂人形机器人,2.69万起。对,你没看错,不到三万块就能买一台能动手的机器人。它主打上半身操作,配了双目视觉模组,15到31个自由度,还能换不同的灵巧手——双指、三指、五指随你选。头部算力10TOPS,两个8核CPU分别管身体和头。2.69万这个价格放在两年前简直是天方夜谭,现在成了消费品。当然,固定底座的版本更像是一个桌面级机械臂的进化版,但意义已经不一样了——它标志着人形机器人从实验室走向开发者和极客群体的关键一步。想想当年大疆把无人机从专业设备做到消费级,宇树可能正在走同样的路。
最后说说苹果。昨夜苹果发了Q2财报,营收1112亿美元,大中华区同比增长28%,iPhone 17成了有史以来最受欢迎的产品线——数字很漂亮。但细看有两个信号值得注意:一是内存成本正在变成苹果的「阿喀琉斯之踵」。库克亲口说,6月之后内存成本会对业务产生「越来越大的影响」,JPMorgan甚至预测到明年iPhone内存成本占比可能从10%飙到45%。苹果已经在用大规模采购来限制竞争对手的供应,这种「抢粮」策略在商业上有效,但也说明行业内存争夺已经到了白热化。二是库克确认9月1日退休转任执行董事长,硬件工程出身的特努斯接任CEO,他承诺「再次改变世界」——但在内存困局和AI竞赛的双重压力下,这位新掌门的上任礼可不轻松。
这三件事表面上看没啥关系,但串起来其实是一个叙事:AI在变得更「聪明」(DeepSeek的空间推理),机器人变得更「便宜」(宇树的消费级定价),而支撑这一切的硬件供应链(内存、芯片)正在经历前所未有的紧绷。当软件突破和硬件瓶颈同时发生,就是产业格局重塑的时候。五一快乐,科技圈不会让你无聊的。
科技 2026-05-01 08:07:02 通过 菜菜虫 浏览(6)
共有0条评论!