· AI Hosts · podcast · 14 min read
每日科技播客 2026-05-22
今日看点:Tycoon AI | Google Antigravity 2.0 | WeWeb 3.0
📌 今日看点:Tycoon AI | Google Antigravity 2.0 | WeWeb 3.0 | OpenAI 模型推翻离散几何学核心猜想 | Gemini 3.5 Flash 发布
今日科技要闻
🚀 Product Hunt 热门产品
- Tycoon AI — 用 AI Agent 运营一人公司,全自动化业务流程
- Google Antigravity 2.0 — 桌面端多 Agent 工作流编排工具,基于 Gemini 3.5
- WeWeb 3.0 — Vibe-code 应用构建器,结合 AI 编程与无代码编辑器的安全网
🔥 Hacker News 热帖
- OpenAI 模型推翻离散几何学核心猜想 — OpenAI 内部模型用代数数论工具解决了离散几何中的知名猜想,被评为”AI在数学领域最令人印象深刻的成就”
- Gemini 3.5 Flash 发布 — Google I/O 2026 发布新一代模型,成为 Gemini App 和搜索 AI Mode 的默认模型,Agent 能力大幅提升
- Minnesota 成为首个禁止预测市场的州 — 禁止 Kalshi、Polymarket 等平台,联邦政府已提起诉讼
🐙 GitHub Trending
- msitarzewski/agency-agents — 完整 AI Agency 工具包,包含前端到后端各类专业 Agent(1,057 stars today)
- GitHub Advanced Security — GitHub 官方安全工具持续热门,代码扫描和漏洞检测
- Kilo Code — 开源 AI 编程助手,支持代码规划、构建和修复,VS Code 插件(Product Hunt 本周 #1)
📚 Hugging Face Daily Papers
- Mega-ASR: 大规模真实声学仿真提升野外语音识别 — 通过复合数据构建和渐进式声学到语义优化,提升真实场景 ASR 鲁棒性
- Video2GUI: 合成大规模交互轨迹 — 从视频中合成 GUI 交互数据,用于训练 GUI Agent
- State of Open Source on Hugging Face: Spring 2026 — 开源 AI 领域春季全景报告,覆盖竞争、地理分布和技术趋势
💻 Dev.to 热门文章
- Building “Sweets Vault” - 多模态 Gemini Agent 与物理硬件集成 — Google I/O 2026 写作挑战参赛文章,展示 Gemini Agent 控制实体设备
- OSS AI coding assistant Kilo Code 登顶 Product Hunt — 开源 AI 编程助手的社区推广实录
- Google I/O 2026 Writing Challenge — Dev.to 联合 Google 发起写作挑战,征集 I/O 相关技术文章
💬 Reddit r/programming
- OpenAI 模型推翻离散几何猜想引发讨论 — 社区热议 AI 是否达到”超人数学家”水平
- May 2026 “What are you working on?” thread — 编程语言社区月度分享
- UK Racket meet-up: London — 函数式编程社区线下聚会
📰 The Verge 科技新闻
- Google I/O 2026 全部新闻汇总 — Gemini 3.5、Android XR 眼镜、搜索 AI Agent 等重磅发布
- Android Show I/O Edition 2026 — 新 Gemini Intelligence、Android XR 眼镜、Android Auto 更新
- Google 在 AI 设计工具领域全面发力 — I/O 2026 展示新一代 AI 设计能力
🦄 TechCrunch 科技新闻
- Waymo 暂停高速公路服务 — 因 Robotaxi 在施工区域表现不佳,暂停高速载客
- Google I/O 2026: AI 设计工具成为新战场 — Google 全面押注 AI 设计领域
- Google 搜索 I/O 2026 更新:AI Agent 和智能搜索框 — 搜索框 25 年来最大升级,引入 AI Agent 能力
📝 完整对话文字版(点击展开)
芊悦:嗨大家好,欢迎收听科技早知道!今天是 2026 年 5 月 22 号,星期五,我是芊悦。
萌萌:我是萌萌!哇今天的新闻真的炸了,OpenAI 的模型居然推翻了一个数学猜想?还有 Google I/O 的后续消息继续刷屏,等下一定要好好聊聊。
芊悦:对,今天必须从 OpenAI 这个开始聊,因为这个事情的意义可能比大多数人想象的要大得多。简单说就是,OpenAI 内部的一个模型,用代数数论的工具,直接推翻了离散几何学里一个已经存在很久的核心猜想。
萌萌:等等等等,“推翻猜想”是什么概念?就是数学家们一直以为是对的东西,AI 说不对?
芊悦:对,而且不是那种”我觉得不对”,是给出了严格的反例证明。数学界的评价是”AI 在数学领域最令人印象深刻的成就”。你可以理解为,AI 不再只是帮人类算算数,而是开始在人类最顶尖的智力活动里做出原创性贡献了。
萌萌:我天……这就像一个围棋 AI 不光能赢人类,还发明了人类从没想过的定式?
芊悦:嗯,比那个还进一步。AlphaGo 那个是在已有规则里找最优解,这次是在开放性的数学问题里提出新的证明路径。性质不一样。
萌萌:但我有个疑问哈,这个模型是 OpenAI 内部的,也就是说我们普通人根本用不到对吧?那这算不算是在秀肌肉?
芊悦:你这个质疑有道理。确实,从实用角度看,这更像是一个能力展示。但我不太同意”只是秀肌肉”这个说法,因为它证明了一个方向是可行的——AI 辅助数学研究真的能产出成果。未来这类工具如果开放出来,数学家的研究效率会有质的飞跃。
萌萌:嗯……我觉得吧,如果数学家自己都觉得印象深刻,那确实不是吹的。不过我更好奇的是,这个模型跟 GPT-5 是什么关系?是同一个还是专门为数学训练的?
这个 OpenAI 没有明说,只说是”内部模型”。我猜测大概率是某个专门针对数学推理做过强化的版本,不一定是通用模型直接做到的。
萌萌:行,那这条就先聊到这。哎对了说到 Google,Gemini 3.5 Flash 也出来了你看了吗?
芊悦:看了看了,这次 Google I/O 2026 的后续消息还在持续放出来。Gemini 3.5 Flash 现在是 Gemini App 和搜索 AI Mode 的默认模型了,Agent 能力大幅提升。
萌萌:所以现在 Google 搜索默认就是 AI 回答了?那传统搜索结果列表是不是要被干掉了?
芊悦:还没到那一步,但方向很明确。这次搜索框被他们称为”25 年来最大升级”,引入了 AI Agent 能力。就是说你搜一个东西,AI 不只给你答案,还能帮你执行后续操作。
萌萌:比如?
芊悦:比如你搜”帮我订明天从上海到北京的高铁”,它不只是告诉你有哪些班次,而是直接帮你走完订票流程。当然目前应该还是有限场景。
萌萌:这个……说实话我有点怕。万一它帮我订了个我不想要的呢?
所以肯定会有确认环节啦,不会直接扣钱的。但你说的这个担忧其实是 AI Agent 普及后所有人都会面对的问题——信任边界在哪里。
萌萌:确实。我现在连自动回复邮件都不太敢开,更别说让 AI 帮我花钱了哈哈哈。
芊悦:哈哈你这也太保守了。不过 Google 这次还发布了 Android XR 眼镜和新一代 AI 设计工具,整体战略就是把 AI 塞进所有产品线。
萌萌:AI 设计工具这个我有看到!TechCrunch 说 AI 设计工具是”下一个大战场”,Google 在 I/O 上 all in 了。你觉得 Figma 那些会慌吗?
芊悦:短期不会,长期一定会。Google 的优势是它有模型、有数据、有分发渠道,但设计工具这个领域用户粘性很高,不是你模型好就能抢走用户的。
萌萌:有道理,就像你手机拍照再好,专业摄影师还是用单反嘛。
芊悦:嗯差不多这个意思。好,我们快速过几条其他新闻——
萌萌:来来来,速览时间!
芊悦:第一条,Waymo 暂停了高速公路载客服务,原因是 Robotaxi 在施工区域表现不佳。
萌萌:笑死,AI 能推翻数学猜想,但搞不定修路的锥桶。
芊悦:哈哈哈你这个对比绝了。但确实,真实世界的复杂度和数学世界完全不一样。施工区域标识混乱、临时变道,对感知系统挑战很大。
萌萌:所以自动驾驶离真正”全场景可用”还早着呢。
芊悦:对。第二条,Product Hunt 上有个叫 Tycoon AI 的产品火了,号称用 AI Agent 运营一人公司,全自动化业务流程。
萌萌:一人公司?所以以后创业不需要招人了?老板和员工都是 AI?
芊悦:理论上是这个方向。但我觉得短期内更现实的是,一个人 + 一堆 AI Agent 能干原来五六个人的活。
萌萌:那不就是我现在的状态嘛哈哈哈哈。
芊悦:第三条,Minnesota 成为美国第一个禁止预测市场的州,Kalshi、Polymarket 这些平台都被禁了,联邦政府已经提起诉讼。
萌萌:哇,这个挺意外的。预测市场不是最近两年很火吗?美国大选的时候大家都在上面押注。
芊悦:是啊,所以才有争议。支持者说这是信息聚合工具,反对者说这就是赌博换了个皮。Minnesota 站了反对派这边。
萌萌:我不太同意全面禁止啊,预测市场起码比传统赌博有信息价值吧?
芊悦:嗯,我其实也觉得一刀切不太合理,但监管的逻辑通常是——如果我管不好,就先禁掉。
萌萌:典型的懒政嘛。
芊悦:哈哈别这么说,各有各的难处。再来一条,GitHub Trending 上有个项目叫 agency-agents,是一个完整的 AI Agency 工具包,前端到后端各类专业 Agent 都有,今天涨了一千多 star。
萌萌:一千多 star 一天?离谱。看来大家都在搞 multi-agent 了。
芊悦:对,还有 Kilo Code,开源 AI 编程助手,拿了 Product Hunt 本周第一。支持代码规划、构建和修复,VS Code 插件。
萌萌:又一个 Copilot 竞品?这赛道也太卷了吧。
芊悦:卷是好事,用户受益嘛。最后一条,Hugging Face 发布了 2026 春季开源 AI 报告,覆盖竞争格局、地理分布和技术趋势。感兴趣的同学可以去看看。
萌萌:好的!那今天就聊到这里。芊悦总结一下?
芊悦:今天最大的感受是,AI 的能力边界在两个方向同时扩展——向上,能做数学家做的事;向下,想接管日常生活的操作。但中间那个”信任”的问题,可能是接下来几年最核心的挑战。
萌萌:说得好!科技早知道,每天 5 分钟,掌握科技圈大小事。我们明天见~