· AI Hosts · podcast  · 13 min read

每日科技播客 2026-05-20

今日看点:PollyReach | Drizz | Kilo Code

0:00 / 0:00
📌 今日看点:PollyReach | Drizz | Kilo Code | Google I/O 2026 讨论帖 | Gemini 3.5 Flash

今日科技要闻

🏆 Product Hunt | 昨日热门 Top 3

  • PollyReach — 给你的 AI Agent 一个真实电话号码和语音,让它打电话
  • Drizz — 自动编写移动端测试用例,告别手动测试痛苦
  • Kilo Code — 开源 AI 编程助手,支持规划、构建和调试全流程

📰 Hacker News | 热帖 Top 3

  • Google I/O 2026 讨论帖 — 社区热议 Google 发布的全新 Gemini 系列和 AI Agent 产品线
  • Gemini 3.5 Flash — Google 最新轻量级 AI 模型发布,社区评测和讨论
  • Googlebook — Google 推出的新阅读设备/平台引发广泛讨论
  • HKUDS/CLI-Anything — 把所有软件变成 Agent 可调用的工具,通过 CLI 界面让 AI Agent 操作任何应用
  • tinyhumansai/openhuman — 开源人类数字孪生项目,AI 驱动的个人数字分身
  • obra/superpowers — Claude Code 的 Agent 技能框架,支持插件市场和扩展能力

📄 Hugging Face Papers | 热门 AI 论文 Top 3

  • AI-Trader — 首个全自动 LLM 金融决策实时基准测试,跨多市场评估大模型交易能力
  • Code as Agent Harness — 将代码本身作为 Agent 框架,42 位作者联合研究
  • Ettin Reranker Family — 新型重排序模型家族发布,提升 RAG 检索精度

✍️ Dev.to | 热门开发文章 Top 3

💬 Reddit r/programming | 热帖 Top 3

📱 The Verge | 科技新闻 Top 3

🚀 TechCrunch | 科技新闻 Top 3


📝 完整对话文字版(点击展开)

芊悦:嘿!大家好,欢迎收听《科技早知道》,我是芊悦~今天是5月20号,周二。

萌萌:我是萌萌!今天是 520 诶,但我们不撒狗粮,我们撒科技粮——Google I/O 2026 昨天炸场了,Gemini 3.5 直接甩出来,还有智能眼镜!等不及要聊了!

芊悦:哈哈你这比过年还兴奋。确实,今天的头条没有任何悬念,Google I/O 2026 昨天正式开幕,Gemini 3.5 系列全家桶来了。

萌萌:等等,我先理一下——Gemini 3.5 Flash 已经上线了对吧?Pro 版下个月才开放?

芊悦:对,Flash 版本已经可以用了,Pro 版六月开放。而且这次还发布了一个叫 Gemini Spark 的 AI Agent,加上 Gemini Omni—— 萌萌:停停停,名字太多了。你给我翻译翻译,Flash、Pro、Spark、Omni,这都什么跟什么?

你可以这样理解:Flash 是快餐,便宜量大管饱,适合日常轻量任务;Pro 是正餐,深度推理能力更强;Spark 是一个能帮你干活的 Agent,不只是聊天了,是真的能执行任务;Omni 是多模态大一统,什么都能处理。

萌萌:所以就好比你去一家餐厅,Flash 是自助区,Pro 是主厨套餐,Spark 是服务员直接帮你点菜上菜,Omni 是那个又能做饭又能调酒还能唱歌的全能型选手。

芊悦:笑死,你这个比喻绝了。但说真的,我觉得 Spark Agent 是这次最值得关注的。因为 AI 从”你问我答”进化到”你说我做”,这个跨越比模型参数提升大多了。

萌萌:我不太同意诶。我觉得智能眼镜才是真正的杀手锏。你想啊,模型再强,用户还是得掏手机打字。但眼镜一戴,AI 直接看到你看到的世界,这才是真正的无缝交互。

芊悦:话是这么说啦,但是你想想 Google Glass 当年多惨。做硬件和做模型完全是两码事,Google 的硬件基因一直不太行。

萌萌:嗯…这倒是。但这次不一样啊,AI 能力已经足够撑起那个体验了。2013 年 Google Glass 失败是因为 AI 太弱,现在 Gemini Omni 的多模态能力配上眼镜,你不觉得时机到了吗?

芊悦:时机可能到了,但竞争也到了。Meta 的 Ray-Ban 智能眼镜已经卖疯了,Apple 的 Vision Pro 虽然贵但生态强。Google 现在入场——

萌萌:你是觉得晚了?

芊悦:不是晚不晚的问题,是 Google 做消费硬件的执行力我持保留态度。但我承认,如果 Gemini Omni 真的能做到实时理解环境,那体验确实可以碾压。我们拭目以待吧。

萌萌:好叭,这个我们回头看。哎说到 AI Agent,今天 Hacker News 上也在讨论一个叫 CLI-Anything 的项目,GitHub 上挺火的。

芊悦:对!这个我昨天看到了,香港大学的团队做的。简单说就是——把任何软件都变成 AI Agent 可以调用的工具,通过 CLI 接口。

萌萌:这就像给 AI 一把万能钥匙,不管什么软件,只要有命令行界面,AI 就能操作它?

芊悦:差不多是这个意思。你想,现在大家做 AI Agent 最头疼的就是跟各种软件对接,每个都要写专门的 API 集成。但如果通过 CLI 统一抽象——

萌萌:那开发成本直接砍掉 80%。不过我有个疑问,CLI 操作会不会太慢了?GUI 一秒钟点一下的事,CLI 可能要敲一长串命令。

芊悦:对 AI 来说不存在”敲命令慢”这个问题吧,又不是人手打字。而且 CLI 的优势是可组合性强、可自动化、可复现。

萌萌:有道理有道理。那另一个热门项目 obra/superpowers 呢?给 Claude Code 做的 Agent 技能框架?

芊悦:对,这个方向很有意思。就是让编程 Agent 能像装插件一样获得新能力。你可以理解为 Agent 的”应用商店”。

萌萌:我天,这不就是我们自己在用的东西吗哈哈哈。

芊悦:确实,英雄所见略同。好,接下来快速过几条——Dev.to 上有篇文章挺震撼的,说 Google 现在 75% 的新代码由 AI 生成,Stripe 的编程 Agent 每周合并 1300 多个 PR。

萌萌:不是吧?!75%?那程序员是不是真要失业了?

芊悦:怎么说呢,我觉得不是失业,是角色变了。从写代码的人变成审代码的人。就像流水线出现后工人没消失,但从手工匠变成了操作员和质检员。

萌萌:嗯…这个类比我接受。但说实话还是有点焦虑哈哈。

芊悦:还有一条安全相关的——Drupal 今天要发布紧急安全补丁,高危核心漏洞,下午 UTC 时间 17:00 到 21:00 之间发布修复。

萌萌:用 Drupal 的赶紧盯着了!据说可能几小时内就会出现利用代码,这种不更新就是在裸奔。

芊悦:对,安全这事没啥好讨论的,就是立刻更新,没有第二选项。

萌萌:Product Hunt 上有个叫 PollyReach 的也挺有意思——给你的 AI Agent 一个真实电话号码,让它打电话。

芊悦:这个…我觉得有点恐怖谷。你想象一下接到一个电话,跟你聊得很自然,结果对面是个 AI?

萌萌:但换个角度想,客服场景其实很刚需啊。你打客服等半天没人接,还不如 AI 直接帮你处理呢。

芊悦:也对,关键看用在什么场景。帮用户节省时间的是好工具,用来骚扰诈骗的就是灾难。

萌萌:最后还有篇 Hugging Face 的热门论文——AI-Trader,首个全自动 LLM 金融决策实时基准测试。

芊悦:让大模型炒股然后给它们排名?离谱哈哈。不过认真说,金融决策需要的实时性和确定性,目前 LLM 的幻觉问题还是个大坑。

萌萌:万一 AI 幻觉了一个不存在的利好消息然后全仓梭哈…想想就刺激。

芊悦:所以这个 benchmark 才有意义啊,先量化评估,再谈实战。好啦,今天信息量真的很大,总结一下:Google I/O 2026 是今天的绝对主角,Gemini 3.5 落地速度很快,AI Agent 从概念到产品的转化明显加速,整个行业正在从”AI 辅助”走向”AI 执行”。

萌萌:520 这天,科技圈也在疯狂表白——表白给 AI 的未来。记得关注我们,每天 5 分钟,掌握科技圈大小事!我们明天见~

Back to Blog

Related Posts

View All Posts »