AI Radar

来源：Product Hunt

将 Claude 级对话能力直接用于生成和迭代 PowerPoint 文件。

Folio AI 做的事情很直接：你像和 Claude 聊天一样描述需求，它直接给你一个可编辑的 PowerPoint 文件。它的用户不是设计师，而是那些需要频繁产出商业提案、周报、投资人简报，但不想在排版和对齐上花时间的运营、销售和创业者。

今天大多数人做 PPT 的流程仍然很断裂。一种方式是打开 PowerPoint 或 Google Slides，从空白页开始搭结构、写内容、调格式，再反复对齐文本框。另一种方式是先让 Claude 或 ChatGPT 生成大纲和逐页文案，然后手动复制粘贴到幻灯片里，再套模板、调整图片位置、统一字体。还有一些人使用 Gamma 或 Tome 这类 AI 生成工具，输入一个标题就得到一套视觉风格统一的页面，但一旦需要修改某页的逻辑、替换数据或调整叙述顺序，往往只能重新生成，或者进入一个并不灵活的编辑器里手动调整。这些工具能“生成”，但很难“对话式迭代”。

真正的卡点不在内容生成，而在内容到可用文件之间的那一步。Claude 可以写出结构清晰、论证严密的讲稿，但它输出的是 Markdown 或纯文本，不是 .pptx 文件。用户拿到文本后，仍然要自...

Editor's Pick

cclank/lanshu-animated-architecture-diagram

30 forks203 stars

来源：GitHub · 类型：hot newcomer · 项目今日上线

将 JSON 规格渲染为黑底手绘动画架构图的 Codex 技能与本地管线

lanshu-animated-architecture-diagram 是一个 Codex 技能兼本地渲染器，它把一份 JSON 规格变成黑底、手绘风格的动态架构图，同时输出可编辑的 Excalidraw 源文件、静态 PNG 和真正带有流动高光与脉冲效果的 GIF。它的用户是那些需要为技术文章、系统说明或工作流配图，但又不想在多个设计工具之间来回折腾的开发者。

现在开发者要制作一张带动画的架构图，常见路径是先在 Excalidraw 里手绘，再录屏或逐帧导出，最后用 ScreenToGif 或 ffmpeg 合成动画。也有人用 Mermaid 或 PlantUML 生成静态结构，然后拖进 Figma 加高光动效，或者干脆用 Python Pillow 一帧一帧写脚本。这些流程的卡点很具体：Excalidraw 本身没有动画导出能力，录屏方案依赖浏览器环境和稳定的窗口尺寸，手绘风格的一致性全靠个人手感，而 Pillow 直接绘图虽然灵活，但产出不了可二次编辑的矢量源文件，改一处就得重新跑脚本。

这个项目切入的是设计表达层里“技术图表的程序化动画生成”这一环。它不替代 Excali...

Editor's Pick

NVIDIA/NemoClaw

2871 forks21455 stars

docs.nvidia.com

来源：GitHub · 类型：trending growth · 项目上线 104 天

NVIDIA开源参考栈，在OpenShell沙箱中安全运行OpenClaw等AI agent。

NVIDIA NemoClaw 是一个开源参考栈，让开发者能在 NVIDIA OpenShell 沙箱里安全地运行 OpenClaw、Hermes 等始终在线的 AI agent，并提供推理路由、网络策略和生命周期管理。它面向那些需要让 agent 执行代码、访问网络但又担心安全风险的 Builder。

现在，一个开发者如果想用 OpenClaw 或 Hermes 来自动化处理 issue、运行脚本，通常的做法是直接在本地终端启动 agent 进程，给它一个 API key，然后让它自由操作文件系统和执行命令。稍微谨慎一点的会用 Docker 容器跑，自己写 Dockerfile，挂载必要的目录，再手动配置端口映射和网络限制。但 agent 的行为并不总是可预测——它可能会尝试安装未验证的包、读取 .env 文件、向外发送数据，甚至因为 prompt 注入执行意料之外的操作。Docker 提供了基本的进程隔离，但默认网络是开放的，文件系统挂载也可能暴露敏感信息，而且没有针对 AI agent 的细粒度策略，比如限制出站域名、阻止访问特定 IP 范围、控制推理请求的路由。开发者要么花大...

Editor's Pick

Vanszs/qwencloud-generator

56 forks133 stars

来源：GitHub · 类型：hot newcomer · 项目今日上线

批量注册 QwenCloud 账户并自动收割 API 密钥的浏览器自动化工具。

qwencloud-generator 是一个用 Python 写的命令行工具，它自动完成 QwenCloud 的账户注册、邮箱验证和 API 密钥提取，整个过程在多个浏览器实例中并行跑，配合代理轮换和 Gmail OAuth 读取验证码。它的用户不是普通消费者，而是需要大量免费 API 额度的开发者、脚本作者，或者做模型测试的人。

在没有这个工具之前，开发者要拿到一批可用的 QwenCloud API 密钥，只能手动打开浏览器，填注册表单，切到邮箱等验证码，再回到页面复制密钥。如果一个人需要 20 个密钥，就要重复 20 遍，中间还要换 IP、换邮箱，避免被风控拦截。有人会自己写 Playwright 或 Selenium 脚本，但很快会卡在几个地方：Gmail 的 OAuth 认证流程不是简单的 IMAP 登录，需要提前在 Google Cloud Console 建项目、启用 API、下载 client_secret.json，再跑一次浏览器授权；多线程下浏览器实例的显存和内存占用容易把机器拖垮；代理轮换如果没做好，同一个 IP 连续注册会被直接拒绝；页面状态多变，注册、登录、...

Editor's Pick

Yeachan-Heo/oh-my-codex

2457 forks31418 stars

oh-my-codex.dev

来源：GitHub · 类型：trending growth · 项目上线 145 天

为 OpenAI Codex CLI 添加 hooks、agent 团队和 HUD 的工作流封装层。

oh-my-codex（OMX）是一个架在 OpenAI Codex CLI 之上的工作流增强工具。它不替代 Codex 的代码生成和执行能力，而是给它装上 hooks、agent 团队和可视化 HUD，让原本单次命令式的交互变成可编排、可复用的持续工作流。

在没有 OMX 之前，开发者使用 Codex CLI 的典型方式是：打开终端，输入一段任务描述，Codex 生成代码并尝试执行，然后人工检查结果，不满意就重新描述，反复多轮。遇到需要分步推进的复杂任务时，只能手动把大任务拆成多次调用，每次都要重新交代上下文。如果想在任务开始前自动拉取最新代码、结束后自动运行测试或通知，就得自己写 shell 脚本包裹 Codex 命令。当需要多个 agent 角色协作——比如一个负责写代码、一个负责审查、一个负责写文档——更是只能靠人工接力，或者自己维护一套复杂的脚本调度逻辑。

这些动作暴露出的真正卡点不是 Codex 不够聪明，而是它缺少一个原生的编排层。Codex CLI 本身只提供“输入提示词、输出代码和执行”的原子能力，没有 hooks 机制让开发者在任务前后插入自定义行为，没有 ag...

Editor's Pick

CopilotKit/OpenTag

22 forks200 stars

来源：GitHub · 类型：hot newcomer · 项目今日上线

开源自托管 Slack AI 助手，可自定义模型和工具，支持生成式 UI 与人工审批。

RetroMac 做的事情很直接：在现代 Mac 上，一键启动一个完整的老款 Macintosh 桌面环境。它不是壁纸包，也不是图标主题，而是一个可以直接运行旧软件、打开旧文件、回到 System 7 或 Mac OS 9 操作体验的独立应用。会用它的人，可能是想打开一份 ClarisWorks 文档的设计师，想跑老游戏的玩家，或者单纯想在一个没有通知弹窗、没有浏览器标签页的环境里写点东西的人。

今天用户如果想回到经典 Mac OS，通常要自己动手搭模拟器。最常见的是 SheepShaver 或 Basilisk II，这两个开源项目能模拟 PowerPC 或 68000 系列 Mac，但配置过程相当折腾。你需要找到一个合法的 ROM 文件，准备一份系统安装光盘镜像，手动分配内存、设置磁盘镜像路径、配置网络共享，还要解决分辨率缩放和文件交换的问题。每一步都可能卡住，论坛上的教程往往过时，不同 macOS 版本下的兼容性也不一样。另一种选择是 Infinite Mac 这类浏览器内模拟器，打开网页就能用，但它跑在沙箱里，没法直接读写本地硬盘，文件一关就没了，也不能安装持久化的软件。还有...

Product Huntsignal

Cloud World Model

151 votes41 comments

开发者想练习部署一个 S3 存储桶、写一段 Lambda 函数，或者测试一个跨 GCP Cloud Storage 和 DigitalOcean Spaces 的数据同步脚本，通常只有两条路：要么直接连真实云账户，要么在本地搭一套模拟环境。真实账户这条路，免费层额度有限，一个忘记删除的负载均衡器、一条没关的日志流，月底账单就能让人心跳加速。本地模拟这条路，过去几乎只有 LocalStack 一个像样的选择，但它只覆盖 AWS，而且社区版在高频调用下经常出现未实现接口的错误。如果项目同时用到 GCP 的 Pub/Sub 和 DigitalOcean 的 Droplet API，开发者就只能自己写 mock 服务，用 Docker 凑一套假的响应，或者干脆在代码里插一堆 `if (process.env.NODE_ENV === 'test')` 的分支。

这些做法的问题不是“不够方便”，而是模拟结果不可信。自己写的 mock 只返回预设数据，不会像真实云服务那样在特定参数组合下抛权限错误、限流错误或区域不可用错误。等到代码部署到真实环境，这些边界情况才会第一次暴露，修复成本已经翻了几倍...

Product Huntsignal

Epilogue. Write novels, scripts & poetry

125 votes11 comments

Epilogue 是一个专门为写小说、剧本和诗歌而设计的写作应用，它的用户是那些需要完成长篇作品的严肃作者。与通用文档工具不同，它把一本书当作一个项目来管理，而不是一个无限延伸的文本流。

今天，大多数作者仍然在用 Word、Google Docs 或 Scrivener 写书。Word 和 Google Docs 的用法很原始：新建一个文档，从第一章开始往下写，章节标题靠手动加粗放大，人物设定记在另一个文档里，情节线索靠脑子记。写到后面，想调整章节顺序，只能剪切粘贴一大段文字，然后祈祷格式不乱。想查某个配角上次出场是什么时候，得在几十万字里搜索名字，再人眼核对上下文。

Scrivener 试图解决这个问题，它提供了软木板、大纲视图和分章节管理，但它的设计哲学停留在 2000 年代。界面拥挤，功能入口藏在多层菜单里，学习曲线陡峭到很多作者买完就放弃了。更麻烦的是，它的文件格式依赖本地存储，同步要靠 Dropbox，多人协作几乎不可能。一个合著者想看一眼最新稿子，得等对方手动导出 PDF 发过来。

Epilogue 切入的是长篇内容的结构化管理层。它把书籍拆解成可拖拽的章节、场景和节...

Product Huntsignal

Supra Player

2 forks134 stars

dehub.it.com

数据工程师的学习路径一直靠拼凑。打开浏览器，在 awesome-data-engineering 仓库的几千行 Markdown 里找链接，翻 Data Engineering Cookbook 的目录，再切到 dbt 文档、Airflow 官方教程、某个个人博客的对比文章。这些资源散落在十几个标签页里，没有统一入口，也没有人告诉你今天该先学什么。DEHUB 做的事情很直接：把 500 多个资源、50 多种工具、10 多条学习路线图打包成一个可安装的 Python 包，用终端界面交付。上线一天就拿到 134 颗星，说明数据工程师对“别再让我自己整理书签了”这件事有多强的需求。

这个项目真正切入的是知识发现与学习路径层。它不是新工具，不是新框架，而是把已经存在的、但散落各处的优质内容重新组织成一个可交互的入口。用户执行 `pip install dehub-knowledge` 后，在终端里就能浏览分类资源、查看工具对比、跟着路线图走。旧方案里，awesome 列表只是一个扁平链接堆，没有结构化的学习顺序，没有工具之间的横向对比，更新完全依赖维护者的个人时间。官方文档虽然权威，但不会告...

GitHubtrending growth

anomalyco/opencode

22099 forks179737 stars

opencode.ai

OpenCode 是一个在终端里运行的 AI 编码代理，定位是“开源版 Claude Code”。它不绑定特定编辑器，也不依赖某个模型厂商，开发者可以在命令行里直接让 AI 读代码、改文件、跑命令。上线 400 多天，已经积累了超过 17 万颗星，增长曲线很陡。

今天大多数开发者用 AI 写代码，要么在 IDE 里装 Copilot 或 Cursor，要么在终端里用 Claude Code。Claude Code 的能力确实强，但它是一个闭源产品，跑在 Anthropic 的服务器上，模型固定，行为不可定制，日志和决策过程对用户不透明。Cursor 虽然体验流畅，但同样把 agent 的调度逻辑锁在客户端里，用户没法换模型、改提示词策略，也没法把它嵌入自己的自动化流水线。那些想自己搭一套编码 agent 的团队，往往只能从零写脚本，把 OpenAI API 和文件系统拼在一起，很快会卡在上下文管理、工具调用循环、安全沙箱这些工程细节上。

OpenCode 切入的是 Agent 执行层。它不训练模型，也不做 IDE 界面，而是把“理解任务→读取代码→规划步骤→执行命令→修改文件→验证...

今日值得看：Agent Arena

Agent Arena 是今天最值得先看的信号。一个让 AI 代理公开对战、排名的社区竞技场。

今日 Brief

产品侧可以先看 Agent Arena：一个让 AI 代理公开对战、排名的社区竞技场。
开源侧可以先看 bozhouDev/codex-orange-book：非官方 Codex 全链路实战指南，用结构化文档降低新工具上手门槛。

Editor's Pick

Agent Arena

304 votes62 comments

来源：Product Hunt

一个让 AI 代理公开对战、排名的社区竞技场。

Agent Arena 是一个公开的 AI 代理竞技场，开发者可以把自己的代理提交上去，在统一的任务里与其他代理同场较量，获得实时排名。它的用户不是终端消费者，而是正在构建、调优 AI 代理的开发者与研究者。

在没有这种公开竞技场之前，开发者想比较自己的代理和别人的代理，流程相当原始。通常是去 GitHub 上找某个开源代理的代码，拉下来，配环境，解决依赖冲突，再想办法跑通作者提供的测试用例。如果对方没有公开测试脚本，就得自己写一套评估逻辑，把两个代理放在同一个任务上跑，手工记录结果。更常见的情况是，开发者直接看论文里的表格，但那些数字往往对应着旧版本模型、特定 prompt 和未公开的测试集，换一个环境就跑不出同样的分数。

这套流程卡在两个地方。第一，复现成本极高，不同代理的接口、工具调用方式、运行环境千差万别，光是让它们跑起来就可能耗掉一个下午。第二，缺乏时效性和透明度，论文数据是静态的，而代理本身在快速迭代，今天的排行榜明天就过时了。开发者没有一个地方能看到“现在”谁家的代理在某个任务上最强。

Agent Arena 切入的是代理评估层。它不关心代理内部怎么实现，只关心在给...

Editor's Pick

winsznx/theeleven

0 forks447 stars

regista11.xyz

来源：GitHub · 类型：hot newcomer · 项目今日上线

11个AI代理在足球直播中自动开启预测市场，基于Uniswap v4 hook和X Layer。

theeleven 是一组运行在 X Layer 上的自主 AI 代理，它们实时追踪足球比赛的控球、射门、犯规等事件，并在链上自动开启二元预测市场。每个市场都是一个自定义的 Uniswap v4 hook，用 USDT0 结算，用户只需一次 EIP-712 签名就能无 Gas 参与。它面向的是想在比赛进行中对具体事件下注的人，以及想看到 AI 代理直接操作链上金融的开发者。

在 theeleven 出现之前，如果开发者想做一个实时足球预测市场，通常只能走两条路。一条是接入中心化博彩平台的数据和赔率，但无法控制市场创建规则，用户资金也不在自己手里。另一条是自己写一套系统：拉取比赛数据、设计市场合约、处理做市和结算，还要解决 Gas 费对用户的劝退问题。Polymarket 虽然提供了去中心化预测市场的模板，但市场创建需要审核，且不会根据比赛中的每一次抢断或角球自动开出新市场。手动为一场比赛创建几十个动态市场根本不现实。

theeleven 切入的是实时事件到链上市场的自动化创建层。它把 AI 代理当作市场创建者，每个代理盯住不同的战术窗口，从共享的命题模板里挑出合适的市场，然后通过 ...

Editor's Pick

GraeLefix/GITVERSE

1 forks131 stars

gitverse.id

来源：GitHub · 类型：hot newcomer · 项目今日上线

将任意代码库逆向为AI可执行的构建提示，生成架构蓝图与重建指令。

GITVERSE 做的事情很直接：把一整个代码仓库转成一份结构化的构建提示，让 Cursor、Claude Code 或 Codex CLI 能照着它把项目重新写出来。它不分析代码质量，不修 bug，只做一件事——把现有代码变成 AI 编码代理能“读懂并复刻”的施工图纸。用它的多半是那些需要快速理解陌生项目、或者想让 AI 帮忙克隆一个已有应用的开发者。

今天开发者想让 AI 复刻一个项目，通常得自己啃代码。先手动梳理目录结构，搞清楚用了什么框架、哪些依赖、API 怎么调、环境变量有哪些，然后把这些信息拼成一段长提示，再反复调试 AI 的输出。有人会用 GitHub Copilot 的 @workspace 问问题，或者靠 Cursor 的代码库索引跳转，但这些工具只能回答局部问题，给不出一个从零搭建的完整蓝图。也有人直接让 Claude 读文件，但上下文窗口塞不下整个仓库时，就得自己挑重点，漏掉一个关键配置就可能让 AI 生成的代码跑不起来。

真正卡住的地方不是 AI 不够聪明，而是缺少一种把“已有代码”高效翻译成“AI 可执行指令”的中间格式。GITVERSE 切入的正是这一层...

Editor's Pick

mnapoli/vibephp

2 forks104 stars

来源：GitHub · 类型：hot newcomer · 项目今日上线

一个用 AI 替代 PHP 解释器的讽刺性运行时，让代码“靠感觉”执行。

VibePHP 是一个把 PHP 源码直接交给大模型去“脑补”执行的 Web 服务器。它没有解释器，没有编译器，收到请求后，AI 读完代码，自己编造数据库查询结果、当前时间、网络响应，然后返回它认为这段代码本该输出的内容。它不保证正确，不保证一致，甚至不保证便宜，但它确实能跑——而且能跑出 PHP 本身不支持的泛型、异步和 Go/Rust 内联语法。

今天一个 PHP 开发者如果想用泛型或 async/await，通常只有两条路：要么切到其他语言，要么在 PHP 里用文档注解和静态分析工具假装有这些特性。实际运行时仍然是 PHP-FPM 或 FrankenPHP，它们严格受限于 Zend 引擎的能力边界。代码里写 `class Prices<K: Stringable, V>` 在真实 PHP 里只会报语法错误，更不用说在 PHP 文件里直接写 Go 代码块。开发者卡在语言规范与工程需求之间的裂缝里，要么接受限制，要么离开生态。

VibePHP 切入的是代码执行层。它把“执行”这个动作从编译/解释替换成了大模型推理。旧方案——无论是传统的 PHP-FPM，还是基于 Go 的 Fra...

Editor's Pick

abundantbeing/hermes-browser-extension

14 forks162 stars

来源：GitHub · 类型：hot newcomer · 项目上线 2 天

为本地 Hermes Agent 提供浏览器侧边栏，自动捕获网页上下文并注入 Agent 运行时。

Hermes Browser Extension 是一个 Chrome/Edge 侧边栏扩展，它本身不是聊天机器人，而是把当前浏览器页面的标题、URL、选中文本、可读正文、表单、链接等上下文，实时交给本地或远程的 Hermes Agent 运行时。使用者是已经在本地跑 Hermes、配好了模型、工具、技能和 MCP 服务器的开发者，他们不想再手动把网页内容复制进终端或聊天框。

今天，一个开发者在浏览器里看到一篇需要总结的长文、一个需要分析的表单页面，或者一组需要对比的标签页，通常的做法是：选中文字复制，切换到 Claude Code 或 ChatGPT 网页版，粘贴，再附上一句“帮我总结这个页面”。如果页面结构复杂，还得手动描述有哪些按钮、哪些输入框。更麻烦的是，这些云端工具拿不到本地 Agent 已经配好的记忆、会话和 MCP 工具，每次都要重新建立上下文。有些用户会自己写一个简单的浏览器扩展，把当前页面的文本抓下来，通过 API 发给 OpenAI，但很快会卡在权限管理、跨域、持久会话和与本地工具链的对接上。

这个项目切入的是上下文管理层。它不改变模型能力，也不创造新的 Age...

Editor's Pick

Gemini Spark

261 votes11 comments

来源：Product Hunt

一个全天候主动管理任务、跨应用执行意图的 AI 代理，而非被动等待对话的聊天工具。

217 forks2134 stars

GitHubtrending growth

omnigent-ai/omnigent

610 forks5010 stars

omnigent.ai

想象一下你是一个全栈开发者，手头有三个项目：一个用 React 写前端，一个用 Python 做后端 API，还有一个是给客户演示的 POC。你同时装了 Claude Code、Codex 和 Cursor，因为每个工具在不同任务上各有优势。但问题来了：Claude Code 在终端里跑，Codex 在 VS Code 插件里，Cursor 是个独立编辑器。你想让 Claude Code 帮你重构一个函数，然后让 Codex 检查测试覆盖率，最后用 Cursor 改个 UI 样式。每次切换，你都得重新登录、重新加载项目、重新告诉 AI 上下文。更烦的是，你不敢让 Claude Code 直接改生产环境的配置文件，因为它没有权限控制，一旦它自作主张改了数据库连接字符串，你就等着线上事故吧。你每天花在“伺候”这些 AI 上的时间，比写代码还多。

Omnigent 就是来解决这个混乱的。你作为开发者或团队负责人，先安装它，然后在配置文件里声明你要用哪些 AI 工具：Claude Code、Codex、Cursor，甚至你自己写的自定义 agent。系统会把这些工具统一注册到一个“元工具”里...

GitHubhot newcomer

vercel/eve

200 forks2669 stars

想象一下你是个独立开发者，正在做一个自动处理客户邮件的代理。你打开编辑器，开始写代码：调用 OpenAI API，解析回复，管理状态，处理错误，还要考虑安全沙箱。一周后，你的代码变成了一团乱麻——API 调用散落在各个文件里，状态管理靠全局变量，错误处理全靠 try-catch 堆砌。你甚至不敢部署，因为一旦某个环节出错，整个代理就会卡死。这就是没有 eve 时的状态：你花 80% 的时间在搭架子，只有 20% 的时间在真正写业务逻辑。

eve 就是来解决这个问题的。它不是一个现成的 AI 助手，而是一个让你自己造 AI 助手的工具箱。你是一个开发者，你用 TypeScript 写一个工作流定义文件，告诉 eve 你的代理要做什么：比如“每天早上 8 点检查新邮件，如果是退款请求就调用 Stripe API 查询订单状态，然后根据金额和客户等级决定自动处理还是标记人工”。eve 拿到这个定义后，会在一个沙箱环境里运行你的代理，管理它的生命周期、状态持久化、工具调用和错误恢复。输出是一个可以部署到 Vercel 的代理实例，或者一个可以嵌入到你现有应用里的模块。上下游接什么？它原生对接...

GitHubtrending growth

heygen-com/hyperframes

2934 forks31547 stars

HyperFrames 是一个开源框架，让 AI 编码代理通过编写 HTML 直接生成 MP4 视频。它不提供新的模型能力，也不做视频编辑，真正切入的是视频表达层——把代理输出的文本代码，变成可预览、可渲染的最终视频文件。

今天，一个开发者想让 Claude Code 或 Cursor 生成一段产品介绍视频，通常会走两条路。要么手动打开 Premiere 或 CapCut，把代理生成的文案、分镜脚本一段段贴进去，调整时间轴、加转场、配音乐；要么调用 HeyGen、Synthesia 这类 AI 视频服务的 API，但代理需要理解复杂的 JSON 参数、素材上传流程和异步渲染状态，稍有不慎就卡在鉴权、模板 ID 或视频合成超时上。真正能跑通的，往往是开发者自己写一段 FFmpeg 命令，把图片序列和音频拼起来，但 FFmpeg 参数繁多，代理生成的命令经常因为路径错误、编码参数不兼容而直接失败。

这些方案共同的卡点在于：代理擅长生成文本，但视频是二进制产物，中间隔着 GUI 操作、API 黑盒或命令行脆弱性。HyperFrames 把问题重新定义成“写一段 HTML，然后我来渲染”。...

GitHubhot newcomer

QwenLM/Qwen-AgentWorld

51 forks565 stars

arxiv.org

Qwen-AgentWorld 是一个语言世界模型，它不直接执行任务，而是用长链思维推理来模拟代理可能遇到的环境，覆盖 MCP、搜索等七个领域。它面向正在构建通用 AI 代理的开发者，同时放出了模型权重 Qwen-AgentWorld-35B-A3B 和跨领域评估基准 AgentWorldBench。

现在，开发者想让一个代理同时处理 MCP 工具调用、网页搜索、代码执行等任务，通常需要自己动手拼环境。比如，为了测试代理使用 MCP 服务器的能力，得手动部署几个 MCP 服务，写好交互脚本，再设计各种异常情况；要测搜索，得接上搜索 API 并模拟结果排序和截断。这些环境彼此独立，接口不统一，每加一个新领域就要重新搭一套，而且很难模拟真实世界中任务交错出现的动态变化。部分团队会直接用现有的基准，比如 WebArena 测网页操作，SWE-bench 测代码修复，但它们是静态的、领域单一的，测完一个还得换另一个，没法一次性看清代理的通用能力。

真正卡住的地方不是缺模型，而是缺一个能动态生成多样化交互场景的“世界”。自己写脚本搭环境，不仅耗时，还容易漏掉边缘情况，导致训练出来的代理一进真...

GitHubtrending growth

NousResearch/hermes-agent

36564 forks203770 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上？比如，你是一个独立开发者，每天要回复几十封用户邮件，每封邮件的问题都差不多，但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板，但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本，但脚本只能处理固定格式，遇到用户发来一个带截图的奇怪问题，脚本就卡住了。你甚至想过招个实习生，但预算不够，而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎，时间被切成碎片，真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人，而是一个能自己长大的AI代理。你不需要写复杂的规则，也不需要给它喂一堆训练数据。你只需要开始用，告诉它你想做什么，比如“帮我回复用户邮件”。然后，你正常干活，Hermes在旁边看着。你回复一封邮件，它学一次。你调整了语气，它记下来。你拒绝了某个退款请求，它分析原因。三天后，它开始主动给你建议：“这封邮件和昨天你处理过的第7封很像，要不要用类似的回复？”一周后，它开始自己处理那些它已经确认过多次的邮件，只把...

GitHubhot newcomer

uphiago/recon-skills

20 forks115 stars

github.com

安全研究员和渗透测试工程师每天面对大量目标，侦察阶段往往占据一半以上时间。常见的工作流是打开 Burp Suite 拦截请求，用 Amass 跑子域名，再手动拼接 Nmap 扫描结果，然后根据经验判断下一步该测 SQL 注入还是 CORS 配置错误。这个过程高度依赖个人知识储备，换一个人就可能漏掉关键攻击面。更麻烦的是，当需要把侦察能力交给 AI 代理自动执行时，市面上几乎没有现成的、经过实战验证的技能包可用。代理知道要“找漏洞”，但不知道具体该调用哪个工具、按什么顺序、怎么判断结果。

recon-skills 切入的正是 Agent 执行层与攻击知识之间的空白地带。它把 600 多个真实目标、11 轮现场侦察中沉淀下来的 144 种攻击技能，拆解成代理可以直接读取和执行的指令集。其中包括 24 个侦察技能（WordPress 深度检测、CORS 八种变体利用、JS 源码中 API 密钥提取等）、104 个红队技能（XSS、SSRF、Firebase 配置错误利用等），以及跨攻击链组合和 WordPress 完整沦陷链。每个技能不是泛泛的漏洞描述，而是带有具体操作步骤、参数和判断逻辑...

GitHubtrending growth

nextlevelbuilder/ui-ux-pro-max-skill

10192 forks96862 stars

uupm.cc

ui-ux-pro-max-skill 是一个面向 AI 编码助手的设计技能包，它把 161 条推理规则和 67 种 UI 风格打包成可被 Claude Code、Cursor、Windsurf 等工具直接消费的指令集。开发者用它不是为了画图，而是为了让 AI 写出的界面代码自带设计感。

今天，一个全栈开发者用 Cursor 或 Claude Code 生成前端页面时，通常的做法是给一句提示词：“做一个漂亮的登录页，用 Tailwind”。模型会生成一堆组件，但结果往往像 Bootstrap 默认主题的变体——间距混乱、色彩刺眼、没有信息层级。如果开发者想要更专业的效果，就得自己去 Figma 社区找参考、手动调整设计 token，或者反复和 AI 对话修改，直到视觉上勉强能看。这个过程消耗的不是编码时间，而是设计判断力。

真正卡住的地方在于，AI 编码助手擅长实现功能，却不具备设计决策能力。模型可以写出符合语法的 JSX，但不知道什么样的留白比例适合 SaaS 后台，什么样的阴影深度能传达品牌质感。开发者要么接受“能用但不好看”的结果，要么被迫兼任设计师，在提示词里塞进大量设计约...

今日值得看：QwenLM/Qwen-AgentWorld

QwenLM/Qwen-AgentWorld 是今天最值得先看的信号。一个用长链推理生成多领域代理模拟环境的语言世界模型，附带评估基准。

今日 Brief

开源侧可以先看 DietrichGebert/ponytail：ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

Editor's Pick

QwenLM/Qwen-AgentWorld

47 forks483 stars

arxiv.org

来源：GitHub · 类型：hot newcomer · 项目上线 3 天

一个用长链推理生成多领域代理模拟环境的语言世界模型，附带评估基准。

Editor's Pick

calesthio/OpenMontage

2472 forks22019 stars

github.com

来源：GitHub · 类型：trending growth · 项目上线 88 天

将 AI 编程助手变成视频工作室的开源 agent 系统，用自然语言驱动全流程视频制作。

OpenMontage 是一个开源的 agentic 视频制作系统，它把 Claude Code、Cursor 这类 AI 编程助手直接变成视频工作室。用户只需要用自然语言描述想要什么，agent 就会自动完成研究、脚本撰写、素材生成、剪辑和最终渲染。它不是一个视频生成模型，而是一套让现有模型和工具协同工作的编排层。

今天，一个开发者如果想做一条像样的视频，通常要横跨多个工具：在 ChatGPT 里写脚本，用 Midjourney 或 Stable Diffusion 出图，打开 Runway 或 Pika 把图变成动态片段，再到 ElevenLabs 生成旁白，最后进 Premiere 或 CapCut 手动对齐时间线、加字幕、调节奏。每一步都要导出导入、手动衔接，格式不兼容、参数不一致是常态。更麻烦的是，如果想批量生产或迭代修改，整个流程就得从头再来一遍。也有人尝试自己写脚本串接这些 API，但很快会卡在素材管理、错误处理、时间线同步和渲染参数这些工程细节上。

OpenMontage 切入的是 Agent 执行层和视频表达层。它把视频制作拆成 12 条 pipeline、52 ...

Editor's Pick

Hmbown/CodeWhale

3363 forks39012 stars

codewhale.net

来源：GitHub · 类型：trending growth · 项目上线 157 天

终端编码代理 harness，让任意模型在终端里读代码、改代码、跑命令并自我纠错。

CodeWhale 切入的是模型与终端工具之间的 harness 层。它不训练...

Editor's Pick

Forward-Future/loop-library

146 forks1663 stars

signals.forwardfuture.ai

来源：GitHub · 类型：hot newcomer · 项目上线 13 天

一个面向 AI Agent 的可复用循环工作流库，提供带反馈和自检的重复执行模板。

Loop Library 是一个为 AI Agent 设计的可复用循环工作流库，同时附带一个可安装技能，帮助 Agent 通过对话发现、适配和设计这些循环。它不提供新的模型能力，真正切入的是 Agent 执行层中“任务如何被拆解成可自我修正的重复步骤”这一环节。

今天开发者让 Agent 做事，最常见的方式是给一句指令，比如“让这个网站更快”，然后等结果。在 Claude Code、Cursor 或 Codex CLI 里，Agent 会尝试一次，返回一个改动。如果结果不对，开发者就再补一句“再试一下，这次重点看图片加载”，或者自己动手改。整个过程靠人来回纠正，Agent 本身没有内置的检查、测量和迭代机制。一次提示就是一次尝试，第一次不行就靠人接着推。

真正卡住的地方不是 Agent 不够聪明，而是它缺少一个“做完—检查—决定下一步”的内置循环。开发者可以自己写一个带检查步骤的长提示，但每次都要重新设计判断标准、停止条件和回退逻辑，非常繁琐。而且不同任务需要的循环模式差异很大：修 bug 需要定位—修复—验证—回归；提升性能需要测量—改一处—再测量—比较；写测试需要覆盖—运行—看...

Editor's Pick

samuto69/claude-ai-desktop-app

0 forks101 stars

来源：GitHub · 类型：hot newcomer · 项目今日上线

一个聚合免费 Claude 路由与本地 LLM 的跨平台桌面客户端

claude-ai-desktop-app 是一个社区维护的跨平台桌面应用，把免费访问 Claude 的多种非官方渠道和本地模型整合进一个统一界面。它面向那些想用 Claude 编码、聊天、分析图片，但不想付费也不想折腾配置的开发者。

现在一个开发者想免费使用 Claude，通常会走几条路：在 Claude 官网用完有限的免费额度，然后到处找社区分享的免费 API 代理地址，手动填进 Chatbox、Cherry Studio 这类客户端里；或者自己用 Cloudflare Worker 搭反代，再配上 OpenRouter 的免费额度。每条路都有断点。免费代理地址经常失效，今天能用明天就 401；不同客户端对模型名、API 路径的兼容要求不一样，换一个工具就要重新填一遍 Base URL 和 Key；想把本地 Ollama 跑的模型和云端 Claude 放在同一个对话里对比，更是要在几个应用之间切来切去。

这个项目切入的是模型接入与桌面体验的聚合层。它不训练模型，也不发明新的 API 中转协议，而是把已经存在但分散、不稳定、需要手动拼接的免费访问路径，打包成一个开箱即用的桌面应用...

Editor's Pick

benlamiro/ShipGenAI

0 forks125 stars

shipgenai.org

来源：GitHub · 类型：hot newcomer · 项目今日上线

50 个带支付认证的生成式 AI SaaS 应用模板，一键部署上线。

想靠 AI 生图或视频赚钱的开发者，今天通常要自己搭一套完整的 SaaS：Next.js 前端、Stripe 计费、Google OAuth 登录、模型 API 接入、异步任务处理、积分扣减逻辑，最后再部署到 Vercel。这些步骤里，真正和 AI 能力相关的代码可能只占两成，其余全是胶水代码。每做一个新应用，就得把支付流程、鉴权、模型轮询重新写一遍，或者从旧项目里复制粘贴再改半天。

ShipGenAI 切入的是工作流封装层。它不提供新模型，也不发明新框架，而是把 50 个生成式 AI 应用——从图片生成、视频生成到电商产品图——全部做成开箱即用的模板，每个都预置了 Stripe 积分计费、Google OAuth 和 Vercel 一键部署。开发者拿到代码，改个品牌名，配好环境变量，就能直接上线收钱。

旧方案里，有人用 Vercel 的官方模板或 Next.js SaaS Starter，但这些只给了空壳，没有 AI 业务逻辑。有人用 Midjourney 或 OpenAI API 直接拼，但模型输出到可售卖产品之间，还隔着用户管理、计费扣点、异步状态同步这些工程问题。自己写脚本...

More Signals

GitHubhot newcomer

DietrichGebert/ponytail

2948 forks57973 stars

ponytail.dev

你肯定见过这种场景。凌晨两点，你让 AI 帮你写一个简单的函数——比如从 CSV 里读数据、过滤掉空行、返回一个数组。你心想，这玩意儿三分钟搞定。结果 AI 给你生成了 80 行代码：它自己写了个 CSV 解析器，加了一整套错误处理，还贴心地附上了类型定义、单元测试和文档注释。你盯着屏幕，脑子里只有一个念头：我只是想读个文件啊。更糟的是，你不敢删它写的那些“防御性代码”，因为你不知道删了会不会出事。于是你花了二十分钟，一行一行地审查 AI 替你写的“安全网”，最后删掉了 60 行，留下了真正需要的 20 行。你比写代码还累。

ponytail 就是来解决这个问题的。它不是一个独立的工具，而是一套规则和提示词，你可以把它装进 Claude Code、Cursor 或者任何支持自定义规则的 AI 代码助手。你告诉它“用 ponytail 模式”，然后你输入需求的方式完全不变——还是那句“从 CSV 读数据，过滤空行，返回数组”。但 AI 处理的方式变了：它先问自己三个问题。第一，这个功能有没有现成的库可以用？第二，用户真的需要错误处理吗，还是说数据来源是可控的？第三，这段代码三个月后还有...

GitHubhot newcomer

bozhouDev/codex-orange-book

195 forks1930 stars

Codex 橙皮书是一个开源的非官方使用手册，用 HTML 和 PDF 把 Codex 的安装、核心功能、工作流和实战案例组织成一本可阅读的指南。你打开 GitHub 仓库，在线阅读或下载 PDF，就能获得从零到交付的完整路径。和官方文档的碎片化参考不同，它提供了三条阅读路线，从快速上手到进阶扩展，还包含宠物零食网站、招商 PPT、宣传视频等五个完整案例，甚至教你怎么接入第三方模型。内容用 Markdown 编写，版本控制在 GitHub，通过 HTML 渲染，可生成 PDF 离线阅读，结构像一本精心编排的教材。

Codex 发布后，你兴冲冲装好 App，打开终端输入命令，结果面对自动化、Skill、MCP、云端运行这些概念，官方文档像一本字典，每个词都解释了，但你就是不知道怎么串起来做一个真实项目。你在 YouTube 和博客间跳来跳去，看了三个小时，还是没跑通一个完整流程。这个仓库上线一天就拿到 700 多颗星，正是因为它填补了这个“从零到一”的空白。它没有重复官方文档，而是用一本结构化的橙皮书，直接告诉你“先看这里，再做这个，然后你就能交付一个宠物零食网站”。

你作为开发者或...

GitHubhot newcomer

vercel/eve

195 forks2597 stars

GitHubtrending growth

heygen-com/hyperframes

2911 forks31330 stars

HyperFrames 是一个开源的视频渲染框架，它把 HTML 代码变成 MP4 视频，专为 AI 编程助手设计。你用自然语言描述想要的视频，AI 编程助手就会写出带动画的 HTML 页面，然后 HyperFrames 把它渲染成视频文件。和传统视频工具不同，它把视频创作变成了一次代码生成任务，结果可复现、可版本控制。底层基于 Puppeteer 渲染页面，用 FFmpeg 合成音视频，通过 MCP 协议让 Claude Code、Cursor 这类 AI 编程助手直接调用。

最近几个月，AI 编程助手开始能写代码、操作文件，但一直缺一个把代码变成视频的“最后一公里”。以前你想让 AI 帮你做视频，只能让它生成提示词丢给 Runway，或者写个脚本让你手动去剪。画面不可控，修改一次就要重新生成。HyperFrames 的出现正好填上了这个缺口。它给 AI 编程助手装上了视频渲染能力，你只要说“做一个 10 秒的产品介绍，标题淡入，背景视频加轻音乐”，AI 就能直接产出 HTML 源码并渲染成 MP4。这种“代码即视频”的方式让 AI 视频生成从黑盒变成了白盒，每一次修改都精确可控，...

GitHubhot newcomer

Waishnav/devspace

253 forks2486 stars

你打开 ChatGPT，想让它帮你写一段 Python 脚本处理 CSV 文件。你刚把需求打了一半，突然想起昨天让它帮你润色了一封辞职信，聊天记录里还挂着那句“我决定离开公司”。你犹豫了一下，把那段话删了，重新写了一个更模糊的请求。这就是问题——ChatGPT 只有一个聊天窗口，你所有的对话都混在一起。今天你用它写代码，明天用它写情书，后天用它查菜谱。每次打开，你都得先翻一翻历史，确认上次聊了什么，再小心翼翼地开始新任务。更烦的是，如果你同时开着 Codex 写代码，ChatGPT 和 Codex 是两个完全不同的产品，你得在两个窗口之间来回切换，复制粘贴代码，还要忍受 Codex 那套独立的计费方式。你明明只想让 AI 帮你写代码，却要管理两个账号、两套对话历史、两种使用习惯。

devspace 解决的就是这个混乱。你是一个开发者，你每天的工作流是这样的：打开 VS Code，旁边挂着 ChatGPT 的网页，偶尔切过去问个问题。但你发现，ChatGPT 的对话历史里，编程相关的请求和日常闲聊混在一起，每次找上次写的代码片段都要翻半天。你用 devspace 之后，只需要在 Cha...

GitHubtrending growth

NousResearch/hermes-agent

36337 forks203045 stars

今日值得看：Propane

Propane 是今天最值得先看的信号。自动聚合客户上下文，让产品团队和 AI Agent 共享同一套客户理解。

今日 Brief

产品侧可以先看 Propane ：自动聚合客户上下文，让产品团队和 AI Agent 共享同一套客户理解。
开源侧可以先看 DietrichGebert/ponytail：ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

Editor's Pick

Propane

439 votes125 comments

来源：Product Hunt

自动聚合客户上下文，让产品团队和 AI Agent 共享同一套客户理解。

产品团队和 AI Agent 面对同一个尴尬：它们需要理解客户，但客户的真实信号散落在 Intercom 对话、Zendesk 工单、Slack 频道、邮件线程和销售通话记录里。Propane 做的事情很直接——自动把这些分散的客户上下文聚合起来，变成产品经理和 Agent 都能直接消费的结构化信息。它的用户不是某一个人，而是产品团队和正在接入这些团队的 AI Agent。

今天，一个产品经理要搞清楚某个企业客户为什么迟迟不续费，通常需要打开 Intercom 翻最近三个月的对话，在 Slack 里搜索客户名称，再请销售同事转发几封邮件。最后把关键信息手动整理进 Notion 或 Linear 工单里。如果团队里跑着一个客服 Agent 或产品问答 Agent，情况更麻烦：Agent 只能拿到当前会话里的几句话，看不到客户六个月前提过的需求、上一次投诉的解决结果，也看不到对方公司正在试用哪个功能。Agent 的回答因此变得泛泛，甚至重复追问用户已经解释过的问题。

卡点不在工具少，而在上下文被锁死在各个渠道的原始格式里。Intercom 的对话是聊天流，Zendesk 的工单是状态机...

Editor's Pick

bozhouDev/codex-orange-book

142 forks1379 stars

来源：GitHub · 类型：hot newcomer · 项目今日上线

一本非官方的Codex全链路使用指南，把零散的官方文档和社区经验变成可下载的系统化橙皮书。

你作为开发者或...

Editor's Pick

vercel/eve

189 forks2530 stars

来源：GitHub · 类型：hot newcomer · 项目上线 8 天

eve 是 Vercel 推出的一个框架，让你用 TypeScript 造出能自己干活的 AI 代理。

Editor's Pick

heygen-com/hyperframes

2892 forks31042 stars

来源：GitHub · 类型：trending growth · 项目上线 106 天

一个让 AI 编程助手通过写 HTML 来生成视频的开源框架。

Editor's Pick

sums001/Windows-Copilot-API

236 forks659 stars

来源：GitHub · 类型：hot newcomer · 项目上线 5 天

Windows-Copilot-API 是一个把微软 Windows Copilot 拆开、重新包装成 OpenAI 风格 API 的开源工具，让你不用花钱、不用申请密钥就能调用 GPT-4 和 GPT-5。

你是个独立开发者，正在做一个自动写周报的小工具。你想用 GPT-4 来生成内容，但打开 OpenAI 的官网，先要注册账号，绑定信用卡，然后每个月盯着账单，生怕调用次数超了。更烦的是，你只是写个个人项目，不想为了一点点 AI 能力去填一堆表格、签一堆协议。你试过用免费的 Claude，但它的 API 也要申请，而且额度有限。最后你只能手动复制粘贴到网页版 ChatGPT，然后复制回来，效率低得让人想砸键盘。你真正想要的，就是一个能直接调用的接口，不关心账单，不关心密钥，只关心能不能跑起来。

Editor's Pick

Crewdle AI

261 votes86 comments

来源：Product Hunt

一个聚合多个商业AI工具的按需访问平台，免去逐个订阅的负担。

Crewdle AI 做的事情很直接：把多个商业 AI 工具打包进一个入口，用户不再需要为每个工具单独付费订阅。它的目标用户不是大企业采购部门，而是那些日常工作中需要频繁切换不同 AI 工具的独立开发者、小型团队和自由职业者。

今天一个典型的 Builder 如果想用 ChatGPT 写技术文档、用 Claude 做长文分析、用 Midjourney 生成社交媒体配图、再用 Jasper 优化广告文案，他需要同时维护至少四个订阅。每个工具月费从 20 到 30 美元不等，加起来每月固定支出轻松超过 100 美元。更麻烦的是，这些工具的使用频率并不均匀——可能某个月只用了两次 Midjourney，但订阅费照扣。于是有人开始用免费版凑合，忍受次数限制和水印；有人注册多个账号轮流试用；还有人干脆放弃某些工具，退回到更通用的方案，比如只用 ChatGPT 同时做文本和生图，效果打折扣。

真正的卡点不是工具不够好，而是订阅模式把偶尔使用的成本拉得和重度使用一样高。用户被锁在一个个独立的付费墙后面，每想尝试一个新工具，就要先押上一个月费用。这直接抑制了工具探索和组合使用。

Crewdle ...

More Signals

Product Huntsignal

Tencent EdgeOne Makers

361 votes81 comments

---

把 AI Agent 变成一个可以访问的网页应用，这件事在今天仍然比想象中重得多。Tencent EdgeOne Makers 做的事情，就是把 Agent 的构建和发布流程，压缩到像在 Vercel 上部署一个前端项目那样简单——几分钟内拿到一个可分享的 URL，背后是已经跑在边缘节点上的完整 Agent。

现在一个开发者如果想做一个能对外服务的 AI Agent，比如一个自动处理用户邮件的助手或一个可以调用外部工具的问答机器人，通常的工作流是这样的：用 LangChain 或类似框架写好 Agent 逻辑，在本地调试通过，然后开始面对部署问题。他需要选择一个云函数服务或一台服务器，把代码打包上传，配置环境变量、密钥、域名、SSL 证书，再写一个简单的前端界面作为交互入口。如果 Agent 需要持久化状态，还得挂一个数据库。整套流程走下来，即使是一个有经验的开发者，从写完核心逻辑到真正上线让别人能用，也常常要花掉半天到一天。对于只想快速验证一个 Agent 想法的 Builder 来说，这个时间成本太高了。

真正的卡点不在模型调用本身，而在“让 Agent 成为一个可访...

Product Huntsignal

Customer Relationship Agents by Clarify

182 votes26 comments

一个销售团队使用 CRM 的日常通常是这样的：早上打开 Salesforce 或 HubSpot，看到一堆待办提醒，然后开始逐条更新线索状态、记录通话摘要、给潜在客户写跟进邮件。这些动作本身并不产生新的商机，但它们占用了销售每天两到三个小时。Clarify 的 Customer Relationship Agents 做的事情很直接——它把 CRM 里那个“M”（Management）从人身上拿走，交给一组 AI Agent 去跑。

用户今天完成这些工作的方式高度依赖人工。销售在打完电话后，要手动在 Pipedrive 里把联系人从“已联系”拖到“已报价”，再设置下一次跟进任务。邮件跟进时，他们通常从 Notion 或 Google Docs 里复制半成品模板，稍作修改后发出。如果一天有几十个线索需要推进，这套动作就会变成重复劳动，而且很容易漏掉关键节点。更大的问题是，CRM 系统本身只是一个记录仓库，它不会主动判断“这个客户三天没回复，应该换一种话术再触达”，也不会在销售忘记填写跟进记录时自动补上。

Clarify 切入的是 CRM 中的管理层，而不是数据存储层或分析层。它没有试...

Product Huntsignal

128 votes24 comments

完整叙事内容：

StaleMate PR 做的事情非常简单：它把 GitHub 上待处理的 Pull Request 数量变成一个菜单栏颜色信号，PR 堆积到一定阈值，菜单栏就变红。用它的主要是每天被代码和通知淹没的开发者，尤其是那些同时维护多个仓库、需要频繁做代码审查的人。

在没有这个工具之前，开发者跟踪 PR 状态主要靠几件事：打开 GitHub 网页看通知列表、等邮件提醒、或者在 Slack 频道里被 @。也有人自己写一个 cron 脚本，定时调 GitHub API，把未 review 的 PR 数量打印到终端或者发一条系统通知。但这些动作都有一个共同的问题——它们需要开发者主动切换注意力，或者依赖一条很容易被划掉的通知。GitHub 的通知中心里，issue 更新、CI 失败、讨论回复全混在一起，一条 PR review 请求很容易被后续涌入的信息推走。邮件同理，收件箱里还有 Jira 工单、监控告警和日程提醒，PR 只是其中一条。Slack 消息更脆弱，一旦已读就消失了，不会持续提醒你“还有三个 PR 已经躺了两天”。

真正的卡点不是开发者不知道有 PR 要审，而是知...

Product Huntsignal

FUTO Swipe

124 votes8 comments

FUTO Swipe 做的事情很具体：它提供一套开放的、可在设备本地运行的滑动输入模型。不是又一个键盘应用，而是把滑动识别的核心能力拆出来，做成开发者可以直接集成的东西。谁会用？那些想自己做一个滑动输入键盘，但又不想从零训练模型，也不想把用户输入数据交给 Gboard 或 SwiftKey 的人。

GitHubhot newcomer

Reyzowter/Hello-Agents

3 forks127 stars

helloagents.org

AI 解读暂未生成。可点击 GitHub 链接查看详情。

GitHubtrending growth

teng-lin/notebooklm-py

2285 forks16813 stars

github.com

AI 解读暂未生成。可点击 GitHub 链接查看详情。

GitHubtrending growth

NVIDIA/OpenShell

881 forks7252 stars

2787 forks55099 stars

ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

GitHubhot newcomer

omnigent-ai/omnigent

557 forks4722 stars

omnigent.ai

Omnigent 是一个开源工具，让你在一个地方管理所有 AI 编程助手，比如 Claude Code、Codex、Cursor，还能给它们设规则、限制权限，并实时协作。

GitHubhot newcomer

DietrichGebert/ponytail 是今天最值得先看的信号。ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

今日 Brief

产品侧可以先看 OpenArt Director：OpenArt Director 是一个通过聊天对话来导演电影级视频的AI工具。
开源侧可以先看 DietrichGebert/ponytail：ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

Editor's Pick

DietrichGebert/ponytail

2611 forks52404 stars

来源：GitHub · 类型：hot newcomer · 项目上线 12 天

ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

Editor's Pick

nexu-io/open-design

7923 forks70213 stars

open-design.ai

来源：GitHub · 类型：trending growth · 项目上线 57 天

一个本地优先的开源 AI 设计工作站，把自然语言变成可交互的原型、幻灯片和视频，替代 Claude 的碎片化设计体验。

Open Design 是一个本地优先的开源 AI 设计桌面应用，它把自然语言描述的设计意图直接变成可交互的 Web、移动端原型、幻灯片、图片甚至视频。你用聊天的方式告诉它要什么，AI 代理就在本地调用 259 多个技能和 142 多套设计系统，生成高保真界面，并在沙盒里实时预览，最后导出 HTML、PDF、PPTX 或 MP4。和 Claude 的 Artifacts 只能产出单页 HTML 不同，Open Design 做的是完整的设计项目：多页面、动效、素材管理、评论迭代，全在一个窗口里完成。底层是 TypeScript 写的 Electron 桌面应用，插件化的技能架构让它能接入 Claude Code、Cursor、OpenCode 等 17 种以上的 AI 编程代理，模型密钥你自己带，或者用官方的 AMR 路由按量付费。

它最近爆发式增长，57 天拿下 7 万星，直接原因是 0.10.0 版本把整个 agentic 设计流程装进了一个窗口。以前你想用 AI 做设计，得先在 Claude 里生成一段 HTML 预览，截图贴进 Figma 调间距，再打开 Runway 做动效...

Editor's Pick

paperclipai/paperclip

13281 forks71357 stars

paperclip.ing

来源：GitHub · 类型：trending growth · 项目上线 113 天

一个把 AI agent 当员工管起来的开源编排工具，让你用任务面板设定目标、分配角色、审批预算，像经营公司一样调度一群 agent。

Paperclip 是一个开源的多 agent 编排工具，它把零散的 AI agent 组织成一支有层级、有预算、有目标的对齐团队。你用类似 Notion 或 Asana 的任务面板描述一个商业目标，比如“做一款月入百万的 AI 笔记应用”，然后给团队分配 CEO、CTO、设计师、营销这些角色，每个角色背后可以是任何模型、任何供应商的 agent。系统会生成执行策略，你审批预算后点一下运行，就能在仪表盘上看到工作进度和成本消耗。底层是 Node.js 服务器加 React 前端，MIT 许可证，你可以把它部署到自己的服务器上，接入任何 agent，完全自控。

它最近在 GitHub 上猛涨到 7 万多 star，核心原因是踩中了一个尴尬的空白：很多人已经用上了能干活儿的 AI agent，但一旦同时跑三个以上，管理就崩了。你让一个 agent 写代码，另一个做测试，第三个写周报，结果只能靠 Slack 频道里喊话、翻聊天记录来协调。谁在干什么、花了多少 token、有没有跑偏，全凭感觉。Paperclip 把这种“多 agent 协作”从脚本思维拉到了组织管理思维，让非技术角色也能像...

Editor's Pick

OpenArt Director

382 votes115 comments

来源：Product Hunt

OpenArt Director 是一个通过聊天对话来导演电影级视频的AI工具。

你坐在电脑前，想拍一个短片。不是那种手机随手拍的，是带镜头语言、有情绪、能让人看进去的那种。你脑子里有画面：一个穿红裙子的女人在废弃车站等车，风把她的头发吹起来，镜头从她的背影慢慢摇到铁轨尽头。但你不会拍。你甚至不会用摄像机。你试过那些AI视频工具，输入一段描述，等两分钟，出来一个四不像——人脸扭曲，动作像卡顿的PPT。你改提示词，加“电影感”“浅景深”“慢动作”，出来还是不对。你花了一个下午，生成了一堆废片，最后只能放弃。

OpenArt Director 想解决的就是这个。它把“导演”这件事变成了一场对话。你不需要写提示词，不需要调参数，不需要懂分镜。你只需要像跟一个真人导演聊天一样，说出你的想法。比如你打开聊天框，说：“我想拍一个雨夜，主角是个穿风衣的男人，他从巷子里走出来，抬头看霓虹灯。”系统会理解你的意思，然后生成一段视频。你觉得镜头太远了，就说：“把镜头推近一点，拍他的眼睛。”它重新生成。你说：“雨再大一点，背景音乐要低沉。”它继续改。每一次对话，都是一次新的“拍摄”。

谁在用这个？可能是独立电影人、广告创意、短视频博主，甚至是你——一个从来没碰过摄像机但脑子里...

Editor's Pick

XiaomiMiMo/MiMo-Code

986 forks10528 stars

mimo.xiaomi.com

来源：GitHub · 类型：hot newcomer · 项目上线 13 天

MiMo-Code 是一个让 AI 模型和 AI 代理在同一个终端里互相配合、共同进化的开源工具。

你是一个开发者，正在写一个复杂的后端服务。你打开终端，敲下“帮我写一个处理用户登录的中间件”，然后等着 AI 给你一段代码。它确实给了，但你一看，里面用了你项目里根本不存在的库，还漏掉了 JWT 验证。你手动改完，再让它写下一个功能，它又忘了刚才的上下文，重新给你一段和项目结构对不上的代码。你开始怀疑，这到底是在帮你还是在给你添乱。你真正需要的不是一台只会吐代码的机器，而是一个能理解你项目、能自己跑起来、能根据运行结果自我修正的搭档。

MiMo-Code 就是冲着这个来的。它不是一个聊天窗口，而是一个跑在你终端里的系统。你打开它，输入的不是自然语言问题，而是具体的任务，比如“给这个 API 端点加上限流逻辑”。MiMo-Code 会先调用一个模型来理解你的项目结构，然后派一个代理去扫描你的代码库，找到相关的文件，再让另一个代理去执行修改。修改完之后，它会自动跑测试，如果测试挂了，它会读取错误日志，把问题反馈给模型，模型重新调整方案，代理再改，直到测试通过。整个过程，你只需要在终端里看着它一步步输出，像看一个远程同事在干活。

它的核心机制，你可以想象成一个“教练加运动员”的组合。模型...

Editor's Pick

Bluerails Discovery

560 votes107 comments

来源：Product Hunt

Bluerails Discovery 是一套让 AI agent 能自动找到你并给你打钱的支付轨道。

你坐在工位上，老板丢过来一句话：“下周客户回访，你搞个登记系统，能填信息、能查历史、能自动发邮件。” 你打开电脑，脑子里开始过选项：用 Excel 吧，多人协作容易乱，发邮件还得手动；用 Google Forms 吧，只能收集数据，查历史得另建表格；找开发吧，排期两周，老板等不了。最后你打开 Jotform，开始拖拽字段、设置逻辑、连邮件服务，折腾一下午，勉强能跑，但界面丑得像 2005 年的内部系统。你叹了口气，心想：要是能直接说句话就生成一个应用就好了。

Jotform AI App Builder 就是干这个的。你打开它，在输入框里打一句话，比如“客户回访登记表，包含姓名、电话、上次回访日期、本次回访记录，提交后自动发送确认邮件给客户，并保存到数据库”。系统用 AI 理解你的需求，几秒钟后，一个完整的应用就出现在你面前：表单字段已经排好，提交按钮绑定了邮件发送，数据自动存入 Jotform 的表格里。你可以直接分享链接给同事用，也可以继续微调——改个颜色、加个字段、调个逻辑，都是拖拽完成。它接的是 Jotform 自己的表单引擎和数据库，上下游就是你的邮箱、你的团队、你的客户。...

Product Huntsignal

Steam Machine

173 votes12 comments

你周末想跟朋友在客厅打《赛博朋克 2077》，但你的游戏本放在书房，搬过去要拔一堆线，HDMI 线不够长，手柄还得重新配对。你试过串流，延迟高到枪都开不准。最后你只能一个人窝在书房玩，客厅那台 65 寸电视落灰。这不是你的问题，是游戏 PC 天生就不该长成那个样子——它又大又重，风扇吵得像吸尘器，摆在电视柜旁边丑得你妈都不想看。

Steam Machine 就是冲着这个场景来的。它小到什么程度？大概两本《哈利·波特》叠起来那么大，重量不到一公斤。你把它塞进双肩包的电脑夹层，带到朋友家，插上电视的 HDMI 口，接上手柄，开机，Steam 大屏幕模式直接弹出来。它跑的是完整 Windows 系统，不是阉割版，所以你能装任何游戏平台——Steam、Epic、Xbox Game Pass 都行。输入就是你的手柄或键鼠，系统自动识别电视分辨率，输出就是 4K 60 帧的画面。上下游接什么？你不需要接任何东西，它自己就是一台完整的 PC，Wi-Fi 6 连网，蓝牙连手柄，USB-C 口可以插外置硬盘。

它的核心机制可以想象成“游戏本被压缩成了一个游戏卡带”。你小时候玩任天堂卡带，插进机器就能...

Product Huntsignal

Blazly SEO

135 votes15 comments

你是一个内容营销负责人，手下有三个人，每个月要出 30 篇博客文章来拉自然流量。你的日常工作是这样的：周一早上打开 Google Docs，看到上周的选题清单，然后开始手动研究关键词——打开 Ahrefs 查搜索量、看竞争对手的标题、分析他们的内容结构。接着你打开 ChatGPT，把关键词和要点扔进去，让它生成初稿。但 ChatGPT 写出来的东西经常跑题，或者语气不对，你得花半小时改。改完以后，你还要手动插入内链、优化 meta description、调整 H2 标签的密度。最后把文章贴到 WordPress 里，设置好发布时间，再手动提交到 Google Search Console。一篇文章从选题到发布，至少三个小时。30 篇就是 90 个小时，你一个人根本做不完，团队里每个人都在重复这个流程，而且每个人用的工具不一样，风格不统一，关键词覆盖经常撞车。

Blazly SEO 想解决的就是这个“内容生产流水线”的问题。它把自己叫做“AI 内容操作系统”，意思是它不只是一个写作助手，而是一个能管理选题、写作、优化、排期、发布的平台。你作为内容负责人，先在 Blazly 里设定好你...

Product Huntsignal

Sakana Fugu

141 votes8 comments

你手上有三个 AI 模型的 API 密钥：OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5、Google 的 Gemini 2.0。每个模型有自己的接口格式、自己的认证方式、自己的定价策略。你的产品需要根据用户输入自动选择最合适的模型——比如写代码用 Claude，创意文案用 GPT，多模态用 Gemini。于是你的代码里塞满了 if-else 判断、错误重试逻辑、token 计数、成本追踪。每次新模型发布，你都要改一遍路由层。更烦的是，用户抱怨响应慢，你查了半天才发现是某个模型超时了，但你的重试机制写错了，直接挂了整个请求。你盯着满屏的 try-catch，心想：我只是想用最好的模型，为什么变成了模型运维工程师？

Sakana Fugu 就是来解决这个问题的。它的名字很怪——Sakana 是日语里的“鱼”，Fugu 是“河豚”——但它的逻辑很直接：你只需要接入一个 API，把请求扔给它，它帮你决定用哪个模型、怎么调用、怎么重试、怎么计费。开发者是它的用户，你输入的是用户的问题和上下文，系统内部维护一个模型池，根据你的配置（比如成本上限、延迟要求、模型擅长...

GitHubtrending growth

openclaw/openclaw

79619 forks380187 stars

openclaw.ai

OpenClaw 是一个自托管的个人 AI 助手，它把 WhatsApp、Telegram、Slack、iMessage 甚至 QQ 和微信这些你每天都在用的聊天渠道，变成同一个私人助理的对话界面。你用自然语言在任何接入的 app 里跟它说话，它就能回答问题、执行任务、生成内容，还能语音对话或推一个实时 Canvas 给你看。和那些把你锁在单一客户端里的 AI 产品不同，OpenClaw 的核心主张是“渠道只是外壳，助手才是产品”，而且所有数据和推理都可以跑在你自己的设备上。底层是一个 TypeScript 写的 Gateway 控制平面，通过适配器对接二十多种消息平台，最近还接入了 MCP 协议，让助手能直接调用外部工具和数据源。

这个项目最近能冲到 38 万 star，很大程度上是因为它踩中了两个趋势的交汇点：一是人们对 AI 助手“数据主权”的焦虑，二是 MCP 协议让自托管助手突然有了可扩展的手和脚。以前你要么忍受大厂 AI 把你当产品，要么自己用 LangChain 拼一个半成品，但渠道打通和工具调用这两件事始终是断裂的。OpenClaw 把“在任何聊天软件里召唤同一个助手...

GitHubtrending growth

6000 forks59707 stars

linkedin.com

这个项目是一套给 Claude Code 用的工程化操作手册。它把“想到什么说什么”的 vibe coding，翻译成有分工、有流程、可复用的 agentic engineering。你不再只是和一个通用助手聊天，而是通过预定义的子代理、命令和技能文件，让 Claude Code 像一支微型工程团队那样工作——有人负责写代码，有人负责审查，有人管测试，还有人编排整个流水线。核心差异在于，它把散落在推文、博客和试错里的 Claude Code 高阶用法，沉淀成一套可克隆、可修改、可立刻跑起来的目录结构。底层完全基于 Claude Code 自身的 sub-agent、hook 和 MCP 机制，用 Markdown 和 YAML 定义行为，不引入额外运行时。

46 forks853 stars

agentapprenticeship.org

Agent Apprenticeship 是一个开源的 agent 学徒训练生态。它把本地 agent 执行真实任务的过程，转化成可积累、可交换的学习信号。你用 `npx agent-apprenticeship init` 接入，agent 干活的同时自动记录执行轨迹，提炼出可复用的经验教训，再回馈给整个生态。

和绝大多数 agent 框架只关心“这一次能不能跑通”不同，Agent Apprenticeship 盯的是“下一次能不能跑得更好”。它内置了一套迭代工作流循环，让学徒 agent 跟着导师 agent 或人类专家完成长周期任务，每完成一次，就产出一组训练信号。底层是一个 npm 包，直接对接 Claude Code、Cursor、Codex、OpenCode 等本地 agent，种子数据集已经塞进了 500 多个真实任务、495 条可复用教训、上千条完整执行轨迹。

这个仓库上线四天就冲到 800 多 star，因为它戳中了一个被忽视的集体焦虑：你的 agent 今天写了个爬虫脚本，明天换个网站又要从头调 prompt，它永远在失忆。每个开发者都在私下教自己的 agent...

GitHubtrending growth

openai/codex

13769 forks93085 stars

你正盯着终端里那个红色的测试失败信息，已经看了十五分钟。你记得这个函数应该处理边界情况，但你不确定是哪里漏了。你打开浏览器，搜索“Python 列表切片边界”，翻了三篇 Stack Overflow，又切回编辑器，加了一行 if 判断，重新跑测试——还是红的。你又切回浏览器，这次搜的是“为什么我的 for 循环跳过了最后一个元素”。你来回切了六次窗口，最后发现是索引写错了。这个 bug 你花了四十分钟，而它本质上只是少了一个 `-1`。

Codex 就是为这种时刻设计的。它是一个用 Rust 写的命令行工具，你装好之后，直接在终端里敲 `codex "修复这个测试"`，它就会读取你当前项目的文件结构、代码内容、测试输出，然后自己分析问题、生成修改方案，甚至直接帮你把代码改了。你不需要打开任何网页，不需要复制粘贴错误信息，不需要手动定位文件。你只需要告诉它你想干什么，它自己看代码、自己动手。

具体怎么工作的？你打开终端，cd 到项目目录，然后输入 `codex "给用户列表加一个分页功能"`。Codex 会先扫描你项目里的所有文件，理解你的代码风格、依赖关系、已有的 API 结构。然...

今日值得看：DietrichGebert/ponytail

今日 Brief

产品侧可以先看 Skybridge：Skybridge 是一个开源的 React 全栈框架，专门用来快速搭建基于 MCP 协议的 AI 应用。
开源侧可以先看 DietrichGebert/ponytail：ponytail 是一个让 AI 代码助手学会偷懒的工具，它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的，绝不写多余的。

Editor's Pick

510 forks4462 stars

omnigent.ai

来源：GitHub · 类型：hot newcomer · 项目上线 11 天

Omnigent 就是来解决这个混乱的。你作为开发者或团队负责人，先安装它，然后在配置文件里声明你要用哪些 AI 工具：Claude Code、Codex、Cursor，甚至你自己写的自定义 agent。系统会把这些工具统一注册到一个“元工具”里，你只需要在一个终端或 Web 界面里输入任务，比如“重构 user.py 里的登录逻辑，然后跑一遍测试”。Omnigent 会自动判断哪个 agent 最适合第一步，哪个适合第二步，把任务拆解、分配、执行。它还会强制执行你设定的策略，比如“不允许任何 agent 修改 production 目录下的文件”，或者“所有 agent 的代码生成必须经过沙箱测试”。执行结果会实时同步到所有设备上，你在办公室电脑上发起任务，回家用 iPad 也能看到进度。上下游接的是你的代码仓库、CI/CD 流水线、以及你配置的各个 AI agent 的 API。

你可以把 Omnigent 想象成一个指挥家，而 Claude Code、Codex、Cursor 是乐队里的不同乐手。指挥家不自己演奏，但他知道什么时候让小提琴手独奏，什么时候让鼓手加入，还能确保整个乐队不跑调。你不需要告诉每个乐手该做什么，你只需要对指挥家说“来一首贝多芬”，剩下的由他协调。Omnigent 就是这个指挥家，你只需要告诉它“帮我改代码”，它自己决定用哪个 agent、怎么分步骤、怎么保证安全。

对比一下直接用 Claude Code 或 Codex。那些工具是“单兵作战”的，每个 agent 有自己的界面、自己的上下文、自己的权限模型。你想换一个 agent，就得重写整个工作流。比如你之前用 Claude Code 写了一个自动化脚本，现在想换成 Codex，因为 Codex 对 Python 支持更好，那你得把脚本里的所有 Claude Code 调用改成 Codex 的 API，还得重新配置环境。Omnigent 走的是另一条路：它把 agent 当成可插拔的模块。你只需要在配置里改一行，把“claude-code”换成“codex”，剩下的任务拆分、策略执行、结果汇总都由 Omnigent 处理。这种能力在团队协作时尤其重要：你的前端同事用 Cursor，后端同事用 Claude Code，但你们可以共享同一个 Omnigent 配置，统一安全策略，不用各自为政。

当然，Omnigent 不是万能的。如果你的团队只有一个人，只用一种 AI 工具，那它带来的复杂度可能超过收益。你得学习它的配置语法，理解策略和沙箱的概念，还要处理 238 个 open issues（截至数据采集时）。它目前有 4462 个 star，510 个 fork，说明社区活跃，但毕竟才发布 11 天，文档和稳定性还在打磨。如果你只是想快速用 Claude Code 改一行代码，直接打开终端输入命令更快。Omnigent 的战场是那些需要多 agent 协作、有严格安全要求、或者团队分散在不同设备上的场景。

用起来什么样？假设你是一个三人小团队，负责一个电商网站的后端。你在办公室电脑上打开 Omnigent 的 Web 界面，输入：“修复 checkout 页面的库存检查 bug，然后让 Codex 写单元测试，最后用 Cursor 优化一下错误提示的 UI。” 你按下回车，Omnigent 先让 Claude Code 分析代码，定位到库存检查函数里少了一个条件判断；它自动把修复代码提交到 feature 分支，然后通知 Codex 基于这个分支写测试；测试写完后，它又调用 Cursor 打开前端文件，修改了错误提示的样式。整个过程你只发了一条指令。晚上你回到家，打开手机上的 Omnigent 客户端，看到所有任务都完成了，测试通过率 100%，UI 改动已经合并到主分支。你给团队发了条消息：“今天的工作，AI 帮我搞定了。”

Editor's Pick

Waishnav/devspace

224 forks2135 stars

来源：GitHub · 类型：hot newcomer · 项目上线 8 天

devspace 解决的就是这个混乱。你是一个开发者，你每天的工作流是这样的：打开 VS Code，旁边挂着 ChatGPT 的网页，偶尔切过去问个问题。但你发现，ChatGPT 的对话历史里，编程相关的请求和日常闲聊混在一起，每次找上次写的代码片段都要翻半天。你用 devspace 之后，只需要在 ChatGPT 里装一个插件，或者通过它提供的接口，就能在同一个 ChatGPT 账号下创建一个独立的“编程空间”。你在这个空间里输入代码问题，系统只处理代码相关的请求，不会污染你的主聊天记录。它怎么做到的？devspace 本质上是一个会话隔离层。你在 ChatGPT 里发一条消息，devspace 会判断这条消息是不是编程相关——比如你写了“写一个二分查找函数”，它就把这条消息路由到独立的编程会话里，调用 ChatGPT 的代码生成能力，然后把结果返回给你。这个独立的会话有自己的上下文、自己的历史、自己的计费方式。你不需要再开一个 Codex 窗口，也不需要担心辞职信和排序算法混在一起。它接的是 ChatGPT 的 API，输出的是干净的代码片段，上下游就是你常用的编辑器或者终端。

你可以把 devspace 想象成给 ChatGPT 装了一个“工作模式”开关。就像你手机上的“专注模式”——打开之后，只有工作相关的通知能进来，游戏、社交、视频全部静音。devspace 就是给 ChatGPT 的聊天窗口装了一个“编程模式”。你在这个模式下，ChatGPT 只记得你刚才写的代码，不会想起你昨天问的“怎么追女生”。它把 ChatGPT 的大脑分成了两个独立的房间，一个房间堆满了代码、算法、调试日志，另一个房间堆满了日常闲聊、生活建议、情感咨询。你走进哪个房间，它就给你哪个房间的记忆。

对比一下真正的竞品——Codex。Codex 是 OpenAI 专门为编程场景打造的 AI 助手，它深度集成在 VS Code 里，能直接补全代码、解释函数、生成测试。Codex 的路径是“为编程造一个专用工具”，它从一开始就只做一件事：写代码。它的优势是深度、精准、低延迟。但代价是，你得单独付费，单独管理，而且它不能帮你写邮件、查资料、做翻译。devspace 走的是另一条路：它不造新工具，而是改造你已有的工具。它让 ChatGPT 同时扮演两个角色——一个通用助手和一个编程助手，通过会话隔离让它们互不干扰。这种路径的优势是，你不需要学习新工具，不需要切换窗口，不需要管理两套账号。你只需要在 ChatGPT 里多一个“编程空间”的选项。但代价也很明显：它依赖 ChatGPT 的 API，延迟和稳定性受限于 OpenAI 的服务；它不能像 Codex 那样深度集成到编辑器的每一行代码里；它更适合那些“偶尔写代码”的开发者，而不是每天写 8 小时代码的专业程序员。

devspace 的边界很清楚。如果你是一个全职的软件工程师，每天在 VS Code 里写几千行代码，Codex 或者 GitHub Copilot 更适合你——它们能直接在光标位置补全代码，不需要你手动输入问题。但如果你是一个产品经理、数据分析师、或者偶尔写脚本的开发者，你不想为了写几行代码再开一个付费工具，也不想让 ChatGPT 的聊天记录变成一团乱麻，devspace 就是那个让你“在 ChatGPT 里顺便写代码”的解决方案。它的风险在于，会话隔离不是完美的——如果 OpenAI 更新了 API 或者改变了会话管理策略，devspace 可能失效。另外，它目前只有 17 个 open issues，说明还在早期，bug 可能不少。

想象一下你明天早上的场景。你打开 ChatGPT，看到左边多了一个“编程空间”的标签。你点进去，输入“写一个 Python 脚本，读取当前目录下所有 CSV 文件，合并成一个 Excel 表格”。ChatGPT 立刻开始写代码，你看着它一行一行地生成，然后复制到你的编辑器里运行。你发现有个小 bug，又输入“加一个错误处理，如果文件是空的就跳过”。它马上修改了代码。你关掉这个标签，回到主聊天窗口，看到昨天和女朋友聊的旅行计划还在那里，干干净净，没有被代码请求打断。你突然意识到，你已经有三个月没用过 Codex 了。

Editor's Pick

Skybridge

432 votes114 comments

来源：Product Hunt

你是一个前端开发者，老板突然说：“下周我们要上线一个 AI 助手，能调用公司内部的 API，还能记住用户上次聊到哪。”你打开编辑器，开始想：要处理模型上下文，要管理工具调用，要处理流式响应，还要做状态同步。你翻了一遍 LangChain 的文档，发现它只管后端逻辑，前端还得自己搭。你试了试 Vercel AI SDK，确实快，但一旦要自定义 UI 组件、要接入自己的数据库、要处理复杂的用户交互，你就得自己写一堆胶水代码。你开始怀疑：为什么没有一个东西，能把 AI 的“脑子”和 React 的“界面”直接焊在一起？

Skybridge 就是冲着这个痛点来的。它不是一个 AI 模型，也不是一个聊天 UI 组件库。它是一个完整的全栈框架——你写 React 组件，它帮你把 MCP 协议（Model Context Protocol）的通信、工具注册、状态管理、流式渲染全部包了。你只需要定义你的 AI 能调用哪些工具（比如查数据库、发邮件、调用第三方 API），然后像写普通 React 组件一样写界面，剩下的交给 Skybridge。

具体怎么用？你是一个独立开发者，想做一个“文档问答助手”。你打开终端，用 Skybridge 的 CLI 初始化一个项目。你写一个 React 组件叫 `ChatWindow`，里面放一个输入框和一个消息列表。然后你定义一个 `tools` 数组，里面写一个 `searchDocs` 函数，它去你的 Notion 或本地 Markdown 文件里搜内容。Skybridge 自动把这个工具注册到 MCP 服务器上，当用户问“上次的会议记录在哪”，AI 模型会调用 `searchDocs`，结果流式地推回前端，你的 `ChatWindow` 组件自动渲染出带引用的回答。整个过程，你不需要手动处理 WebSocket、不需要写 SSE 解析、不需要管理对话历史的状态——Skybridge 的运行时帮你做了。

用一个比喻来说：Skybridge 就像预制菜套装。你自己不用去菜市场挑菜、洗菜、切菜、配调料，你只需要把包装袋撕开，倒进锅里炒一下。传统开发方式是你从种菜开始，而 Skybridge 把 MCP 通信、工具调度、状态管理这些“配菜”都给你切好了，你只需要写 React 组件这个“炒菜”步骤。

对比一下真实竞品。比如你直接用 LangChain + Express + React 自己搭。这条路给你最大的灵活性：你可以选任何模型、任何数据库、任何前端框架。但代价是你要自己处理所有边界情况：连接断开怎么办？工具调用超时怎么办？多个用户并发时状态怎么隔离？Skybridge 选择了一条不同的路：它把 MCP 协议作为核心抽象，强制你按照它的约定来写工具和组件。这让你失去了部分灵活性——比如你不能随便换一个非 MCP 的模型——但换来了开箱即用的流式渲染、自动重连、状态持久化。在大多数 AI 应用场景里，这些功能比“能换模型”重要得多。尤其是当你需要快速验证一个想法，或者团队里没有后端工程师的时候，Skybridge 的价值就出来了。

当然，它也有边界和代价。如果你的 AI 应用需要非常复杂的多轮对话逻辑，或者需要对接非标准的模型接口（比如自己微调的模型），Skybridge 的 MCP 约束可能会成为障碍。另外，它目前只支持 React，如果你团队用 Vue 或 Svelte，那就得等社区适配。还有，框架本身还在早期，文档和社区支持可能不如成熟方案。如果你做的只是一个简单的聊天机器人，用 Skybridge 可能有点重——就像用烤箱烤一片面包，杀鸡用牛刀。

说一个用起来什么样的小故事。我的朋友小陈，一个前端工程师，周末想做个“AI 简历助手”。他用 Skybridge 初始化项目，写了一个 `ResumeUploader` 组件，一个 `JobDescriptionInput` 组件，然后定义了两个工具：`parseResume` 和 `matchJob`。他花了大概三个小时，就做出了一个能上传 PDF 简历、粘贴职位描述、然后 AI 自动分析匹配度并给出修改建议的页面。他给我演示的时候，我问他后端怎么部署的，他说：“Skybridge 自带了一个 Node 服务器，我直接 `npm run build` 然后扔到 Vercel 上就行了。”整个过程他没有写过一行后端代码，没有配置过数据库，没有处理过 WebSocket。他唯一写的，就是几个 React 组件和几个纯函数工具。这就是 Skybridge 想给你的日常。

More Signals

Product Huntsignal

Alai 2.0

249 votes48 comments

你明天要见投资人，PPT 还差十页。你打开 Google Slides，盯着空白页面，光标一闪一闪。你想起上周花三个小时调一个柱状图的颜色，最后发现配色方案跟公司 logo 完全不搭。你试过用模板，但模板里那些花里胡哨的图标跟你数据一点关系都没有。你甚至想过外包给设计师，但设计师说排期要三天，而你只有今晚。你最后只能自己硬着头皮做，结果做出来的东西连你自己都不想看第二遍。这不是你一个人的问题。每个需要做 presentation 的人——创业者、产品经理、市场运营——都在这条船上。你明明有想法、有数据，但把它们变成视觉语言这件事，就像让你用左手写书法。

Alai 2.0 就是冲着这个场景来的。它不是一个让你从零开始拖拽的编辑器，而是一个能听懂你需求的 AI 设计搭档。你打开 Alai，输入一句话，比如“做一个三页的融资 deck，第一页讲市场规模，第二页讲产品优势，第三页讲团队”。系统会理解你的意图，然后自动生成一整套幻灯片，包括布局、配色、字体、图标，甚至帮你把数据做成图表。你不需要告诉它“标题用 36 号字，副标题用 24 号”，它自己会判断。你还可以继续跟它对话：“第二页的图表改成饼图，颜色用蓝色系。”它立刻调整。输出的是可以直接用的 PPT 或 PDF 文件，能导出到 Google Slides、PowerPoint，或者直接分享链接。上下游接什么？你从 Notion 或文档里复制一段文字进来，Alai 吃掉它，吐出一套视觉方案。你不需要打开 Figma，不需要学设计软件。

它的核心机制，你可以想象成一个“会画画的翻译官”。你脑子里有一团想法，像一堆散落的乐高积木。Alai 不是帮你拼积木，而是先问你“你想拼什么？城堡还是飞船？”，然后它自己从积木堆里挑出合适的零件，按它学过的上千种优秀设计案例，帮你搭出一个结构。你只需要说“这里再加一个塔”，它就知道往哪加。它不替你思考内容，但替你思考怎么呈现。

对比一下真实竞品 Canva。Canva 的路径是“给你海量模板，你自己选，自己改”。它像一个巨大的素材超市，你推着购物车进去，自己挑背景、挑字体、挑贴纸，然后手动拼在一起。好处是自由度极高，坏处是你得自己知道要什么。如果你没有设计直觉，你会在几千个模板里迷失，最后选了一个跟别人一模一样的。Alai 的路径是“你告诉我目标，我来出方案”。它像一个私人设计师，你描述需求，它给你几个选项，你挑一个，再微调。能力差异在哪？在“从零到一”的速度。如果你要做一个全新的、没有现成模板的页面，比如一个结合了数据图表和产品截图的竞品分析页，Canva 需要你手动布局，Alai 可以一句话生成。这个差异在时间紧迫、内容复杂的时候特别重要。

当然，Alai 不是万能的。它最擅长的是“有明确结构”的内容——演示文稿、社交媒体帖子、简单的海报。如果你要做一套完整的品牌 VI 手册，或者需要像素级精确的印刷品，它可能不够细。它的设计风格偏向现代、干净、通用，如果你需要非常独特、带有强烈个人风格的视觉，它可能给不了你那种“一眼就认出是你”的感觉。风险在于：你可能会过度依赖它，不再自己思考布局逻辑，导致所有输出看起来都像同一个 AI 做的。另外，它生成的图表数据需要你核对，AI 偶尔会误解你的数字。

想象一下这个场景：晚上十点，你坐在咖啡店，手机响了，老板发消息说“明天早上九点前把季度汇报 PPT 发我”。你打开 Alai，输入“季度汇报，四个部分：业绩回顾、问题分析、下季度计划、资源需求。数据在附件里。”然后你上传一个 Excel 表格。三十秒后，Alai 生成了一套 12 页的幻灯片，每页都有对应的图表和要点。你扫了一遍，发现第三页的饼图把“其他”项标成了最大，你打字说“把‘其他’放到最后，颜色改成灰色”。它改了。你导出，发出去。整个过程十五分钟。你合上电脑，喝了一口已经凉了的咖啡，心想：要是去年有这个，我少熬多少夜。

Product Huntsignal

AgentX

335 votes118 comments

你花了两周时间写了一个 AI agent，用来自动处理客户退款申请。你精心设计了 prompt，接上了 Stripe 和 CRM，测试了几十个场景，看起来一切正常。上线第一天，客服主管就冲过来：agent 把一笔 200 美元的老客户退款直接拒绝了，客户气得要投诉。你打开日志，看到 agent 调用了“拒绝退款”工具，但不知道它为什么这么选。是 prompt 里某个词被误解了？是 CRM 返回的客户等级字段格式不对？还是模型自己抽风了？你只能手动复制当时的输入，一遍遍重跑，改 prompt，再试，再改。一个下午就没了。

AgentX 就是来解决这个问题的。它不是一个帮你写 agent 的平台，而是一个专门用来“查问题”的工具。你用它的时候，只需要把 agent 的调用记录——包括每次输入、输出、调用了哪些工具、工具返回了什么、模型中间思考了什么——全部丢进去。AgentX 会自动分析这些数据，像代码调试器一样，定位到具体哪一步出了问题。比如它发现 agent 在某个分支里错误地解析了客户等级字段，因为 CRM 返回的是“Gold”而不是“gold”，而你的 prompt 里只写了小写。然后 AgentX 会直接给出修复建议：要么改 prompt 里的匹配规则，要么在调用前加一个大小写转换。你点一下“一键修复”，它就把修改后的 prompt 或工具调用逻辑推送到你的 agent 配置里。整个过程不需要你手动翻日志、猜原因。

它的工作流很直接。你作为开发者或 AI 工程师，把 agent 的 trace 数据（比如通过 API 或 SDK 自动上报）接入 AgentX。系统先做一次全量分析，把每个步骤的输入输出、工具调用链、模型 token 消耗、决策路径都可视化出来。然后它用一套规则引擎加小模型，自动标记异常：比如某个工具返回了空值但 agent 没处理、某个 prompt 指令被模型忽略、某个分支条件永远不满足。最后生成一个报告，列出问题列表，每个问题都附带“一键修复”按钮。修复后，你可以重新跑一遍测试用例，确认没问题再上线。上下游接的是你的 agent 框架（比如 LangChain、CrewAI）的日志系统，以及你的 CI/CD 管道——修复后自动触发回归测试。

你可以把 AgentX 想象成一个给 AI agent 用的 X 光机。普通日志只能看到骨头有没有断，但 X 光机能告诉你断在哪里、怎么断的、需不需要手术。AgentX 就是那个能自动读片、写诊断报告、甚至帮你打石膏的机器。

对比一下传统的做法。大多数团队现在调试 agent 靠的是手动加 print 语句、看 LangSmith 或 LangFuse 的 trace 图。这些工具能告诉你 agent 调用了什么工具、花了多少时间，但不会告诉你“这里有问题”。你得自己盯着数据猜。AgentX 走的是另一条路：它不满足于展示，而是主动诊断。它内置了常见 agent 故障模式的知识库，比如“工具调用参数类型不匹配”、“模型在长上下文里丢失指令”、“循环调用死锁”。当你的 agent 出现这些模式时，它直接指出来，而不是让你自己从几百行 trace 里找。这个能力在 agent 变复杂、有多个工具和分支时特别重要。你不可能每次上线前都手动跑一百个场景，但 AgentX 可以自动扫描历史 trace，发现你根本没注意到的边缘情况。

当然，AgentX 不是万能的。它依赖 agent 的 trace 数据质量——如果你的 agent 没有完整记录中间思考过程，它分析不了。它更适合那些有一定复杂度的 agent，比如有 3 个以上工具调用、多步推理的场景。如果你只是写一个简单的“根据关键词回复”的 bot，用它就像用杀牛刀切葱花。另外，一键修复虽然方便，但自动修改 prompt 或工具逻辑可能引入新问题。你需要信任它的修复建议，或者至少跑一遍测试。对于关键业务场景，建议把修复先放到 staging 环境验证。

想象一下你是一个 SaaS 公司的 AI 负责人。早上到公司，打开 AgentX 的 dashboard，看到昨晚 agent 处理了 1200 个请求，其中 3 个被标记为“异常”。你点开第一个：agent 在处理一个客户取消订阅的请求时，错误地调用了“升级套餐”工具。AgentX 分析发现，是因为客户消息里写了“我想取消，但你们套餐太贵了”，agent 把“太贵了”误解为“需要更便宜的套餐”，于是调用了升级。AgentX 建议在 prompt 里加一条规则：“如果客户明确提到取消或退款，优先执行取消流程，忽略其他信息”。你点了一下“应用修复”，然后看到第二个异常：agent 在调用 CRM 查询客户等级时，API 返回了 500 错误，agent 没有重试，直接拒绝了请求。AgentX 建议增加重试逻辑。你又点了一下。前后不到五分钟，三个问题全部解决。你关掉电脑，去冲了杯咖啡。这就是 AgentX 想给你的日常。

Product Huntsignal

readywhen

193 votes44 comments

你刚开完一个客户会议，聊了四十分钟，最后你说“我周五前把方案发给你”。对方点头，你记在脑子里。然后你回到工位，打开邮箱，发现三封紧急邮件，一个同事在 Slack 上问你数据，老板又拉了个群说下午要汇报。你埋头处理这些，周五早上客户发来消息：“方案怎么样了？”你一拍脑袋——忘了。这不是你懒，是你根本记不住。你每天要跟多少人说话，开多少会，随口答应多少事？没人能全记住。但客户不会管你忙不忙，他只记得你说了“周五前”。

readywhen 就是来解决这个问题的。它不是一个让你手动输入待办事项的 app，而是一个能自动从你的对话里挖出承诺的 AI。你把它连上你的 Gmail、Outlook、Slack、日历，甚至 Zoom 的转录。它每天扫描这些地方，找出所有“我会……”“我答应……”“我回头给你……”这类句子，然后自动生成一个承诺清单。每个承诺都带上下文：谁说的、什么时候说的、截止日期是什么（如果提到了）。然后它帮你设提醒，甚至能自动帮你写一封跟进邮件草稿，你只需要点发送。

它的工作流是这样的：你开完会，会议录音被转成文字，readywhen 的模型跑一遍，识别出“我周五前发方案”这句话。它自动在系统里创建一个任务，关联客户的名字，设截止日期为周五。然后它每天检查进度，周四晚上给你发一条 Slack 消息：“你答应周五给客户发方案，还没发，需要帮你起草邮件吗？”你点一下，它调出你之前写的方案草稿，生成一封邮件，你改两句话就发出去了。下游它还能连你的 CRM，自动把这次跟进记录到客户档案里。

你可以把它想象成一个永远不睡觉的私人助理，坐在你办公桌旁边，手里拿着一个小本子，你每说一句“我会做”，它就记下来。然后它每隔一段时间翻翻本子，戳你一下：“这个还没做，那个快到期了。”区别是，这个助理不会累，不会漏，也不会因为你语气不好就辞职。

跟 Todoist 或 Asana 比，readywhen 走了一条完全不同的路。Todoist 是个好工具，但它需要你主动去创建任务。你得在开会时掏出手机，手动输入“周五前发方案”，然后设提醒。问题是，你经常忘了输入，或者当时觉得能记住，结果转头就忘。readywhen 不依赖你的主动性，它被动地监听你的沟通，自动提取。这听起来简单，但实际差别很大：当你一天有二十个承诺时，手动录入的摩擦会让你放弃一半。而 readywhen 让你不用改变任何习惯，它自己从你的日常对话里捞东西。

当然，它也有代价。它需要读取你的邮件、聊天记录、会议转录，这意味着你要信任它处理敏感信息。如果你在高度保密的行业，或者你老板不允许任何第三方访问公司数据，那 readywhen 可能进不了门。另外，它可能会误判——比如你说“我会考虑一下”，它可能当成一个承诺，实际上你只是敷衍。你得多花时间清理误报。它最适合那些承诺多、节奏快、对隐私要求不极端的人，比如销售、项目经理、创业者。如果你每天只开一个会，只答应一件事，那手动记一下更省事。

想象一下你是一个 SaaS 公司的客户成功经理。早上九点，你打开 readywhen 的仪表盘，看到昨晚跟三个客户的沟通里被识别出五个承诺：一个答应发使用指南，一个答应查 bug 进度，一个答应安排培训。系统已经自动生成了三封邮件草稿，你扫了一眼，改了两个日期，全部点发送。十点，你收到一条提醒：“你上周答应客户周三前更新合同，今天周三了，还没发。”你赶紧调出合同，改完发出去。下午五点，readywhen 弹出一条总结：“今天你完成了 4 个承诺，还有 2 个明天到期，需要提前准备吗？”你关掉电脑，发现今天没有一个人追着你问“你答应我的事呢”。这就是 readywhen 想给你的日常。

Product Huntsignal

HAQQ Legal AI on Mobile

184 votes8 comments

你晚上十一点坐在出租屋的床边，手机屏幕上是房东发来的微信：“押金不退，因为你弄坏了地板。”你明明记得搬进来时地板就有划痕，但当时没拍照。你想争，但不知道法律上怎么说。你打开百度搜“租房押金不退怎么办”，出来一堆广告和律师咨询页面，点进去要填手机号，然后第二天就有陌生号码打过来：“您好，我们是XX律所……”你挂掉电话，觉得更烦了。你需要的不是推销，是现在、立刻、有人告诉你：我有没有胜算？该发什么消息给房东？如果去法院，流程是什么？

HAQQ Legal AI on Mobile 就是为这种时刻做的。它是一个手机App，你打开它，像跟朋友聊天一样输入你的情况：“我租的房子，地板本来就有划痕，房东现在说是我弄坏的，要扣我2000押金，我该怎么办？”它不会让你填手机号，也不会转接给真人律师。它直接分析你描述的事实，对照相关法律条文和判例，然后给你一个清晰的回答：你的情况属于“承租人正常使用损耗”，根据《民法典》第七百一十条，出租人应当承担维修义务，押金不能随意扣除。它还会建议你下一步做什么——比如先发一条微信给房东，引用这条法律，语气怎么措辞；如果房东坚持不退，可以去街道调解委员会，或者申请小额诉讼，流程大概多久，需要什么材料。

这个工作流很简单：你输入自然语言描述的场景，HAQQ 在后台把这段话拆解成关键事实要素——主体（租客、房东）、标的（押金）、争议点（地板损坏原因）、金额（2000元）。然后它匹配到对应的法律领域（租赁合同纠纷），再调用它训练过的法律知识库和判例数据，生成一个结构化的回答。输出不是一堆法条堆砌，而是分三段：第一段告诉你法律上怎么认定，第二段给你具体行动建议，第三段列出你可能需要的证据清单。它还能接你手机里的备忘录或截图，你拍下合同条款照片，它能 OCR 识别后分析条款是否有效。

你可以把它想象成一个在法学院图书馆泡了三年、又在小额法庭旁听了两年实习生。它不会替你出庭，但它能帮你把案情理清楚，把法律语言翻译成人话，把下一步行动列成清单。你不需要懂“不当得利”或“违约责任”，你只需要说人话。

跟传统法律咨询App比，比如“华律网”或者“找法网”，那些平台本质上是一个律师黄页。你提交问题，平台分发给注册律师，律师免费回答几句，然后引导你付费咨询或委托代理。它们的商业模式靠的是撮合交易，所以回答天然带有销售倾向——律师会暗示“你这个案子比较复杂，最好当面聊”。HAQQ 走的是另一条路：它不卖律师服务，它卖的是法律理解本身。它用AI直接给出答案，不经过中间人。这意味着你不需要等24小时，不需要接推销电话，不需要判断这个律师是不是在吓唬你。代价是，它不能替你写起诉状，不能替你出庭，不能替你谈判。如果你的案子涉及几十万的标的、复杂的证据链，或者对方也有律师，你仍然需要真人律师。HAQQ 的边界很清楚：它解决的是“我该不该维权”和“我第一步该做什么”，而不是“帮我打赢官司”。

它也有风险。法律是地域性很强的领域，不同省份的司法解释、地方条例可能不同。如果HAQQ的训练数据覆盖不全，或者你描述的事实有遗漏，它给出的建议可能不准确。比如你忘了说合同里有一条“租客承担一切维修费用”，那它的结论就可能偏了。所以它会在回答末尾加一句：“以上建议仅供参考，重大决策请咨询执业律师。”这不是免责声明，是实话。

想象一下你那个晚上。你打开HAQQ，输入问题，三十秒后看到回答。你截图发给房东，附上一句：“根据《民法典》第七百一十条，正常使用损耗由出租人承担，押金应全额退还。如果你坚持扣除，我会向街道调解委员会申请调解。”五分钟后房东回你：“算了，押金退你，但下次注意。”你关掉手机，觉得今晚能睡个好觉。这就是HAQQ想创造的日常。

Product Huntsignal

uwait

155 votes33 comments

你肯定遇到过这种情况。打开 ChatGPT，输入一段提示词，等它慢慢吐出几百个字。或者用 Midjourney 生成一张图，盯着进度条转圈。或者让 Claude 分析一份 PDF，它说“正在思考，请稍候”。这几秒、十几秒、甚至一分钟里，你什么都干不了，只能盯着屏幕发呆。你刷了一下手机，回来发现它已经写完了，但你错过了开头。你重新读一遍，又浪费了时间。这种等待是 AI 时代的“碎片时间”——你没法用它做正经事，因为随时可能被打断。

uwait 想做的事很简单：把这些等待时间变成你的收入。它不是让你去挖矿或者看广告，而是让你在 AI 思考的过程中，系统自动给你塞点小活儿——比如快速判断一张图片里的物体、给一段文字打标签、或者回答一个简单的是非题。这些任务不需要你动脑子，几秒钟就能完成，而且每完成一个，你的账户里就多几美分。等你回到 AI 的输出界面，任务已经做完，钱也到账了。

具体怎么运作？你装一个浏览器插件或者桌面客户端，然后正常使用任何 AI 工具——ChatGPT、Claude、Gemini、Perplexity 都行。当你提交一个请求，AI 开始“思考”的时候，uwait 会在屏幕角落弹出一个微型任务窗口。任务来自它的合作方——广告主、数据标注公司、搜索引擎优化团队——他们需要大量人工判断来训练模型或优化结果。你点一下“是”或“否”，或者选一个选项，任务就完成了。系统自动记录你的贡献，按任务难度和时长结算。等你回到 AI 的回复页面，任务窗口自动消失。整个过程不会打断你的工作流，因为 AI 本来就在转圈。

你可以把它想象成一个“等待税”的反向操作。以前你等电梯、等公交、等咖啡，那些时间被白白浪费了。现在 AI 替你等，但 AI 等的时候你也在等。uwait 把这段“双倍等待”变成了一个微型劳动力市场——你出的是注意力碎片，买的是零钱。

和它最像的竞品是那些“被动赚钱”的浏览器扩展，比如 Honey 或者 Swagbucks。但那些东西是在你购物时返现，或者让你看广告赚积分。它们的路径是“你主动做一件事，然后得到回报”。uwait 的路径是“你本来就在等，顺便做一件事，然后得到回报”。区别在于：前者需要你改变行为——你得记得去点返现链接，或者专门打开一个网站看广告。后者不需要你改变任何行为——你本来就要用 AI，你本来就要等。这个差异在“高频低价值”场景里特别重要。如果你每天用 AI 几十次，每次等 10 秒，一个月下来就是好几个小时的碎片时间。用 uwait，这些时间能变成几十美元。而用传统返现工具，你根本不会为了几毛钱去专门看广告。

当然，它也有明显的边界。首先，它只在你用 AI 的时候生效。如果你不用 AI，它就是个摆设。其次，任务的质量和数量取决于合作方的需求。如果某天没有任务，你就赚不到钱。另外，那些需要深度思考的 AI 任务——比如写长文、做复杂分析——等待时间可能很长，但任务窗口可能在你思考时弹出，反而干扰你。最合适的场景是那些“短等待、高频次”的 AI 使用：比如用 AI 翻译一句话、生成一个标题、搜索一个事实。这时候等待时间刚好够你点两下任务。

还有一个风险：隐私。uwait 需要知道你在用哪个 AI 工具、什么时候提交请求。它会不会读取你的输入内容？官方说不会，但这类工具天然让人不放心。如果你处理敏感信息，最好别用。

我认识一个做内容运营的朋友，每天用 AI 写几十条社交媒体文案。每条文案生成大概等 8 到 12 秒。他装了 uwait 之后，每天顺手点掉一百多个小任务，一个月多赚了 40 美元。他说最爽的不是那 40 美元，而是“终于不用盯着那个转圈圈发呆，感觉自己像个资本家，连 AI 的思考时间都要榨出油来”。

Product Huntsignal

Cloudflare Temporary Accounts

160 votes8 comments

你是一个独立开发者，周末想试一个新想法——用 AI agent 自动抓取某个电商网站的价格变动，然后发邮件通知你。你打开 Cloudflare Workers 的页面，准备写几行代码，结果第一步就卡住了：你得先注册一个 Cloudflare 账号，填邮箱、设密码、验证手机号，然后创建项目、绑定域名、配置 API 密钥。等你搞完这些，那股冲劲已经凉了一半。更烦的是，你只是想跑个实验，根本不想把个人信息绑在一个可能只用一次的项目上。

Cloudflare Temporary Accounts 就是冲着这个场景来的。它让你在用户注册之前，就能让 AI agent 直接部署和运行。具体怎么用？你作为开发者，在 Cloudflare 的界面里点一下“创建临时账户”，系统立刻生成一个独立的、有完整权限的临时环境——包括一个临时子域名、一组临时 API 密钥、一个可用的 Workers 运行时。你把这个临时账户的凭证直接塞给你的 AI agent，比如一个用 LangChain 写的爬虫 agent，它就能立刻登录、部署代码、开始跑任务。整个过程不需要你本人注册任何永久账号。临时账户有默认的存活时间，比如 24 小时，到期后自动销毁，所有数据、日志、密钥一并清除。

你可以把这个机制想象成酒店前台给访客发一张临时房卡。你不用办会员、不用交押金、不用填身份证，前台直接给你一张卡，告诉你“房间在 302，明天中午前退房”。你进去住一晚，第二天走人，卡自动失效。Cloudflare 的临时账户就是那张房卡——它给了 AI agent 一个临时的“房间”，让 agent 能进去干活，干完就走，不留痕迹。

对比一下主流的替代方案。AWS 的 Lambda 或者 Vercel 的 Edge Functions 也允许你快速部署代码，但它们的前提是你必须先有一个永久账号。AWS 甚至要求你绑定信用卡才能创建第一个函数。这条路的设计逻辑是“先建立信任，再提供服务”——你得证明你是谁，平台才敢给你资源。Cloudflare 选了另一条路：“先提供服务，再建立信任”。它赌的是，大多数临时使用场景不会造成破坏，而且临时账户的权限天然受限（比如不能访问持久化存储、不能修改 DNS 记录），风险可控。这种差异在什么场景下重要？当你是一个在黑客马拉松上现场写 demo 的开发者，或者是一个需要给客户做快速原型演示的售前工程师，或者是一个只想跑一次数据抓取的业余爱好者——这些场景里，注册流程的摩擦直接决定了你愿不愿意动手。

当然，临时账户不是万能的。它的边界很清楚：你不能用它跑生产环境，因为 24 小时后一切消失；你不能用它存储用户数据，因为临时环境没有持久化数据库；你也不能用它做需要长期身份绑定的操作，比如绑定信用卡、开通付费服务。如果你是一个需要长期维护 AI agent 的团队，临时账户反而会成为障碍——你每次都要重新配置环境、重新部署代码。它的真正战场是“试一下”这个动作：降低从想法到验证的门槛，让 agent 能在你决定注册之前就先跑起来。

想象一下，你坐在咖啡馆里，突然想到一个用 AI 自动回复客服邮件的点子。你打开笔记本，在 Cloudflare 的临时账户里粘贴了一段代码，创建了一个临时邮箱接收端点，然后把 agent 的 webhook 指向它。五分钟后，你往那个临时邮箱发了一封测试邮件，agent 自动回复了。你笑了笑，合上电脑，临时账户在第二天凌晨自动消失。你甚至没记住那个临时子域名是什么。这就是 Cloudflare Temporary Accounts 想创造的日常——让“先试试”变得比“先注册”更容易。

Product Huntsignal

AirJelly

127 votes9 comments

你打开电脑，桌面上有五个便签、三个待办清单、两个笔记软件、一个收藏夹、一个稍后阅读工具。你记得上周看到过一篇关于竞品定价的文章，但你不确定是存在 Notion 里、浏览器书签里、还是微信收藏里。你花了十五分钟翻来翻去，最后放弃了，重新搜了一遍。然后你发现，你其实已经存过那篇文章了，就在你昨天刚建的那个叫“临时”的文件夹里。这种场景你太熟了——信息越多，脑子越乱，越觉得自己记性差。但问题不是你的记性，是你没有一个能主动帮你整理的东西。

AirJelly 想解决的就是这个。它不是一个你主动去“记”的工具，而是一个你扔进去就行的容器。你往里面丢任何东西：网页链接、截图、语音备忘录、邮件、PDF、随手写的想法。它自己会读、会分类、会关联。你不需要给它建文件夹、打标签、设提醒。它自己会判断哪些东西重要，哪些东西需要你注意，然后主动推给你。比如你存了一篇关于“如何做用户访谈”的文章，三天后你收到一条推送：“你之前保存的用户访谈指南，和下周要做的客户调研相关，要不要看看？”它不是在等你问，它自己觉得该提醒你了。

工作流是这样的：你装好 AirJelly 的浏览器插件或者手机 App，看到任何有用的东西，一键保存。系统后台会做几件事——先 OCR 图片里的文字，再提取全文，然后用一个轻量的模型理解内容主题，再跟库里已有的所有内容做相似度匹配。如果发现新内容和旧内容有关联，它会自动建立链接。比如你保存了一份“定价策略”的 PDF，它发现你上周存过一篇“SaaS 定价模型”的博客，就会把这两份东西关联起来，生成一个叫“定价相关”的自动集合。你不需要手动操作，它自己长出了结构。输出端，它给你一个搜索框、一个时间线、一个“今天值得看”的卡片。它还能接你的日历和待办清单，比如你日历上有个“产品评审会”，它会在会前把相关的笔记、文章、历史记录整理成一个摘要推给你。

用一个比喻来说，AirJelly 像你雇了一个图书管理员，但这个管理员不是坐在前台等你来借书，而是每天在你办公室转一圈，看到你桌上堆了一堆文件，自己帮你分类、装订、贴上标签，然后放在你最容易拿到的地方。你甚至不用告诉他“把红色文件夹放左边”，他自己会判断。

现在市面上有很多“第二大脑”工具，比如 Notion、Obsidian、Roam Research。它们走的路是给你一个强大的编辑器，让你自己建结构、写链接、画图谱。你花大量时间在“整理”上——建数据库、设属性、写模板。AirJelly 选了另一条路：它替你干整理这件事。Notion 是给你一堆乐高，你自己拼房子；AirJelly 是给你一个自动组装机，你把砖块扔进去，它自己拼。差别在哪？如果你是一个喜欢手动整理、享受构建知识体系的人，Notion 会让你很爽。但如果你是一个每天被信息淹没、根本没时间整理的人，AirJelly 的“自组织”就很重要。比如你是一个产品经理，每天要读几十篇用户反馈、竞品动态、行业报告，你不可能每篇都手动分类。AirJelly 能让你只负责“存”，剩下的它来。

当然，代价也很清楚。自组织意味着你放弃了控制权。你不知道它怎么分类的，它可能把一篇关于“定价”的文章和一篇关于“用户留存”的文章关联起来，但你觉得它们不相关。你没法手动调整它的分类逻辑，至少目前看起来不行。如果你是一个对信息组织有强迫症的人，你会觉得它不够精确。另外，它依赖 AI 理解内容，如果内容很冷门、专业术语很多，或者语言不是主流语言，它的理解可能出错。还有一个风险：你把所有信息都扔进去，等于把知识管理完全托付给一个黑盒。如果它哪天服务挂了，或者你换平台，数据迁移可能很麻烦。它适合那些信息量大、但不需要精细分类的人，不适合那些需要严格知识图谱的研究者。

想象一下你是一个创业公司的运营负责人。你每天要盯十几个渠道的信息：行业新闻、竞品动态、用户反馈、内部文档。你以前的做法是每天花半小时手动整理，然后写一个简报给团队。用了 AirJelly 两周后，你发现每天早上打开手机，它已经给你生成了一份“今日简报”，里面有三条：一条是你昨晚保存的竞品融资新闻，关联了你之前存过的竞品分析报告；一条是用户反馈里提到的一个 bug，关联了你们的产品文档；还有一条是你上周收藏的一篇增长策略文章，它提醒你下周要开增长会。你只需要扫一眼，然后转发给对应的人。你甚至不需要打开任何笔记软件。这就是 AirJelly 想给你的日常。

Product Huntsignal

MediaSeg

120 votes19 comments

你刚录完一场两小时的团队复盘会，视频文件 4.2GB。你想把它发到 Slack 频道，结果拖进去转圈三分钟，最后弹出一行红字：“文件过大，最大支持 1GB。”你试压缩，画质糊成马赛克；你试分两段，得手动找时间点、用 QuickTime 剪、导出、重命名、再上传。搞完已经过了半小时，中间还因为导出格式不对被同事问“怎么打不开”。这不是你的错，是工具从来没认真对待过“上传”这件事。

MediaSeg 就是来解决这个的。你打开它，把那个 4.2GB 的 .mov 拖进窗口，输入你想切成的块大小——比如 900MB。它自动分析文件，在尽量不打断内容的地方（比如静音段或场景切换点）切开，输出几个命名清晰的片段，比如“复盘会_1.mov”“复盘会_2.mov”。然后你直接拖到 Slack 或 Google Drive 里，每个都小于 1GB，秒传。它不转码，不压缩，只做一件事：切。上下游接的就是你本地的 Finder 和你的上传目的地。

你可以把它想象成一个智能的切蛋糕刀。蛋糕太大，盘子装不下，你不需要把蛋糕烤小，也不需要把蛋糕压扁，只需要一把知道哪里是奶油层、哪里是水果层的刀，沿着自然缝隙切下去，每块刚好能放进盘子。MediaSeg 就是那把刀，它读的是媒体文件里的时间轴和音频波形，找到那些“这里可以断一下”的位置，而不是像普通分割器那样硬生生在 1 小时 23 分 15 秒处一刀切。

市面上有替代方案，比如 HandBrake 或 FFmpeg。HandBrake 的路径是“转码+压缩”，它把整个文件重新编码一遍，输出一个更小的文件。代价是耗时——4GB 文件转码可能要 20 分钟，而且画质损失明显。FFmpeg 更灵活，但你要记命令行参数，比如 `ffmpeg -i input.mp4 -ss 00:00:00 -t 00:30:00 -c copy output.mp4`，还得自己算时间点，切出来的片段可能正好卡在说话中间。MediaSeg 的路径是“智能分割+不转码”，它用 macOS 的底层媒体框架直接复制数据流，不重新编码，所以几秒就切完，画质零损失。这个差异在什么场景下重要？当你需要保留原始画质用于剪辑或存档，或者你赶时间、不想等转码的时候，MediaSeg 就是唯一合理的选择。

当然它也有边界。如果你的文件本身编码有问题或者损坏，任何分割工具都救不了。另外，它只做分割，不做压缩、格式转换、字幕嵌入。如果你需要把 4K 视频压成 1080p 发给客户，它帮不上忙。还有一个限制：它依赖 macOS 原生支持的媒体格式，如果你拿一个罕见的 .rmvb 或 .wmv，它可能认不出来。风险在于，如果你切的时候选了“按固定大小”而不是“按场景”，可能会在对话中间断开，但你可以手动调整切点——它提供了预览功能。

想象一下你是个播客制作人，刚录完一期 3 小时的访谈，原始文件 2.8GB。你要把前 30 分钟试听片段发到社交媒体，把完整版分三段上传到播客托管平台（每段限 1GB）。以前你得打开 Audacity，找到时间点，导出三段，再分别检查音量。现在你打开 MediaSeg，拖入文件，输入“每段 900MB”，它自动切出三段，文件名带时间戳。你直接把第二段拖到 Twitter 上，配一句“嘉宾在 1 小时 10 分讲了个重磅消息”，然后去喝咖啡。这就是 MediaSeg 想给你的日常。

Product Huntsignal

Clawd

113 votes15 comments

你正在查一个开源项目的文档，开了十几个标签页，GitHub 仓库、Stack Overflow 问答、官方 API 参考、一篇 Medium 教程。你来回切换，复制代码片段，记笔记，脑子像一团乱麻。突然想起刚才在某个页面看到过一个关键参数，但你忘了是哪个标签页，只能一个个点回去翻。这时候你多希望有个人能帮你记住所有上下文，在你需要的时候直接递过来。但你不敢用那些云端 AI 助手，因为你的浏览记录里可能包含公司内部代码、未公开的 API key、或者你不想让任何人知道的搜索历史。

Clawd 就是来解决这个问题的。它是一个 Chrome 扩展，装好之后你的浏览器里会多出一只小宠物——一个卡通形象，可能是只猫或者别的什么，具体长什么样不重要。重要的是，它一直在看着你。不是偷窥，而是像你桌面上的一只电子宠物，默默记录你当前在看什么、之前看过什么、哪些页面之间有联系。所有数据都留在你的电脑里，因为它的 AI 模型是 100% 本地运行的，不需要把任何信息发到云端。

怎么用呢？你正常浏览网页，Clawd 在后台分析页面内容。当你需要帮助时，比如你想总结当前页面、提取关键信息、或者问一个关于之前看过内容的问题，你直接点一下它，或者用快捷键呼出对话框。输入你的问题，比如“刚才那个仓库的安装命令是什么”，它就会从本地存储的上下文里找到答案，直接显示出来。它还能主动提醒你：当你打开一个跟之前某个页面相关的页面时，它会弹个小提示，说“你之前看过这个库的 issue，要不要回顾一下？”它不依赖任何外部 API，所有推理都在你的 CPU 或 GPU 上完成，用的是像 Llama 或 Phi 这样的小型本地模型。

你可以把它想象成一只坐在你肩膀上的小精灵。你工作的时候它不说话，只是看着。当你需要的时候，它凑到你耳边，递给你一张小纸条，上面写着刚才你漏掉的东西。它不会把你的话传给别人，因为它根本没有嘴巴往外说——所有数据都锁在你的电脑里。

跟市面上那些浏览器 AI 助手比，比如 Monica 或者 ChatGPT 侧边栏，它们走的是云端路线。你把问题发过去，它们调用大模型，返回结果。好处是模型能力强，能处理复杂推理。坏处是你得信任它们不会记录你的数据，而且每次都要联网，速度取决于网络。Clawd 选了另一条路：完全本地。这意味着它的模型能力肯定不如 GPT-4，但换来了绝对的隐私和离线可用。你在飞机上、地铁里、或者公司内网环境，它都能工作。而且它不需要你手动复制粘贴上下文——它自己看着你，知道你在做什么。这个差异在什么场景下重要？当你浏览的内容涉及敏感信息时，比如医疗记录、财务数据、公司内部代码，你不敢让任何云端服务碰。Clawd 就是为你这种人准备的。

当然，代价也很明显。本地模型的大小受限于你的电脑性能，所以它没法做长篇大论的写作，也没法理解非常复杂的逻辑。如果你需要写一份完整的市场分析报告，用它就像用自行车去拉货。它的真正战场是那些需要快速回顾、提取、关联信息的场景——你正在读一篇技术文章，突然想不起之前看过的某个概念，问它一句，它立刻告诉你。另外，它需要占用一定的本地计算资源，如果你的电脑本身就很卡，装它可能会让风扇转起来。

想象一下这个画面：你正在调试一个 bug，打开了 GitHub 上的一个 PR，里面有人提到了一个类似的 issue。你点进去看，然后 Clawd 的图标闪了一下，弹出一条消息：“这个 issue 的解决方案在你昨天打开的 Stack Overflow 回答里，需要我帮你打开吗？”你点了一下，它直接跳转到那个页面。你不需要回忆，不需要翻历史记录，甚至不需要中断当前的工作流。这就是 Clawd 想给你的日常。

GitHubhot newcomer

vercel/eve

162 forks2272 stars

你可以把 eve 想象成一个“代理工厂”。你不需要自己造螺丝、焊电路板、设计流水线。你只需要画一张图纸——用 TypeScript 写一个工作流定义——然后工厂自动帮你把代理组装好、测试通过、打包发货。图纸上写的是“如果 A 发生，就调用 B 工具，然后根据 C 结果决定下一步”，工厂负责把这句话变成真正能跑起来的代码。

和 LangChain 这类框架比，eve 走了一条完全不同的路。LangChain 给你一堆抽象概念——链、代理、记忆、工具——让你自己拼装。它像一盒乐高，零件很多，但你要自己看说明书、自己搭结构、自己保证拼出来的东西不会散架。eve 选择的是“给你一个固定的流水线，你只需要填业务逻辑”。它内置了沙箱执行、状态管理、错误重试和可观测性。这意味着什么？在 LangChain 里，你要自己写代码处理代理卡死、API 超时、状态丢失这些生产环境问题。在 eve 里，这些是框架默认提供的。如果你只是做个原型，LangChain 够用。但如果你要把代理部署到线上，每天处理几百个真实请求，eve 的沙箱和错误恢复机制就变得很重要。

当然，eve 不是万能的。它目前有 70 个开放 issue，说明还在快速迭代中。如果你只是想做一个简单的问答机器人，用 eve 就像用货车去买菜——能装，但没必要。它的真正战场是那些需要长期运行、涉及多个步骤、需要安全隔离的生产级代理。比如一个自动处理 GitHub issue 的代理：它要读取 issue 内容，调用 OpenAI 分类，然后根据分类结果打标签、分配负责人、回复评论。这个流程涉及多个 API 调用、状态切换和错误处理，用 eve 的沙箱和工作流定义来管理，比你自己写一堆回调函数要靠谱得多。

还有一个代价：eve 目前只支持 TypeScript。如果你团队的主力语言是 Python，那它暂时不适合你。另外，它深度绑定 Vercel 生态——虽然你可以自己部署，但默认的部署路径就是 Vercel。如果你已经用了 AWS 或 GCP，迁移成本需要考虑。

说个具体的场景。你是一个开源项目的维护者，每天有几十个 issue 涌入。你写了一个 eve 工作流：当新 issue 创建时，代理读取内容，调用 OpenAI 判断是 bug、feature 还是 question，然后自动打标签、分配负责人、回复一条模板消息。你把它部署到 Vercel，设置一个 GitHub webhook 触发。第二天早上，你打开 GitHub，发现 47 个 issue 已经被自动分类，其中 3 个 bug 被标为高优先级，2 个重复 issue 被自动关闭。你只需要处理那 3 个高优先级的 bug，剩下的时间可以写代码。这就是 eve 想创造的日常——不是让你写更少的代码，而是让你写的每一行代码都真正在解决业务问题，而不是在搭架子。

GitHubhot newcomer

BuilderIO/skills

130 forks2451 stars

agent-native.com

你是一个前端开发者，正在用 Cursor 或 Copilot 写一个 React 组件。你输入“帮我写一个带搜索和分页的用户列表”，AI 生成了代码，但样式不对，分页逻辑有 bug，而且它不知道你用的是 Tailwind 还是 Ant Design。你花十分钟改 prompt：“用 Tailwind，分页用 usePagination hook，列表数据从 /api/users 拿”。AI 这次对了，但下次你让它写一个“带拖拽排序的表格”，它又忘了你的技术栈偏好。你开始怀疑：这 AI 是不是每次都在“重新学习”怎么干活？

Skills 就是来解决这个问题的。它是一个给编码代理用的“技能库”，由 BuilderIO 开源，发布 12 天就拿到了 2451 颗星。它的思路很简单：把 AI 能做的事拆成一个个独立的“技能”，每个技能是一个 JavaScript 模块，定义了输入、输出、上下文和调用方式。你不需要写复杂的 prompt，只需要告诉 AI“用这个技能”，它就知道怎么处理。

具体怎么用？假设你是一个团队的技术负责人，你们用 Cursor 写代码，但每次让 AI 生成 API 接口文档，它都格式不对。你可以创建一个“生成 API 文档”的技能：输入是路由文件路径和注释，输出是 Markdown 格式的文档，上下文里绑定了你们团队的文档模板和字段规范。然后把这个技能注册到 Skills 库里。下次你的队友在 Cursor 里输入“给 /users 路由生成文档”，AI 会自动加载这个技能，按你的模板输出，不用再反复调教。Skills 本身不跑代码，它只是一个“技能描述”的仓库，真正的执行靠 Cursor、Copilot 这类编码代理去调用。上下游接的是你的编辑器、你的代码仓库、你的文档系统。

你可以把 Skills 想象成给 AI 助手装上的“外挂插件”。就像游戏里的角色，基础能力是走路、攻击、跳跃，但装上“火焰剑”插件就能放火，装上“飞行背包”就能上天。Skills 就是这些插件，每个插件教会 AI 一个特定领域的“绝活”。没有 Skills，AI 就像一个只会基础动作的裸装角色，每次遇到新任务都要从零学起。

对比一下 OpenAI 的 Function Calling。OpenAI 的路径是“让 AI 学会调用你定义的函数”，你需要写函数签名、参数、返回值，然后 AI 在对话里决定要不要调用。这条路的问题是：函数是死的，AI 只能按你写好的逻辑执行，不能自己“学会”新函数。Skills 的路径是“让 AI 学会使用你定义的技能”，技能本身可以包含上下文、示例、甚至子技能，AI 可以组合多个技能完成复杂任务。差异在哪？Function Calling 适合“执行一个确定操作”，比如“调用 sendEmail 函数发邮件”；Skills 适合“完成一个不确定流程”，比如“根据用户反馈和代码历史，自动生成修复方案”。如果你的场景是固定的、重复的，Function Calling 够用；如果你的场景是变化的、需要 AI 自己判断的，Skills 更灵活。

但 Skills 不是万能药。它的代价是：你需要花时间写技能定义，而且技能的质量直接决定 AI 的表现。如果你写的技能描述模糊、示例太少，AI 可能用错或不用。另外，Skills 目前依赖编码代理去加载，如果你的编辑器不支持 Skills 协议，它就是个空架子。目前 Skills 的生态还在早期，只有 BuilderIO 自家的 Agent Native 平台原生支持，其他工具需要手动集成。还有一个风险：技能是公开的，你写的技能可能被别人看到或修改，虽然 MIT 许可证允许，但如果你有商业机密，得自己托管私有版本。

想象一下这个场景：你的团队新来了一个实习生，他第一次用 Cursor 写代码。他输入“帮我修复这个 CSS 布局问题”，AI 自动加载了“CSS 修复技能”，这个技能包含了你们项目里所有常见的布局模式、浏览器兼容性处理、以及你们团队偏好的 Flexbox 写法。AI 不仅修复了问题，还加上了注释说明为什么这么改。实习生看了一眼，说：“这 AI 怎么这么懂我们？”他不知道，是你们团队的技术负责人提前写好了那个技能，放在 Skills 库里。

GitHubhot newcomer

sums001/Windows-Copilot-API

119 forks342 stars

Windows-Copilot-API 就是给这种处境的人准备的。它本质上是一个 Python 写的本地服务，你把它跑起来之后，它会监听一个端口，比如 localhost:5000。然后你只需要像调用 OpenAI 的 API 一样，发一个 POST 请求过去，带上你的消息，它就会返回 GPT-4 或 GPT-5 的回复。你不需要去微软注册任何东西，不需要申请任何密钥，甚至不需要知道 Windows Copilot 是什么。你只需要在代码里把 API 地址改成 localhost，其他一切照旧。它背后做的事情是：拦截你的请求，通过反向工程的手段，跟微软的 Windows Copilot 服务通信，拿到结果再返回给你。你的上游是你自己的代码或工具，下游是微软的 Copilot 服务器，中间这个 API 就是翻译官和快递员。

你可以把它想象成一条从你家后院挖到微软后厨的地道。别人要进微软的餐厅吃饭，得先买票、排队、出示身份证。你不需要，你直接从地道钻进去，在后厨拿一份菜就走。这条地道就是 Windows-Copilot-API，它帮你绕过了所有前台手续，直接拿到了后厨的食材。

跟 OpenAI 官方 API 比，这条路完全不同。OpenAI 走的是正规军路线：你要注册、付费、遵守使用条款，换来的是稳定的服务、明确的 SLA、以及随时可以找客服。Windows-Copilot-API 走的是游击队路线：免费、无需注册、即开即用，但代价是你完全依赖微软的 Windows Copilot 服务是否稳定、是否改接口、是否封杀这种用法。OpenAI 的 API 适合做商业产品，你可以在上面跑用户数据，出了问题有人负责。Windows-Copilot-API 适合做个人实验、快速原型、或者预算为零的项目。如果你只是想验证一个想法，花 5 分钟搭起来跑一下，它比任何官方方案都快。

但代价也很清楚。第一，它依赖 Windows Copilot 这个服务，微软随时可能更新协议或接口，导致这个工具失效。第二，它没有官方支持，出了问题你只能去 GitHub 提 issue，而作者 sums001 只有一个人，项目才 3 天，342 个 star，119 个 fork，还挂着 1 个 open issue。第三，它可能违反微软的服务条款，你用它跑商业项目，风险自己扛。第四，它只支持文本对话，不能处理图片、文件、或者流式输出，功能比官方 API 少得多。如果你需要稳定、合规、全功能，别碰它。如果你只是想花 10 分钟让 GPT-4 帮你写一段代码，或者测试一个 prompt，它可能是你见过最爽的工具。

想象一下，你周五晚上坐在电脑前，想试试 GPT-5 写诗的能力。你打开终端，pip install 几个依赖，python run.py，然后打开另一个终端，curl 过去一句“写一首关于程序员失眠的诗”。几秒钟后，终端里跳出一段文字，押韵、有画面、还带点自嘲。你没有注册任何账号，没有绑定任何信用卡，没有等任何审批。你只是跑了一个开源项目，就拿到了微软最新模型的能力。这就是 Windows-Copilot-API 给你的体验。

GitHubtrending growth

atlassian/atlassian-mcp-server

98 forks794 stars

atlassian.com

想象一下周一早上九点，你坐在工位上，面前是三个浏览器标签页：Jira 里 47 个待办任务，Confluence 里 12 篇需要审阅的文档，还有 Slack 里产品经理催你更新 Sprint 进度的消息。你开始手动复制粘贴：把 Jira 的任务标题和状态复制到 Confluence 的周报模板里，再打开另一个页面查某个需求的原始讨论记录，然后切回 Slack 回复“进度正常”。这个过程你每周重复一次，每次花掉四十分钟。更烦的是，你想让 AI 帮你干这事，但你的公司不允许把 Jira 数据喂给 ChatGPT——合规部门盯着呢。

Atlassian MCP Server 就是来解决这个尴尬的。它是一个跑在远程的服务器，专门负责在 AI 和你的 Atlassian 工具之间当翻译和保安。你不需要把 Jira 或 Confluence 的数据导出、复制、粘贴到任何第三方 AI 平台。你只需要让你的 AI 助手——比如你 IDE 里的 Copilot、你 Slack 里的 bot、或者你自建的 agent——通过 MCP 协议连上这个服务器。然后你就可以用自然语言说：“帮我查一下这个 Sprint 里所有状态是‘进行中’的任务，按优先级排序，然后总结成一段话。”服务器收到指令后，会用你的身份凭证去 Jira 查询，把结果格式化，再安全地返回给你的 AI。整个过程，你的数据没有离开 Atlassian 的围墙。

它的工作流很直接。谁用它？主要是开发者和产品经理，但也可以是任何需要频繁从 Jira 和 Confluence 拉数据的人。输入是你对 AI 说的一句话，比如“把昨天 Confluence 上更新的文档标题列出来”。系统先通过 MCP 协议解析你的意图，然后服务器端用 OAuth 验证你的身份，再调用 Jira 或 Confluence 的 REST API。输出是结构化的数据——JSON、Markdown、或者直接是 AI 帮你整理好的摘要。上下游接什么？上游是你的 LLM、IDE 或者 agent 平台，下游是 Atlassian 的云服务。它不存数据，只做实时查询。

你可以把它想象成一个外交官。你（AI 助手）想进 Jira 和 Confluence 这两个国家办事，但你不能直接闯进去翻文件，因为你不懂当地语言，也没有签证。这个 MCP 服务器就是你的外交官，它懂两边的语言，持有合法的通行证，每次你提出请求，它帮你翻译、递交、取回结果。它不会把整个国家的档案库搬出来给你，只会给你你要的那一份文件。

对比一下直接让 AI 调用 Jira API 的方案。很多团队自己写脚本，让 AI 直接调 Jira 的 REST API。这条路的问题是：你得自己管理 API 密钥、处理认证过期、写错误重试逻辑，还得确保 AI 不会乱发请求——比如不小心删掉一个任务。Atlassian 的 MCP 服务器选择了另一条路：它把所有这些脏活封装好，并且加了一层安全控制。你不需要在 AI 的 prompt 里写 API 密钥，不需要担心 AI 误操作，因为服务器只允许读操作和有限制的写操作（比如更新任务状态）。这个差异在团队协作场景下特别重要。当你让一个共享的 AI bot 去查项目进度时，你不想它因为某个人的 prompt 写错了，就把整个 Sprint 的任务全删了。

当然，它也有边界。如果你的团队只有三个人，Jira 里只有二十个任务，你手动复制粘贴可能更快。这个工具的价值在于规模——当你有几百个任务、几十个文档、每周要出报告时，它才值得你花时间配置。另外，它依赖网络和 Atlassian 的云服务，如果你的公司用的是自托管的 Jira 数据中心版，这个远程 MCP 服务器可能连不上。还有，它目前有 76 个 open issues，说明还在迭代中，不是每个边缘情况都处理好了。如果你需要 AI 做复杂的跨项目关联分析，比如“找出所有被阻塞的任务并关联到对应的 Confluence 设计文档”，它可能做不到，因为 MCP 协议本身对多步骤推理的支持还在完善。

说个具体的场景。你是一个后端工程师，正在 IDE 里写代码。你的同事在 Slack 里@你，说“那个用户登录的 bug 修好了吗？对应的 Jira 任务更新一下状态”。你不想切出编辑器，于是你打开 Copilot 的聊天窗口，输入：“把 JIRA-1234 的状态改成‘已修复’，并在 Confluence 的‘发布检查清单’文档里，把‘登录模块’这一项勾上。”Copilot 通过 MCP 服务器，用你的账号执行了这两个操作。三十秒后，Slack 里同事回了一句“看到了，谢谢”。你没离开过代码编辑器，没打开过一个浏览器标签页。

今日值得看：Agent 37 Cloud

Agent 37 Cloud 是今天最值得先看的信号。Agent 37 Cloud 是一个让企业给每个客户分配一个专属 AI agent 的平台，每个 agent 独立运行、独立配置、独立权限。

今日 Brief

产品侧可以先看 Agent 37 Cloud：Agent 37 Cloud 是一个让企业给每个客户分配一个专属 AI agent 的平台，每个 agent 独立运行、独立配置、独立权限。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

Agent 37 Cloud

349 votes24 comments

来源：Product Hunt

你是一家 SaaS 公司的客户成功负责人，手上有 200 个企业客户。每个客户都有自己的数据、自己的业务流程、自己的审批规则。你接入了 ChatGPT 的 API，做了一个统一的客服机器人，放在所有客户的群里。结果呢？客户 A 问“帮我查一下上个月的账单”，机器人调了客户 B 的数据，因为权限没隔离。客户 C 说“按我的规则自动退款”，机器人说“我没有权限”。你每天花两个小时手动给每个客户建一个单独的 Slack 应用，配置不同的 API Key，写不同的 prompt。200 个客户，200 个 bot，200 套维护脚本。你累，客户也烦。

Agent 37 Cloud 就是来解决这个问题的。它的核心想法很简单：给每个客户一个自己的 agent，而不是让所有客户共用同一个。你作为开发者，在 Agent 37 Cloud 的后台创建一个 agent 模板，然后为每个客户实例化一个独立的 agent。这个 agent 有自己的身份、自己的存储、自己的工具权限。客户可以在自己的系统里直接跟它对话，或者通过 API 调用它。输入是客户的问题或指令，系统根据这个客户专属的配置去调用对应的工具——比如查这个客户的 CRM、操作这个客户的 Stripe、读取这个客户的数据库。输出是直接执行结果或回答。上下游接的是你现有的系统：Zendesk、Salesforce、Slack、Teams，或者你自己的后端 API。每个 agent 就像是一个只服务于一个客户的虚拟员工，它只认这个客户的数据和规则。

你可以把它想象成酒店里的每个房间都有一个专属管家，而不是前台统一接电话。管家认识你，知道你喜欢什么温度、几点吃早餐、要不要叫醒服务。前台只能回答“房间号多少？”，然后转接。Agent 37 Cloud 做的就是让每个客户拥有一个只认识自己的管家，而不是一个对所有客人都说“请稍等”的总机。

对比一下你现在的替代方案。你可能会用 Intercom 的 Fin AI，或者 Zendesk 的 Answer Bot。这些产品走的是“统一模型 + 权限过滤”的路线：所有客户共享同一个 AI 模型，但通过权限系统限制数据访问。听起来合理，但实际跑起来你会发现，权限配置复杂得要命，而且模型本身没有“客户意识”——它不知道自己在跟谁说话，只能靠上下文 token 里塞客户 ID。一旦上下文超长或者用户切换了话题，它就忘了。Agent 37 Cloud 走的是“每个客户一个独立 agent”的路线，每个 agent 有自己的长期记忆、自己的工具链、自己的 prompt 模板。代价是你要管理更多的 agent 实例，但换来的是每个客户体验上的绝对隔离和一致性。在客户数量少但每个客户价值高、规则复杂的场景里，这条路明显更靠谱。

当然，代价也很清楚。如果你只有 10 个客户，每个客户的需求都很简单，用统一的 bot 加权限过滤就够了。Agent 37 Cloud 的独立 agent 模式会带来额外的运维成本：你要为每个客户部署、更新、监控一个 agent。而且 agent 之间的数据完全隔离，意味着你不能做跨客户的分析或知识共享。如果你的业务需要从所有客户的数据中学习，比如训练一个通用的推荐模型，那每个客户独立 agent 反而成了障碍。另外，Hermes 和 OpenClaw 本身是开源框架，Agent 37 Cloud 相当于帮你托管和编排这些 agent，但如果你有很强的工程团队，自己用 Kubernetes 跑 OpenClaw 也能实现类似效果，只是要花时间。

想象一下三个月后的一个早上。你打开 Agent 37 Cloud 的后台，看到客户 D 的 agent 昨晚自动处理了 23 个退款请求，全部符合客户 D 的规则，只有一笔超过 5000 美元的被标记出来等你确认。客户 E 的 agent 在凌晨三点检测到客户 E 的服务器 CPU 飙升，自动调用了客户 E 的 AWS 账号重启了实例，然后发了一条消息到客户 E 的 Slack：“已处理，日志在这里。”你什么都没做，但每个客户都觉得你给他们配了一个 24 小时在线的专属助手。这就是 Agent 37 Cloud 想让你做到的日常。

Editor's Pick

affaan-m/ECC

33608 forks219312 stars

来源：GitHub

你正在用 Claude Code 重构一个老项目。你输入“把用户模块的验证逻辑抽出来”，它开始改文件。三分钟后，它改了五个文件，但有两个地方用了你三个月前废弃的变量名，一个地方直接访问了生产环境的数据库配置。你不得不停下来，一条条检查它的改动，然后手动回滚，再重新描述一遍上下文。这不是 AI 不行，是你和它之间缺了一个“翻译官”——一个能告诉 AI 你的项目有什么规矩、什么不能碰、什么该记住的系统。这就是 ECC 想干的事。

ECC 的全称是“agent harness performance optimization system”，但你可以把它理解成一个给 AI 编码助手配的“外挂大脑”。你平时用 Claude Code、Codex、Cursor 这些工具写代码，它们本身很聪明，但每次对话都是“失忆”的——它们不知道你项目的代码风格、不知道哪些文件是敏感配置、不知道你之前踩过什么坑。ECC 就是来解决这个问题的。你把它装进你的开发环境，它就像给 AI 配了一个私人助理，负责记住你的项目习惯、管理它能访问的文件范围、甚至预判它下一步可能犯的错。

具体怎么用？你是一个开发者，你打开终端，启动 Claude Code，然后告诉它“帮我写一个用户注册的 API”。正常情况下，Claude Code 会直接开始写，但有了 ECC，它会先问 ECC 要“技能”——比如你项目里常用的错误处理模式、数据库连接方式、API 响应格式。ECC 从它维护的“技能库”里调出这些规则，注入到 Claude Code 的上下文里。同时，ECC 会检查 Claude Code 要访问的文件，如果它想读 `config/production.json`，ECC 会拦住它，因为你在 ECC 里设过“生产配置只读”。如果 Claude Code 写了一段代码，ECC 还会用它的“直觉”机制判断这段代码是不是和你项目里已有的代码风格一致，不一致就标出来。整个过程，你只需要在第一次配置时告诉 ECC 你的项目规则，之后它自动运行。

你可以把 ECC 想象成一个“机场塔台”。AI 编码助手是飞机，它知道怎么飞，但不知道机场的跑道在哪、哪条航线有禁飞区、哪个停机位是空的。ECC 就是那个塔台，它告诉飞机：跑道 27 可用，别飞过那片云，停机位 3 已经有人了。没有塔台，飞机也能飞，但容易撞机、误入禁区、浪费燃油。有了塔台，每架飞机都能安全、高效地完成自己的任务。

和直接使用 Claude Code 或 Codex 的默认设置相比，ECC 走了一条完全不同的路。默认设置下，这些 AI 工具是“裸奔”的——它们有强大的语言理解能力，但没有任何项目级别的约束和记忆。你每次对话都要重新描述上下文，每次都要祈祷它别乱改文件。ECC 选择给 AI 加一层“安全带”和“导航仪”。这带来的能力差异很明显：在简单项目里，比如一个只有三个文件的 Python 脚本，默认设置够用了，你不需要 ECC。但在一个 50 万行代码、有多个微服务、有严格安全规范的项目里，没有 ECC，你每让 AI 改一次代码，都要花 10 分钟检查它有没有越界。有了 ECC，你只需要看它标记出来的异常，剩下的它自己搞定。

当然，ECC 不是万能的。它不适合那些你只想“问个问题”的场景——比如你只是想查一下某个函数的用法，不需要 AI 改代码。这时候装 ECC 就像用卡车去买菜，太重了。它的代价也很明显：你需要花时间配置规则，告诉它哪些文件能碰、哪些模式是好的。如果你的项目每天都在剧烈变化，规则也要跟着改，维护成本不低。另外，ECC 目前主要支持 Claude Code、Codex、Cursor 这些工具，如果你用的是其他小众 AI 编码助手，可能用不了。还有，它本身是一个开源项目，有 54 个 open issues，说明还在快速迭代，可能会有 bug 或者兼容性问题。

想象一下你接手了一个新项目，代码乱得像一团麻。你装上 ECC，花半小时配置了规则：告诉它“不要碰 `vendor` 目录”、“所有 API 返回格式必须带 `code` 和 `message`”、“数据库查询必须用 ORM”。然后你打开 Claude Code，输入“把用户列表接口改成分页”。Claude Code 开始写，ECC 在后台实时检查。三秒后，Claude Code 输出了一段代码，ECC 在旁边标注：“这段代码访问了 `vendor` 目录，已拦截。建议改用 `app/Http/Controllers` 下的已有分页函数。”你点了一下“采纳建议”，Claude Code 自动重写。整个过程你只花了 30 秒，而不是像以前一样花 10 分钟检查它有没有乱改东西。这就是 ECC 想给你的日常。

Editor's Pick

Atomic Mail Agentic

204 votes9 comments

来源：Product Hunt

你是一个创业者，公司刚融了天使轮，团队五个人，你负责销售、客服、运营，还兼着写周报。每天早上你打开邮箱，看到 200 封未读邮件，其中 50 封是客户咨询，30 封是订阅确认，20 封是退款请求，剩下的是垃圾邮件和 newsletter。你一封一封点开，回复“感谢您的订阅”，手动标记“已处理”，把退款申请转发给财务。这个过程每天花你两个小时，而且你永远不知道哪封邮件其实需要你亲自回复——比如一个客户在邮件里抱怨产品 bug，但你把它当成了普通咨询，只回了句“稍后联系”。两个月后，那个客户在 Twitter 上骂你，你才意识到错过了什么。

Atomic Mail Agentic 就是来解决这个问题的。它不是一个帮你写邮件的 AI，而是一个能替你“处理”邮件的 AI。你只需要在后台设置规则：哪些邮件自动回复，哪些邮件标记给谁，哪些邮件直接执行操作。比如，你告诉它“所有包含‘取消订阅’的邮件，自动回复确认链接并标记为已处理”；“所有来自 VIP 客户的邮件，转发到我手机并标红”；“所有退款请求，提取金额和原因，生成表格发到 Slack”。然后，这个 AI 代理就开始工作了。它登录你的邮箱，读取每一封新邮件，理解内容，判断意图，然后执行你设定的动作。它不需要你每封都看，也不需要你手动点“发送”。它自己读、自己判断、自己回复、自己记录。上下游接什么？它接你的邮箱（Gmail、Outlook），接你的 CRM（比如 HubSpot），接你的 Slack 或 Teams。你只需要在后台配一次，剩下的交给它。

用一个比喻来说，它就像一个 24 小时在岗的邮件助理，但这个助理不是坐在你旁边等你吩咐，而是你给了它一本操作手册，它自己翻、自己干。你早上到公司，它已经把该回的回了，该转的转了，该标记的标记了，你只需要扫一眼异常。

和竞品比，差别很明显。比如 Gmail 自带的智能回复，它只能给你三个选项让你选，你还是要手动点。Zapier 的邮件自动化，能帮你转发、归档，但它只能基于关键词和发件人做简单判断，理解不了“这个客户在抱怨，但语气很客气，可能只是需要安抚”这种复杂情况。Atomic Mail Agentic 走的是另一条路：它用大语言模型理解邮件内容，而不是靠规则匹配。这意味着它能处理“客户说‘我考虑一下’但其实是想要折扣”这种模糊场景。能力差异在哪？在需要理解上下文的时候。比如，一个客户连续发了三封邮件，第一封问价格，第二封说太贵，第三封说“算了”。传统工具只能分别处理，但 Atomic Mail Agentic 能看出这是一个完整的对话，自动给出一个综合回复。这个场景对客服团队来说很重要，因为客户体验往往取决于你是否理解了他的完整意图。

当然，它也有边界和代价。首先，它需要你花时间设置规则。如果你连规则都不想写，那它对你没用。其次，它依赖 AI 的判断，而 AI 有时候会误读。比如，一封邮件里写着“我恨你们的产品”，它可能当成投诉自动回复道歉，但客户其实是在开玩笑。这种误判在客服场景里可能引发更大的问题。另外，它只能处理规则明确的邮件。如果你的业务高度定制化，每封邮件都需要你亲自判断，那用它就像用自动售货机买定制西装——不合适。风险在于，如果你把退款权限给了它，它可能误操作，比如给一个不该退的客户退了款。所以，你最好先从小范围开始，比如只让它处理订阅确认和常见问题，等信任建立了再扩大范围。

用起来什么样？想象一下，你是一个电商客服主管，每天要处理 500 封邮件。你用了 Atomic Mail Agentic，设置了三类规则：自动回复常见问题、标记 VIP 客户、提取退款信息。第一天，你早上打开邮箱，发现 AI 已经处理了 400 封，剩下 100 封需要你亲自看。你扫了一眼，发现其中 80 封是 AI 标记的“可能需人工处理”，20 封是它不确定的。你花了 30 分钟处理完，剩下的时间用来优化规则。一周后，你发现 AI 的准确率越来越高，需要你亲自处理的邮件降到了 50 封。你开始把更多权限交给它，比如让它直接处理小额退款。一个月后，你几乎不用看邮箱了，每天早上 AI 给你发一份摘要：“今天处理了 300 封邮件，其中 280 封自动回复，15 封标记给你，5 封需要你确认退款。”你花 10 分钟看完，然后去干真正重要的事——比如改进产品。

Editor's Pick

Grok by SpaceXAI for Word

176 votes10 comments

来源：Product Hunt

你正在写一份季度汇报，第三段怎么读都不对劲。你删了又写，写了又删，最后打开浏览器，登录 ChatGPT，把那段话贴进去，打一句“帮我改得更简洁”，等几秒，复制结果，切回 Word，粘贴，然后发现格式乱了，字体变了，还得手动调。整个过程花了三分钟，而你只是改了一个段落。如果今天要改十段，半小时就没了。更烦的是，你根本不想离开 Word——你所有的上下文、排版、思路都在那个文档里，每次切出去都像被拽出状态。

Grok for Word 就是冲着这个场景来的。它不是一个独立的写作工具，也不是一个需要你复制粘贴的网页服务。它直接住在 Word 的右侧面板里。你选中一段文字，点一下“精简”，它就在面板里给出几个版本，你挑一个，点一下，原文就被替换了。你也可以让它“重写”或者“扩写”，甚至直接告诉它“改成更正式的语气”或者“像在跟投资人说话”。整个过程你不需要离开 Word，不需要复制粘贴，不需要担心格式丢失。

谁在用这个？任何一个靠 Word 写东西的人——市场文案、产品经理、咨询顾问、学生、律师助理。输入就是你选中的那段文字，系统怎么处理？它把文字发给背后的语言模型，根据你选的指令（精简、重写、扩写、改语气）生成新版本。输出就是几个候选文本，你点击替换。上下游接什么？它只接 Word，不接 Slack，不接 Notion，不接浏览器。它就是一个 Word 插件，专一得有点偏执。

你可以把它想象成一个坐在你旁边的文字编辑，你指一段话，他看一眼，然后说“我帮你改三个版本，你挑一个”。他不问你要背景，不跟你开会，不打断你的思路，你只需要点头或摇头。

市面上已经有 Grammarly 和 Microsoft Editor 这类工具。它们走的是另一条路：实时检测语法错误、拼写问题、标点符号，然后在你打字的时候画红线提醒。它们像是一个严格的语文老师，盯着你写每一个字，随时纠正。Grok 不干这个。它不关心你拼写对不对，它关心你这段话是不是太啰嗦、语气是不是不对、结构是不是可以更好。Grammarly 适合写邮件、写短句、写正式文书，但当你需要把一个冗长的产品描述压缩成三句话，或者把一段技术文档改得让客户看懂，Grammarly 帮不上忙。Grok 的战场是“改”，不是“纠”。

代价也很清楚。它依赖云端 AI，所以没网络的时候用不了。它改出来的文字可能偏离你的原意——尤其是专业术语或者内部黑话，AI 可能会自作主张换成更通用的词，结果意思变了。如果你在写法律合同、医疗报告、技术规格书，这种“改写”风险很高，你不敢直接点替换，必须逐字核对，那还不如自己写。另外，它只支持 Word，如果你主要用 Google Docs 或者 Notion，它对你没用。

想象一下这个场景：你是一个产品经理，正在写新功能的发布说明。你写了一段：“我们很高兴地宣布，经过团队几个月的努力，现在用户可以在设置页面找到一个新的开关，开启后系统会自动根据你的使用习惯推荐相关内容。”你读了一遍，觉得太啰嗦。你选中这段话，在 Grok 面板里点“精简”，它立刻给出三个版本。第一个：“新功能上线：开启设置中的‘智能推荐’，系统会根据你的使用习惯自动推荐内容。”你扫了一眼，觉得不错，点了一下，原文被替换。你继续写下一段，整个过程不到十秒。这就是 Grok 想给你的日常。

Editor's Pick

Backgrind

167 votes11 comments

来源：Product Hunt

你打开电脑，桌面上摊着三个窗口：左边是 Excel 表格，中间是某个 SaaS 后台，右边是 Chrome 浏览器。你要做的事很简单——把 Excel 里的一列客户编号，一个一个复制到 SaaS 后台的搜索框里，查状态，再把结果填回 Excel 的对应列。一共 200 行。你深吸一口气，开始机械地复制、粘贴、等待、复制、粘贴。手指酸了，眼睛花了，第 47 行的时候你复制错了编号，查出来的结果全乱套，你骂了一句，从头再来。这不是你一个人的日常。任何需要跨应用重复操作的工作——客服录入、财务对账、游戏里刷日常任务——都长这样。你明明知道电脑能做，但你就是找不到一个工具能“看”懂屏幕上的按钮和输入框，然后替你把手指动起来。

Backgrind 就是冲着这个来的。它不挑应用，不挑界面，甚至不挑游戏。你告诉它你要做什么，它自己看屏幕，自己找按钮，自己点。具体怎么用？你先打开目标应用——比如那个 SaaS 后台，或者《原神》的日常任务界面。然后你在 Backgrind 里描述任务：“把左边表格里每一行的订单号，粘贴到搜索框，点查询，把结果里的金额复制到右边表格。” 它不需要 API，不需要插件，不需要开发者给你写脚本。它直接看你的屏幕截图，识别出搜索框在哪、按钮长什么样、表格的单元格怎么定位。然后它开始模拟鼠标移动和键盘输入，就像你亲手操作一样。做完之后，它把结果写回你指定的位置，或者直接弹个通知告诉你“搞定了”。上下游？它不接任何系统，它只接你的屏幕和你的手。

你可以把它想象成一个“看得见屏幕的机器人手指”。传统自动化工具像 RPA，需要你教它“点击坐标 (x,y)”，一旦窗口大小变了、按钮位置挪了，它就废了。Backgrind 用的是视觉——它像人一样看屏幕，认出“那个蓝色的‘提交’按钮”，而不是记住它的像素位置。所以窗口可以缩放，按钮可以换皮肤，它依然能找到。这就像你让一个实习生去操作电脑，你不教他快捷键，只告诉他“点那个绿色的按钮”，他能自己找到。

和同类工具比，比如 UiPath 或者 Keyboard Maestro，它们走的是“录制回放”或“API 对接”的路。录制回放的问题是脆弱——录的时候窗口在左上角，下次打开在右下角，脚本就偏了。API 对接的问题是门槛高——你得有权限、有文档、会写代码。Backgrind 选了一条更笨但更通用的路：用 AI 视觉理解界面。代价是它慢一点，因为每次操作前要截图、识别、决策；而且对高度动态的界面（比如 3D 游戏里快速移动的按钮）可能识别不准。但好处是，你不需要任何技术背景，只要会描述任务，它就能干活。

当然，它也有明显的边界。如果你的应用是纯命令行终端，没有图形界面，Backgrind 就没什么用——它依赖视觉。如果你的任务需要极低的延迟，比如毫秒级的游戏操作，它可能跟不上。另外，它需要访问你的屏幕和鼠标键盘，安全风险你得自己掂量——别让它登录你的银行账户然后离开座位。还有一个限制：它目前只能处理“看得见”的操作，如果某个按钮需要先悬停才能出现，它可能得额外学一下。但总的来说，对于那种“重复、枯燥、但规则明确”的桌面操作，它是个不错的替代方案。

我认识一个做游戏代练的朋友，他每天要手动登录 20 个账号，每个账号做一遍日常任务，领奖励，下线。以前他雇了两个人轮班，每个月工资 6000 块。他试过用 AutoHotkey 写脚本，但游戏一更新，界面按钮位置变了，脚本就废了。后来他装了 Backgrind，对着游戏录了一遍操作，然后告诉它“每天凌晨 3 点，按这个顺序跑一遍”。第一个晚上他有点紧张，怕被封号。第二天早上他打开电脑，看到 20 个账号全部完成了日常，奖励已领取，截图存在文件夹里。他愣了几秒，然后取消了那两个人的排班。

Editor's Pick

oioi

152 votes16 comments

来源：Product Hunt

你正在写一封重要的邮件，里面需要引用一段上周从某个网页复制过的客户反馈。你记得那段话的大概意思，但具体措辞记不清了。你打开浏览器，翻历史记录，找到那个页面，重新加载，滚动，复制——结果发现页面已经更新了，那段话被删掉了。你骂了一句，然后开始翻微信聊天记录，看看有没有发给过同事。没有。你甚至试了试 Ctrl+Z 能不能撤销复制操作，当然不能。最后你放弃了，凭记忆重写了一段，但总觉得不如原来的好。

这就是 oioi 要解决的那个瞬间。它不是一个复杂的工具，就是一个常驻在你菜单栏里的透明小窗口。你复制任何东西——文字、图片、文件路径、颜色代码——它都自动存下来。你不需要提前设置什么，不需要告诉它“这个要保留”。它就像你桌面上那个永远不关的记事本，但比记事本快一百倍。

怎么用呢？你按一个快捷键，比如 Ctrl+Shift+V 或者你自己设的什么组合键，屏幕上就会弹出一个半透明的列表，里面按时间倒序排列着你最近复制过的所有内容。你可以用键盘上下选择，按回车直接粘贴到当前光标位置。也可以搜索，输入几个关键词就能找到几天前复制的一段代码。它不挑应用，不挑系统——macOS、Windows、Linux 都跑，而且界面长得一模一样，都是那种毛玻璃效果，看着很舒服。

它的工作流简单到不像一个产品：你复制，它记录；你按快捷键，它展示；你选择，它粘贴。上下游接的就是你电脑自带的系统剪贴板，它不依赖任何云服务，不要求你注册账号，不往你硬盘里塞一堆配置文件。你装好之后，它就在那里，安静得像一块玻璃。

你可以把 oioi 想象成一个透明的记忆盒子。你往里面扔东西，它不会丢，也不会混。你伸手进去摸，摸到哪个就拿哪个。盒子是透明的，所以你一眼能看到里面有什么。它不替你分类，不替你打标签，不替你分析——它只做一件事：记住你复制过什么，然后让你最快地拿出来。

市面上当然有别的剪贴板管理器。macOS 上最出名的是 Paste，Windows 上有 Ditto，Linux 上有 CopyQ。它们都做得不错，但各有各的脾气。Paste 只支持 macOS，而且它的界面是那种厚重的卡片风格，每个条目都带缩略图，占地方大，滚动起来有点拖沓。Ditto 功能很全，能加密、能网络同步，但界面像上个世纪的软件，按钮多，选项多，你装完之后得花十分钟关掉那些你不需要的功能。CopyQ 更极端，它几乎是一个剪贴板脚本引擎，你可以写插件、设规则、自动处理——但大多数人只是想要一个能记住最近十次复制内容的东西，而不是一个编程工具。

oioi 选了另一条路：它把界面做薄，把速度做快。它不给你任何多余的按钮，不让你配置什么“排除列表”或“自动清理规则”。它的默认设置就是大多数人需要的设置。你打开它，它就在那里；你关掉它，它也不抱怨。这种选择带来的能力差异很具体：当你需要在一秒钟内从二十条历史记录里找到那个颜色代码时，oioi 的毛玻璃列表比 Paste 的卡片列表快得多，因为你的眼睛不需要扫过缩略图和标题，只需要看文字本身。当你同时用 Mac 和 Windows 工作时，oioi 让你在两个系统上获得完全一致的体验，而 Paste 和 Ditto 做不到这一点。

当然，这种极简也有代价。oioi 不会帮你把剪贴板内容同步到手机，不会自动加密敏感信息，不会按项目分组，不会自动删除过期的临时内容。如果你需要这些功能，它就不适合你。它的边界很清楚：它只解决“快速找回最近复制的内容”这一个问题。如果你复制的内容超过几百条，它的列表会变得很长，搜索功能虽然能用，但不如那些专门做搜索的工具快。另外，因为它把数据存在本地，如果你的电脑被偷了，那些复制过的密码、地址、银行卡号也就跟着丢了——这是所有本地剪贴板管理器的共同风险，oioi 没有做额外保护。

但如果你只是想要一个不打扰你、不拖慢你、不让你在关键时刻抓狂的剪贴板工具，oioi 就是那个答案。

我认识一个前端开发者，他每天要在 Figma、VS Code、Chrome 和 Slack 之间来回切换。他复制过的东西五花八门：颜色值、字体大小、API 地址、用户反馈、代码片段。以前他靠记忆，后来靠截图，再后来靠一个叫“临时记事本”的 txt 文件。装了 oioi 之后，他跟我说，最爽的时刻不是第一次用快捷键调出历史列表，而是三天后，他忽然想起周一复制过一段 CSS 动画代码，按了一下快捷键，输入“anim”，回车，那段代码就出现在了他的编辑器里。他愣了两秒，然后继续写代码。

More Signals

Product Huntsignal

Cloudback MCP Server

127 votes20 comments

你正在 Cursor 里改一个紧急 bug，改到一半突然想起：今天还没备份生产数据库。你叹了口气，切到终端，敲 `pg_dump`，等它跑完，再检查日志，确认没报错。整个过程大概五分钟，但每次切换上下文都像被人从水里拽出来。更烦的是，你经常忘了备份，直到某天凌晨三点被报警短信吵醒——数据库挂了，而上次备份是三天前。那一刻你盯着屏幕，脑子里只有一个念头：为什么不能直接跟编辑器说一句“备份一下”？

Cloudback MCP Server 就是干这个的。它不是一个备份工具本身，而是一个翻译官——把你的自然语言指令，转成备份系统能理解的操作。你不需要离开 Claude、Cursor 或 VS Code，不需要打开浏览器，不需要记命令。你只需要在聊天框里说：“把 staging 数据库备份到 S3，保留最近 7 天。” 然后 Cloudback 的 MCP 服务器收到这条消息，通过 Model Context Protocol 解析你的意图，调用 Cloudback 的 API 去执行备份，最后把结果——成功还是失败、备份文件多大、存在哪里——直接回复给你。整个过程发生在你写代码的同一个窗口里，你甚至不用切换标签页。

谁在用这个？主要是那些每天跟多个环境、多个数据库、多个云存储打交道的开发者。你可能是后端工程师，也可能是 DevOps，或者一个全栈创业者。你的输入就是一句自然语言，系统处理的核心是 MCP 协议——它让 AI 模型（比如 Claude）知道“备份”这个动作对应哪个 API、需要哪些参数。输出是一个确认消息，或者一个错误提示。上下游接的是 Cloudback 的备份服务，它本身支持 GitHub、GitLab、Bitbucket 的仓库备份，也支持数据库和文件系统。所以你可以说“备份一下这个仓库”，它就知道去拉 Cloudback 的配置。

用一个比喻来理解：想象你有一个私人管家，你坐在书房里写东西，突然想起要浇花。你不需要站起来去拿水壶、接水、走到阳台。你只需要说一句“把阳台的花浇了”，管家就去做了。Cloudback MCP Server 就是这个管家，而 Claude、Cursor 就是你的书房。传统的备份工具是水壶和水龙头——你得自己动手。这个产品把“动手”变成了“动嘴”。

对比一下真实竞品。比如你之前可能用 Backblaze 或 AWS Backup，它们都有 Web 控制台或 CLI。你要备份一个数据库，得先登录控制台，找到备份策略，点几下，或者写一个 shell 脚本定时跑。这条路很成熟，但问题是它要求你离开当前工作流。另一个替代方案是直接在编辑器里装一个插件，比如 VS Code 的备份扩展，但那些插件通常只能备份文件，不能理解“备份生产数据库并发送通知”这种复合指令。Cloudback 选择了一条不同的路径：它不跟编辑器抢界面，而是通过 MCP 协议把 AI 助手变成你的备份操作入口。这造成的能力差异是：你可以用自然语言组合多个动作，比如“备份 staging 数据库，然后发一条 Slack 消息给团队”。传统工具做不到，因为 Slack 和备份是两个系统。而 MCP 服务器可以串联它们——只要 Cloudback 的 API 支持，你就能在一条指令里完成。

当然，这个产品有明确的边界和代价。它不适合那些需要精细控制备份策略的场景。比如你要做增量备份、指定压缩算法、设置复杂的保留规则，用自然语言描述可能比直接写脚本还麻烦。另外，它依赖 AI 模型的理解能力。如果你说“备份一下那个重要的”，AI 可能不知道“那个”指的是什么。风险在于权限：如果你在编辑器里给了 AI 执行备份的权限，它误操作了怎么办？比如你说“备份所有数据库”，但你的生产库有 500GB，备份一次要一小时，还影响性能。所以 Cloudback 需要你提前配置好哪些环境、哪些操作是允许的，就像给管家一把只能开特定门的钥匙。

最后，讲一个用起来什么样的小故事。周五下午四点，你准备收工。你在 Cursor 里对 Claude 说：“把本周所有改过的仓库都备份一次，然后发一份备份报告到我的邮箱。” 你按下回车，看到 Claude 回复：“正在处理，预计需要 3 分钟。” 你关掉电脑，去接孩子放学。周一早上打开邮箱，看到一封来自 Cloudback 的邮件，标题是“备份报告：7 个仓库成功，0 个失败”。你点开，每个备份的大小、时间、存储位置都列得清清楚楚。你甚至不记得自己做过这件事——但备份确实在那里。

Product Huntsignal

35334 forks198979 stars

它的工作流是这样的：你作为用户，在终端或者你常用的工具里输入一个任务目标，比如“监控竞品价格变动，每天生成一份对比表”。Hermes会先理解这个目标，然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做，它会自己尝试。第一次可能搞错了格式，你纠正一次，它就记住了。它会把结果输出到你指定的地方，比如一个Google Sheet或者一个Slack频道。上下游接什么系统？它自己会去探索。你给它一个API密钥，它就知道怎么用。你给它一个网页地址，它就知道怎么爬。它就像一个刚入职的新人，第一天什么都不会，但学得飞快，而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里，它自己会从你的操作中吸收养分，慢慢长出新的枝叶。一开始它只是一棵小苗，只能处理最简单的任务。随着你不断使用，它会长出新的分支，学会更复杂的操作。你不需要告诉它怎么长，它自己会朝着最需要它的方向伸展。有些分支可能长歪了，你剪掉一次，它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比，Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀，你告诉它切哪里、切多深，它执行得又快又好。但如果你自己都不知道该切哪里，或者每次要切的东西都不一样，手术刀就没用了。Hermes更像一个学徒，它先看你做一遍，然后模仿，然后改进，最后独立操作。Claude Code适合那些任务明确、步骤固定的场景，比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景，比如“帮我处理客服工单，但要根据客户等级和问题类型调整优先级”。在后者这种场景里，Claude Code会因为你没给它明确的规则而卡住，而Hermes会从你的历史操作中自己总结出规则。

当然，Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件，它帮不了你，它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周，你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识，比如法律合同审核，它需要你先给它一些样本，它才能学会。而且，因为它会自己探索，有时候它会尝试一些你没想到的操作，比如访问了一个你不想让它访问的网站。你需要给它设定边界，告诉它哪些地方不能去。另外，它的开源性质意味着你完全掌控数据，但也要自己负责部署和维护。如果你不想折腾服务器，可能更适合用托管服务。

想象一下，你是一个电商小团队的运营负责人。你招了一个Hermes，告诉它“帮我处理退货申请”。第一天，它什么都不懂，你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请，它看了50遍。第二天，它开始主动给你建议：“这个用户的商品已经拆封了，按规则只能退50%，要确认吗？”你点了确认。第三天，它开始自己处理那些未拆封、金额低于100元的申请，只把异常情况推给你。一周后，你发现你每天只需要花15分钟审核它处理的结果，剩下的时间你可以去研究怎么优化退货流程。一个月后，你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

thedotmack/claude-mem

7230 forks83564 stars

你用过 AI agent 吗？就是那种你让它写代码、查资料、整理文档的“数字实习生”。刚开始用的时候挺爽，你告诉它“帮我重构这个模块”，它刷刷刷就干完了。但问题出在第二天。你打开一个新的会话，想让它继续昨天的工作，结果它一脸茫然地看着你，好像你们从没见过。你不得不把昨天的上下文、代码结构、你的偏好重新说一遍。更烦的是，如果你同时在跑好几个 agent——一个在写测试，一个在调 API，一个在分析日志——每个 agent 都像得了失忆症，每次对话都是第一次见面。你花在“重新介绍”上的时间，比让它们干活的时间还多。

claude-mem 就是来解决这个问题的。它不是一个 agent 本身，而是一个记忆层，可以插到任何 agent 后面。你用的 agent 是 Claude Code、OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode——随便哪个——只要接上 claude-mem，它就开始自动记录。记录的不是原始对话日志，而是经过 AI 压缩和提炼的“记忆”。比如你让 agent 调试一个 bug，它试了三种方案，最后用第二种解决了。claude-mem 不会记下你说了什么废话，而是记下“用户偏好第二种调试路径，该 bug 的根因是内存泄漏”。下次你再遇到类似问题，agent 打开新会话时，claude-mem 会自动把这条记忆注入进去，agent 就会直接说：“上次我们遇到类似情况，你选了第二种方案，要不要再试试？”

它的工作流是这样的：你启动 agent，agent 启动时加载 claude-mem 插件。agent 每做一件事——调用工具、写代码、查文档——claude-mem 都在后台抓取这些操作，然后用 AI 模型把它们压缩成结构化的记忆片段，存到本地数据库里。它支持 SQLite 和 ChromaDB 两种存储后端，前者轻量，后者适合做向量检索。下次 agent 启动时，claude-mem 会根据当前任务的关键词，从数据库里检索相关的旧记忆，然后像塞小纸条一样塞进 agent 的上下文窗口里。agent 看到这些纸条，就知道“哦，这个用户之前做过这个，那个项目有坑”。整个过程对你是透明的，你不需要手动管理任何东西。

你可以把 claude-mem 想象成给 AI agent 装了一个“私人助理”。这个助理不干活，但它有一本笔记本，随时记下 agent 做过什么、你喜欢什么、哪些方案失败了。每次 agent 开始新任务，助理就把相关的笔记翻出来放在桌上。agent 不用再问“你上次是怎么做的”，直接看笔记就行。

市面上已经有类似的项目，比如 Mem0、Supermemory、OpenMemory。它们的目标都是给 AI 加记忆，但路径不同。Mem0 走的是“记忆即服务”路线，它自己管理一个向量数据库，提供 API 让你存和查。Supermemory 更偏向个人知识管理，像一个 AI 版的 Notion。claude-mem 的选择是“嵌入 agent 的工作流”。它不是让你手动去存笔记，而是自动抓取 agent 的每一个操作，然后压缩、索引、注入。这意味着你不需要改变使用 agent 的习惯，装个插件就行。这种路径的好处是“零摩擦”——你不需要学习新工具，不需要手动分类记忆，agent 自己就学会了记住你。坏处是，它依赖 agent 的插件系统，如果某个 agent 不支持插件，你就用不了。目前它支持的主流 agent 已经很多了，但如果你用的是某个小众的 agent，可能就得等社区适配。

代价也很清楚。第一，它需要额外的计算资源。每次会话结束后，它都要跑一次 AI 压缩，把原始操作变成记忆。如果你一天开几十个会话，这个压缩过程会消耗不少 token 和本地算力。第二，记忆的质量取决于压缩模型。如果模型压缩得太狠，可能会丢失关键细节；如果压缩得太松，记忆会膨胀，占用上下文窗口。第三，隐私问题。所有记忆都存本地，但如果你用的是云端 agent，你的操作数据会被传到 agent 的服务器，claude-mem 只能保证本地存储的安全，管不了传输过程。第四，它不适合那些“每次任务都完全不同”的场景。比如你让 agent 每天写一篇不同的新闻稿，昨天的记忆对今天几乎没有帮助，那 claude-mem 就白费力气了。

想象一下这个场景：你是一个独立开发者，维护着一个开源项目。你让 Claude Code 帮你写测试、修 bug、重构代码。以前你每天打开终端，输入“继续昨天的重构”，Claude Code 会问“哪个模块？什么重构目标？你上次改到哪了？”你得翻聊天记录，找到昨天的对话，复制粘贴。装了 claude-mem 之后，第三天早上你打开终端，输入“继续昨天的重构”，Claude Code 直接说：“好的，继续重构 user 模块的认证逻辑。你昨天已经完成了单元测试，今天要改的是 session 管理部分。上次你提到想用 JWT 替代 cookie，要现在开始吗？”你愣了一下，然后笑了。它记住了。

GitHubsignal

bytedance/deer-flow

9827 forks72551 stars

你是一个独立开发者，接了一个外包项目：给一家小公司做一个内部工具，从零开始。你打开浏览器，先搜技术方案，翻十几篇博客，对比框架，决定用哪个。然后打开 IDE，写代码，跑起来发现报错，再回去查文档。中间还要去 Slack 问同事某个 API 的用法，等回复。一个下午过去了，你还在研究怎么搭数据库连接池。这不是你懒，是这类任务天然就长——它需要你切换五六个工具，记住一堆上下文，还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人，而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手，而是一个能接受一个模糊目标，然后自己规划、执行、调整、直到完成的系统。你给它一个任务，比如“研究一下当前最好的开源 RAG 方案，写一个对比报告，并生成一个 demo 代码”。它不会只给你一段文字，它会自己启动一个沙盒环境，在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后，你拿到的是一个完整的输出：一份报告加一个能跑的 demo。

它的工作流是这样的：你通过消息网关（Message Gateway）丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务，判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理（Subagents）去干具体的事，每个子代理有自己的记忆（Memories）和工具（Tools），可以调用外部 API 或数据库。所有操作都在沙盒（Sandbox）里执行，不会污染你的系统。如果某个子代理卡住了，主代理会重新规划，换一条路径。整个过程就像你有一个项目经理，带着几个工程师，各自在自己的工位上干活，项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话，而是给一个项目组下达了一个任务。这个项目组有自己的会议室（沙盒）、白板（记忆）、工具箱（工具）、专家（子代理）和前台（消息网关）。你不需要知道谁在干什么，你只需要说“我要这个”，然后等结果。

跟 AutoGPT 比，deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵，什么都能干一点，但容易跑偏，而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务，比如“研究一个开源项目，理解它的架构，然后写一个插件”，而不会在中间因为上下文丢失而胡来。代价是，它比 AutoGPT 重，启动慢，配置复杂。如果你只是想让它帮你写一封邮件，用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务，deer-flow 的架构优势就出来了。

当然，它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行，能配置 Python 环境，理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外，它依赖 LLM 的质量——如果底层的模型不够聪明，子代理之间的协调就会出问题，任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues，说明它还在快速迭代中，不是那种开箱即用的产品。如果你只是想快速验证一个想法，可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友，他每周要花两天时间研究竞品的技术栈，写报告。他试了 deer-flow，给了一个任务：“研究最近三个月发布的五个开源 AI 框架，对比它们的性能、社区活跃度和文档质量，输出一个表格和一段总结。”他早上丢进去，去开了个会，回来发现 deer-flow 已经跑完了：沙盒里有一个 CSV 文件，一个 Markdown 报告，甚至还有一个自动生成的对比图。他只需要检查一下数据来源，改几个措辞，就交差了。那天下午他提前下班了。

GitHubsignal

code-yeongyu/oh-my-openagent

5110 forks63154 stars

它的核心机制像是一个“代码导游”。你站在一个陌生城市（代码库）里，导游不会把整张地图拍在你脸上，而是先带你走主干道，再拐进小巷，最后停在你要找的那家店门口。oh-my-openagent 就是那个导游，它知道什么时候该看全局，什么时候该钻细节，不会让你在无关的文件里迷路。

跟 Cursor 或者 GitHub Copilot 比，它们走的是另一条路。Cursor 更像一个“超级自动补全”，你写一行它猜下一行，适合写新代码或者改小段逻辑。但当你面对一个几千行、跨多个模块的老项目时，自动补全就帮不上忙了，因为它不知道整个项目的上下文。oh-my-openagent 选择的是“先理解再动手”，它花更多时间在分析代码结构上，而不是即时生成代码。这个差异在重构遗留系统、接手别人项目、或者排查深层 bug 时特别重要。你不需要自己先花半小时搞清楚代码怎么组织的，它帮你做了。

5110 forks63154 stars

omo/lazycodex: The coding agent for tokenmaxxers;the one and only agent harness for complex codebases. For your Codex, for your OpenCode

2026-06-21

今日值得看：WorkClaw

WorkClaw 是今天最值得先看的信号。WorkClaw 是一个在 Slack 里和你一起工作的主动型 AI 同事，它不等着你问问题，而是自己干活、汇报结果。

今日 Brief

产品侧可以先看 WorkClaw：WorkClaw 是一个在 Slack 里和你一起工作的主动型 AI 同事，它不等着你问问题，而是自己干活、汇报结果。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

WorkClaw

284 votes65 comments

来源：Product Hunt

你打开 Slack，看到 47 条未读消息。三条是同事问“这个订单发货了吗”，五条是客户催“我的退款什么时候到”，还有两条是老板问“本周的销售数据呢”。你开始一个个回复：先登录 Shopify 查订单状态，再切到 Stripe 看退款进度，然后打开 Excel 手动拉数据、截图、粘贴。每一条消息平均花你三分钟，但真正要命的是——你刚回完一条，新消息又来了。一天下来，你感觉自己不是在做事，而是在当人肉 API，把信息从一个系统搬到另一个系统。这就是没有 WorkClaw 时的真实工作状态。

161 votes7 comments

来源：Product Hunt

你正在写一段关键逻辑，光标停在函数名后面，等着 AI 给你补全下一行。你按下 Tab，然后……等。一秒，两秒，三秒。补全出来了，但你的思路已经断了。你不得不重新读一遍上下文，确认它给的代码对不对。这种打断每天发生几十次，每次几秒钟，累积下来就是十几分钟的注意力碎片。更糟的是，如果你在跑一个自动化测试脚本，或者在做代码审查时让 AI 总结 diff，响应慢一点，整个流程就卡住了。你开始怀疑：到底是 AI 在帮你，还是在拖你后腿？

Mellum 就是冲着这个场景来的。它是 JetBrains 做的一个 LLM 推理服务，核心就一句话：快。不是“比别的模型快一点”，而是快到你几乎感觉不到它在后台运行。你用它的时候，输入的是你 IDE 里的代码上下文、光标位置、或者一段待总结的 diff。系统拿到这些后，直接丢给一个专门优化过推理速度的模型——可能是量化过的、蒸馏过的，或者用了更激进的缓存策略——然后几乎瞬间吐出补全、解释或总结。输出直接喂回你的编辑器插件、CI 流水线或者命令行工具。上下游接的是 JetBrains 全家桶（IntelliJ、PyCharm 等）的插件生态，也可能通过标准 API 对接其他工具。

你可以把它想象成一辆赛车的引擎。普通 LLM 推理服务像家用轿车的发动机，平稳、省油，但踩油门到动力输出之间有明显的延迟。Mellum 的引擎则把油门响应调到了极致——牺牲一点燃油经济性（也就是模型参数量或推理精度），换来的是你踩下去的瞬间车就窜出去。在开发场景里，这种“瞬间”就是你能不能保持心流的关键。

跟它直接对标的竞品是 Groq。Groq 走的是硬件路线，用自研 LPU 芯片把推理延迟压到毫秒级。Mellum 走的是软件和模型优化路线——JetBrains 没有自己的芯片，但他们有大量的 IDE 使用数据，知道开发者真正需要什么样的补全、什么样的响应速度。Groq 的强项是通用场景下的极低延迟，但它的模型选择有限，而且你没法在本地跑。Mellum 的优势是深度集成到 JetBrains 的编辑器里，并且可能是开源的——从 Product Hunt 的话题标签看，它属于 Open Source 类别。这意味着你可以自己部署、自己调优，甚至针对你的代码库做微调。在需要完全离线或者数据不出内网的企业环境里，这个差异就很重要了。

当然，Mellum 的代价也很清楚。它追求的是速度，所以它不适合那些需要深度推理、长上下文、或者高准确率的任务。比如你要让 AI 分析整个项目的架构设计，或者写一份复杂的重构方案，Mellum 可能给不出足够好的答案。它的战场是那些“看一眼就能回答”的问题：补全下一行代码、解释一段函数、快速格式化注释、在 CI 里做简单的代码审查。如果你需要的是 GPT-4 级别的思考能力，Mellum 不是你的选择。另外，因为它是 JetBrains 的产品，如果你不用他们的 IDE，集成体验可能会打折扣。

想象一下你正在用 IntelliJ 写一个 Spring Boot 的 Controller。你刚打完 `@GetMapping("/users/{id}")`，光标停在方法体里。Mellum 的插件已经在后台把你的方法签名、类名、导入的依赖都打包成 prompt 发了出去。你还没想好怎么写，补全就弹出来了：`return userService.findById(id).orElseThrow(() -> new UserNotFoundException(id));`。你按一下 Tab，继续写下一行。整个过程不到 200 毫秒，你的思路根本没断。这就是 Mellum 想给你的日常。

Editor's Pick

pumaDB

135 votes6 comments

来源：Product Hunt

你写了一个 AI agent，它能帮你查天气、订外卖、回邮件。你把它部署到 Slack 里，第一天它表现不错，第二天它开始犯傻——你问它“刚才那个客户叫什么”，它说不知道。你明明刚跟它聊过。问题出在哪？AI agent 没有记忆。每次对话对它来说都是第一次见面。你当然可以把整个聊天历史塞进提示词里，但 token 烧得飞快，而且上下文窗口再大也有上限。更麻烦的是，如果 agent 需要跨会话记住信息，比如记住用户偏好、记住上次处理到哪一步，你就得自己搭一个存储系统。很多开发者走到这一步就卡住了：用 Redis 吧，要自己管理连接、持久化、过期策略；用数据库吧，太重，查询延迟高，agent 等不起。最后要么放弃记忆功能，要么花一周时间写一个简陋的缓存层，然后发现它动不动就丢数据。

pumaDB 就是冲着这个痛点来的。它是一个托管的内存层，专门给 AI agent 用。你不需要自己部署 Redis 或 Memcached，也不需要写复杂的 SQL。你在代码里引入 pumaDB 的 SDK，然后像操作一个字典一样读写数据。比如 agent 在对话中识别出用户叫“张三”，你就写一句 `memory.set('user_name', '张三')`。下次 agent 启动时，先读 `memory.get('user_name')`，就能直接叫出用户名字。系统怎么处理？pumaDB 把数据存在内存里，读写速度在毫秒级，同时自动做持久化——你不用担心服务器重启后数据丢失。它还会自动处理过期时间，比如你可以设置“记住用户偏好 24 小时”，超过时间自动清除，避免内存爆掉。上下游接什么？它通过 REST API 或 SDK 接入你的 agent 框架，比如 LangChain、AutoGPT、或者你自己写的 Python 脚本。你不需要改 agent 的逻辑，只需要在需要记忆的地方加两行代码。

你可以把 pumaDB 想象成一个给 AI agent 用的便签本。agent 每处理一件事，就在便签上写一行；下次需要时，翻到那一页就能看到。这个便签本很小，但翻得快，而且不会丢。它不像一个图书馆（比如 PostgreSQL），查一本书要花时间；也不像一张白纸（比如无状态 agent），每次都要重新画。它就是那个刚好够用的便签本。

跟 Redis 比一下。Redis 是通用的内存数据库，功能强大，能当缓存、消息队列、排行榜。但你要自己部署、配置、监控、备份。如果你只是想让 agent 记住几句话，用 Redis 就像开一辆卡车去买一瓶水。pumaDB 选择的是“专为 agent 设计”的路径：它只提供最简单的键值对读写，没有复杂的数据结构，没有集群管理，没有持久化策略配置。你注册一个账号，拿到一个 API key，然后就能用。代价是什么？你失去了灵活性。如果你需要做复杂查询、需要跨多个键做聚合、需要高并发支撑上万个 agent，pumaDB 可能撑不住。它叫“small hosted memory layer”，这个“small”既是优点也是边界。它适合个人开发者、小团队、原型项目，或者那些 agent 数量不多、记忆量不大的场景。如果你的 agent 每天要处理几百万次读写，或者需要存储几十 GB 的向量数据，你应该去看 Redis 或者专门的向量数据库。

还有一个替代方案是直接用大模型的上下文窗口。比如 GPT-4 有 128K token，你可以在每次请求时把整个历史对话塞进去。这确实能解决短期记忆，但 token 成本高，而且每次请求都重新处理所有历史，延迟也高。pumaDB 的思路是只存关键信息，比如用户 ID、偏好、上次操作状态，而不是存全文。这样 token 消耗少，响应快。但代价是你要自己决定存什么、怎么存——这需要你在 agent 逻辑里设计记忆策略，不是开箱即用的。

想象一下你正在做一个客服 agent。你把它接入了公司网站，用户来问“我的订单什么时候到”。agent 查了订单号，回复了预计时间。然后用户说“好的，谢谢”。第二天同一个用户又来了，说“我的订单还没到”。如果没有记忆，agent 会再问一遍订单号。有了 pumaDB，agent 在第一次对话结束时存了 `{user_id: '123', order_id: '456', status: 'shipped'}`。第二天用户一开口，agent 先查记忆，发现这个用户昨天问过，直接说“您的订单 456 昨天已发货，预计今天下午到，需要我帮您查物流详情吗？”用户觉得这个 agent 真聪明。而你作为开发者，只花了十分钟集成 pumaDB，写了三行代码。这就是它想给你的日常。

More Signals

Product Huntsignal

Pixlie

100 votes3 comments

你花了一下午写脚本、找素材、剪了三个版本，最后甲方说“把那个蓝色杯子换成红色，人物往左移一点”。你深吸一口气，打开视频编辑软件，开始一帧一帧地抠图、调色、重新渲染。如果用的是现在主流的 AI 视频生成器，你连这个“换杯子”的机会都没有——它们像一台自动爆米花机，你扔进去一段文字，它“嘭”一声吐出一段视频，好看是好看，但里面的人物、物体、背景全是随机组合，你没法说“把那个杯子换成红色”，因为 AI 根本不知道杯子的概念，它只是生成了像素。你只能重新写提示词，祈祷下一次运气好一点。这就是大多数 AI 视频工具的真实状态：生成快，但不可控。

Pixlie 想解决的就是这个“不可控”。它不是一个黑盒子，而是一个你可以“上手调”的视频工作室。你用它的时候，输入可以是文字描述，也可以是一张图片——比如你拍了一张产品照片，或者一张概念草图。系统会先理解你的输入，然后生成一段视频，但关键在后面：你可以在生成之后，对画面里的具体元素进行修改。比如你指着画面里的一个物体说“把它换成蓝色”，或者“让这个人物向右走两步”，Pixlie 会重新计算，只改动你指定的部分，而不是整个画面重来。输出是一段可以直接用的视频，你可以导出到剪辑软件里继续加工，或者直接发到社交媒体。上下游接什么？上游接你的创意素材（文字、图片），下游接你的剪辑流程或发布平台。

用一个比喻来理解 Pixlie 的核心机制：它像是一个“可编程的摄影棚”。传统 AI 视频生成器是给你一个已经搭好的布景，你只能站在外面看，不能动里面的道具。而 Pixlie 给了你一个遥控器，你可以让演员走位、换衣服、调灯光，甚至把背景墙拆了重搭。这个“遥控器”就是它对画面元素的独立控制能力——不是整体重生成，而是局部编辑。

对比一下市面上最主流的 AI 视频工具，比如 Runway 或 Pika。它们走的是“端到端生成”路线：你输入提示词，模型直接输出视频。这条路的好处是快，几秒钟就能看到结果，适合做灵感探索、快速原型。但代价是你几乎无法控制细节。你想让一只猫从左边走到右边，而不是从右边走到左边？你得反复试提示词，或者靠运气。Pixlie 走的是另一条路：它把视频生成拆成“理解场景”和“局部编辑”两步。先让 AI 理解画面里有什么物体、什么关系，然后允许你针对这些物体做修改。这个差异在商业场景里特别重要——比如电商产品视频，你需要让产品保持品牌色、特定角度，不能随机生成。或者广告片，你需要让演员做指定动作，而不是 AI 自由发挥。在这些场景下，Pixlie 的“控制”就是生产力。

当然，Pixlie 也有它的边界和代价。首先，局部编辑意味着计算量更大，生成速度可能比纯端到端工具慢。如果你只是想要一个快速的概念视频，不在乎细节，那用 Runway 可能更省时间。其次，控制能力取决于 AI 对场景的理解深度——如果画面里物体太多、太复杂，AI 可能分不清哪个是杯子哪个是花瓶，局部编辑就会出错。另外，Pixlie 目前看起来是移动端优先（Android 话题），这意味着它的操作界面受限于手机屏幕，复杂编辑可能不如桌面端顺手。如果你需要做 4K 长视频、多图层合成，它可能不是最佳选择。最后，100 个投票、3 条评论说明它还处于早期，社区反馈和文档可能不够完善，遇到 bug 时你得有耐心。

想象一下你是一个做短视频的创作者，接了一个客户需求：拍一条 15 秒的产品展示视频，产品是一个红色保温杯。你用 Pixlie 上传了一张产品图，输入文字“杯子在桌面上旋转，背景是渐变色”。AI 生成了一段视频，杯子转得挺好，但背景是蓝色，客户想要橙色。你不需要重新生成整个视频，只需要在界面上点一下背景区域，输入“改成橙色渐变”，几秒后背景变了，杯子还在原地转。你又发现杯子的反光太强，你调整了“光泽度”参数，反光变柔和了。整个过程不到五分钟，你导出视频发给客户，对方回复“可以，就这个”。这就是 Pixlie 想让你拥有的日常——不是碰运气，而是真的在“做”视频。

Product Huntsignal

Foyer

113 votes4 comments

你正坐在咖啡馆里写一份方案，耳机里是隔壁桌打电话的声音、咖啡机蒸汽声、还有门口的风铃。你其实需要一点背景音来隔绝这些，但打开网易云音乐找歌单太分心，搜“白噪音”又全是广告。你试过打开一个叫 Noisli 的网页，但浏览器标签一多就忘了关，等你想切回来的时候，它已经被埋在一堆文档下面了。你甚至试过用 Spotify 播“雨声”，但播到一半突然插进来一首歌，节奏完全不对。最后你放弃了，干脆戴上降噪耳机，世界安静了，但你也觉得太安静了，像被关在一个隔音盒子里，反而更焦虑。

这就是 Foyer 想解决的事。它不是一个播放器，不是一个网站，它是一个“房间”——一个藏在你的 MacBook 刘海里的声音房间。你不需要打开任何窗口，不需要切换应用，甚至不需要看它一眼。你只需要把鼠标移到屏幕顶部的刘海区域，点一下，雨声就来了。再点一下，换成壁炉噼啪声。再点一下，变成咖啡馆的模糊人声。它就在那里，像你桌角放了一个小音箱，但你看不见它，因为它住在你的刘海里面。

谁会用 Foyer？任何一个在 Mac 上工作、需要背景音但又不想被工具打断的人。你输入的是点击——点一下刘海，系统就切换一个声音场景。Foyer 怎么处理？它在你电脑后台运行一个极轻量的音频引擎，预加载了几种环境音样本，每次点击就切换播放。输出就是声音，直接通过你的耳机或扬声器出来。它不接任何上下游系统，不连 Spotify，不连 Apple Music，不连你的日历。它就是一个独立的小东西，只做一件事：在刘海里面给你一个声音房间。

用一个比喻来理解 Foyer 的核心机制：它就像你办公室门上的那个小窗户。你不需要开门，不需要站起来，只需要透过窗户看一眼外面，就知道天气怎么样。Foyer 就是那个窗户，只不过它传递的不是光，是声音。你不需要打开一个 App，不需要加载一个页面，只需要瞥一眼刘海，就能听到你想听的环境。它把“切换背景音”这个动作压缩到了几乎为零——从你想听到听到，中间只隔了一次点击，而且那个点击发生在你鼠标本来就会经过的屏幕顶部。

对比一下真实的竞品。比如 Endel，它也是一个环境音应用，但它的路径完全不同。Endel 会分析你的心率、时间、活动状态，然后实时生成一个自适应音轨。它很聪明，但它需要你打开一个全屏界面，需要你授权健康数据，需要你订阅每月 10 美元。Foyer 选了另一条路：它不分析你，不生成你，它只是给你几个预设好的声音房间，让你自己选。Endel 像一个智能调酒师，会根据你的心情调一杯鸡尾酒；Foyer 像一个只有四个按钮的自动售货机，你按哪个就出哪个。能力差异很明显：Endel 能给你更精准、更个性化的体验，但代价是复杂和侵入感；Foyer 牺牲了所有个性化，换来了极致的轻量和无感。在什么场景下这个差异重要？当你正在赶一个截止日期，脑子已经快炸了，你不想再跟任何 App 交互，你只想“啪”一下听到雨声然后继续写——这时候 Foyer 赢了。但如果你想要一个能跟着你一天节奏变化的声音伴侣，Endel 更合适。

当然，Foyer 的边界和代价也很清楚。它只适合 Mac 用户，而且必须是带刘海的 MacBook Pro 或 MacBook Air。如果你用的是外接显示器，或者老款 MacBook，它就没法用。它的声音选择很有限——从产品描述看，它可能只内置了少数几种环境音，比如雨声、壁炉、咖啡馆、海浪。你不能自定义，不能导入自己的音频，不能调整音量平衡。如果你对声音有很挑剔的要求，比如想要 8 小时不间断的森林鸟鸣，或者想要精确控制混响，Foyer 满足不了你。还有一个风险：它把交互入口放在刘海区域，而刘海本身是 Mac 系统菜单栏的一部分。如果你菜单栏图标太多，或者你经常用鼠标点刘海来触发其他功能（比如某些刘海插件），可能会冲突。另外，它毕竟是一个第三方应用，需要常驻后台，虽然它声称极轻量，但任何后台进程都会消耗一点电和内存——在电池焦虑的 MacBook 用户眼里，这可能是个问题。

想象一下你用起来的样子。现在是下午三点，你刚写完一段代码，准备调试。你戴上 AirPods，鼠标自然地滑到屏幕顶部，你看到刘海旁边多了一个小圆点——那是 Foyer 的图标。你点了一下，听到雨声，不大不小，刚好盖住办公室空调的嗡嗡声。你开始调试，十分钟后，雨声停了——可能是你误触了，也可能是 Foyer 默认只播一段时间。你又点了一下，这次换成壁炉噼啪声。你继续工作，直到同事拍你肩膀说“下班了”，你才意识到自己已经听了三个小时壁炉声，而你的刘海里面那个小房间，一直安安静静地待在那里，没打扰过你一次。

Product Huntsignal

Are you in the Weights?

112 votes3 comments

你有没有过这种感觉：你写了一篇博客，发了一条推文，录了一期播客，然后某天你问 ChatGPT 一个关于你自己的问题，它居然答对了。你心里咯噔一下——它怎么知道的？它看过我的东西？它把我的话吞进去了？但你又没法确认。你只能猜。你甚至不知道它到底记住了你多少，是只记住了你的名字，还是连你十年前在论坛上发的那个冷笑话都记得。这种不确定感很烦人，尤其是当你的工作、创作、甚至个人生活都开始依赖这些模型的时候。你想知道答案，但没人给你一个搜索框。

“Are you in the Weights?” 就是那个搜索框。你打开它的网页，输入你的名字，或者一段你写过的文字，或者你的社交媒体账号。系统会去扫描那些公开的大模型训练数据——比如 Common Crawl 的网页快照、维基百科、Reddit 的公开帖子、GitHub 的代码库。它把这些数据里和你输入匹配的内容找出来，然后告诉你：这段文字出现在 GPT-4 的训练集里，那段出现在 Llama 3 里，还有一段被 Claude 用上了。你看到结果，就像看到自己的 DNA 片段散落在不同的模型大脑里。你终于知道，你确实“活”在它们的权重里。

这个产品的核心机制，其实就是一个巨大的反向搜索引擎。想象一下，搜索引擎是让你输入关键词，找到网页。而“Are you in the Weights?” 是让你输入你自己，找到那些把你吞进去的模型。它不生成新东西，它只是把已经公开的训练数据索引起来，然后做匹配。你输入一段话，它去查那些公开的数据集哈希表，看有没有一模一样的片段。如果有，它就告诉你“找到了，在这里”。如果没有，它就告诉你“目前没发现，但未来可能”。就这么简单。

和它最像的竞品是“Have I Been Trained?”——那个工具让你上传一张图片，检查它是否被 LAION 数据集收录，从而被 Stable Diffusion 等图像模型训练过。但那个只查图片，而且只查一个特定的数据集。而“Are you in the Weights?” 针对的是文本，覆盖多个主流大模型的训练数据来源。更重要的是，它把这件事做成了游戏。你查完自己，还可以查你的朋友、你的偶像、你的竞争对手。你甚至能查一段你讨厌的营销文案，看看它是不是被模型学去了。它把“隐私焦虑”变成了“数字考古”的乐趣。

当然，这个工具有明显的边界。它只能查公开的训练数据。很多大模型（比如 GPT-4 的完整训练集）并没有完全公开，它只能查那些被泄露或公开的部分。所以如果你查不到自己，不代表你没被记住，只是可能数据没公开。另外，它只能做精确匹配或近似匹配，不能理解语义。你写了一句“今天天气真好”，模型可能记住了这句话，但如果你换了个说法“今天阳光明媚”，它就查不到了。它是个机械的指纹比对，不是个侦探。而且，它本质上是个娱乐工具——你查到了，然后呢？你没法删除，没法控制。它只是告诉你一个事实，不提供任何行动选项。

想象一下你是一个独立开发者，叫小林。你花了一年时间写了一个技术博客，内容很硬核，但流量一直不大。有一天你朋友发来一个链接，说“快查查你的博客”。你打开“Are you in the Weights?”，输入你博客的 URL。几秒钟后，结果出来了：你的三篇文章被 GPT-4 的训练集收录了，还有一篇被 Llama 3 用了。你盯着屏幕，突然觉得这一年没白写。你的文字，真的活在了那些模型的脑子里。你甚至开始想，也许以后面试的时候，面试官问的问题，答案就来自你的博客。你笑了笑，截图发了个推文。然后你继续写下一篇。

Product Huntsignal

Basedash Access Controls

110 votes5 comments

你公司里最值钱的东西，不是办公室的咖啡机，也不是那台 MacBook Pro，而是数据库里那堆数字。客户名单、销售漏斗、财务流水、产品路线图——随便一个实习生误操作，或者一个离职员工顺手拷走，损失可能比丢十台电脑还大。但现实是，大多数公司的数据权限管理，还停留在“要么全看，要么全不看”的原始阶段。

想象一下这个场景：你是公司的数据负责人，刚上线了一个新的 BI 仪表盘，销售总监要看客户转化率，市场部要看渠道来源，财务要看回款周期。你怎么办？最省事的办法是给所有人开一个只读账号，密码写在 Slack 里。但你知道这有多危险——销售总监能看到财务的毛利率，市场部能看到销售的个人业绩，甚至一个刚入职的运营专员，也能导出全公司的用户邮箱。你每天晚上睡不着，怕哪天有人点错按钮，把整张表删了。更可怕的是，你根本不知道谁看了什么、谁下载了什么。

Basedash Access Controls 就是来解决这个问题的。它不是让你重新搭一套权限系统，而是直接嵌在你现有的数据工具里。谁用它？公司的数据管理员、安全负责人，或者任何一个需要给团队分权限的人。你输入什么？你输入的是“谁”和“能做什么”：比如“销售团队可以看客户表，但不能看成本列”，“市场部只能看本月数据，不能看历史”，“财务可以读写，但不能删除”。系统怎么处理？它把这些规则翻译成细粒度的访问策略，直接作用在数据库层面。输出什么？每个用户登录后，只能看到自己被允许看到的数据行和列，其他内容就像不存在一样。上下游接什么系统？它通常接在你的数据库（PostgreSQL、MySQL 等）和 BI 工具（Metabase、Superset 等）之间，或者直接作为 Basedash 平台的一个模块——Basedash 本身是一个让你用 SQL 查数据的工具，而 Access Controls 就是给这个工具加了一把智能锁。

你可以把它想象成一家公司的门禁系统。传统做法是：大门一把锁，所有人用同一把钥匙。谁都能进，谁都能翻文件柜。Basedash Access Controls 的做法是：每个人发一张门禁卡，刷卡只能进自己该进的房间。销售只能进销售办公室，财务只能进财务室，而且每个房间里还有上锁的抽屉——比如销售能看到客户名字，但看不到客户利润率。这张卡还能记录你几点进了哪个房间、待了多久、有没有带东西出来。

对比一下真实竞品。很多公司用的是数据库自带的权限功能，比如 PostgreSQL 的 GRANT 语句。这条路的问题是：太技术了。你得懂 SQL，得手动写几十行 grant 命令，而且一旦表结构变了，权限就得重新配。更麻烦的是，它只能控制到表级别，不能控制到行级别或列级别。比如你想让销售只能看自己负责的客户，用原生 SQL 几乎不可能优雅实现。另一条路是用 IAM 系统，比如 AWS IAM 或 Okta。它们能控制谁可以登录，但控制不了登录之后能看到哪些数据行。Basedash Access Controls 走的是第三条路：在应用层和数据库层之间加一层策略引擎，让你用界面拖拽或写简单的规则，就能实现行级、列级的细粒度控制。这个能力在什么场景下重要？当你公司有几十个部门、几百个用户、数据表有几千行的时候，原生权限和 IAM 都扛不住，而 Basedash 的规则可以批量生效。

当然，它也有边界和代价。首先，它只对 Basedash 平台内的数据查询生效。如果你的团队还用 Excel 导出、或者直接连数据库客户端，那它管不了。其次，配置权限本身需要花时间——你得先梳理清楚每个角色该看什么，这往往是组织问题，不是技术问题。如果你们公司只有三个人，所有数据都公开也没关系，那用它就像给自行车装防盗锁，多余。另外，它依赖 Basedash 作为数据访问入口，如果你已经重度使用了其他 BI 工具，迁移成本需要考虑。风险在于：权限规则越细，越容易配错。比如你给市场部开了“查看用户邮箱”的权限，但忘了关掉“导出”，那数据泄露的风险依然存在。所以它需要配合审计日志一起用，而 Basedash Access Controls 本身是否自带审计功能？从产品描述看，它主要控制“谁能访问”，但“谁访问了什么”可能需要额外配置。

最后，讲一个用起来什么样的小故事。李姐是某电商公司的数据管理员，公司用 Basedash 做数据分析。以前每次有新员工入职，她都要手动在数据库里跑 grant 命令，还要反复确认对方是不是只该看自己部门的数据。有一次她不小心把“delete”权限给了实习生，吓得她半夜爬起来改回来。自从上了 Access Controls，她花了一个下午把权限规则写好：运营组只能看订单表的前 10 列，不能看成本；客服组只能看最近 30 天的退款记录；管理层可以看所有汇总数据，但不能看个人明细。之后新员工入职，她只需要在 Basedash 里点一下“添加用户”，选一个角色，权限自动生效。上周销售总监想偷偷看财务的毛利率，登录后发现那列数据直接是灰色的，点不了。李姐在后台看到了一条被拒绝的访问日志，笑了笑，没说话。

Product Huntsignal

ReleaseDock

101 votes3 comments

你是一个 SaaS 产品的创始人，团队就三个人。每天早上一打开电脑，你面对的是四个标签页：Zendesk 里 23 条未回复的客户工单，Intercom 上 7 个聊天窗口在闪，Notion 里那篇帮助中心文章已经三个月没更新了，还有一封邮件问“你们上周发的那个新功能到底怎么用？”你翻了一遍自己的发布记录——其实你上周只改了一个按钮颜色，但客户以为你加了什么大东西。你开始怀疑自己到底是做产品的，还是做客服的，还是做文档的。更糟的是，你发现同一个客户在三个渠道问了同一个问题，你回了三次。

ReleaseDock 想解决的就是这种混乱。它把三个东西——AI 客服机器人、帮助中心（知识库）、以及产品更新日志——全部合并到一个界面里，叫“收件箱”。你不需要再在五个工具之间来回跳。谁用它？就是你这种小团队，或者大公司里负责客户沟通的运营人员。输入很简单：客户发来的任何消息，不管是邮件、网站聊天还是 Slack 里的提问，都会流进同一个收件箱。系统先让 AI 自动判断：这个问题帮助中心里有没有现成答案？如果有，AI 直接回复，并把那篇帮助中心文章附上。如果没有，AI 会把它标记成“需要人工”，同时自动搜索最近的更新日志，看看是不是新功能导致的疑问。输出就是一条清晰的对话记录，附带相关文档链接。上下游接什么？它应该能连你的网站、邮件、Slack 和 Discord，但具体集成列表你得上官网看。

核心机制可以用一个比喻来理解：ReleaseDock 就像一个同时兼任客服、图书管理员和公告员的智能前台。客户走进来问“你们那个新功能怎么用？”前台先翻一下公告板（更新日志），发现上周贴了说明，然后从书架上抽出那本帮助手册（知识库），直接递给客户。如果客户的问题手册里没有，前台就喊你出来亲自接待。你不需要自己跑去翻公告板，也不用担心手册放错位置。

对比一下真实竞品。Intercom 和 Zendesk 是两条不同的路。它们也提供 AI 客服、知识库和公告功能，但它们是三个独立的产品模块，各自有独立的界面、独立的设置、独立的定价。你买了 Intercom 的客服模块，还得再买它的帮助中心模块，然后更新日志可能得用另一个工具比如 Headway 或者自己写邮件。ReleaseDock 的选择是把这三样东西硬塞进同一个收件箱。代价是什么？功能深度。Intercom 的 AI 客服可以训练复杂的对话流，Zendesk 的工单系统有 SLA 和自动分配规则，而 ReleaseDock 的 AI 可能只能处理简单问答。如果你需要精细的工单路由、多级 SLA、或者自定义的聊天机器人流程，它可能不够用。它的真正战场是那些“客户问题不复杂但渠道多、团队小、没时间维护多个工具”的场景。

边界和代价也很清楚。如果你的客户问题高度专业、需要人工判断，AI 回复反而会惹恼人。比如一个医疗 SaaS 的客户问“这个报告里的数据为什么和昨天不一样？”AI 没法回答，你还是要亲自上。另外，把更新日志和帮助中心混在一起，意味着你每次发布新功能都得在 ReleaseDock 里写一条，而不是像以前那样只在产品里弹个窗。如果你习惯用专门的 changelog 工具（比如 Beamer）来收集用户反馈，迁移成本也不低。还有，101 票、3 条评论——这个产品还很新，社区和文档可能都不够成熟，出了问题你只能找创始人 Siddhant Chaudhary 一个人。

想象一下你试用 ReleaseDock 的第一周。周一早上，你把它接上网站聊天和邮箱。一个客户发来消息：“你们的定价页面打不开。”AI 自动回复：“抱歉，我们正在修复，这是临时帮助页面链接。”你甚至没看到这条消息。另一个客户问：“上个月说的批量导出功能上线了吗？”AI 查了一下更新日志，发现你上周确实发布了，于是回复：“已上线，这是操作指南。”你只收到一条通知：“有 1 个问题需要你处理——客户投诉退款流程太复杂。”你点开，看到 AI 已经把相关帮助中心文章和最近的更新记录都贴在了对话里。你回了一句“我手动处理”，然后关掉电脑去喝咖啡。这就是 ReleaseDock 想给你的日常。

GitHubsignal

NousResearch/hermes-agent

35167 forks198296 stars

GitHubsignal

thedotmack/claude-mem

7220 forks83396 stars

GitHubsignal

bytedance/deer-flow

9771 forks71993 stars

今日值得看：Zernio WhatsApp API

Zernio WhatsApp API 是今天最值得先看的信号。Zernio WhatsApp API 是一个把 WhatsApp 的消息、通话和 AI 智能体打包成一个接口的开发者工具。

今日 Brief

产品侧可以先看 Zernio WhatsApp API：Zernio WhatsApp API 是一个把 WhatsApp 的消息、通话和 AI 智能体打包成一个接口的开发者工具。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

Zernio WhatsApp API

279 votes71 comments

来源：Product Hunt

你是一家电商公司的技术负责人，老板突然说：“下周我们要在 WhatsApp 上做客服和营销，用户发消息过来要能自动回复，还要能打语音电话通知订单异常，最好还能让 AI 分析聊天记录自动跟进。”你听完头皮发麻。WhatsApp Business API 的申请流程本身就够折腾了——要提交企业资质、要等 Meta 审核、要配置 webhook、要处理消息模板的预审。更麻烦的是，你想让 AI 参与进来，就得自己搭一个对话管理服务，把 WhatsApp 的消息流接到 LLM，再处理状态管理、会话超时、媒体文件上传。等你把这一套搞完，老板可能已经换了三个方向。这就是 Zernio 想替你省掉的那部分痛苦。

Zernio 做的事情很简单：给你一个统一的 API，让你用一行代码就能发 WhatsApp 消息、发起语音通话、甚至部署一个 AI 智能体。你不是直接跟 Meta 的 WhatsApp Business API 打交道，而是通过 Zernio 的接口。你作为开发者，只需要在后台配置好你的 WhatsApp 商业账号，然后调用 Zernio 的 endpoint。比如你想给用户发一条订单确认消息，POST 一个 JSON 过去，里面写上收件人号码、消息内容、要不要附带图片。Zernio 帮你处理模板合规、消息路由、重试和状态回调。如果你想做 AI 客服，你可以在 Zernio 里创建一个 agent，告诉它你的业务规则和知识库，然后把这个 agent 绑定到某个 WhatsApp 号码上。用户发消息过来，Zernio 自动把消息传给 agent，agent 处理后通过 Zernio 回复。整个过程你不需要自己维护 LLM 的推理服务，也不需要操心 WhatsApp 的速率限制和媒体存储。

它的核心机制可以想象成一个“WhatsApp 万能转接头”。你本来需要自己焊一堆线——Meta 的 API、Twilio 的语音、OpenAI 的接口、数据库、消息队列——现在 Zernio 把所有这些接口集成到一个插排上，你只需要插上你的业务逻辑。它帮你做了协议转换、认证、状态同步和错误处理。你不需要知道 WhatsApp 的媒体上传需要先获取一个 upload URL，也不需要知道语音通话的信令流程。你只需要告诉 Zernio：“给这个号码打电话，播放这段语音。”剩下的它搞定。

对比一下真实存在的替代方案。Twilio 也提供 WhatsApp API，而且很成熟，支持消息和语音。但 Twilio 的定位是“通信基础设施”，它给你的是底层能力：发消息、收消息、管理会话。你要自己做 AI 集成，自己写对话管理逻辑，自己处理多轮对话的上下文。Zernio 选择了一条更上层的路径：它把 AI 智能体直接内置到 API 里。你不需要再单独接一个 LLM 服务，Zernio 的 agent 可以理解自然语言、调用你定义的工具（比如查订单、改地址）、并且自动维护会话历史。这意味着，如果你只是想快速做一个 WhatsApp 上的 AI 客服原型，用 Zernio 可能一天就能上线，而用 Twilio 加 LangChain 加你自己的服务器，至少需要一周。但代价是，你失去了对底层细节的控制。Twilio 允许你自定义几乎每一个环节的失败处理、重试策略、媒体编码，而 Zernio 把这些封装成了黑盒。如果你的业务需要极低延迟的语音通话或者特殊的消息路由逻辑，Zernio 可能不够灵活。

边界和代价也很清楚。Zernio 不适合那些已经深度定制了 WhatsApp 通信流程的大企业。比如你已经有了一套复杂的消息路由系统，对接了多个 CRM 和工单系统，那么迁移到 Zernio 可能意味着要重构现有架构。另外，Zernio 的 AI agent 目前能处理的任务复杂度有限——它适合规则明确的场景，比如退货咨询、订单查询、预约提醒。如果你的客服需要处理大量模糊的、需要人工判断的复杂投诉，AI agent 可能会给出不准确的回复，这时候你还是需要人工兜底。还有一个风险是依赖第三方：Zernio 本身依赖 Meta 的 WhatsApp API，如果 Meta 调整政策或限制接口，Zernio 的可用性会受影响。你没法直接跟 Meta 沟通，只能等 Zernio 适配。

想象一下你是一个独立开发者，正在做一个帮本地花店做 WhatsApp 订花的小工具。你用 Zernio 花了一个周末就搭好了：创建一个 agent，告诉它“用户发‘我要订花’就展示菜单，用户选好花后询问配送地址和时间，然后调用你的库存 API 检查是否有货，最后生成订单并发送确认消息”。周一早上，花店老板打开手机，看到 WhatsApp 上已经有三个客户通过这个机器人下了单，每个订单的聊天记录都自动同步到了他的后台。他只需要在后台确认配送即可。这就是 Zernio 想让你做到的——把 WhatsApp 变成一个能自动接单、能打电话、能聊天的业务入口，而你只需要写几行配置。

Editor's Pick

affaan-m/ECC

33481 forks218265 stars

来源：GitHub

Editor's Pick

Claude Code Artifacts

371 votes10 comments

来源：Product Hunt

你正坐在电脑前，跟一个同事在 Slack 里争论一个 React 组件的样式。你觉得自己写的那个 hover 动画没问题，但同事说“你跑一下看看”。你只好把代码复制出来，打开 CodeSandbox，粘贴，等它加载，再截图发过去。整个过程大概三分钟，但你已经被打断了三次——一次是 Slack 通知，一次是浏览器标签页太多找不到 CodeSandbox，一次是粘贴时漏了一行 import。等你终于把截图发过去，同事又说“不对，你点一下那个按钮试试”。你没法在截图里演示交互，只能再录个屏。这时候你已经完全忘了刚才在想什么。

Claude Code Artifacts 就是冲着这个场景来的。它不是一个独立的 IDE，也不是一个在线沙箱，而是直接嵌在 Claude 对话里的一个功能。你在跟 Claude 聊天时让它写一段代码——比如一个带交互的图表、一个表单验证逻辑、或者一个简单的网页布局——它生成代码的同时，旁边就会自动出现一个实时预览窗口。你不需要离开对话，不需要新建项目，不需要配置环境。代码改了，预览立刻跟着变。而且你点一下“分享”，就能生成一个公开链接，任何人打开就能看到那个可交互的工件，就像打开一个网页一样。

它的工作流很简单。你打开 Claude，输入“帮我写一个倒计时组件，样式好看一点，支持自定义截止时间”。Claude 开始生成代码，同时 Artifacts 模块自动启动：它把生成的 HTML/CSS/JS 渲染在一个隔离的 iframe 里，你立刻就能看到倒计时在跑。你觉得字体太小，说“把字体调大，用红色”，Claude 修改代码，预览同步更新。你觉得差不多了，点“分享”，复制链接，丢到 Slack 里。同事点开链接，看到的就是一个能交互的倒计时，还能自己改时间测试。整个过程你只用了两次对话，没有离开 Claude。

你可以把它想象成一个“会自己搭舞台的魔术师”。传统方式是你写好剧本（代码），然后自己找舞台（本地环境或在线沙箱），自己搭布景（配置依赖），自己拉幕布（运行预览）。而 Claude Code Artifacts 是魔术师一边写剧本，一边就把舞台搭好了，幕布也拉开了，你甚至可以直接把观众请进来看。它把“写代码”和“展示代码”这两个动作合并成了一个。

跟 CodeSandbox 或 JSFiddle 这类工具比，路径完全不同。CodeSandbox 是一个完整的在线 IDE，你需要在里面创建项目、安装依赖、写代码、运行。它的优势是能处理复杂项目，有完整的文件系统和包管理。但代价是启动慢、操作重、不适合快速迭代。Claude Code Artifacts 选择的是“轻到极致”——它不关心你的项目结构，不关心依赖管理，只关心你当前这一小段代码能不能跑起来、能不能给别人看。所以当你只是想快速验证一个想法、或者给同事演示一个交互效果时，CodeSandbox 就像开一辆卡车去买瓶水，而 Artifacts 就像骑共享单车。

当然，代价也很明显。它只能处理单文件或少量文件的小型代码片段。如果你要做一个多页面应用、需要后端 API、或者要集成复杂的 npm 包，Artifacts 就无能为力了。它没有文件系统，没有状态管理，没有调试工具。而且预览环境是受限的——你不能访问本地文件、不能调用外部服务、不能持久化数据。它本质上是一个“演示沙箱”，不是开发环境。另外，分享的链接是公开的，如果你不小心把包含敏感信息的代码分享出去，那就麻烦了。所以它适合原型、演示、教学、快速验证，不适合生产级开发。

想象一下这个场景：你正在跟产品经理开会，讨论一个新功能的前端交互。产品经理说“能不能做一个像苹果官网那样的卡片翻转效果？”你打开 Claude，输入“写一个卡片翻转的 3D 效果，鼠标悬停时翻转，背面显示产品信息”。几秒钟后，一个可交互的卡片出现在预览区。你点一下分享，把链接发到会议群里。产品经理在手机上点开，翻转卡片，说“背面再加个按钮”。你当场改代码，预览实时更新。整个会议没有一个人离开座位，没有一个人打开 IDE。这就是 Claude Code Artifacts 想创造的日常。

Editor's Pick

Midjourney Scanner

212 votes6 comments

来源：Product Hunt

你大概有过这种经历：医生让你去做个 MRI，你查了查预约，最早要排到三周后。你到了放射科，躺进那个窄窄的管子，机器开始轰隆隆响，你闭着眼数了四十分钟，出来时耳朵嗡嗡的，护士说结果要等两天。如果查出来没事，你白花了三千块和半天假；如果查出来有事，你又要再等两周才能见到专科医生。整个过程像一场慢动作的折磨，而你只是想确认一下自己身体里有没有长东西。

Midjourney Scanner 想把这套流程压缩到一分钟。它是一台基于超声波的全身扫描仪，你站进去，像过安检一样，60 秒后系统就输出全身的断层图像。谁用它？体检中心的技师、急诊科的医生、或者你公司楼下那个想搞快速筛查的诊所。输入很简单：你脱掉外套，站到指定位置，机器自动调整探头位置。系统用多组超声换能器从不同角度发射声波，接收反射信号，然后通过算法重建出三维解剖结构。输出是一套标准 DICOM 格式的影像，可以直接接入医院的 PACS 系统，也能导出到手机 App 里让你自己看。上下游接什么？上游是预约系统，下游是 AI 辅助诊断软件——比如自动标出可疑结节、囊肿或钙化点。整个工作流里，技师只需要按一个开始键，剩下的交给机器。

你可以把它想象成拍立得和暗房冲洗的对比。传统 MRI 就像把胶卷送到暗房，等几个小时才能看到照片；Midjourney Scanner 是拍立得，按下快门，相纸自己吐出来，60 秒后图像就清晰可见。核心机制是超声波的物理特性：声波在不同组织界面上反射强度不同，机器通过计算回波时间和强度，就能画出身体内部的轮廓。而 MRI 用的是强磁场和射频脉冲，需要超导磁体、液氦冷却、复杂的屏蔽室，所以它又大又贵又慢。

和真正的竞品——比如 GE 的 SIGNA 系列 MRI 或者西门子的 SOMATOM CT——对比，Midjourney Scanner 走了一条完全不同的路。MRI 追求极致分辨率，能看清软组织里的微小病变，代价是扫描时间长、设备成本高（一台 3T MRI 要 200 万美元以上）、对患者要求高（不能有金属植入物、不能动）。Midjourney Scanner 选择用超声，牺牲一部分细节，换来速度、便携和低成本。它的分辨率可能不如 MRI 精细，但在筛查场景里，60 秒能发现肝脏上的一个 1 厘米结节，或者颈动脉里的斑块，这就够了。急诊科医生最需要的是“快”——一个车祸伤员被推进来，你花 60 秒扫一遍全身，先排除内脏大出血，再决定要不要送 CT 做更细的检查。这个场景下，MRI 根本来不及。

当然，代价也很明显。超声对骨骼和气体的穿透力很差，所以它扫不了颅骨里面的脑组织，也扫不了被肠气挡住的胰腺。如果你怀疑脑瘤或者脊髓病变，Midjourney Scanner 帮不了你，还是得老老实实去排 MRI。另外，它的图像质量高度依赖算法重建——如果训练数据不够全，或者患者体型特殊，可能会漏掉一些微小病灶。风险在于，你可能会因为“60 秒就出结果”而过度依赖它，忽略了它看不清楚的地方。

想象一下这个场景：你 45 岁，公司组织年度体检。以前你要空腹抽血、憋尿做 B 超、再约个 CT 查肺，折腾一上午。今年体检中心新装了一台 Midjourney Scanner。你走进去，站好，机器嗡嗡转了一圈，60 秒后屏幕上出现了你全身的横截面图。技师指着肝脏区域说：“这里有个低回声区，大概 8 毫米，建议你去做个增强 MRI 确认一下。”你当场就拿到了报告，下午就约好了专科。整个过程比你买杯咖啡还快。

Editor's Pick

Firecrawl Research Index

187 votes14 comments

来源：Product Hunt

你是一个做 AI 研究的工程师，每天早上打开浏览器，先刷一遍 arXiv，再扫一遍 Twitter 上的论文推荐，然后去 GitHub 看看有没有新的开源实现。你收藏了十几个 RSS 源，但信息还是像瀑布一样砸过来。你真正想要的是：昨天有没有一篇关于“用强化学习优化扩散模型采样步数”的论文？有没有人复现了？代码在哪？你花了一个小时翻来翻去，最后发现那篇论文其实三天前就发了，只是标题里没有“diffusion”这个词，你漏掉了。更糟的是，你的 AI agent——那个你写来帮你做实验的脚本——它根本不会帮你搜论文，它只会等你喂给它数据。

Firecrawl Research Index 就是来解决这个问题的。它不是给你用的，是给你的 agent 用的。你写一个 agent，比如一个每天自动扫描最新研究的脚本，它需要知道去哪里找、怎么找、找到后怎么理解。以前你得自己写爬虫，解析 arXiv 的 XML，处理不同网站的格式，还要处理反爬。现在你只需要让 agent 调用 Firecrawl Research Index 的接口，输入一个查询，比如“强化学习扩散模型采样”，系统就会返回一个结构化的结果列表：论文标题、作者、摘要、代码链接、相关博客。这些结果不是简单的网页链接，而是经过清洗和索引的，agent 可以直接读、直接比较、直接决定要不要下载全文。

工作流是这样的：你的 agent 每天早上 8 点启动，先向 Firecrawl Research Index 发一个请求，参数是“领域=AI/ML，时间=过去24小时，关键词=你关注的方向”。系统内部会去爬取 arXiv、OpenReview、Papers With Code、GitHub 仓库、以及一些顶级会议官网，把新出现的论文和代码抓下来，去重、分类、提取关键信息，然后返回一个 JSON 数组。你的 agent 拿到这个数组后，可以自己跑一个简单的筛选逻辑：如果摘要里提到“diffusion”并且有代码链接，就标记为高优先级，然后自动下载 PDF 到你的本地文件夹。整个过程不需要你动手，你只需要在 agent 的配置文件里写一行“index_url = https://research.firecrawl.dev”。

你可以把它想象成一个专门为 AI agent 设计的图书馆管理员。这个管理员每天凌晨把所有新到的期刊、预印本、代码仓库都整理好，按主题分类，贴上标签，然后站在门口等你家的机器人来问。你家的机器人说“我要今天所有关于扩散模型的新论文”，管理员就递过去一叠已经贴好便签的卡片，每张卡片上写着论文名、摘要、代码在哪。机器人不用自己翻书架，不用自己认字，直接拿卡片回去处理就行。

跟 arXiv 的官方 API 比，Firecrawl Research Index 走了一条完全不同的路。arXiv 的 API 是给人用的，返回的是 XML 格式的元数据，字段很多但结构松散，你需要自己解析、自己过滤、自己决定哪些是重要的。而且 arXiv 只覆盖预印本，不覆盖 GitHub 代码、博客文章、会议论文。Firecrawl Research Index 是专门为机器消费设计的，返回的是紧凑的 JSON，字段少而精，并且聚合了多个来源。如果你的 agent 需要同时跟踪论文和代码，用 arXiv API 你得写两套逻辑，用 Firecrawl 一次搞定。但如果你只是偶尔手动搜一篇论文，用 arXiv 网页搜索更快，因为 Firecrawl 的索引可能比 arXiv 官方晚几个小时——它需要爬取和整理的时间。

代价也很清楚。Firecrawl Research Index 目前只覆盖 AI/ML 领域，你如果做的是量子计算或者生物信息学，它帮不上忙。而且它依赖爬虫，有些网站有严格的 robots.txt 或者需要登录，可能抓不到。另外，它返回的结果质量取决于它索引的源站质量，如果某个会议官网改版了，爬虫可能暂时失效。最重要的是，你得有一个 agent 来消费它——如果你不会写 agent，或者你的工作流里根本没有自动化脚本，那这个索引对你来说就是一堆没用的 JSON。它不是一个给你看的网站，它是一个给机器调用的接口。

想象一下这个场景：你正在训练一个图像生成模型，但效果一直不好。你写了一个小 agent，叫它“论文猎手”，每天凌晨 3 点跑一次。它调用 Firecrawl Research Index，查询“text-to-image 改进 2026”，然后发现一篇来自 ICML 2026 的论文，标题是“Adaptive Guidance for Diffusion Models”，摘要里提到一种新的引导方法，代码在 GitHub 上已经开源。你的 agent 自动下载了 PDF 和代码，还顺手在 Notion 里创建了一个笔记，标题是“今天发现：Adaptive Guidance”，正文里贴了摘要和链接。你早上醒来打开 Notion，看到这条笔记，花 10 分钟读完，然后决定今天试一下这个新方法。如果没有这个索引，你可能要等到一周后别人在 Twitter 上转发才知道这篇论文。这就是 Firecrawl Research Index 想给你的日常——不是让你搜得更快，而是让你的 agent 替你盯着。

Editor's Pick

API to MCP

174 votes26 comments

来源：Product Hunt

想象一下你是个独立开发者，正在做一个 AI 客服 agent。你想让它能查订单状态、改地址、退换货。这些功能你的电商平台都有 API，但你的 agent 没法直接用——它只懂 MCP 协议，不懂 REST、GraphQL、OAuth。你不得不花两天写一个中间层：处理认证、解析 JSON、封装成 MCP 格式。写完发现平台 API 升级了，参数变了，你又得改。更烦的是，你手头有三个不同的 SaaS 要接，每个都要重复这套流程。你开始怀疑，到底是在做 AI 还是在做 API 适配工。

API to MCP 就是来解决这个问题的。你是一个开发者，你手头有一个 API——可能是 Stripe 的支付接口、Notion 的数据库、或者你们公司内部的 CRM。你把这个 API 的 OpenAPI 规范或者一个简单的端点描述扔给 API to MCP，它自动生成一个 MCP 服务器。这个服务器跑起来之后，你的 AI agent 就能像调用本地函数一样调用它：agent 说“查订单 12345”，MCP 服务器就去调那个 API，把结果翻译回 agent 能理解的格式。整个过程你不需要写一行胶水代码。上下游也很清楚：上游是你已有的 API，下游是任何支持 MCP 的 AI agent——比如 Claude、GPT 或者你自己写的 agent 框架。你只需要把生成的 MCP 服务器地址告诉 agent，它就能用了。

你可以把这个过程想象成给一个只会说普通话的人配一个同声传译耳机。API 说的是方言——REST、GraphQL、SOAP，各有各的语法和认证方式。MCP 是普通话，AI agent 只听得懂这个。API to MCP 就是那个耳机，它实时把方言翻译成普通话，而且不需要你手动调频。你只要把耳机戴在 API 上，agent 就能跟它聊天了。

市面上已经有类似的东西，比如 Zapier 的 AI 动作或者 Make 的模块。它们走的是“低代码工作流”路线：你拖拽一个触发器，配置一个动作，然后让 AI 在特定场景下触发。这条路的好处是可视化，非技术人员也能用。但代价是慢——每次调用都要经过 Zapier 的中间层，延迟几百毫秒起步；而且你只能使用 Zapier 已经集成好的 API，自定义的、内部的、小众的 API 接不进去。API to MCP 走的是另一条路：它不提供 UI，不帮你编排流程，它只做一件事——把 API 的“方言”翻译成 MCP 的“普通话”。这意味着它更快（没有额外中间层）、更灵活（任何 API 都能接）、更底层（你可以自己控制认证和缓存）。如果你需要让 agent 高频调用一个内部 API，比如每秒查一次库存，Zapier 那种方案根本扛不住，API to MCP 生成的服务器可以跑在你的服务器上，延迟只有网络往返的时间。

当然，它也有边界。API to MCP 假设你的 API 是稳定的、定义清晰的。如果你的 API 三天两头改字段、换端点，你每次都要重新生成 MCP 服务器，虽然比手动改代码快，但依然有维护成本。它也不适合那些需要复杂状态管理的场景——比如一个 API 调用依赖前一个调用的结果，你需要在 agent 端自己处理逻辑，API to MCP 只负责单次翻译。另外，安全方面你要自己负责：生成的 MCP 服务器会暴露你的 API 给 agent，如果你把 API key 写死在配置里，那 agent 就能无限调用。你需要自己控制 agent 的权限范围。

我有个朋友，他在一家 SaaS 公司做客服系统。他们想用 AI 自动处理退款，但退款 API 是内部自建的，没有现成的 MCP 封装。他花了 15 分钟把那个 API 的 OpenAPI 文件拖进 API to MCP，生成了一个 MCP 服务器，然后让 Claude 连上它。现在客服 agent 可以这样说：“查一下订单 8823，如果金额小于 50 美元且没有争议，直接退款。” 整个过程从“写两天代码”变成了“喝杯咖啡的功夫”。他后来跟我说，最爽的不是省了时间，而是他终于可以把精力放在 agent 的逻辑上，而不是 API 的适配上了。

More Signals

Product Huntsignal

133 votes6 comments

你是一个广告优化师，每周一早上打开 Google Ads 后台，面对的是十几个广告系列、上百个关键词、几十张报表。你要找出上周哪个广告组 ROI 掉了，哪个关键词的点击成本突然涨了，哪个受众群体的转化率在下降。你熟练地打开“报表”标签，选时间范围，拖维度，点“应用”，等五秒，看到一张表格。然后你复制到 Excel 里，再拉个透视表，再画个折线图。整个过程四十分钟，你喝了两口咖啡，发现咖啡凉了。更烦的是，老板突然在 Slack 上问你：“昨天那个新上的搜索广告效果怎么样？”你又得重新拉一遍数据，因为刚才那套报表是针对上周的，不是昨天的。

Ask Ad Manager 就是来解决这个问题的。它是 Google Ads 官方出的一个 AI 助手，跑在 Gemini 模型上。你不需要学任何查询语法，不需要记报表路径，甚至不需要知道数据存在哪个表里。你直接在 Google Ads 界面里打字，像跟人说话一样：“上周哪个关键词的转化成本最高？”或者“帮我对比一下两个广告系列过去七天的点击率。”系统收到你的问题后，Gemini 会先理解你的意图，然后自动去拉 Google Ads 里的原始数据——展示次数、点击、花费、转化、收入这些字段——再根据你的问题做聚合、排序、对比，最后把结果用一句话或者一张小图直接回给你。整个过程大概十秒。它接的是 Google Ads 自己的数据管道，所以不需要你额外授权，也不需要接什么第三方工具。你问完，它答完，你直接就能做决策：关掉那个高成本的关键词，或者给那个高点击率的广告组加预算。

你可以把它想象成一个坐在你工位旁边的数据分析实习生。你不需要教他 SQL，不需要告诉他数据在哪，你只要开口问，他就立刻去查，然后回来告诉你答案。这个实习生不会帮你做复杂的多维度交叉分析，也不会帮你写周报，但他能帮你把那些“看一眼就知道”的问题从四十分钟压缩到十秒。

跟市面上其他广告分析工具比，Ask Ad Manager 走了一条完全不同的路。比如 Supermetrics 或者 Looker Studio，它们给你的是“搭积木”的能力：你拖拽维度、选指标、设过滤器，拼出一张自定义报表。这条路的好处是灵活，你想怎么切数据都行，坏处是每次搭积木都要花时间，而且你得知道你要搭什么。Ask Ad Manager 反过来，它不让你搭积木，它让你直接问问题。你不需要提前想好报表结构，你只需要知道你想知道什么。这个差异在什么场景下重要？就是当你被老板突然问一句、或者开会前五分钟需要快速确认一个数字的时候。那种时候你根本没时间搭积木，你只想有人直接告诉你答案。但反过来，如果你要做一份每周固定的深度复盘，需要同时看十几个维度的交叉数据，那搭积木的方式反而更可靠，因为你可以精确控制每个细节。

当然，Ask Ad Manager 也有它的边界和代价。它只能回答跟 Google Ads 数据直接相关的问题。你问它“这个关键词的搜索趋势跟季节有什么关系？”它可能答不上来，因为它没有外部数据。你问它“帮我预测下个月的花费”，它可能只能给你一个简单的线性外推，而不是复杂的预测模型。另外，它依赖你问问题的准确性。如果你问“哪个广告效果最好”，它可能不知道你指的“效果”是点击率还是转化率还是 ROI，你需要说清楚。还有，它目前看起来只支持英文，中文用户可能暂时用不了。最核心的风险是：它给出的答案是基于你账户里的原始数据，但原始数据本身可能有延迟或者错误。如果昨天某个转化追踪代码出了问题，它给你的“转化成本最高”的结论就是错的。所以你不能完全信任它，尤其是涉及大金额决策的时候，最好还是去后台手动核对一下。

想象一下这个场景：周三下午三点，你正在写下周的投放计划，老板突然在走廊里喊你：“小张，过来一下，客户问我们那个品牌词广告最近三天花了多少钱，转化了多少？”你打开 Google Ads，点进 Ask Ad Manager 的对话框，打字：“品牌词广告系列最近三天的花费和转化数。”两秒后，它回你：“花费 $1,230，转化 47 次，转化成本 $26.17。”你直接走到老板办公室，把数字报给他。老板点点头，说“行，继续。”你回到座位，咖啡还是热的。

Product Huntsignal

Blazly Backlinker

116 votes15 comments

你是一个做独立站的小老板，或者一个在创业公司里管 SEO 的人。你每天早上打开 Ahrefs 或者 Semrush，看到竞争对手的外链数量又涨了，而你的网站还卡在同一个数字上。你知道外链是 Google 排名的命门，但你也知道手动去搞外链有多恶心：你要花几个小时搜博客、找编辑邮箱、写定制化的 outreach 邮件、跟进、记录。你试过外包给 freelancer，结果对方发了一堆垃圾链接，反而被 Google 惩罚。你也试过用模板群发，回复率低到让你怀疑人生。最后你只能自己干，一边写邮件一边骂，时间全耗在这上面，产品本身反而没空优化。

Blazly Backlinker 就是冲着这个场景来的。它的用法很直接：你给它一个目标网站（比如你的电商站），再给它几个核心关键词。然后它自己开始干活。它先扫描整个互联网，找出那些可能接受 guest post、资源页、或者 broken link 的网站。接着它分析这些网站的内容，自动生成一封看起来不像模板的邮件——会提到对方网站上的某篇文章，说“我注意到你有一篇关于 X 的文章，我这里有一篇关于 Y 的补充内容，也许你的读者会喜欢”。邮件发出去之后，它跟踪回复，如果有人感兴趣，它继续跟进，直到链接被放上去。整个过程你不需要碰键盘。最后它会给你一个仪表盘，告诉你哪些链接已经成功、哪些还在沟通、哪些被拒绝了。

这个工作流的核心，其实就是一个自动化的外链建设机器人。你可以把它想象成一个虚拟的 SEO 实习生，但这个实习生不会偷懒、不会抱怨、不会把链接发到色情网站上去。它每天的工作就是：找机会、写邮件、发邮件、跟进、记录。你只需要每天早上花五分钟看一眼进度，然后决定要不要调整策略。

和市面上已有的外链工具比，Blazly 走了一条不同的路。像 Pitchbox 或者 BuzzStream 这类工具，它们本质上是一个外链 outreach 的 CRM——帮你管理联系人、模板、跟进，但邮件内容还是要你写，目标网站还是要你手动找。它们把流程数字化了，但没把人力省掉。而 Blazly 想做的，是把“找目标”和“写邮件”这两个最耗脑子的环节也自动化了。代价是，你失去了对邮件内容的完全控制。如果你是一个对品牌语气极其敏感的人，或者你的行业非常垂直（比如医疗、法律），自动生成的邮件可能会显得不够专业，甚至冒犯对方。

另一个替代方案是买链接，或者用 PBN（私有博客网络）。但那是灰色地带，Google 一旦发现，你的网站可能直接被降权。Blazly 走的是白帽路线——它只做 guest post、资源页添加、broken link 替换这些 Google 认可的方式。所以它的速度不会像买链接那么快，但风险也低得多。

当然，Blazly 不是万能的。它的效果高度依赖你给的关键词和网站质量。如果你选的关键词太冷门，或者你的网站本身内容很薄，它可能找不到多少合适的 target。另外，自动生成的邮件再聪明，也还是比不上一个真正懂行业的人写的定制化邮件。如果你的 niche 需要非常深度的专业交流（比如跟学术期刊编辑打交道），那它可能帮倒忙。还有，它需要接入你的邮箱来发信，如果你用的是 Gmail 或者 Outlook 的免费版，发送量一大就可能被限流甚至封号。你得准备好一个专门的发信域名，或者用 SendGrid 这类服务。

我认识一个做户外装备电商的朋友，他之前每个月花 20 个小时手动搞外链，效果还一般。他试了 Blazly 之后，把关键词设成“hiking gear review”“camping checklist”，然后让它跑了两个星期。第一个星期它发了 80 封邮件，回复率大概 12%，其中 6 个博主同意放链接。第二个星期又发了 60 封，又拿到 4 个。一个月下来，他的外链从 23 个涨到 33 个，域名权重从 28 涨到 32。他说最爽的不是排名涨了，而是他再也不用在周五晚上对着 Excel 表发呆了。现在他每周花 10 分钟看看 Blazly 的报表，剩下的时间全用来拍产品视频。

GitHubsignal

NousResearch/hermes-agent

34988 forks197633 stars

GitHubsignal

bytedance/deer-flow

9731 forks71689 stars

今日值得看：Upstream

Upstream 是今天最值得先看的信号。Upstream 是一个同时为人类和 AI 代理设计的收件箱，让邮件不再混在一起。

今日 Brief

产品侧可以先看 Upstream：Upstream 是一个同时为人类和 AI 代理设计的收件箱，让邮件不再混在一起。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

Upstream

542 votes219 comments

来源：Product Hunt

你每天打开邮箱，看到的是一堆乱七八糟的东西。促销邮件、系统通知、客户询价、同事抄送、还有那些你根本不知道谁发的自动回复确认。你花半小时扫一遍，标记几个重要的，剩下的要么归档要么删掉。但真正让你头疼的是那些需要你亲自回复的邮件——它们混在机器发来的消息里，你得像淘金一样翻找。更糟的是，你明明可以用一个自动脚本处理“重置密码”这类重复请求，但你不敢，因为一旦脚本回错人，或者把机密信息发出去，你就得背锅。你的收件箱本质上是一个人类和机器混居的公寓，没有门牌号，谁都能敲门。

Upstream 想解决的就是这个混乱。它不是一个普通的邮件客户端，而是一个专门为“人类”和“代理”两种角色设计的收件箱。你可以把它理解成，你的邮箱里同时住着你和几个虚拟助手，每个助手有自己的房间、自己的钥匙、自己的待办清单。你不再是唯一的管理员，而是这些助手的老板。

具体怎么用？假设你是一个电商公司的客服主管。每天有上百封邮件进来：客户问物流、要求退款、投诉商品、还有系统自动发送的订单确认。以前你只能靠 Gmail 的过滤器把系统邮件自动归档，但那些需要人工回复的客户邮件还是得你一封封看。现在你用 Upstream，先创建一个“客服代理”，给它一个专属的邮箱地址或者让它监控你的主收件箱里特定标签的邮件。你告诉它规则：所有包含“退款”和“订单号”的邮件，先查一下订单金额，低于 50 美元的自动回复退款链接，高于 50 美元的转给你。然后你创建一个“物流代理”，让它自动回复那些问“我的包裹到哪了”的邮件，从你的物流系统拉取数据。你不需要写代码，Upstream 的界面里直接配置条件和动作。系统处理完的邮件，会标记为“代理已处理”，你只需要每天扫一眼异常情况。上下游接什么？它需要接入你的邮箱服务（Gmail、Outlook 等），可能还需要连接你的电商后台或 CRM。输出就是每个代理的回复草稿、已发送记录、以及需要你确认的待办列表。

用一个比喻来理解 Upstream 的核心机制：它像是一个智能的邮件分拣台，但不是按发件人分拣，而是按“谁该处理”分拣。传统收件箱把所有邮件堆在一个传送带上，你一个人站在末端挑拣。Upstream 在传送带前面加了好几个小机器人，每个机器人只认一种邮件，比如“退款机器人”只抓退款邮件，“会议机器人”只抓会议邀请。它们抓走之后自己处理，处理不了的再扔回你的传送带上。你看到的传送带上的邮件，就只剩下那些机器人搞不定的、或者需要你亲自拍板的。

对比一下真实竞品。Gmail 的智能回复和过滤器其实也在做类似的事，但它的路径是“帮你更快地手动处理”。你写规则、点按钮、选模板，本质上还是你在操作。Upstream 的路径是“让代理替你操作”。Gmail 的过滤器只能做简单的转发、归档、标记，不能主动回复。而 Upstream 的代理可以执行多步骤动作：读取邮件内容、查询外部系统、生成回复、发送。这个差异在什么场景下重要？当你每天有几十封结构化的、规则明确的邮件时，比如“重置密码”、“查询余额”、“预约时间”，Gmail 的过滤器只能帮你归档，你还是要手动回复。Upstream 的代理能直接替你回掉，你只需要审核异常。另一个竞品是像 Missive 这样的团队协作邮箱，它让多个人共用一个收件箱，但每个人还是手动处理。Upstream 引入的是非人类同事，它们不睡觉、不请假、不回错（如果规则写对的话）。

当然，Upstream 不是万能药。它的代价很明显：你需要花时间配置代理的规则和权限。如果你只是每天收十几封私人邮件，用它就像用卡车去买菜。而且代理的决策完全依赖你写的规则，如果规则有漏洞，比如退款金额判断条件写错了，代理可能把大额退款也自动处理了，造成损失。另一个风险是隐私——你把邮件内容和外部系统连接起来，数据安全取决于 Upstream 的加密和你的信任。如果你处理的是高度机密的合同或医疗信息，让一个 AI 代理自动回复可能不合规。所以它最适合的场景是那些重复、低风险、规则清晰的邮件流程，比如客服、订单确认、会议安排。

想象一下你是一个 SaaS 公司的客户成功经理。早上打开 Upstream，看到左侧面板分成了两栏：“人类邮件”和“代理邮件”。人类邮件里只有 3 封：一封是重要客户的升级投诉，一封是 CEO 的紧急询问，一封是合作伙伴的合同修改。代理邮件那一栏显示：客服代理昨晚处理了 47 封密码重置请求，全部自动回复成功；会议代理帮你拒绝了 5 个时间冲突的会议邀请，并自动建议了新的时间；账单代理标记了 2 个付款失败的客户，并生成了提醒邮件草稿等你确认。你花 10 分钟处理了那 3 封人类邮件和 2 个异常，剩下的时间你可以去喝杯咖啡，或者想想怎么改进产品。这就是 Upstream 想给你的日常——不是更快地处理邮件，而是让邮件自己处理自己。

Editor's Pick

Honestly

412 votes112 comments

来源：Product Hunt

你做了一个产品，上线了，发了推，请了 KOL，数据看起来不错。但你心里清楚，真正的反馈不在你的后台，不在客服邮件里，而在 Reddit 的某个子版块和 TikTok 的评论区里。那些地方没人认识你，没人会给你留情面。用户在那里骂你的定价，吐槽你的 UI，或者——更糟——根本没人提你。你想知道他们到底在说什么，但 Reddit 的搜索烂得像 2005 年的论坛，TikTok 的推荐算法只给你看跳舞的猫。你只能手动翻，翻到凌晨两点，看到一条“这玩意儿就是个垃圾”，然后你点进那个人的主页，发现他是个竞品的水军。你累了。

Honestly 就是来解决这个问题的。你不需要再当人肉爬虫。你打开 Honestly，输入你的产品名或者网址，系统就开始干活。它去 Reddit 和 TikTok 上搜所有提到你产品的帖子、评论、视频和回复。然后它把这些内容拉回来，不是简单列个列表，而是帮你分类：哪些是正面评价，哪些是负面，哪些是功能请求，哪些是 bug 报告。你看到的不再是散落的碎片，而是一份整理好的“用户真实想法报告”。你可以把它接进 Slack 或者 Notion，每天早上看一眼，就知道昨天有没有人在 Reddit 上骂你服务器崩了。

它的工作流其实很简单。你作为产品经理或者创始人，在 Honestly 的界面里输入你的产品关键词。系统调用 Reddit 和 TikTok 的公开 API（或者爬虫），抓取匹配的内容。然后它用 NLP 做情感分析和主题聚类，把每条内容打上标签，比如“价格太贵”“功能缺失”“UI 好看”。最后输出一个仪表盘，你可以按时间、平台、情感倾向筛选。上下游？你可以把结果导出成 CSV 给团队，或者通过 webhook 推送到你的数据分析工具里。

171 votes54 comments

140 votes27 comments

你大概有过这种经历：坐在咖啡馆里采访一个创业者，对方语速飞快，你一边点头一边在笔记本上狂写，三分钟后手就酸了，字迹潦草到连自己都认不出。或者你是个产品经理，在头脑风暴会上突然冒出一个好想法，你掏出手机录音，心想“回头再整理”，结果那个录音文件在手机里躺了三个月，再打开时你已经完全忘了当时在兴奋什么。更常见的是，你是个学生，上课时老师讲得正嗨，你拼命记笔记，结果漏掉了后半段的关键推导。你试过用手机上的语音转文字 App，但要么要付费，要么必须联网，要么识别出来一堆错别字，还得手动改。最烦的是，你不敢把敏感内容——比如商业计划、病历、法律条款——传到云端，谁知道那些录音会被谁看到。

Juno 就是冲着这个痛点来的。它是一款免费、开源、完全在本地运行的语音转文字工具，核心卖点就三个字：实时、本地、免费。你打开它，点一下录音按钮，对着麦克风说话，屏幕上立刻出现文字，你说完它停，文字就留在那里了。整个过程不需要联网，你的声音不会离开你的电脑。它用的是本地 AI 模型，不需要 GPU 也能跑——当然，如果你有块好显卡，速度会更快。

谁会用 Juno？记者、学生、内容创作者、会议记录员、程序员——任何需要把口头信息快速变成文字的人。输入就是你的声音，系统怎么处理？它加载一个轻量级的语音识别模型（比如 Whisper 的本地版本），实时把音频流切成片段，逐段识别，然后拼接成连贯的文字。输出就是一段干净的文本，你可以直接复制到笔记软件、邮件、文档里。上下游接什么？它本身不绑定任何系统，但你可以把它当成一个“语音输入法”来用：打开 Juno，说话，复制文字，粘贴到 Notion、Obsidian、Google Docs 或者你的代码注释里。如果你是个开发者，它甚至提供了 API，你可以把它嵌入到自己的工具链里。

用一个比喻来理解 Juno 的核心机制：它就像你桌上放了一个永不疲倦的速记员。这个速记员只为你工作，不联网，不偷看你的笔记，你说什么他立刻写下来，而且写完之后你可以直接拿走那张纸。他不需要打电话回总部去查字典，因为他自己就带着一本厚厚的词典——那本词典就是本地 AI 模型。你不用担心他把你说的秘密泄露出去，因为他根本不跟外界通信。

对比一下市面上常见的替代方案。最直接的竞品是 Otter.ai，它也是实时语音转文字，但它是云端服务。你说话，音频上传到 Otter 的服务器，识别完再传回来。好处是模型大、准确率高、能区分说话人、还能自动生成摘要。坏处是：免费版每月只有 300 分钟，超过就要付费；而且你的所有录音都存在别人服务器上，隐私是个大问题。另一个替代方案是 Google Docs 的语音输入，它也是云端，而且只能在浏览器里用，识别质量依赖网络。Juno 选择了一条完全不同的路：本地运行。这意味着它不依赖网络，不消耗你的流量，不把你的数据交给任何人。代价是什么？本地模型的准确率通常不如云端大模型，尤其是在口音重、背景噪音大的情况下。而且你需要自己下载模型文件，初次设置可能需要几分钟，不像 Otter 那样打开网页就能用。但如果你经常处理敏感信息——比如律师整理客户谈话、医生记录病历、创业者讨论未公开的产品——那么本地运行就是刚需。你不可能为了省几分钟设置时间，把客户的隐私数据传到云端。

边界和代价也很清楚。Juno 不适合需要极高准确率的专业场景，比如法庭记录、医学听写，因为本地模型可能把“心肌梗死”识别成“心急梗死”，这种错误在医疗场景里是致命的。它也不适合多人会议，因为它目前没有区分说话人的能力——如果三个人同时说话，它只会输出一团乱麻。另外，它需要一定的计算资源：如果你的电脑是五年前的轻薄本，CPU 跑起来可能会风扇狂转，识别速度也会变慢。开源项目还有一个风险：维护者可能某天不更新了，或者模型版本落后了。但好处是，你可以自己改代码，或者等社区贡献。

最后，讲一个用起来什么样的小故事。我有个朋友是科技记者，经常在嘈杂的展会现场采访。以前他每次采访完，都要花两小时听录音、打字。后来他装了 Juno，在采访前打开它，把手机放在桌上当麦克风（Juno 支持任何系统输入设备）。采访过程中，他一边听对方说话，一边看着屏幕上实时跳出的文字，偶尔纠正一下识别错误。采访结束，他直接复制文字到稿件里，稍微润色一下就能发。他说，以前两小时的工作现在十五分钟搞定，而且再也不用担心录音文件丢失了。有一次他在飞机上写稿，没有网络，他对着 Juno 口述了整篇专栏，落地时文字已经在了。这就是 Juno 想给你的日常。

Product Huntsignal

Retool

132 votes7 comments

你是一个创业公司的 CTO，团队二十个人，散落在三个时区。你们用 Retool 搭了十几个内部工具——客户管理、订单审核、库存预警、财务对账。但最近你发现，市场部的人偷偷用 Airtable 搭了一个客户跟进表，运营部在 Google Sheets 里写了一个自动计算物流费用的脚本，甚至有个工程师用 Python 写了个爬虫，直接连了生产数据库。没人知道这些工具谁在用、数据流到哪里、有没有安全漏洞。你半夜被报警短信吵醒，说某个 API 被调了十万次，你翻遍所有系统都找不到是谁干的。这就是没有治理的后果——你给了团队自由，但失去了控制。

Retool 的新方向就是解决这个矛盾。它不强迫你只能在 Retool 的编辑器里写应用。你可以用 VS Code、用 Cursor、甚至用 AI 聊天工具生成代码，然后把那个应用“注册”到 Retool 里。一旦注册，Retool 就接管了所有脏活：谁可以访问这个应用、它连接哪些数据库、每次操作有没有日志、版本怎么回滚。你不需要改一行代码，只需要在 Retool 的控制台里点几下，就能给每个应用贴上标签、分配权限、设置审批流程。输入是你的代码或配置，输出是一个受管的应用，上下游接的是你的数据库、API、以及企业 SSO。

想象一下，你有一个团队用“Vibe coding”——就是那种让 AI 帮你写代码、你只管说“再改一下”的玩法。他们可能一天生成十几个小工具，每个都连不同的数据源。如果没有治理，这些工具就是定时炸弹。Retool 的做法是：你尽管用 AI 写，写完之后扔进 Retool 的“治理层”，它会自动扫描依赖、检测敏感数据、生成审计日志。就像一个安检通道，你带什么行李都行，但必须过 X 光机。

这和 Airtable 或 Notion 的路径完全不同。Airtable 让你搭数据库和界面，但它本质上是一个超级表格，权限只能做到“谁可以看这个表”，做不到“谁可以执行这个操作”。Notion 更偏向文档和知识库，它的权限模型是页面级的，不适合处理带业务逻辑的工具。Retool 选择的是“开发自由 + 集中治理”——它不限制你用什么工具写，但要求所有应用最终都跑在它的运行时里，受它的策略控制。这个差异在合规场景下特别重要。比如你要过 SOC 2 审计，审计员会问：“你们所有内部工具的数据流有没有记录？谁有权限修改生产数据？”用 Airtable 你很难回答，用 Retool 你可以直接导出一份完整的审计报告。

当然，这个方案有代价。它假设你的团队愿意把应用“交出来”统一管理。如果你们只有两三个人，所有工具都是一个人写的，那治理就是多余的成本。而且 Retool 本身的学习曲线不低——你要理解它的权限模型、环境变量、部署策略。如果你只是想快速搭一个一次性脚本，用 Retool 就像用集装箱卡车运一袋米。它的真正战场是那些“团队在扩张、工具在爆炸、审计在敲门”的公司。

我认识一个运维主管，他团队里有个实习生用 Claude 写了一个自动重启服务器的工具，直接连了 AWS 的 root 账号。主管发现后吓出一身冷汗，但没骂实习生，而是把那个工具导入 Retool，加了一条规则：所有涉及生产环境的操作，必须经过另一个有权限的人确认。现在那个工具还在用，但每次重启都会发一条 Slack 消息给主管，他点一下确认才执行。三个月后审计来了，他直接导出操作日志，审计员看了一眼说“没问题”。这就是 Retool 想给你的日常——你可以继续用你喜欢的方式写代码，但安全和控制，交给它。

GitHubsignal

NousResearch/hermes-agent

34783 forks196989 stars

GitHubsignal

thedotmack/claude-mem

7190 forks83142 stars

GitHubsignal

bytedance/deer-flow

9703 forks71541 stars

今日值得看：Framer 3.0

Framer 3.0 是今天最值得先看的信号。Framer 3.0 是一个让设计师用 AI 代理协作建网站的工具，它把网站设计从“一个人画完所有页面”变成了“你指挥一群 AI 助手各自干活”。

今日 Brief

产品侧可以先看 Framer 3.0：Framer 3.0 是一个让设计师用 AI 代理协作建网站的工具，它把网站设计从“一个人画完所有页面”变成了“你指挥一群 AI 助手各自干活”。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

Framer 3.0

395 votes18 comments

来源：Product Hunt

你是一个独立设计师，接了一个客户的官网项目。客户说“首页要改，产品页加个新模块，博客页面换个字体”。你打开 Figma，开始调布局、改文案、切图。改完首页，客户又说“对了，那个动画效果能不能再快一点”。你回到 Figma，找到那个组件，调整参数，预览，导出。然后你发现产品页的文案还没改，又得切到另一个页面。一个下午过去了，你只改了三个页面，客户还在微信上催“今晚能上线吗”。你盯着屏幕，光标在空白处闪烁，脑子里只有一个念头：要是有人能帮我改这些重复的细节就好了。

Framer 3.0 就是那个“人”。它不是一个让你从零开始画网站的工具，而是一个让你用 AI 代理来分担具体任务的平台。你打开 Framer，创建一个项目，然后你可以“雇佣”一个 AI 代理。比如你告诉它：“帮我生成产品页的 Hero 区域，风格参考首页，文案用客户给的品牌手册。”你输入的是设计需求和参考素材，系统会调用一个专门处理视觉生成的代理，它理解你的指令，然后自动生成一个 Hero 区域，包括布局、图片、文案、按钮。你检查一下，觉得颜色偏冷，就告诉它“暖一点”，它立刻调整。改完，你点一下“分支”，这个修改就变成一个独立版本，不会影响主站。你继续改其他页面，每个代理负责一个模块，每个分支对应一个版本。最后，你把所有分支合并回主站，一键发布。上游接的是你的设计稿和品牌资产，下游接的是 Framer 的托管和域名系统。整个工作流从“你一个人画所有页面”变成了“你指挥一群 AI 助手各自干活”。

这个机制的核心，就像你有一个设计团队，但每个成员都是 AI。你不需要管他们怎么画图、怎么调代码，你只需要告诉他们“做什么”和“做成什么样”。他们各自有独立的“工作区”——也就是分支，互不干扰。你像项目经理一样，分配任务、检查结果、合并交付。Framer 3.0 的 AI 代理不是那种“你问它答”的聊天机器人，而是能直接操作设计元素的执行者。它理解“把按钮改成圆角”这种具体指令，而不是“帮我设计一个按钮”这种模糊需求。

对比一下 Webflow。Webflow 的路径是“给你一个强大的可视化编辑器，你自己拖拽、调参、写代码”。它的能力上限很高，你可以做出任何你想要的网站，但代价是你要学会它的编辑器，要理解 CSS 和响应式设计。Framer 3.0 的路径是“给你一群 AI 代理，你告诉它们你要什么，它们帮你做”。它的能力上限取决于代理的理解和执行能力，但门槛低得多。在什么场景下这个差异重要？当你需要快速迭代、频繁修改、或者团队里没有专职前端时。比如一个创业公司的市场部，每周要更新活动页面，用 Webflow 你得等设计师出图、前端切图，用 Framer 3.0 你直接告诉代理“生成一个双十一促销页”，十分钟搞定。

当然，Framer 3.0 不是万能的。它的 AI 代理目前更适合处理视觉和布局层面的任务，如果你需要高度定制化的交互逻辑、复杂的后端集成，或者对像素级精度有强迫症，它可能不够用。代理生成的设计有时会偏离你的预期，你需要花时间检查和调整。分支管理虽然方便，但如果团队多人同时操作，合并冲突依然可能发生。而且，它依赖 Framer 的生态，如果你已经深度绑定了其他设计工具或 CMS，迁移成本不低。

想象一下，你接了一个新客户的项目，客户说“我要一个官网，五个页面，三天内上线”。你打开 Framer 3.0，创建项目，然后对 AI 代理说：“首页用品牌色，产品页展示三个核心功能，博客页面用卡片式布局。”代理开始工作，你一边喝咖啡一边看它生成。十分钟后，五个页面的初稿出来了。你检查了一下，觉得产品页的文案不够有冲击力，就告诉代理“把‘高效’改成‘快如闪电’”。它改了。你又让另一个代理生成一个“关于我们”的页面，它自动从品牌手册里提取了公司介绍和团队照片。两个小时后，你完成了所有修改，合并分支，发布上线。客户收到链接，打开一看，说“这比我想象的还好”。你回了一句“常规操作”，然后关掉电脑，去楼下散步。这就是 Framer 3.0 想给你的日常。

Editor's Pick

affaan-m/ECC

33354 forks217281 stars

来源：GitHub

Editor's Pick

Swytchcode CLI

329 votes50 comments

来源：Product Hunt

你花了两周写了一个 AI agent，它能自动帮你查竞品价格、更新库存、发邮件给供应商。你满心欢喜地跑起来，结果第一天就崩了——它调用 Shopify API 时网络闪断，返回了一个 503，agent 直接卡住，把“查询失败”当成“库存为零”，然后给所有供应商发了补货邮件。你赶紧手动回滚，但已经有三家供应商发货了。更糟的是，agent 没有记忆，它不知道刚才查到了哪一步，你只能从头再来。这不是你一个人的问题。所有试图让 AI 干点正经活的开发者，最后都会撞上同一堵墙：API 不可靠，状态不持久。你的 agent 像个金鱼，每次游一圈回来就忘了刚才游到哪了。

Swytchcode CLI 就是冲着这个痛点来的。它不是一个图形界面，也不是一个 SaaS 后台，就是一个命令行工具。你打开终端，装好它，然后告诉它：“我要让我的 agent 能调用 Stripe、Shopify、Slack、Notion、GitHub 这些 API，并且每次调用完要记住结果。” 你不需要写一堆重试逻辑、状态管理、错误处理代码。Swytchcode 替你管这些。它的工作流是这样的：你的 agent 发出一个请求，比如“查订单 #12345 的状态”，Swytchcode 拿到这个请求，先检查自己有没有缓存这个订单的信息，如果没有，它就去调对应的 API。如果 API 返回了错误，它会自动重试三次，每次间隔递增。如果三次都失败，它会把错误信息存下来，然后告诉 agent：“这个请求失败了，原因在这里，你可以决定下一步。” 如果成功了，它会把结果存进一个叫“durable state”的持久化存储里。下次 agent 再问同一个订单，它直接返回缓存，不用再调 API。你的 agent 不需要自己记任何东西，Swytchcode 就是它的外挂大脑。

谁在用这个工具？主要是那些在命令行里写 agent 的开发者。他们可能用 Python、Node.js 或者 Go 写 agent，然后通过 Swytchcode CLI 把 agent 和外部世界连起来。输入是一个 API 请求的描述，输出是一个可靠的结果。上下游接什么？上游是你的 agent 代码，下游是那 2000 多个 API——Stripe、Twilio、GitHub、Slack、Notion、Google Sheets，等等。Swytchcode 自己维护了一个 API 目录，你不需要自己去配 OAuth 流程、处理 token 刷新、管理 rate limit。它把这些脏活都包了。

用一个比喻来理解：你的 agent 就像一个刚入职的实习生，聪明但毛躁。Swytchcode 是给这个实习生配了一个老练的行政助理。实习生说“帮我查一下上个月销售额”，行政助理知道该打哪个电话、怎么说话、如果对方占线就等一会儿再打、打完把结果记在本子上。实习生不需要知道电话怎么拨、对方是谁、万一打不通怎么办。他只需要问一次，然后就能拿到答案，而且下次再问同一个问题，行政助理直接翻本子告诉他。

对比一下真实竞品。市面上有很多 API 封装库，比如 LangChain 的 tool calling、或者直接写 requests 库。它们走的路是“让开发者自己写逻辑”。你写一个函数，里面 try-except 包一下，手动处理重试，手动存一个变量来记状态。这条路的问题是：每个 agent 都要重复造轮子，而且很容易漏掉边界情况。比如你忘了处理 rate limit，agent 被限流后直接报错；你忘了持久化状态，agent 重启后一切归零。Swytchcode 走的是另一条路：它把“可靠调用 API”和“持久化状态”这两个能力从你的代码里抽出来，变成一个独立的服务层。你不需要写任何重试、缓存、状态管理的代码，只需要告诉 Swytchcode 你要调哪个 API，它帮你搞定。这个差异在什么场景下重要？当你的 agent 需要执行多步骤任务时，比如“先查客户信息，再根据客户等级决定折扣，然后生成报价单，最后发邮件”。每一步都依赖上一步的结果，如果中间任何一步失败，整个流程就断了。Swytchcode 的持久状态能保证每一步的结果都被记住，即使 agent 中途崩溃重启，也能从断点继续。

当然，Swytchcode 不是万能的。它不适合那种只需要调一次 API 的简单脚本。如果你只是写一个脚本，每天跑一次，查一下天气，那直接用 requests 库就够了，装 Swytchcode 反而多了一层依赖。它的代价是：你需要学习它的 CLI 命令，理解它的状态管理机制，而且它目前只支持它目录里的那 2000 多个 API——如果你要调一个冷门 API，可能得自己写适配器。另外，持久状态意味着数据会占用存储，如果你调的是高频 API，缓存可能会膨胀，你需要定期清理。还有一个风险：如果你的 agent 依赖 Swytchcode 的缓存，而缓存数据过期了，它可能返回旧数据。你需要自己设置 TTL 或者手动刷新。

想象一下你正在写一个客户支持 agent。以前你写了一个脚本，每天凌晨跑一次，查所有未处理的工单，然后根据关键词自动回复。但经常因为某个 API 超时而中断，第二天你发现有一半工单没处理。你装了 Swytchcode CLI 之后，重新写 agent：它先调 Zendesk API 拉工单列表，Swytchcode 自动重试了两次，成功拿到数据；然后它根据工单内容调一个内部知识库 API 查答案，Swytchcode 把结果缓存了；最后它调 Slack API 通知你“已处理 23 个工单，其中 3 个需要人工审核”。整个过程跑了 12 分钟，没有一次失败。你打开终端看了一眼日志，Swytchcode 显示：“重试 2 次，最终成功；缓存命中 5 次；状态持久化 23 条。” 你关掉终端，去喝咖啡了。

Editor's Pick

Quartz

196 votes50 comments

来源：Product Hunt

值得关注是因为它切中了 AI 工具发展中的“隐私焦虑”与“注意力涣散”痛点，将 AI 与本地化、专注力结合是差异化方向。但 196 票属早期信号，其实际本地 AI 能力是否真能支撑体验仍需验证，存在包装概念的可能。

Editor's Pick

Daemons by Charlie Labs

203 votes31 comments

来源：Product Hunt

值得关注是因为它将 AI 应用边界从写代码扩展到推流程，切中工程效率痛点。但可能只是噱头的一点在于，若 AI 无法深度理解复杂业务逻辑，易沦为简单规则触发器或产生需人工复核的无效操作，目前缺乏其处理复杂上下文能力的证据。

Editor's Pick

Dopami

146 votes15 comments

34525 forks196175 stars

GitHubsignal

thedotmack/claude-mem

7187 forks82991 stars

GitHubsignal

bytedance/deer-flow

9684 forks71420 stars

今日值得看：Goldfish

Goldfish 是今天最值得先看的信号。Goldfish 是一个 Mac 上的 AI 助手，按一下 Option 键，它就能根据你当前的工作内容，用你的语气帮你写好回复。

今日 Brief

产品侧可以先看 Goldfish：Goldfish 是一个 Mac 上的 AI 助手，按一下 Option 键，它就能根据你当前的工作内容，用你的语气帮你写好回复。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

Goldfish

466 votes154 comments

来源：Product Hunt

你正坐在工位上，屏幕上是第三封来自客户的邮件，内容几乎和前两封一样——问同一个功能的交付时间。你手指悬在键盘上，脑子里已经自动生成了一段回复：“感谢您的关注，我们预计在下周完成测试，届时会第一时间通知您。”但你得一个字一个字敲出来。敲完，复制，粘贴到下一封，改个称呼，再发。一天下来，这种“复制-粘贴-改称呼”的活儿能占掉你半小时。更烦的是，你明明知道该怎么回，但就是不想动手。不是不会，是重复。

Goldfish 就是冲着这个场景来的。它是个 Mac 上的小工具，装好之后，你只需要在任何输入框里按一下 Option 键——对，就是键盘左下角那个——它就会读取你当前正在看的屏幕内容，比如邮件正文、Slack 消息、Notion 文档，然后自动生成一段回复，语气和风格都模仿你。你不需要告诉它你是谁，它自己学。怎么学？它观察你过去写的东西：你常用的句式、你爱用的表情、你习惯的礼貌程度。不是靠你上传一堆样本，而是靠你日常使用中慢慢积累。你用得越多，它越像你。

具体工作流是这样的：你打开邮件，光标落在回复框里。你按 Option，Goldfish 在后台把邮件正文、你的历史回复风格、甚至你最近在看的其他文档（如果你允许）一起打包，发给一个本地或云端的小模型。几秒钟后，回复框里自动填好了一段文字。你可以直接点发送，也可以改几个字再发。它不接管你的键盘，只帮你起个头。上下游接什么？它接你的邮件客户端、Slack、微信 Mac 版、任何能输入文本的地方。它不依赖特定平台，因为它只监听你按 Option 这个动作，然后读取当前窗口的文本。

你可以把它想象成一个“会读心术的自动补全”。不是那种你打一个字它猜下一个字的输入法，而是你还没打，它已经知道你要说什么。就像你有个助理坐在旁边，你刚看完一封信，她就把草稿递过来了。你只需要点头或者改个标点。

和 TextExpander 这类工具比，Goldfish 走的是完全不同的路。TextExpander 靠你手动设置缩写和模板，比如你输入“;addr”它就自动替换成你的地址。它很可靠，但需要你提前把所有可能用到的回复都写好存好。Goldfish 不依赖预设，它靠理解上下文。你不需要提前准备任何东西，它自己猜。代价是它可能猜错。比如你收到一封投诉邮件，它可能生成一段过于客气的回复，而你想强硬一点。这时候你得手动改。TextExpander 永远不会猜错，因为它只做你明确告诉它的事。Goldfish 的优势在于处理那些你懒得写模板、但每天都会遇到的新场景——比如客户问一个你从没回答过的问题，你脑子里有答案，但不想打字。

当然，Goldfish 也有明显的边界。它依赖你的历史数据来学习风格，如果你刚装上去，它就是个陌生人，写出来的东西可能完全不像你。你需要给它几天时间“观察”。另外，它读取你屏幕上的内容，这意味着隐私风险。虽然它说数据只在本地处理，但如果你用的是云端模型，你的邮件内容可能会被传到服务器。敏感行业的人可能不敢用。还有一个限制：它只适合短文本回复。如果你要写一篇长报告，按 Option 出来的可能只是一段开头，剩下的还得自己来。

想象一下你是个每天要回几十条客户消息的客服主管。下午三点，你刚处理完一个投诉，又弹出一条新消息。你叹了口气，按了一下 Option。Goldfish 已经根据对话历史生成了一段回复：“非常理解您的情况，我们正在加急处理，预计今天下班前给您结果。”你扫了一眼，改了一个字，发送。然后你发现，今天你只手动打了三行字，其他全是 Goldfish 起的头。你甚至开始觉得，那个 Option 键比鼠标还常用。

Editor's Pick

affaan-m/ECC

33286 forks216716 stars

来源：GitHub

Editor's Pick

Invoko

343 votes87 comments

来源：Product Hunt

你坐在 Mac 前，屏幕上有 12 个窗口。浏览器里开着 Figma 设计稿，旁边是 Slack 消息，底下压着终端，右上角还挂着日历。你想把刚才截图里的那张图拖进某个文档，但得先找到那个文档的文件夹。你想把一段文字从邮件复制到 Notion，但得先切换窗口、选中、复制、再切换、粘贴、调整格式。你想把今天下午的会议邀请一键加到日历，但得先打开日历应用、点新建、填时间、选参会人。这些动作都不难，但每做一次，你的注意力就被打断一次。一天下来，你发现自己不是在干活，而是在“操作电脑”。你的手在键盘和触控板之间来回移动，你的眼睛在十几个窗口之间跳来跳去，你的大脑在“我要做什么”和“电脑怎么操作”之间反复切换。这就是没有 Invoko 时的日常——你不是在用电脑，你是在伺候电脑。

Invoko 想改变这件事。它不是一个全能的 AI 助手，它只做一件事：帮你操作你的 Mac。你不需要打开它，不需要输入复杂的指令，甚至不需要记住它的存在。它就在你的菜单栏里，像一个小手，随时等着帮你按按钮、拖文件、填表单。它的工作流很简单：你告诉它你想做什么，它理解你的意图，然后直接在你的 Mac 上执行。比如你说“把这张截图放到那个文件夹里”，它自动找到截图、找到文件夹、完成移动。你说“把这段文字发到 Slack 的 #design 频道”，它自动打开 Slack、找到频道、粘贴发送。你说“帮我整理桌面”，它自动把文件按类型归类到不同文件夹。它不生成内容，不回答问题，不写代码——它只做一件事：替你动手。

你可以把它想象成一个坐在你旁边的实习生，你只需要说“帮我把这个文件发给老王”，他就直接拿过你的鼠标，点开微信，找到老王，发送文件，然后把鼠标还给你。Invoko 就是那个实习生，只不过它没有手，它用的是你的 Mac 的自动化能力。它的核心机制是“意图识别 + 桌面操作”。它先听懂你的自然语言指令，然后把它拆解成一系列具体的桌面操作：打开哪个应用、点击哪个按钮、输入什么内容、拖拽哪个文件。这些操作不是靠模拟鼠标点击，而是通过 macOS 的辅助功能 API 和 AppleScript 来实现，所以它不会像脚本那样容易出错，也不会像录屏回放那样死板。

这和 Raycast 这类效率工具走的是完全不同的路。Raycast 是一个强大的启动器，你用它来搜索文件、运行命令、管理剪贴板。它的核心是“你告诉它你要什么，它帮你找到”。你输入“打开设计稿”，它列出所有设计稿文件，你选一个打开。Invoko 的核心是“你告诉它你要做什么，它帮你做完”。你说“把设计稿发给老王”，它自己找到设计稿、找到老王、完成发送。Raycast 像一本索引目录，Invoko 像一个跑腿的。在需要快速查找和启动的场景里，Raycast 更快更直接。但在需要完成一个多步骤任务的场景里，Invoko 更省心——你不需要知道文件在哪、老王是谁、怎么发送，你只需要说出结果。

当然，Invoko 的代价也很明显。它需要你信任它去操作你的电脑。它能看到你的文件、你的应用、你的聊天记录。如果你对隐私极度敏感，或者你的工作涉及高度机密的信息，你可能会犹豫。另外，它依赖 macOS 的辅助功能 API，这意味着某些应用如果对辅助功能支持不好，它可能无法操作。比如一些用 Electron 写的应用，或者那些自定义了界面控件的应用，Invoko 可能识别不了按钮在哪。还有，它只能做那些“可以被自动化”的操作。如果你的任务需要判断、创意、或者复杂的逻辑，它帮不了你。它适合的是那些“你知道怎么做，但不想做”的事，而不是“你不知道怎么做”的事。

想象一下你下午三点有个会，但你的桌面乱成一团，文件散落各处，邮件还没回，日历还没更新。你对着 Mac 说：“Invoko，把桌面上的所有 PDF 整理到‘项目文档’文件夹，把今天下午的会议邀请加到日历，然后给老王发一条 Slack 消息说‘文件已整理好’。”然后你起身去倒杯水。回来的时候，桌面干净了，日历上有了会议，Slack 里多了一条已发送的消息。你坐下来，打开 Figma，开始画图。这就是 Invoko 想创造的日常——你不再需要花时间操作电脑，电脑开始为你操作自己。

Editor's Pick

MakersClaw

302 votes28 comments

来源：Product Hunt

你想想看，一个创业团队，五六个人，每个人身上都挂着七八个工具。Slack 里消息炸了，Notion 里文档要更新，Stripe 有退款要处理，HubSpot 的线索还没跟进，Telegram 上客户又在催。你每天打开电脑，第一件事不是做产品，而是当人肉路由器——把信息从 A 系统搬到 B 系统，再回 C 消息。你招不起全职运营，外包又不放心，只能自己扛。结果就是，你花在“协调”上的时间，比花在“创造”上的时间多得多。这不是创业，这是当接线员。

MakersClaw 想解决的就是这个。它不是一个聊天机器人，不是一个问答助手，而是一个能直接住在你聊天软件里的 AI 员工。你在 Slack 里跟它说“帮我创建一个客服 Claw”，它就会生成一个独立的 AI 代理，有自己的身份、自己的权限、自己能访问的系统。你给它一个任务描述，比如“每天上午 9 点检查 Stripe 的退款申请，500 美元以下自动通过，超过的标记出来 @我”，它就会自己去执行。它不需要你教它怎么登录 Stripe，不需要你告诉它什么是退款，它自己会规划步骤、调用工具、记录结果。你只需要在 Slack 里看它发来的报告，处理它标出来的异常。

它的工作流是这样的：你作为团队负责人，在 Slack 里输入“/hire 退款审核员”，MakersClaw 会弹出一个配置界面。你输入任务描述、选择要接入的系统（比如 Stripe、Gmail、Notion）、设定权限范围。系统会基于你的描述，自动生成一个 AI 代理，并把它部署到一个独立的运行时环境里。这个代理有自己的 API key、自己的账号、自己的文件存储。它每天按你设定的时间自动启动，登录系统，执行任务，然后把结果以消息形式发回你的 Slack 频道。如果遇到它无法判断的情况，它会@你，等你确认后再继续。上下游接的是你现有的 SaaS 工具——Stripe、HubSpot、Notion、Google Sheets——它通过 API 或浏览器自动化操作它们。

你可以把 MakersClaw 理解成“数字分身出租”。你不是在用一个 AI 工具，你是在租一个虚拟员工。这个员工没有工位，没有社保，不睡觉，不请假，只做你分配给它的那几件事。它就像你雇了一个远程实习生，但你不教它怎么用电脑，它自己就会。你只需要告诉它“做什么”，它自己搞定“怎么做”。

跟 Zapier 这类自动化工具比，MakersClaw 的路径完全不同。Zapier 是“如果 A 发生，就做 B”，它是事件驱动的，适合处理“当有人提交表单时，发送一封邮件”这种固定流程。但如果你要处理的是“每天检查退款申请，根据金额和客户等级做不同判断，遇到异常还要人工确认”，Zapier 就太死板了。你需要写一堆条件分支，维护起来像在织毛衣。MakersClaw 用的是 AI 代理，它能理解自然语言描述的任务，能自己规划步骤，能根据上下文做判断。Zapier 是给流程工程师用的，MakersClaw 是给业务负责人用的。你不需要懂技术，只需要懂业务。

当然，它也有边界。MakersClaw 适合的是那些规则相对明确、重复性高、涉及多个系统的任务。如果你要它处理的是“判断这个客户投诉是否应该升级到 CEO”，它做不到，因为这种判断需要大量上下文和人类直觉。它也不适合需要实时交互的场景——比如客服聊天，它处理不了那种来回拉扯的对话。风险在于，你给了它访问 Stripe 的权限，如果它误操作了怎么办？MakersClaw 的设计里，每个代理的权限是严格隔离的，你可以限制它只能读不能写，或者每次写操作都需要你确认。但如果你配置得太宽松，它可能会犯错。所以，一开始最好从小任务开始，比如“每天整理未读邮件摘要”，而不是直接让它处理退款。

我认识一个做 SaaS 的创始人，团队就三个人。他之前每天早上花一小时处理 Stripe 的退款和争议，下午再花一小时整理销售线索。用了 MakersClaw 之后，他在 Slack 里创建了两个 Claw：一个叫“退款管家”，一个叫“线索猎人”。退款管家每天早上 8 点自动登录 Stripe，检查所有退款申请，500 美元以下的直接通过，超过的标出来@他。线索猎人每天下午 2 点从 HubSpot 拉出过去 24 小时的新线索，按评分排序，把高分的发到 Slack 频道里，附上公司简介和联系人信息。他只需要花 10 分钟看异常和跟进高价值线索。剩下的时间，他用来写代码和跟客户吃饭。他说，这是他创业以来第一次觉得“有人在帮我干活”。

Editor's Pick

PeakRoutine

192 votes41 comments

来源：Product Hunt

值得关注是因为它切入了量化自我向个性化干预转化的痛点，且初期社区反馈良好。但可能只是噱头：生物标志物数据的获取门槛及指导的科学性若缺乏壁垒，易沦为普通健康App的概念包装。

Editor's Pick

Edgee Turbo Models

165 votes28 comments

34298 forks195334 stars

GitHubsignal

thedotmack/claude-mem

7171 forks82775 stars

GitHubsignal

bytedance/deer-flow

9668 forks71331 stars

今日值得看：Novu Connect

Novu Connect 是今天最值得先看的信号。Novu Connect 是一个让开发者把 AI agent 直接塞进用户已经在用的聊天工具里的开源工具。

今日 Brief

产品侧可以先看 Novu Connect：Novu Connect 是一个让开发者把 AI agent 直接塞进用户已经在用的聊天工具里的开源工具。
开源侧可以先看 affaan-m/ECC：ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统，让它们更聪明、更安全、更懂你的项目。

Editor's Pick

Novu Connect

334 votes49 comments

来源：Product Hunt

你花了两周写了一个 AI agent，它能自动回复客户邮件、查订单状态、甚至能根据聊天记录推荐产品。你把它部署在服务器上，测试了一百遍，完美。然后你兴冲冲地告诉运营团队：“好了，你们可以用了。”运营的人看着你，问：“怎么用？要打开一个新网页吗？还是要装一个 App？”你说：“对，访问这个链接就行。”他们试了试，第二天就忘了。不是你的 agent 不好用，是它不在他们日常待的地方。你的用户每天泡在 Slack 里、Teams 里、Discord 里，他们不会为了一个 agent 多开一个标签页。这就是 Novu Connect 要解决的问题——把你的 agent 送到用户已经打开的那个聊天窗口里。

想象一下这个场景：你是 SaaS 公司的开发者，你们的客服团队每天在 Slack 里处理几百条消息。你写了一个 agent，能自动识别退款请求、查订单、甚至直接调用 Stripe 的 API 发起退款。但问题是，这个 agent 跑在你自己的服务器上，客服要跟它对话，得先打开一个单独的聊天界面，或者用命令行。客服主管试了一次，说“太麻烦了”，然后继续手动复制粘贴到 Excel 里。你气得想砸键盘，但你也知道，这不是 agent 的错，是入口的错。

Novu Connect 的做法很简单：它给你一个 SDK 或者 API，让你把 agent 注册成一个“机器人”，然后直接嵌入到 Slack、Teams、Discord 这些平台里。你不需要自己写 bot 的认证、消息路由、权限管理那一套。你只需要告诉 Novu Connect：“我的 agent 在 http://localhost:3000/webhook，它接受 JSON 格式的输入，返回文本。”然后 Novu Connect 帮你把 agent 变成一个可以在 Slack 里 @ 的账号。用户发一条消息，Novu Connect 把它转成你的 agent 能理解的格式，agent 处理完，Novu Connect 再把结果贴回聊天窗口。上下游接什么？上游是 Slack 的 WebSocket 或 Events API，下游是你的 agent 服务，中间 Novu Connect 做翻译和路由。你甚至可以把多个 agent 挂到同一个 Novu Connect 实例上，一个负责查库存，一个负责生成报表，用户只需要在聊天里 @ 不同的名字。

用一个比喻来说，Novu Connect 就像一个“AI 代理的插线板”。你的 agent 是各种电器——电饭煲、咖啡机、吸尘器——它们都有自己的插头（API）。但用户家里只有一种插座（聊天工具），而且插座形状还不一样，有的两孔（Slack），有的三孔（Teams），有的圆孔（Discord）。Novu Connect 就是那个万能转换器，你只要把电器插到它上面，它自动适配所有插座。用户不用换插座，也不用买新电器，插上就能用。

对比一下自己写 Slack bot 的路径。传统做法是：你去 Slack 开发者后台创建一个 App，配置 OAuth、权限、事件订阅、消息格式，然后写一个服务来接收 Slack 的 payload，解析成你自己的 agent 能处理的结构，再调用 agent，最后把结果格式化成 Slack 的 Block Kit 发回去。这还没完，你还要处理重试、错误、速率限制、多租户隔离。一套下来，光集成工作就占了你一半的开发时间。Novu Connect 选择了一条不同的路：它把这些脏活累活全包了，你只需要提供一个 HTTP 端点。代价是，你失去了对消息格式的完全控制——比如 Slack 的 Block Kit 里那些花哨的按钮、下拉菜单，Novu Connect 可能只支持纯文本或简单的 Markdown。如果你的 agent 需要跟用户做复杂的交互（比如多步表单、文件上传），那 Novu Connect 的抽象层可能不够用。这个差异在什么场景下重要？当你需要 agent 和用户之间有丰富的 UI 交互时，自己写 bot 更灵活；当你只是想让 agent 能“听到”用户的问题并“回答”时，Novu Connect 省下的时间值得。

边界和代价也很清楚。Novu Connect 是一个开源工具，但它的核心是消息路由和平台适配。如果你的用户不在 Slack、Teams、Discord 这些主流平台里，而是在微信、WhatsApp、Telegram 上，那 Novu Connect 可能不支持（至少目前看它的描述只提到了“where your users already work”，但具体支持哪些平台需要查文档）。另外，它假设你的 agent 是无状态的、请求-响应式的。如果你的 agent 需要长时间运行的任务（比如生成一份 10 页的报告），或者需要主动推送消息给用户（比如定时提醒），那 Novu Connect 的模型可能需要额外配置。还有一个风险：你把自己的 agent 暴露给了 Novu Connect 的服务器，虽然它是开源的你可以自托管，但如果你用它的云服务，数据会经过他们的管道。对于金融、医疗等合规严格的场景，你可能需要自己部署。

最后，说一个用起来什么样的小故事。你叫小王，是某电商公司的后端工程师。你写了一个 agent，叫“退货助手”，它能根据用户输入的订单号和退货原因，自动判断是否符合退货政策，然后生成退货标签。以前客服要在后台手动查订单、看政策、再回复。现在你花了一个下午，用 Novu Connect 把“退货助手”挂到了公司的 Slack 里。第二天早上，客服主管在 Slack 里 @退货助手，输入“订单 #12345，用户说尺码不对，想退”。三秒钟后，agent 回复：“订单 #12345 购买于 7 天前，符合 30 天退货政策，已生成退货标签，请发送给用户。”客服主管愣了一下，然后转头对旁边的同事说：“这玩意儿比实习生靠谱。”你坐在工位上，听到这句话，默默把 Novu Connect 的 GitHub 仓库点了个 Star。

Editor's Pick

Wobo 2.0

246 votes38 comments

来源：Product Hunt

值得关注是因为它切中求职者痛点且获得一定票数验证。但可能被高估：招聘方可能会过滤AI自动申请，导致实际转化率存疑；且“滑动”交互在复杂职位匹配上可能过于简化，存在噱头嫌疑。

Editor's Pick

172 votes20 comments

34089 forks194433 stars

GitHubsignal

code-yeongyu/oh-my-openagent

5052 forks62345 stars

GitHubsignal

bytedance/deer-flow

9655 forks71241 stars

今日值得看：Slashy

Slashy 是今天最值得先看的信号。Slashy 是一个能替你读邮件、写回复、管理收件箱的 AI 助手，你只需要授权它访问你的邮箱，剩下的它自己搞定。

今日 Brief

产品侧可以先看 Slashy：Slashy 是一个能替你读邮件、写回复、管理收件箱的 AI 助手，你只需要授权它访问你的邮箱，剩下的它自己搞定。
开源侧可以先看 NousResearch/hermes-agent：Hermes是一个能随着你的使用习惯和业务需求自动进化的AI代理，像养一个会自己长大的数字员工。

Editor's Pick

Slashy

327 votes100 comments

来源：Product Hunt

你每天早上打开电脑，第一件事不是喝咖啡，而是面对收件箱里那堆未读邮件。你一边快速扫标题，一边判断哪些是客户催报价、哪些是同事问进度、哪些是广告和通知。你点开一封，读三行，切到另一个窗口查资料，再回来打字回复。一封邮件平均花你三到五分钟，如果遇到需要确认细节的，来回五六封，半小时就没了。你一天可能处理五十封邮件，其中三十封是重复性的——确认收到、发个链接、说句“稍后回复”。你明明知道这些事不该占用你的大脑，但你没办法，因为邮件就是你的工作流入口，不回就卡住。

Slashy 就是冲着这个场景来的。它不是一个帮你写邮件草稿的插件，而是一个能直接替你完成邮件任务的代理。你把它连上你的 Gmail 或 Outlook，告诉它你的偏好：比如“客户咨询价格时，先查最新报价表，然后回复并抄送销售主管”“会议邀请自动确认并添加日历”“所有订阅邮件自动归档”。然后 Slashy 就开始干活了。它读你的邮件，理解上下文，判断意图，然后执行动作——回复、转发、归档、标记。你只需要每天花几分钟检查它做了什么，纠正一两个错误，剩下的时间你可以去处理真正需要你判断的事。

它的工作流是这样的：你授权邮箱，Slashy 开始扫描新邮件。它用 AI 理解每封邮件的意图——是询问、确认、通知还是垃圾。然后根据你设定的规则或它学习到的你的习惯，决定怎么处理。比如一封邮件写着“请问你们的产品支持 API 集成吗？”，Slashy 会从你的知识库或网站 FAQ 里找到答案，生成回复，加上相关文档链接，然后直接发送。如果它不确定，它会标记出来，等你确认。它还能处理多轮对话——如果对方追问，它会继续跟进，直到问题解决。上下游接的就是你的邮箱系统，不需要额外工具。

156 votes6 comments

33842 forks193502 stars

GitHubsignal

ChromeDevTools/chrome-devtools-mcp

2797 forks43595 stars

npmjs.org

Chrome官方下场提供MCP Server，意味着AI Agent操控浏览器底层调试协议获得官方背书，极大降低Agent调试前端应用的门槛。但4.3万星可能包含对AI概念的跟风关注，且91个未解决issue表明复杂调试场景下的稳定性仍需验证，短期热度可能高于实际生产落地率。

GitHubsignal

code-yeongyu/oh-my-openagent

5039 forks62221 stars

GitHubsignal

bytedance/deer-flow

9644 forks71161 stars