2026-06-28

今日值得看:Folio AI

Folio AI 是今天最值得先看的信号。将 Claude 级对话能力直接用于生成和迭代 PowerPoint 文件。

今日 Brief

  • 产品侧可以先看 Folio AI:将 Claude 级对话能力直接用于生成和迭代 PowerPoint 文件。
  • 开源侧可以先看 bozhouDev/codex-orange-book:非官方 Codex 全链路实战指南,用结构化文档降低新工具上手门槛。

More Signals

Product Huntsignal

QApilot's CoWork

255 votes53 comments

QApilot's CoWork 做的事情很直接:它让同一个质量工程团队在不增加人手的情况下,把移动端自动化测试的产出提升三倍。它的用户不是开发者,而是那些每天要保证 App 在几十种设备上不出问题的测试工程师。

今天一个移动端 QE 团队要写自动化用例,主流路径仍然是 Appium、Espresso 或 XCUITest。测试人员需要先定位元素,用 XPath 或 Accessibility ID 把按钮、输入框、文本标签一一找出来,再编写脚本模拟点击、滑动、输入,最后把断言逻辑嵌进去。一套覆盖登录、注册、支付、推送的用例写下来,往往要几周。更大的麻烦在后面:App 每两周发一个版本,UI 一改,元素定位就失效,脚本成片变红,维护成本比新建还高。很多团队最后只能把自动化比例压到 20% 以下,剩下的靠手工回归,发版前一群人对着设备点到半夜。

具体卡点不是“不会写脚本”,而是脚本和 UI 之间的耦合太紧。测试脚本本质上是对屏幕像素和控件树的一种脆弱描述,界面一调整,描述就断裂。而移动端 UI 的变化频率远高于后端接口,这让传统的基于元素定位的自动化框架始终处于追着界面跑的被动状态。...

Product Huntsignal

Nada

196 votes18 comments

Nada 做的事情很直接:你对着它哼一段旋律,它给你一首编曲完整的音乐。它不要求你会乐器、懂乐理,也不要求你用文字描述想要的风格,只需要发出声音。它的用户是那些脑子里有旋律、但无法快速把它变成可听作品的人。

今天,一个不会编曲的人想把脑海中的旋律做成音乐,通常会走两条路。第一条是打开 Ableton Live、Logic Pro 或 FL Studio,用 MIDI 键盘一个音一个音地把旋律录进去,再选音色、编配器、调混音。这条路需要数周甚至数月的学习,很多人卡在第一步就放弃了。第二条路是用 Suno 或 Udio 这类文本生成音乐工具,输入一段描述,比如“欢快的流行曲,钢琴为主,节奏轻快”,然后从生成的几个结果里挑一个最接近的。但文本描述无法精确传达旋律走向,你脑子里哼的是“哒哒哒滴答”,Suno 给你的可能是另一条完全不同的旋律线。你只能反复调整 prompt,像抽奖一样碰运气。

更尴尬的是那些处于中间状态的用户:他们会用哼唱转 MIDI 的工具,比如 Vochlea 或 HumBeatz,把哼唱录下来转成音符,但接下来的编曲、配器、混音仍然要回到 DAW 里手动完成。旋律有了...

Product Huntsignal

RetroMac

175 votes17 comments

RetroMac 做的事情很直接:在现代 Mac 上,一键启动一个完整的老款 Macintosh 桌面环境。它不是壁纸包,也不是图标主题,而是一个可以直接运行旧软件、打开旧文件、回到 System 7 或 Mac OS 9 操作体验的独立应用。会用它的人,可能是想打开一份 ClarisWorks 文档的设计师,想跑老游戏的玩家,或者单纯想在一个没有通知弹窗、没有浏览器标签页的环境里写点东西的人。

今天用户如果想回到经典 Mac OS,通常要自己动手搭模拟器。最常见的是 SheepShaver 或 Basilisk II,这两个开源项目能模拟 PowerPC 或 68000 系列 Mac,但配置过程相当折腾。你需要找到一个合法的 ROM 文件,准备一份系统安装光盘镜像,手动分配内存、设置磁盘镜像路径、配置网络共享,还要解决分辨率缩放和文件交换的问题。每一步都可能卡住,论坛上的教程往往过时,不同 macOS 版本下的兼容性也不一样。另一种选择是 Infinite Mac 这类浏览器内模拟器,打开网页就能用,但它跑在沙箱里,没法直接读写本地硬盘,文件一关就没了,也不能安装持久化的软件。还有...

Product Huntsignal

Cloud World Model

151 votes41 comments

开发者想练习部署一个 S3 存储桶、写一段 Lambda 函数,或者测试一个跨 GCP Cloud Storage 和 DigitalOcean Spaces 的数据同步脚本,通常只有两条路:要么直接连真实云账户,要么在本地搭一套模拟环境。真实账户这条路,免费层额度有限,一个忘记删除的负载均衡器、一条没关的日志流,月底账单就能让人心跳加速。本地模拟这条路,过去几乎只有 LocalStack 一个像样的选择,但它只覆盖 AWS,而且社区版在高频调用下经常出现未实现接口的错误。如果项目同时用到 GCP 的 Pub/Sub 和 DigitalOcean 的 Droplet API,开发者就只能自己写 mock 服务,用 Docker 凑一套假的响应,或者干脆在代码里插一堆 `if (process.env.NODE_ENV === 'test')` 的分支。

这些做法的问题不是“不够方便”,而是模拟结果不可信。自己写的 mock 只返回预设数据,不会像真实云服务那样在特定参数组合下抛权限错误、限流错误或区域不可用错误。等到代码部署到真实环境,这些边界情况才会第一次暴露,修复成本已经翻了几倍...

Product Huntsignal

Epilogue 是一个专门为写小说、剧本和诗歌而设计的写作应用,它的用户是那些需要完成长篇作品的严肃作者。与通用文档工具不同,它把一本书当作一个项目来管理,而不是一个无限延伸的文本流。

今天,大多数作者仍然在用 Word、Google Docs 或 Scrivener 写书。Word 和 Google Docs 的用法很原始:新建一个文档,从第一章开始往下写,章节标题靠手动加粗放大,人物设定记在另一个文档里,情节线索靠脑子记。写到后面,想调整章节顺序,只能剪切粘贴一大段文字,然后祈祷格式不乱。想查某个配角上次出场是什么时候,得在几十万字里搜索名字,再人眼核对上下文。

Scrivener 试图解决这个问题,它提供了软木板、大纲视图和分章节管理,但它的设计哲学停留在 2000 年代。界面拥挤,功能入口藏在多层菜单里,学习曲线陡峭到很多作者买完就放弃了。更麻烦的是,它的文件格式依赖本地存储,同步要靠 Dropbox,多人协作几乎不可能。一个合著者想看一眼最新稿子,得等对方手动导出 PDF 发过来。

Epilogue 切入的是长篇内容的结构化管理层。它把书籍拆解成可拖拽的章节、场景和节...

Product Huntsignal

Supra Player

123 votes7 comments

视频创作者、剪辑师和审阅者在日常工作中经常需要对比两个视频版本——可能是不同调色方案、不同剪辑版本,或者客户反馈前后的修改。今天完成这件事的主流方式,是在电脑上同时打开两个 VLC 窗口,手动点击播放,靠眼睛和手指尽量让两个画面同步。稍微讲究一点的,会把视频导入 Premiere 或 DaVinci Resolve,叠放在不同轨道上,通过时间轴对齐后播放对比。这两种方式都能看到画面,但都卡在同一个地方:同步。

手动开两个播放器,永远做不到精确同步。一个窗口点下去,另一个窗口总有延迟,来回调整几次,注意力已经从画面内容转移到操作本身。用剪辑软件对齐时间轴虽然准确,但打开工程、导入素材、渲染预览的过程太重。只是想快速看一眼两个版本的差异,却要等上半分钟甚至更久,而且对比时很难在同一个屏幕上获得干净、无 UI 干扰的并排画面。审阅者往往不是剪辑师,他们更不可能为了看一个对比去学习时间轴操作。

Supra Player 切入的是视频播放控制层里的同步对比问题。它不处理剪辑、不碰渲染、不做 AI 分析,只做一件事:让两个视频在同一界面内严格同步播放,用户可以拖动、暂停、逐帧查看,两个画面始终...

GitHubhot newcomer

bozhouDev/codex-orange-book

221 forks2211 stars

Codex 橙皮书是一个非官方的开源使用指南,把 OpenAI 新推出的 Codex 工具从安装、配置、核心功能到完整实战案例打包成一本可下载的 PDF。它不提供任何新模型能力,切入的是工具上手层——当一款强大的新 Agent 产品突然出现,开发者最缺的不是功能列表,而是一条能从头走到尾、不迷路的路径。

Codex 在 2026 年 6 月发布后,入口一下子铺得很开:桌面 App、命令行 CLI、IDE 扩展、Web 端,每种入口的安装方式、鉴权流程、能力边界都不一样。官方文档虽然存在,但更偏向功能说明和 API 参考,缺少“我是一个普通前端,想用 Codex 做一个宠物零食网站,第一步该点哪里”这种连贯叙事。开发者只能自己在 YouTube 视频、博客文章、Discord 问答和推特 thread 里拼凑信息,很容易卡在环境配置、模型选择、MCP 插件接入这些具体环节上,试了几次跑不通就放弃了。

这本橙皮书做的事情很直接:它把散落在各处的信息重新组织成一条可执行的阅读路线。快速上手路线只保留最必要的章节,让新手能在一两个小时内跑通第一个案例;开发者核心路线则深入 Skill、MC...

GitHubtrending growth

Hmbown/CodeWhale

3370 forks39096 stars

CodeWhale 是一个用 Rust 写的终端编码代理,它不绑定任何单一模型,而是提供一个统一的 harness,让开发者把 DeepSeek、本地 Ollama/vLLM 部署、Claude、GPT 等模型接进同一个终端工作流里。它从社区对 DeepSeek 的编码需求中长出来,现在已经是 3.9 万星、快速迭代的通用代理运行时。

今天一个开发者如果想用 DeepSeek 或本地模型做终端编码,通常只有几条路。要么自己写 Python 脚本,把模型 API 接到文件读写、shell 命令执行上,再手搓一个多步任务循环,很快会卡在工具调用格式兼容、上下文窗口溢出、错误重试这些工程细节里。要么用 Claude Code,但它只认 Anthropic 模型,DeepSeek 用户根本用不了。Cursor 的终端 agent 模式虽然能用,但模型选择受限于内置提供商,想切成本地部署的 Qwen 或 DeepSeek 并不自由。这些方案要么模型绑定太死,要么缺少规划、自我纠错和工具扩展这些编码代理必备的能力。

CodeWhale 切入的是模型与终端工具之间的 harness 层。它不训练...

GitHubhot newcomer

vercel/eve

207 forks2797 stars

vercel/eve 是一个文件系统优先的 Agent 框架。它不提供新的模型能力,而是在项目结构层为 AI agent 建立了一套约定:指令放在 `instructions.md`,工具放在 `tools/`,技能放在 `skills/`,通道和定时任务也各有目录。开发者通过 `npx eve@latest init` 就能生成一个结构清晰、可直接运行的 agent 项目。

今天,大多数开发者构建 agent 时用的是 LangChain、Vercel AI SDK 或直接调用 OpenAI API。系统提示往往硬编码在 TypeScript 文件里,工具函数散落在各个模块中,通道集成和定时任务需要额外手写。当 agent 从单个实验变成需要长期维护的服务时,项目结构就变得混乱。新成员接手时,很难一眼看出这个 agent 能做什么、有哪些工具、指令是什么。更麻烦的是,当开发者用 Claude Code 或 Cursor 这类 coding agent 辅助开发时,这些工具本身也需要理解项目结构,而一个没有约定的代码库会让 AI 也难以定位关键信息。

eve 切入的正是 Agent...

GitHubhot newcomer

Waishnav/devspace

270 forks2610 stars

DevSpace 是一个自托管的 MCP 服务器,把 ChatGPT 变成可以直接操作本地项目文件的编码代理。它不替换 ChatGPT,也不绑定某个 IDE,而是在 ChatGPT 和你本机文件系统、终端之间架一条安全通道。谁在用?那些习惯在 ChatGPT 里讨论代码方案、但每次都要手动把代码搬进搬出的开发者。

今天,一个开发者的典型工作流是这样的:在 ChatGPT 里描述需求,拿到一段代码,复制,粘贴到 VS Code,运行,看到报错,再把报错信息贴回 ChatGPT,等它给出修改,再复制粘贴。如果涉及多个文件,这个循环会反复十几次。另一种做法是直接用 Claude Code 或 Cursor,它们能读文件、跑命令,但 Claude Code 是命令行工具,Cursor 是 IDE,两者都要求你离开 ChatGPT 的对话界面。对于那些已经把 ChatGPT 当作思考伙伴的人来说,切换工具意味着丢掉对话上下文,也丢掉了那种边聊边改的节奏。

真正卡住的地方不是模型能力不够,而是 ChatGPT 看不见你的项目。它不知道你有哪些文件,不知道刚才跑的测试到底哪里挂了,更不可能帮你直...

GitHubhot newcomer

eli-labz/Godcoder

0 forks233 stars

Godcoder 是一个运行在桌面上的本地优先开源编码代理。它不依赖云端后端,开发者把自己的 LLM 密钥配置进去,API 请求从本机直达模型提供商,代码不会经过任何中间服务器。主要面向那些既想用 AI 写代码、又不想把源码交给第三方平台的开发者。

今天,大多数开发者使用 Claude Code、Cursor 或 GitHub Copilot 来完成 AI 辅助编码。这些工具的工作流通常是:在编辑器里提问或发起修改,请求被发送到厂商服务器,模型在云端处理后再返回结果。如果开发者对代码隐私有要求,常见的替代方案是自己写脚本调用 OpenAI API,或者用 Continue 这类插件在本地拼接模型,但前者缺少交互界面和文件管理,后者仍需要手动配置模型端点、上下文策略和工具链,离一个完整的代理体验还有距离。

真正卡住的地方不是模型能力不够,而是开发者一旦想获得“代理式”的编码体验——比如让 AI 自动修改多个文件、执行终端命令、调用外部工具——就不得不把代码暴露给云服务。即使愿意接受这一点,云代理的延迟、会话状态丢失、工具审批机制不透明,也让很多本地工作流难以闭环。更麻烦的是,当开发者...

GitHubhot newcomer

Lutschippi/DEHUB

2 forks134 stars

数据工程师的学习路径一直靠拼凑。打开浏览器,在 awesome-data-engineering 仓库的几千行 Markdown 里找链接,翻 Data Engineering Cookbook 的目录,再切到 dbt 文档、Airflow 官方教程、某个个人博客的对比文章。这些资源散落在十几个标签页里,没有统一入口,也没有人告诉你今天该先学什么。DEHUB 做的事情很直接:把 500 多个资源、50 多种工具、10 多条学习路线图打包成一个可安装的 Python 包,用终端界面交付。上线一天就拿到 134 颗星,说明数据工程师对“别再让我自己整理书签了”这件事有多强的需求。

这个项目真正切入的是知识发现与学习路径层。它不是新工具,不是新框架,而是把已经存在的、但散落各处的优质内容重新组织成一个可交互的入口。用户执行 `pip install dehub-knowledge` 后,在终端里就能浏览分类资源、查看工具对比、跟着路线图走。旧方案里,awesome 列表只是一个扁平链接堆,没有结构化的学习顺序,没有工具之间的横向对比,更新完全依赖维护者的个人时间。官方文档虽然权威,但不会告...

GitHubtrending growth

anomalyco/opencode

22099 forks179737 stars

OpenCode 是一个在终端里运行的 AI 编码代理,定位是“开源版 Claude Code”。它不绑定特定编辑器,也不依赖某个模型厂商,开发者可以在命令行里直接让 AI 读代码、改文件、跑命令。上线 400 多天,已经积累了超过 17 万颗星,增长曲线很陡。

今天大多数开发者用 AI 写代码,要么在 IDE 里装 Copilot 或 Cursor,要么在终端里用 Claude Code。Claude Code 的能力确实强,但它是一个闭源产品,跑在 Anthropic 的服务器上,模型固定,行为不可定制,日志和决策过程对用户不透明。Cursor 虽然体验流畅,但同样把 agent 的调度逻辑锁在客户端里,用户没法换模型、改提示词策略,也没法把它嵌入自己的自动化流水线。那些想自己搭一套编码 agent 的团队,往往只能从零写脚本,把 OpenAI API 和文件系统拼在一起,很快会卡在上下文管理、工具调用循环、安全沙箱这些工程细节上。

OpenCode 切入的是 Agent 执行层。它不训练模型,也不做 IDE 界面,而是把“理解任务→读取代码→规划步骤→执行命令→修改文件→验证...

More From Today

Product Huntsignal

QApilot's CoWork

255 votes53 comments

一个让 QA 团队用自然语言驱动移动端自动化测试的 AI 协作工具。

Product Huntsignal

Nada

196 votes18 comments

用哼唱直接生成完整编曲的 AI 音乐工具

Product Huntsignal

RetroMac

175 votes17 comments

把经典 Mac OS 模拟器封装成一键启动的怀旧桌面应用。

Product Huntsignal

Cloud World Model

151 votes41 comments

一个本地模拟 AWS、GCP 和 DigitalOcean 的开发工具,让开发者在不产生云账单的前提下编写和测试云应用。

Product Huntsignal

Supra Player

123 votes7 comments

一个专为快速对比和同步播放多个视频而设计的播放器,解决视频审阅中版本对比的摩擦。

GitHubhot newcomer

bozhouDev/codex-orange-book

221 forks2211 stars

非官方 Codex 全链路实战指南,用结构化文档降低新工具上手门槛。

GitHubtrending growth

Hmbown/CodeWhale

3370 forks39096 stars

终端编码代理 harness,让任意模型在终端里读代码、改代码、跑命令并自我纠错。

GitHubhot newcomer

vercel/eve

207 forks2797 stars

基于文件系统约定的 Agent 框架,把指令、工具、技能映射为标准目录结构。

GitHubhot newcomer

Waishnav/devspace

270 forks2610 stars

自托管 MCP 服务器,让 ChatGPT 直接读写本地代码并执行命令。

GitHubhot newcomer

eli-labz/Godcoder

0 forks233 stars

一个本地优先的开源桌面编码代理,用自带密钥直接调用模型,代码不离开机器。

GitHubhot newcomer

Lutschippi/DEHUB

2 forks134 stars

数据工程知识聚合终端,用命令行界面交付 500+ 资源与路线图。

GitHubtrending growth

anomalyco/opencode

22099 forks179737 stars

开源终端编码 Agent,把 AI 编程从闭源 IDE 拉回命令行。

2026-06-27

今日值得看:Agent Arena

Agent Arena 是今天最值得先看的信号。一个让 AI 代理公开对战、排名的社区竞技场。

今日 Brief

  • 产品侧可以先看 Agent Arena:一个让 AI 代理公开对战、排名的社区竞技场。
  • 开源侧可以先看 bozhouDev/codex-orange-book:非官方 Codex 全链路实战指南,用结构化文档降低新工具上手门槛。

More Signals

Product Huntsignal

note.md

227 votes34 comments

note.md 做的事情很直接:它把你电脑上的 Markdown 笔记和研究文档,变成本地大模型的长期记忆。用户打开终端,指定一个笔记目录,之后每一次和本地模型对话,模型都能自动引用这些笔记内容,不需要每次手动粘贴,也不需要把数据上传到云端。

今天,一个用 Obsidian 或纯 Markdown 文件管理知识的人,如果想用 AI 辅助写作或提问,通常有几条路。一条是打开 ChatGPT 或 Claude 的网页,把相关笔记内容复制进去,问完关掉,下次再问还得重新粘贴。另一条是用 Notion AI 或 Reflect 这类自带 AI 功能的笔记应用,但笔记必须放在它们的云端,而且 AI 功能通常按订阅收费。还有一条是本地搭建 RAG 流程,用 LlamaIndex 或 LangChain 把笔记向量化存入 Chroma 或 Qdrant,再写脚本连接本地模型。这条路对大多数写作者来说太重了。

用户真正卡住的地方不是“没有 AI 可用”,而是笔记和 AI 之间隔着一道手动操作的门槛。每次对话都是一次性的,模型记不住你昨天写了什么,也不知道你积累的研究素材。云端方案解决了记忆问题,但...

Product Huntsignal

Atlas

178 votes26 comments

Atlas 做的事情很直接:它要让团队里用到的每一个 AI 工具,都能知道公司是怎么运作的。不是再做一个新的 AI 应用,而是在 ChatGPT、Claude、Copilot、Gemini 和各种内部 Agent 之间,放一个共享的公司知识层。

今天一个团队使用 AI 的典型状态是,市场部的人在 ChatGPT 里上传了一份产品介绍 PDF,工程团队在 Claude 里粘贴了技术文档片段,运营同事又在 Copilot 里手动输入了客户背景。每个人都在用自己的方式给 AI 工具“喂”公司信息,但这些信息彼此孤立,版本也不一致。当产品定价改了、政策更新了、客户状态变了,没有人会同时去更新三个不同 AI 工具里的上下文。结果就是,同一个问题,ChatGPT 给出的建议基于三个月前的旧数据,Claude 引用的还是上一个版本的流程,Copilot 干脆不知道有这回事。

这个卡点不在模型能力,也不在工具功能,而在“公司状态”这一层没有统一的来源。Atlas 切入的正是这一层:它不是知识库本身,而是让多个 AI 工具能读取同一套公司信息的同步层。旧方案里,Notion 或 Confluence...

Product Huntsignal

Sleek Analytics

153 votes17 comments

大多数网站运营者想知道“现在谁在网站上”,但完成这个动作的路径远比想象中曲折。Sleek Analytics 做的事情很窄:它只回答一个问题——此刻有哪些访客正在浏览你的网站。它的使用者不是需要复杂漏斗分析的数据团队,而是需要即时感知流量变化的内容运营、市场投放和独立开发者。

今天,用户要看到网站实时访客,通常只能打开 Google Analytics,在左侧菜单层层点击进入“实时”报告。这个页面会显示当前活跃用户数、来源渠道和正在浏览的页面,但它被埋在数十个报表之下,每次查看都需要重新加载,无法常驻在屏幕角落。如果团队里有人没有 GA 权限,还得截图或口头转述。另一种做法是用 Hotjar 或 Microsoft Clarity 的录制回放,但这些工具侧重事后分析,不是“此刻”的感知。还有一些付费的实时分析工具如 Chartbeat,但价格和接入复杂度对中小站点并不友好。

用户卡在的不是数据缺失,而是实时状态被锁在一个需要主动打开、无法持续呈现的界面里。当一篇新文章发布、一次广告投放启动,运营者需要反复刷新 GA 才能捕捉到流量变化,这个间隙里可能已经错过了调整时机。更麻烦的是,...

Product Huntsignal

ModuleX

139 votes27 comments

ModuleX 做的事情听起来简单:一个 AI 工作空间,已经接好了你能想到的各种工具和数据源。但它的真正切口不在聊天,而在连接层。用户打开它,不是要跟一个孤立的模型对话,而是要让模型直接读取自己的 Notion 数据库、查询 Stripe 里的交易记录、往 Google Sheets 里写结果、从 PostgreSQL 里取数,再把这些信息汇总成一份分析报告。整个过程不需要离开这个工作空间,也不需要写连接代码。

今天用户要完成类似的事,工作流往往是割裂的。先打开 ChatGPT 或 Claude,描述需求,然后手动去 Notion 里复制一段文档内容粘贴进去,再去数据库里跑一条 SQL 把结果导出成 CSV,上传给模型分析,最后把模型输出的结论手动填回 Google Docs 或者飞书文档。如果数据源多、步骤多,就变成在四五个工具之间反复横跳。稍微进阶一点的用户会用 Zapier 或 Make 搭自动化流程,但那些流程是静态的,一旦需求变了,比如要换一个数据源或者调整分析逻辑,就得重新配置节点、测试字段映射。更关键的是,这些自动化工具本身不具备理解任务意图的能力,它们只是按固定规则...

Product Huntsignal

Basedash for Excel

127 votes10 comments

Basedash for Excel 做的事情很直接:上传一个 Excel 文件,它就能自动生成一个可交互、可筛选的实时仪表盘,并且数据源更新时仪表盘同步变化。它的用户不是数据分析师,而是那些每天用 Excel 记录业务、却卡在“怎么把数字分享出去”这一步的运营、销售或项目负责人。

今天,一个运营人员用 Excel 整理好本周的渠道投放数据,想同步给团队。最常见的动作是截图,贴到飞书或 Slack 里。数据改了,就再截一次。稍微讲究一点的,会用 Excel 的“发布到网页”功能,但那个页面几乎没有任何交互能力,只能看,不能按日期筛选、不能按渠道下钻。再往前走一步,有人会打开 Power BI Desktop,导入 Excel 文件,拖拽字段生成图表,发布到 Power BI 服务,再复制分享链接。这条路对非技术角色来说,每一步都可能卡住:数据连接选哪个、可视化类型怎么配、工作区权限怎么设。Google Sheets 配合 Looker Studio 的路径类似,依然需要手动建立数据源和报表,无法跳过“搭建”这个动作。

真正的卡点不是缺少工具,而是从一份活的 Excel 文件到一个可...

Product Huntsignal

SquidHub

115 votes16 comments

SquidHub 做的事情听起来简单:给人类和 AI 开一个能一起干活的“房间”。它不是又一个套了聊天框的 AI 助手,而是把 AI 当作一个可以同时被多个人看见、打断、接话的协作参与者。它的用户是那些已经习惯在 Slack 频道、Notion 页面或 Figma 画布里多人实时同步的团队,只不过现在多了一个非人类成员。

今天团队要把 AI 拉进协作,最常见的做法是在 Slack 里装一个 bot,或者单独开一个 ChatGPT 窗口。工作流通常是这样的:有人在频道里讨论方案,另一个人把关键信息复制到 ChatGPT,得到回复后再贴回来,其他人对着截图补充意见。如果讨论转向,又要重新粘贴上下文。更麻烦的是,当两个人同时想向 AI 提问,只能排队等那个唯一的聊天窗口,或者各自开私聊,上下文完全割裂。AI 始终被隔离在对话之外,像一个需要手动调用的外部 API,而不是一个能看见白板上所有便签的参与者。

这里卡住的不是 AI 能力不够,而是协作界面没有给 AI 留位置。现有工具要么是为人设计的多人实时同步(Figma、Notion、Google Docs),AI 只能以插件或侧边栏的形式...

Product Huntsignal

过去一家公司想为十几名员工统一订阅某份付费 newsletter,最常见的做法是让每个人用公司信用卡各自购买,月底财务再逐笔报销。稍微规范一点的团队会让一个人订阅后把邮件转发给同事,或者共享同一个登录账号,但很快就会撞上登录设备限制、邮件链接失效、无法统计谁读了哪期。如果内容涉及行业数据或研究结论,合规部门还会追问:授权范围到底覆盖多少人,有没有办法在员工离职时收回访问权限。

这些麻烦不是 newsletter 独有的,而是所有从个人工具起家的内容平台在碰到组织采购时都会出现的断层。Substack、ConvertKit、Ghost 的付费订阅模型默认买家是个人,没有原生的团队管理面板,也没有面向企业的报价、席位分配和续费逻辑。创作者如果想接企业客户,只能走线下:单独谈价格、签合同、开发票、手动添加邮箱白名单,整个过程和平台提供的自助购买体验完全割裂。

beehiiv 的 Group Subscriptions 切入的正是这一层:把企业采购行为从线下人工流程拉回产品界面内,让 newsletter 的 B2B 销售变得像买 Notion 或 Figma 的团队席位一样简单。管理员可...

Product Huntsignal

LockIn MCP

110 votes17 comments

LockIn MCP 做的事情很直接:它把“屏蔽干扰”这个动作变成 AI 助手能调用的一个 MCP 工具。当用户告诉 Claude 或其它支持 MCP 的 Agent “我要开始写代码了,帮我锁住注意力”,Agent 不再只能回复一句“好的,加油”,而是真的可以关掉通知、屏蔽社交媒体网站、启动系统级专注模式。它的用户是那些已经在日常工作流里频繁使用 AI 助手的人,尤其是开发者。

今天大多数人解决专注问题的方式仍然很手工。有人用 Cold Turkey 或 Freedom 这类应用,提前设置好屏蔽列表和定时规则,时间一到自动封锁 YouTube、Reddit、X。有人靠系统自带的 Focus 模式,手动打开,再手动关掉。还有人写一些简单的脚本,用 hosts 文件或浏览器插件来阻断特定域名。这些方法都能用,但它们和 AI 工作流之间有一条很宽的缝:Agent 知道你要开始深度工作了,但它碰不到你的专注设置。你仍然需要从对话窗口里切出去,自己点开一个应用,自己启动屏蔽,自己决定什么时候结束。Agent 只能旁观。

这个缝就是 LockIn MCP 切进去的地方。它没有重新发明专注方法...

GitHubhot newcomer

bozhouDev/codex-orange-book

217 forks2134 stars

Codex 橙皮书是一个非官方的开源使用指南,把 OpenAI 新推出的 Codex 工具从安装、配置、核心功能到完整实战案例打包成一本可下载的 PDF。它不提供任何新模型能力,切入的是工具上手层——当一款强大的新 Agent 产品突然出现,开发者最缺的不是功能列表,而是一条能从头走到尾、不迷路的路径。

Codex 在 2026 年 6 月发布后,入口一下子铺得很开:桌面 App、命令行 CLI、IDE 扩展、Web 端,每种入口的安装方式、鉴权流程、能力边界都不一样。官方文档虽然存在,但更偏向功能说明和 API 参考,缺少“我是一个普通前端,想用 Codex 做一个宠物零食网站,第一步该点哪里”这种连贯叙事。开发者只能自己在 YouTube 视频、博客文章、Discord 问答和推特 thread 里拼凑信息,很容易卡在环境配置、模型选择、MCP 插件接入这些具体环节上,试了几次跑不通就放弃了。

这本橙皮书做的事情很直接:它把散落在各处的信息重新组织成一条可执行的阅读路线。快速上手路线只保留最必要的章节,让新手能在一两个小时内跑通第一个案例;开发者核心路线则深入 Skill、MC...

GitHubtrending growth

omnigent-ai/omnigent

610 forks5010 stars

想象一下你是一个全栈开发者,手头有三个项目:一个用 React 写前端,一个用 Python 做后端 API,还有一个是给客户演示的 POC。你同时装了 Claude Code、Codex 和 Cursor,因为每个工具在不同任务上各有优势。但问题来了:Claude Code 在终端里跑,Codex 在 VS Code 插件里,Cursor 是个独立编辑器。你想让 Claude Code 帮你重构一个函数,然后让 Codex 检查测试覆盖率,最后用 Cursor 改个 UI 样式。每次切换,你都得重新登录、重新加载项目、重新告诉 AI 上下文。更烦的是,你不敢让 Claude Code 直接改生产环境的配置文件,因为它没有权限控制,一旦它自作主张改了数据库连接字符串,你就等着线上事故吧。你每天花在“伺候”这些 AI 上的时间,比写代码还多。

Omnigent 就是来解决这个混乱的。你作为开发者或团队负责人,先安装它,然后在配置文件里声明你要用哪些 AI 工具:Claude Code、Codex、Cursor,甚至你自己写的自定义 agent。系统会把这些工具统一注册到一个“元工具”里...

GitHubhot newcomer

vercel/eve

200 forks2669 stars

想象一下你是个独立开发者,正在做一个自动处理客户邮件的代理。你打开编辑器,开始写代码:调用 OpenAI API,解析回复,管理状态,处理错误,还要考虑安全沙箱。一周后,你的代码变成了一团乱麻——API 调用散落在各个文件里,状态管理靠全局变量,错误处理全靠 try-catch 堆砌。你甚至不敢部署,因为一旦某个环节出错,整个代理就会卡死。这就是没有 eve 时的状态:你花 80% 的时间在搭架子,只有 20% 的时间在真正写业务逻辑。

eve 就是来解决这个问题的。它不是一个现成的 AI 助手,而是一个让你自己造 AI 助手的工具箱。你是一个开发者,你用 TypeScript 写一个工作流定义文件,告诉 eve 你的代理要做什么:比如“每天早上 8 点检查新邮件,如果是退款请求就调用 Stripe API 查询订单状态,然后根据金额和客户等级决定自动处理还是标记人工”。eve 拿到这个定义后,会在一个沙箱环境里运行你的代理,管理它的生命周期、状态持久化、工具调用和错误恢复。输出是一个可以部署到 Vercel 的代理实例,或者一个可以嵌入到你现有应用里的模块。上下游接什么?它原生对接...

GitHubtrending growth

heygen-com/hyperframes

2934 forks31547 stars

HyperFrames 是一个开源框架,让 AI 编码代理通过编写 HTML 直接生成 MP4 视频。它不提供新的模型能力,也不做视频编辑,真正切入的是视频表达层——把代理输出的文本代码,变成可预览、可渲染的最终视频文件。

今天,一个开发者想让 Claude Code 或 Cursor 生成一段产品介绍视频,通常会走两条路。要么手动打开 Premiere 或 CapCut,把代理生成的文案、分镜脚本一段段贴进去,调整时间轴、加转场、配音乐;要么调用 HeyGen、Synthesia 这类 AI 视频服务的 API,但代理需要理解复杂的 JSON 参数、素材上传流程和异步渲染状态,稍有不慎就卡在鉴权、模板 ID 或视频合成超时上。真正能跑通的,往往是开发者自己写一段 FFmpeg 命令,把图片序列和音频拼起来,但 FFmpeg 参数繁多,代理生成的命令经常因为路径错误、编码参数不兼容而直接失败。

这些方案共同的卡点在于:代理擅长生成文本,但视频是二进制产物,中间隔着 GUI 操作、API 黑盒或命令行脆弱性。HyperFrames 把问题重新定义成“写一段 HTML,然后我来渲染”。...

GitHubhot newcomer

QwenLM/Qwen-AgentWorld

51 forks565 stars

Qwen-AgentWorld 是一个语言世界模型,它不直接执行任务,而是用长链思维推理来模拟代理可能遇到的环境,覆盖 MCP、搜索等七个领域。它面向正在构建通用 AI 代理的开发者,同时放出了模型权重 Qwen-AgentWorld-35B-A3B 和跨领域评估基准 AgentWorldBench。

现在,开发者想让一个代理同时处理 MCP 工具调用、网页搜索、代码执行等任务,通常需要自己动手拼环境。比如,为了测试代理使用 MCP 服务器的能力,得手动部署几个 MCP 服务,写好交互脚本,再设计各种异常情况;要测搜索,得接上搜索 API 并模拟结果排序和截断。这些环境彼此独立,接口不统一,每加一个新领域就要重新搭一套,而且很难模拟真实世界中任务交错出现的动态变化。部分团队会直接用现有的基准,比如 WebArena 测网页操作,SWE-bench 测代码修复,但它们是静态的、领域单一的,测完一个还得换另一个,没法一次性看清代理的通用能力。

真正卡住的地方不是缺模型,而是缺一个能动态生成多样化交互场景的“世界”。自己写脚本搭环境,不仅耗时,还容易漏掉边缘情况,导致训练出来的代理一进真...

GitHubtrending growth

NousResearch/hermes-agent

36564 forks203770 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把...

GitHubhot newcomer

uphiago/recon-skills

20 forks115 stars

安全研究员和渗透测试工程师每天面对大量目标,侦察阶段往往占据一半以上时间。常见的工作流是打开 Burp Suite 拦截请求,用 Amass 跑子域名,再手动拼接 Nmap 扫描结果,然后根据经验判断下一步该测 SQL 注入还是 CORS 配置错误。这个过程高度依赖个人知识储备,换一个人就可能漏掉关键攻击面。更麻烦的是,当需要把侦察能力交给 AI 代理自动执行时,市面上几乎没有现成的、经过实战验证的技能包可用。代理知道要“找漏洞”,但不知道具体该调用哪个工具、按什么顺序、怎么判断结果。

recon-skills 切入的正是 Agent 执行层与攻击知识之间的空白地带。它把 600 多个真实目标、11 轮现场侦察中沉淀下来的 144 种攻击技能,拆解成代理可以直接读取和执行的指令集。其中包括 24 个侦察技能(WordPress 深度检测、CORS 八种变体利用、JS 源码中 API 密钥提取等)、104 个红队技能(XSS、SSRF、Firebase 配置错误利用等),以及跨攻击链组合和 WordPress 完整沦陷链。每个技能不是泛泛的漏洞描述,而是带有具体操作步骤、参数和判断逻辑...

GitHubtrending growth

ui-ux-pro-max-skill 是一个面向 AI 编码助手的设计技能包,它把 161 条推理规则和 67 种 UI 风格打包成可被 Claude Code、Cursor、Windsurf 等工具直接消费的指令集。开发者用它不是为了画图,而是为了让 AI 写出的界面代码自带设计感。

今天,一个全栈开发者用 Cursor 或 Claude Code 生成前端页面时,通常的做法是给一句提示词:“做一个漂亮的登录页,用 Tailwind”。模型会生成一堆组件,但结果往往像 Bootstrap 默认主题的变体——间距混乱、色彩刺眼、没有信息层级。如果开发者想要更专业的效果,就得自己去 Figma 社区找参考、手动调整设计 token,或者反复和 AI 对话修改,直到视觉上勉强能看。这个过程消耗的不是编码时间,而是设计判断力。

真正卡住的地方在于,AI 编码助手擅长实现功能,却不具备设计决策能力。模型可以写出符合语法的 JSX,但不知道什么样的留白比例适合 SaaS 后台,什么样的阴影深度能传达品牌质感。开发者要么接受“能用但不好看”的结果,要么被迫兼任设计师,在提示词里塞进大量设计约...

More From Today

Product Huntsignal

note.md

227 votes34 comments

将本地 Markdown 笔记直接作为 LLM 长期记忆的极简工具

Product Huntsignal

Atlas

178 votes26 comments

为所有AI工具提供统一公司上下文的同步层。

Product Huntsignal

ModuleX

139 votes27 comments

一个预置大量数据源连接的 AI 工作空间,让用户在一个界面里直接让模型操作多个工具和数据。

Product Huntsignal

SquidHub

115 votes16 comments

一个让人类和AI像多人游戏队友一样实时协作的工作空间。

Product Huntsignal

LockIn MCP

110 votes17 comments

一个让 AI 助手通过 MCP 协议直接屏蔽干扰的专注工具。

GitHubhot newcomer

bozhouDev/codex-orange-book

217 forks2134 stars

非官方 Codex 全链路实战指南,用结构化文档降低新工具上手门槛。

GitHubtrending growth

omnigent-ai/omnigent

610 forks5010 stars

Omnigent 是一个开源工具,让你在一个地方管理所有 AI 编程助手,比如 Claude Code、Codex、Cursor,还能给它们设规则、限制权限,并实时协作。

GitHubhot newcomer

vercel/eve

200 forks2669 stars

eve 是 Vercel 推出的一个框架,让你用 TypeScript 造出能自己干活的 AI 代理。

GitHubtrending growth

heygen-com/hyperframes

2934 forks31547 stars

将 HTML 渲染为确定性视频的开源框架,专为 AI 编码代理设计。

GitHubhot newcomer

QwenLM/Qwen-AgentWorld

51 forks565 stars

一个用长链推理生成多领域代理模拟环境的语言世界模型,附带评估基准。

GitHubhot newcomer

uphiago/recon-skills

20 forks115 stars

一个面向 AI 安全代理的实战攻击技能库,将 144 种渗透侦察技术封装为可调用模块。

2026-06-26

今日值得看:QwenLM/Qwen-AgentWorld

QwenLM/Qwen-AgentWorld 是今天最值得先看的信号。一个用长链推理生成多领域代理模拟环境的语言世界模型,附带评估基准。

今日 Brief

  • 开源侧可以先看 DietrichGebert/ponytail:ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

More Signals

GitHubhot newcomer

DietrichGebert/ponytail

2948 forks57973 stars

你肯定见过这种场景。凌晨两点,你让 AI 帮你写一个简单的函数——比如从 CSV 里读数据、过滤掉空行、返回一个数组。你心想,这玩意儿三分钟搞定。结果 AI 给你生成了 80 行代码:它自己写了个 CSV 解析器,加了一整套错误处理,还贴心地附上了类型定义、单元测试和文档注释。你盯着屏幕,脑子里只有一个念头:我只是想读个文件啊。更糟的是,你不敢删它写的那些“防御性代码”,因为你不知道删了会不会出事。于是你花了二十分钟,一行一行地审查 AI 替你写的“安全网”,最后删掉了 60 行,留下了真正需要的 20 行。你比写代码还累。

ponytail 就是来解决这个问题的。它不是一个独立的工具,而是一套规则和提示词,你可以把它装进 Claude Code、Cursor 或者任何支持自定义规则的 AI 代码助手。你告诉它“用 ponytail 模式”,然后你输入需求的方式完全不变——还是那句“从 CSV 读数据,过滤空行,返回数组”。但 AI 处理的方式变了:它先问自己三个问题。第一,这个功能有没有现成的库可以用?第二,用户真的需要错误处理吗,还是说数据来源是可控的?第三,这段代码三个月后还有...

GitHubhot newcomer

bozhouDev/codex-orange-book

195 forks1930 stars

Codex 橙皮书是一个开源的非官方使用手册,用 HTML 和 PDF 把 Codex 的安装、核心功能、工作流和实战案例组织成一本可阅读的指南。你打开 GitHub 仓库,在线阅读或下载 PDF,就能获得从零到交付的完整路径。和官方文档的碎片化参考不同,它提供了三条阅读路线,从快速上手到进阶扩展,还包含宠物零食网站、招商 PPT、宣传视频等五个完整案例,甚至教你怎么接入第三方模型。内容用 Markdown 编写,版本控制在 GitHub,通过 HTML 渲染,可生成 PDF 离线阅读,结构像一本精心编排的教材。

Codex 发布后,你兴冲冲装好 App,打开终端输入命令,结果面对自动化、Skill、MCP、云端运行这些概念,官方文档像一本字典,每个词都解释了,但你就是不知道怎么串起来做一个真实项目。你在 YouTube 和博客间跳来跳去,看了三个小时,还是没跑通一个完整流程。这个仓库上线一天就拿到 700 多颗星,正是因为它填补了这个“从零到一”的空白。它没有重复官方文档,而是用一本结构化的橙皮书,直接告诉你“先看这里,再做这个,然后你就能交付一个宠物零食网站”。

你作为开发者或...

GitHubhot newcomer

vercel/eve

195 forks2597 stars

想象一下你是个独立开发者,正在做一个自动处理客户邮件的代理。你打开编辑器,开始写代码:调用 OpenAI API,解析回复,管理状态,处理错误,还要考虑安全沙箱。一周后,你的代码变成了一团乱麻——API 调用散落在各个文件里,状态管理靠全局变量,错误处理全靠 try-catch 堆砌。你甚至不敢部署,因为一旦某个环节出错,整个代理就会卡死。这就是没有 eve 时的状态:你花 80% 的时间在搭架子,只有 20% 的时间在真正写业务逻辑。

eve 就是来解决这个问题的。它不是一个现成的 AI 助手,而是一个让你自己造 AI 助手的工具箱。你是一个开发者,你用 TypeScript 写一个工作流定义文件,告诉 eve 你的代理要做什么:比如“每天早上 8 点检查新邮件,如果是退款请求就调用 Stripe API 查询订单状态,然后根据金额和客户等级决定自动处理还是标记人工”。eve 拿到这个定义后,会在一个沙箱环境里运行你的代理,管理它的生命周期、状态持久化、工具调用和错误恢复。输出是一个可以部署到 Vercel 的代理实例,或者一个可以嵌入到你现有应用里的模块。上下游接什么?它原生对接...

GitHubtrending growth

heygen-com/hyperframes

2911 forks31330 stars

HyperFrames 是一个开源的视频渲染框架,它把 HTML 代码变成 MP4 视频,专为 AI 编程助手设计。你用自然语言描述想要的视频,AI 编程助手就会写出带动画的 HTML 页面,然后 HyperFrames 把它渲染成视频文件。和传统视频工具不同,它把视频创作变成了一次代码生成任务,结果可复现、可版本控制。底层基于 Puppeteer 渲染页面,用 FFmpeg 合成音视频,通过 MCP 协议让 Claude Code、Cursor 这类 AI 编程助手直接调用。

最近几个月,AI 编程助手开始能写代码、操作文件,但一直缺一个把代码变成视频的“最后一公里”。以前你想让 AI 帮你做视频,只能让它生成提示词丢给 Runway,或者写个脚本让你手动去剪。画面不可控,修改一次就要重新生成。HyperFrames 的出现正好填上了这个缺口。它给 AI 编程助手装上了视频渲染能力,你只要说“做一个 10 秒的产品介绍,标题淡入,背景视频加轻音乐”,AI 就能直接产出 HTML 源码并渲染成 MP4。这种“代码即视频”的方式让 AI 视频生成从黑盒变成了白盒,每一次修改都精确可控,...

GitHubhot newcomer

Waishnav/devspace

253 forks2486 stars

你打开 ChatGPT,想让它帮你写一段 Python 脚本处理 CSV 文件。你刚把需求打了一半,突然想起昨天让它帮你润色了一封辞职信,聊天记录里还挂着那句“我决定离开公司”。你犹豫了一下,把那段话删了,重新写了一个更模糊的请求。这就是问题——ChatGPT 只有一个聊天窗口,你所有的对话都混在一起。今天你用它写代码,明天用它写情书,后天用它查菜谱。每次打开,你都得先翻一翻历史,确认上次聊了什么,再小心翼翼地开始新任务。更烦的是,如果你同时开着 Codex 写代码,ChatGPT 和 Codex 是两个完全不同的产品,你得在两个窗口之间来回切换,复制粘贴代码,还要忍受 Codex 那套独立的计费方式。你明明只想让 AI 帮你写代码,却要管理两个账号、两套对话历史、两种使用习惯。

devspace 解决的就是这个混乱。你是一个开发者,你每天的工作流是这样的:打开 VS Code,旁边挂着 ChatGPT 的网页,偶尔切过去问个问题。但你发现,ChatGPT 的对话历史里,编程相关的请求和日常闲聊混在一起,每次找上次写的代码片段都要翻半天。你用 devspace 之后,只需要在 Cha...

GitHubtrending growth

NousResearch/hermes-agent

36337 forks203045 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把...

More From Today

GitHubhot newcomer

DietrichGebert/ponytail

2948 forks57973 stars

ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

GitHubhot newcomer

bozhouDev/codex-orange-book

195 forks1930 stars

一本非官方的Codex全链路使用指南,把零散的官方文档和社区经验变成可下载的系统化橙皮书。

GitHubhot newcomer

vercel/eve

195 forks2597 stars

eve 是 Vercel 推出的一个框架,让你用 TypeScript 造出能自己干活的 AI 代理。

GitHubtrending growth

heygen-com/hyperframes

2911 forks31330 stars

一个让 AI 编程助手通过写 HTML 来生成视频的开源框架。

GitHubhot newcomer

Waishnav/devspace

253 forks2486 stars

devspace 是一个让你把 ChatGPT 变成独立编程助手的小工具,就像给 ChatGPT 装了个“工作模式”开关,把写代码和闲聊彻底分开。

2026-06-25

今日值得看:Propane

Propane 是今天最值得先看的信号。自动聚合客户上下文,让产品团队和 AI Agent 共享同一套客户理解。

今日 Brief

  • 产品侧可以先看 Propane :自动聚合客户上下文,让产品团队和 AI Agent 共享同一套客户理解。
  • 开源侧可以先看 DietrichGebert/ponytail:ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

More Signals

Product Huntsignal

Tencent EdgeOne Makers

361 votes81 comments

---

把 AI Agent 变成一个可以访问的网页应用,这件事在今天仍然比想象中重得多。Tencent EdgeOne Makers 做的事情,就是把 Agent 的构建和发布流程,压缩到像在 Vercel 上部署一个前端项目那样简单——几分钟内拿到一个可分享的 URL,背后是已经跑在边缘节点上的完整 Agent。

现在一个开发者如果想做一个能对外服务的 AI Agent,比如一个自动处理用户邮件的助手或一个可以调用外部工具的问答机器人,通常的工作流是这样的:用 LangChain 或类似框架写好 Agent 逻辑,在本地调试通过,然后开始面对部署问题。他需要选择一个云函数服务或一台服务器,把代码打包上传,配置环境变量、密钥、域名、SSL 证书,再写一个简单的前端界面作为交互入口。如果 Agent 需要持久化状态,还得挂一个数据库。整套流程走下来,即使是一个有经验的开发者,从写完核心逻辑到真正上线让别人能用,也常常要花掉半天到一天。对于只想快速验证一个 Agent 想法的 Builder 来说,这个时间成本太高了。

真正的卡点不在模型调用本身,而在“让 Agent 成为一个可访...

Product Huntsignal

一个销售团队使用 CRM 的日常通常是这样的:早上打开 Salesforce 或 HubSpot,看到一堆待办提醒,然后开始逐条更新线索状态、记录通话摘要、给潜在客户写跟进邮件。这些动作本身并不产生新的商机,但它们占用了销售每天两到三个小时。Clarify 的 Customer Relationship Agents 做的事情很直接——它把 CRM 里那个“M”(Management)从人身上拿走,交给一组 AI Agent 去跑。

用户今天完成这些工作的方式高度依赖人工。销售在打完电话后,要手动在 Pipedrive 里把联系人从“已联系”拖到“已报价”,再设置下一次跟进任务。邮件跟进时,他们通常从 Notion 或 Google Docs 里复制半成品模板,稍作修改后发出。如果一天有几十个线索需要推进,这套动作就会变成重复劳动,而且很容易漏掉关键节点。更大的问题是,CRM 系统本身只是一个记录仓库,它不会主动判断“这个客户三天没回复,应该换一种话术再触达”,也不会在销售忘记填写跟进记录时自动补上。

Clarify 切入的是 CRM 中的管理层,而不是数据存储层或分析层。它没有试...

Product Huntsignal

Stripe.Directory

230 votes8 comments

Stripe.Directory 做的事情很直接:它把使用 Stripe 的商家变成可被搜索的条目,而且明确把“agents”写进了产品描述里。这意味着它的目标用户不只是想查某个网店用不用 Stripe 的开发者,还包括那些正在执行支付相关任务的 AI Agent。它切入的不是支付处理层,也不是 Stripe API 的封装层,而是支付生态里长期缺失的一层——商家身份的可发现层。

今天如果一个开发者想知道某个网站是否接入了 Stripe,或者一个 Agent 需要验证一笔交易的收款方是不是合法的 Stripe 商家,能用的办法非常原始。要么手动打开目标网站的结账页面,查看网络请求里有没有 Stripe.js 的痕迹;要么去 Stripe Dashboard 里翻 Connect 子账户列表,前提是你已经有权限;要么写脚本去撞 Stripe 的公开 API,但 Stripe 的 API 设计从来不是为了“搜索商家”存在的,它需要你事先知道 account_id。这些动作对人来说已经够繁琐了,对 Agent 来说几乎不可操作。Claude Code 或 GPT 调用工具时,不能指望它去扒...

Product Huntsignal

Buy by Agentcard

156 votes27 comments

Buy by Agentcard 做的事情很直接:让用户在 Claude 对话里直接下单 DoorDash。它不是一个外卖聚合器,也不是一个聊天机器人插件,而是一个让 AI 助手完成真实支付和订单提交的执行层工具。用一句话说,它把“帮我点一份披萨”从一句建议变成了一次实际交易。

今天用户点外卖的流程非常固定。打开 DoorDash 应用或网页,浏览餐厅,选餐品,填地址,选支付方式,确认下单。如果用户正在和 Claude 对话,比如让 Claude 推荐附近评分最高的披萨店,Claude 可以给出几个选项,甚至附上链接,但到此为止。用户必须离开对话界面,手动完成剩下的所有步骤。从“知道该点什么”到“真的点到”,中间隔着一整套需要人类手指完成的操作。

这个断层在开发者场景里更明显。有人想用 Claude 搭建一个自动订餐的脚本,或者把点餐能力嵌入一个客服 Agent,让用户说一句“老样子”就能下单。但 DoorDash 的 API 虽然存在,直接调用却要处理 OAuth 认证、地址管理、支付令牌、订单状态回执等一系列问题。最麻烦的是支付环节:让 AI 直接持有用户的信用卡信息,既不安全...

Product Huntsignal

Mindstone Rebel

170 votes53 comments

Mindstone Rebel 是一个给 AI Agent 使用的工作区,核心动作不是让 Agent 直接执行任务,而是让它先理解你的项目、你的代码库、你的工作上下文,然后在动手之前先问一句。它的用户是那些已经开始让 Agent 参与写代码、改配置、操作仓库,但又不敢把权限完全交出去的开发者。

今天开发者让 AI 参与实际工作,主要靠几类工具。一类是 Cursor 或 GitHub Copilot 这种内联补全和聊天面板,Agent 在编辑器里给建议,用户一行一行审阅,决定接受还是拒绝。另一类是 Claude Code 或 Codex CLI 这类命令行 Agent,它们可以读文件、跑命令、改代码,每一步会弹出确认。还有一类是更自主的 Devin 或 OpenHands,给定一个任务,Agent 自己去规划、执行、提交 PR。这些工具的共同点是:Agent 要么被动等待用户触发,要么在获得许可后一路执行下去,中间缺乏一个“我先搞清楚状况再跟你商量”的环节。

具体卡点就在这里。Claude Code 的权限确认是操作级的,它问你“是否执行这个命令”,但不告诉你这个命令在整个项目里意味...

Product Huntsignal

Ruby

125 votes21 comments

Ruby 做的事情很窄:在销售或客服通话过程中,实时理解对话内容,并在侧边栏或耳机里轻声提示“下一个问题可以怎么问”。它不是通话记录仪,不是事后分析工具,也不是对话脚本生成器。它的用户是那些每天要打几十通电话、需要在几秒钟内做出反应的人——销售代表、客户成功经理、招聘面试官。

今天,这类用户在通话前通常会自己准备一份问题清单,或者从团队共享的 Notion 文档里复制一套话术。通话过程中,他们一边听客户说话,一边在脑子里快速匹配下一个问题。遇到客户抛出意料之外的异议,比如“你们比竞品贵”,很多人会本能地进入防御性解释,而不是追问。事后,团队可能会用 Gong 或 Chorus 回听录音,标注哪些地方问得不好,但那个电话已经结束了,丢掉的线索不会回来。有些团队会让经理实时旁听,通过 Slack 私聊给销售递话,但一个经理最多同时盯两三个通话,没法规模化。

真正的卡点不在“不知道好问题长什么样”,而在“知道却来不及想”。通话是实时流,客户说完一句话,销售通常只有一两秒的沉默窗口。在这个窗口里,人要同时完成理解、判断和构思,认知负荷极高。Gong 和 Chorus 解决的是“事后知道哪里...

Product Huntsignal

StaleMate PR

128 votes24 comments

完整叙事内容:

StaleMate PR 做的事情非常简单:它把 GitHub 上待处理的 Pull Request 数量变成一个菜单栏颜色信号,PR 堆积到一定阈值,菜单栏就变红。用它的主要是每天被代码和通知淹没的开发者,尤其是那些同时维护多个仓库、需要频繁做代码审查的人。

在没有这个工具之前,开发者跟踪 PR 状态主要靠几件事:打开 GitHub 网页看通知列表、等邮件提醒、或者在 Slack 频道里被 @。也有人自己写一个 cron 脚本,定时调 GitHub API,把未 review 的 PR 数量打印到终端或者发一条系统通知。但这些动作都有一个共同的问题——它们需要开发者主动切换注意力,或者依赖一条很容易被划掉的通知。GitHub 的通知中心里,issue 更新、CI 失败、讨论回复全混在一起,一条 PR review 请求很容易被后续涌入的信息推走。邮件同理,收件箱里还有 Jira 工单、监控告警和日程提醒,PR 只是其中一条。Slack 消息更脆弱,一旦已读就消失了,不会持续提醒你“还有三个 PR 已经躺了两天”。

真正的卡点不是开发者不知道有 PR 要审,而是知...

Product Huntsignal

FUTO Swipe

124 votes8 comments

FUTO Swipe 做的事情很具体:它提供一套开放的、可在设备本地运行的滑动输入模型。不是又一个键盘应用,而是把滑动识别的核心能力拆出来,做成开发者可以直接集成的东西。谁会用?那些想自己做一个滑动输入键盘,但又不想从零训练模型,也不想把用户输入数据交给 Gboard 或 SwiftKey 的人。

今天大多数人在手机上使用滑动输入,靠的是系统自带或第三方键盘。iPhone 用户用 QuickPath,Android 用户用 Gboard 或 SwiftKey。这些键盘的滑动识别模型藏在应用内部,开发者拿不到,用户也看不到。如果你想做一个面向小语种的滑动键盘,或者一个完全离线、不请求网络权限的输入法,你面前的选择很少。要么去调用某个云端输入 API,要么自己收集数据训练模型,前者有隐私风险,后者门槛太高。

用户卡在几个很具体的地方。第一,Gboard 的滑动输入虽然好用,但它是一个完整的键盘应用,不是可以拆出来用的组件。你不能只把它的滑动识别能力拿过来,放进自己的输入法里。第二,即使 Gboard 支持离线模式,它的模型仍然是闭源的,无法审计,也没法针对特定词汇或输入习惯做微调。第三...

GitHubhot newcomer

DietrichGebert/ponytail

2787 forks55099 stars

你肯定见过这种场景。凌晨两点,你让 AI 帮你写一个简单的函数——比如从 CSV 里读数据、过滤掉空行、返回一个数组。你心想,这玩意儿三分钟搞定。结果 AI 给你生成了 80 行代码:它自己写了个 CSV 解析器,加了一整套错误处理,还贴心地附上了类型定义、单元测试和文档注释。你盯着屏幕,脑子里只有一个念头:我只是想读个文件啊。更糟的是,你不敢删它写的那些“防御性代码”,因为你不知道删了会不会出事。于是你花了二十分钟,一行一行地审查 AI 替你写的“安全网”,最后删掉了 60 行,留下了真正需要的 20 行。你比写代码还累。

ponytail 就是来解决这个问题的。它不是一个独立的工具,而是一套规则和提示词,你可以把它装进 Claude Code、Cursor 或者任何支持自定义规则的 AI 代码助手。你告诉它“用 ponytail 模式”,然后你输入需求的方式完全不变——还是那句“从 CSV 读数据,过滤空行,返回数组”。但 AI 处理的方式变了:它先问自己三个问题。第一,这个功能有没有现成的库可以用?第二,用户真的需要错误处理吗,还是说数据来源是可控的?第三,这段代码三个月后还有...

GitHubhot newcomer

omnigent-ai/omnigent

557 forks4722 stars

想象一下你是一个全栈开发者,手头有三个项目:一个用 React 写前端,一个用 Python 做后端 API,还有一个是给客户演示的 POC。你同时装了 Claude Code、Codex 和 Cursor,因为每个工具在不同任务上各有优势。但问题来了:Claude Code 在终端里跑,Codex 在 VS Code 插件里,Cursor 是个独立编辑器。你想让 Claude Code 帮你重构一个函数,然后让 Codex 检查测试覆盖率,最后用 Cursor 改个 UI 样式。每次切换,你都得重新登录、重新加载项目、重新告诉 AI 上下文。更烦的是,你不敢让 Claude Code 直接改生产环境的配置文件,因为它没有权限控制,一旦它自作主张改了数据库连接字符串,你就等着线上事故吧。你每天花在“伺候”这些 AI 上的时间,比写代码还多。

Omnigent 就是来解决这个混乱的。你作为开发者或团队负责人,先安装它,然后在配置文件里声明你要用哪些 AI 工具:Claude Code、Codex、Cursor,甚至你自己写的自定义 agent。系统会把这些工具统一注册到一个“元工具”里...

GitHubhot newcomer

Waishnav/devspace

246 forks2371 stars

你打开 ChatGPT,想让它帮你写一段 Python 脚本处理 CSV 文件。你刚把需求打了一半,突然想起昨天让它帮你润色了一封辞职信,聊天记录里还挂着那句“我决定离开公司”。你犹豫了一下,把那段话删了,重新写了一个更模糊的请求。这就是问题——ChatGPT 只有一个聊天窗口,你所有的对话都混在一起。今天你用它写代码,明天用它写情书,后天用它查菜谱。每次打开,你都得先翻一翻历史,确认上次聊了什么,再小心翼翼地开始新任务。更烦的是,如果你同时开着 Codex 写代码,ChatGPT 和 Codex 是两个完全不同的产品,你得在两个窗口之间来回切换,复制粘贴代码,还要忍受 Codex 那套独立的计费方式。你明明只想让 AI 帮你写代码,却要管理两个账号、两套对话历史、两种使用习惯。

devspace 解决的就是这个混乱。你是一个开发者,你每天的工作流是这样的:打开 VS Code,旁边挂着 ChatGPT 的网页,偶尔切过去问个问题。但你发现,ChatGPT 的对话历史里,编程相关的请求和日常闲聊混在一起,每次找上次写的代码片段都要翻半天。你用 devspace 之后,只需要在 Cha...

GitHubtrending growth

NousResearch/hermes-agent

36110 forks202028 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把...

More From Today

Product Huntsignal

Ruby

125 votes21 comments

一款在通话中实时提示提问建议的AI助手,面向销售与客服场景。

Product Huntsignal

StaleMate PR

128 votes24 comments

一个菜单栏应用,用颜色持续暴露 PR 堆积状态,减少开发者主动检查的负担。

Product Huntsignal

FUTO Swipe

124 votes8 comments

一个提供设备端滑动输入开放模型的项目,让开发者能构建不依赖云端的自定义键盘。

GitHubhot newcomer

DietrichGebert/ponytail

2787 forks55099 stars

ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

GitHubhot newcomer

omnigent-ai/omnigent

557 forks4722 stars

Omnigent 是一个开源工具,让你在一个地方管理所有 AI 编程助手,比如 Claude Code、Codex、Cursor,还能给它们设规则、限制权限,并实时协作。

GitHubhot newcomer

Waishnav/devspace

246 forks2371 stars

devspace 是一个让你把 ChatGPT 变成独立编程助手的小工具,就像给 ChatGPT 装了个“工作模式”开关,把写代码和闲聊彻底分开。

GitHubhot newcomer

Reyzowter/Hello-Agents

3 forks127 stars

🤖 Building AI Agent Systems from Scratch — A comprehensive, practical tutorial from fundamentals to production-grade multi-agent applications

GitHubtrending growth

teng-lin/notebooklm-py

2285 forks16813 stars

Unofficial Python API and agentic skill for Google NotebookLM. Full programmatic access to NotebookLM's features—including capabilities the web UI doesn't expose—via Python, CLI, and AI agents like Claude Code, Codex, and OpenClaw.

2026-06-24

今日值得看:DietrichGebert/ponytail

DietrichGebert/ponytail 是今天最值得先看的信号。ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

今日 Brief

  • 产品侧可以先看 OpenArt Director:OpenArt Director 是一个通过聊天对话来导演电影级视频的AI工具。
  • 开源侧可以先看 DietrichGebert/ponytail:ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

More Signals

Product Huntsignal

Cotypist

342 votes73 comments

你坐在 Mac 前,光标在邮件正文里一闪一闪。你已经写了三行,第四行卡住了——不是不知道要说什么,而是找不到那个最自然的说法。你打开浏览器,切到 ChatGPT,把草稿粘进去,等它生成一段,再复制回来。读一遍,觉得语气太正式,又改了几个词。一封邮件折腾五分钟,一天二十封,光切换窗口和复制粘贴就吃掉你一个多小时。更烦的是,ChatGPT 写出来的东西永远带着一股“AI 味”,你得手动调成自己的声音。

Cotypist 就是来干掉这个流程的。你安装它之后,它躲在菜单栏里,不占地方。你在任何 Mac 应用里打字——邮件、备忘录、Notion、Slack、甚至 Xcode——它都会实时看你正在写什么,然后在光标后面浮出一段灰色的建议。觉得合适,按 Tab 就接受。它怎么知道你的语气?你给它喂样本。把你过去写过的邮件、文章、聊天记录拖进去,它就在本地 Mac 上分析你的用词习惯、句子长度、标点偏好。所有数据不出你的电脑,不上云。输出就是一段跟你本人一模一样的续写。它不接任何外部系统,只跟你的键盘和屏幕打交道。

你可以把它想象成一个“文字分身”——它不说话,只是在你打字时悄悄站在你身后...

Product Huntsignal

Latitude

329 votes46 comments

你花了两周写了一个 AI agent,它能在 Slack 里自动回复客户问题,能查数据库,能调用 API。上线第一天,它突然开始胡说八道——把“退款申请”回复成“恭喜您中奖了”,或者干脆卡住不动。你翻日志,全是 JSON 和 token 计数,根本看不出它当时在想什么。你试着复现,但 agent 的行为有随机性,同样的输入可能走不同的路径。你只能加一堆 print 语句,重新跑,等它再出错。这个过程重复了三天,你开始怀疑自己是不是不该用 AI。

Latitude 就是来解决这个问题的。它不是一个帮你写 agent 的框架,而是一个专门用来“看” agent 内部运行的工具。你把它接入你的 agent 代码——通常是通过一个 SDK 或者 API 调用——然后 Latitude 就开始记录 agent 的每一步:它收到了什么指令,它调用了哪个工具,它从数据库查到了什么,它生成了什么中间思考,最后输出了什么。所有这些信息被结构化地存下来,你可以像看回放一样逐帧检查。它接 GitHub,所以你可以把一次失败的 agent 运行直接关联到某次代码提交,知道是哪个版本引入了 bug。

它的核...

Product Huntsignal

Thumbmagic

309 votes65 comments

---

你花了两天拍、剪、调色、配乐,终于把视频上传到 YouTube。然后你盯着那个默认的缩略图——就是视频里随便截的一帧,画面灰扑扑的,人脸半张着嘴,背景是乱糟糟的桌面。你知道这不行,但你已经没力气再打开 Photoshop 了。你随便找了张网上搜来的“震惊”表情包,配上大号黄色字体“99%的人都不知道”,上传。结果呢?播放量 200,其中 150 是你自己刷的。这不是你的内容差,是你的封面在 YouTube 的推荐流里,连让人停下来的资格都没有。

这就是 Thumbmagic 想替你干掉的事。它不是一个通用的 AI 画图工具,比如你告诉它“画一只戴墨镜的猫”,它不会理你。它的训练数据只有一个来源:YouTube 上那些真正跑出来的、点击率高的缩略图。谁在用?任何一个靠 YouTube 吃饭的人——独立创作者、营销团队、MCN 机构。你输入的是视频的标题、关键词、或者一段简短描述,比如“如何用 100 元改造出租屋”。Thumbmagic 的系统会先理解这个视频的核心卖点,然后从它记住的几十万张爆款封面里提取模式:什么颜色组合最抓眼球?人脸放在左边还是右边?文字是加粗还是手写体...

Product Huntsignal

Hush

181 votes23 comments

你正在调试一个语音客服机器人。它在安静的办公室里表现完美,你说“我要改地址”,它立刻回答“好的,已为您更新”。但当你把它放到真实的门店里——背景是收银机嘀嘀声、顾客聊天声、空调嗡嗡响——它就开始犯傻。你说“我要退货”,它回“好的,您要退火吗?”你重复三遍,它还是听成“退火”。你检查日志,发现语音识别引擎把“退货”识别成了“退火”,因为背景里有人说了“火”字。你气得想砸键盘。这不是你的算法烂,是噪音把信号淹没了。

Hush 就是来解决这个问题的。它是一个开源的噪声抑制库,开发者把它塞进语音 AI agent 的音频管道里。输入是一段带噪音的原始音频流——比如从麦克风录到的 16kHz PCM 数据。Hush 在中间做一件事:把背景噪音滤掉,只留下干净的人声。输出是一段几乎只有说话人声音的音频,然后你再把它送给语音识别引擎或者直接给 AI agent 处理。上下游很简单:上游是任何能采集音频的设备或文件,下游是 ASR 或者对话系统。你可以把它当成一个中间件,用几行代码集成到你的语音管道里。

它的核心机制可以用一个比喻理解:给语音 AI agent 戴上一副降噪耳机。你平时在嘈...

Product Huntsignal

Jotform AI App Builder

164 votes15 comments

你坐在工位上,老板丢过来一句话:“下周客户回访,你搞个登记系统,能填信息、能查历史、能自动发邮件。” 你打开电脑,脑子里开始过选项:用 Excel 吧,多人协作容易乱,发邮件还得手动;用 Google Forms 吧,只能收集数据,查历史得另建表格;找开发吧,排期两周,老板等不了。最后你打开 Jotform,开始拖拽字段、设置逻辑、连邮件服务,折腾一下午,勉强能跑,但界面丑得像 2005 年的内部系统。你叹了口气,心想:要是能直接说句话就生成一个应用就好了。

Jotform AI App Builder 就是干这个的。你打开它,在输入框里打一句话,比如“客户回访登记表,包含姓名、电话、上次回访日期、本次回访记录,提交后自动发送确认邮件给客户,并保存到数据库”。系统用 AI 理解你的需求,几秒钟后,一个完整的应用就出现在你面前:表单字段已经排好,提交按钮绑定了邮件发送,数据自动存入 Jotform 的表格里。你可以直接分享链接给同事用,也可以继续微调——改个颜色、加个字段、调个逻辑,都是拖拽完成。它接的是 Jotform 自己的表单引擎和数据库,上下游就是你的邮箱、你的团队、你的客户。...

Product Huntsignal

Steam Machine

173 votes12 comments

你周末想跟朋友在客厅打《赛博朋克 2077》,但你的游戏本放在书房,搬过去要拔一堆线,HDMI 线不够长,手柄还得重新配对。你试过串流,延迟高到枪都开不准。最后你只能一个人窝在书房玩,客厅那台 65 寸电视落灰。这不是你的问题,是游戏 PC 天生就不该长成那个样子——它又大又重,风扇吵得像吸尘器,摆在电视柜旁边丑得你妈都不想看。

Steam Machine 就是冲着这个场景来的。它小到什么程度?大概两本《哈利·波特》叠起来那么大,重量不到一公斤。你把它塞进双肩包的电脑夹层,带到朋友家,插上电视的 HDMI 口,接上手柄,开机,Steam 大屏幕模式直接弹出来。它跑的是完整 Windows 系统,不是阉割版,所以你能装任何游戏平台——Steam、Epic、Xbox Game Pass 都行。输入就是你的手柄或键鼠,系统自动识别电视分辨率,输出就是 4K 60 帧的画面。上下游接什么?你不需要接任何东西,它自己就是一台完整的 PC,Wi-Fi 6 连网,蓝牙连手柄,USB-C 口可以插外置硬盘。

它的核心机制可以想象成“游戏本被压缩成了一个游戏卡带”。你小时候玩任天堂卡带,插进机器就能...

Product Huntsignal

Blazly SEO

135 votes15 comments

你是一个内容营销负责人,手下有三个人,每个月要出 30 篇博客文章来拉自然流量。你的日常工作是这样的:周一早上打开 Google Docs,看到上周的选题清单,然后开始手动研究关键词——打开 Ahrefs 查搜索量、看竞争对手的标题、分析他们的内容结构。接着你打开 ChatGPT,把关键词和要点扔进去,让它生成初稿。但 ChatGPT 写出来的东西经常跑题,或者语气不对,你得花半小时改。改完以后,你还要手动插入内链、优化 meta description、调整 H2 标签的密度。最后把文章贴到 WordPress 里,设置好发布时间,再手动提交到 Google Search Console。一篇文章从选题到发布,至少三个小时。30 篇就是 90 个小时,你一个人根本做不完,团队里每个人都在重复这个流程,而且每个人用的工具不一样,风格不统一,关键词覆盖经常撞车。

Blazly SEO 想解决的就是这个“内容生产流水线”的问题。它把自己叫做“AI 内容操作系统”,意思是它不只是一个写作助手,而是一个能管理选题、写作、优化、排期、发布的平台。你作为内容负责人,先在 Blazly 里设定好你...

Product Huntsignal

Sakana Fugu

141 votes8 comments

你手上有三个 AI 模型的 API 密钥:OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5、Google 的 Gemini 2.0。每个模型有自己的接口格式、自己的认证方式、自己的定价策略。你的产品需要根据用户输入自动选择最合适的模型——比如写代码用 Claude,创意文案用 GPT,多模态用 Gemini。于是你的代码里塞满了 if-else 判断、错误重试逻辑、token 计数、成本追踪。每次新模型发布,你都要改一遍路由层。更烦的是,用户抱怨响应慢,你查了半天才发现是某个模型超时了,但你的重试机制写错了,直接挂了整个请求。你盯着满屏的 try-catch,心想:我只是想用最好的模型,为什么变成了模型运维工程师?

Sakana Fugu 就是来解决这个问题的。它的名字很怪——Sakana 是日语里的“鱼”,Fugu 是“河豚”——但它的逻辑很直接:你只需要接入一个 API,把请求扔给它,它帮你决定用哪个模型、怎么调用、怎么重试、怎么计费。开发者是它的用户,你输入的是用户的问题和上下文,系统内部维护一个模型池,根据你的配置(比如成本上限、延迟要求、模型擅长...

GitHubtrending growth

openclaw/openclaw

79619 forks380187 stars

OpenClaw 是一个自托管的个人 AI 助手,它把 WhatsApp、Telegram、Slack、iMessage 甚至 QQ 和微信这些你每天都在用的聊天渠道,变成同一个私人助理的对话界面。你用自然语言在任何接入的 app 里跟它说话,它就能回答问题、执行任务、生成内容,还能语音对话或推一个实时 Canvas 给你看。和那些把你锁在单一客户端里的 AI 产品不同,OpenClaw 的核心主张是“渠道只是外壳,助手才是产品”,而且所有数据和推理都可以跑在你自己的设备上。底层是一个 TypeScript 写的 Gateway 控制平面,通过适配器对接二十多种消息平台,最近还接入了 MCP 协议,让助手能直接调用外部工具和数据源。

这个项目最近能冲到 38 万 star,很大程度上是因为它踩中了两个趋势的交汇点:一是人们对 AI 助手“数据主权”的焦虑,二是 MCP 协议让自托管助手突然有了可扩展的手和脚。以前你要么忍受大厂 AI 把你当产品,要么自己用 LangChain 拼一个半成品,但渠道打通和工具调用这两件事始终是断裂的。OpenClaw 把“在任何聊天软件里召唤同一个助手...

GitHubtrending growth

heygen-com/hyperframes

2858 forks30619 stars

HyperFrames 是一个开源的视频渲染框架,它把 HTML 代码变成 MP4 视频,专为 AI 编程助手设计。你用自然语言描述想要的视频,AI 编程助手就会写出带动画的 HTML 页面,然后 HyperFrames 把它渲染成视频文件。和传统视频工具不同,它把视频创作变成了一次代码生成任务,结果可复现、可版本控制。底层基于 Puppeteer 渲染页面,用 FFmpeg 合成音视频,通过 MCP 协议让 Claude Code、Cursor 这类 AI 编程助手直接调用。

最近几个月,AI 编程助手开始能写代码、操作文件,但一直缺一个把代码变成视频的“最后一公里”。以前你想让 AI 帮你做视频,只能让它生成提示词丢给 Runway,或者写个脚本让你手动去剪。画面不可控,修改一次就要重新生成。HyperFrames 的出现正好填上了这个缺口。它给 AI 编程助手装上了视频渲染能力,你只要说“做一个 10 秒的产品介绍,标题淡入,背景视频加轻音乐”,AI 就能直接产出 HTML 源码并渲染成 MP4。这种“代码即视频”的方式让 AI 视频生成从黑盒变成了白盒,每一次修改都精确可控,...

GitHubtrending growth

NousResearch/hermes-agent

35833 forks200905 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把...

GitHubhot newcomer

eooce/transfer-api

1535 forks332 stars

你是一个独立开发者,正在做一个 AI 聊天机器人。你选了 OpenAI 的 GPT-4,因为它的对话能力确实强。但你人在东南亚,每次调用 API 都要等两三秒,有时候直接超时。你试过换 VPN,但 VPN 不稳定,而且每个月多花几十美元。你试过用其他国家的服务器中转,但配置起来像在修水管——你得自己搭 Nginx、配 SSL、写转发规则,还要担心 IP 被封。你每天花在调试网络上的时间,比写代码还多。你开始怀疑,自己到底是在做产品,还是在当运维。

transfer-api 就是来解决这个问题的。你是一个开发者,你只需要在 Cloudflare Workers 上部署这个适配器。输入是什么?就是你原本要发给 OpenAI 或 Anthropic 的 API 请求,格式完全一样,URL 改成你部署的 Worker 地址。系统怎么处理?它收到请求后,通过 unlimited.surf 这个服务去中转,把请求转发到真正的 OpenAI 或 Anthropic 接口,然后把响应原样返回给你。输出就是正常的 AI 回复,你的应用完全不需要改代码。上下游接什么?上游是 unlimited.surf...

GitHubhot newcomer

Codex 橙皮书是一个开源的非官方使用手册,用 HTML 和 PDF 把 Codex 的安装、核心功能、工作流和实战案例组织成一本可阅读的指南。你打开 GitHub 仓库,在线阅读或下载 PDF,就能获得从零到交付的完整路径。和官方文档的碎片化参考不同,它提供了三条阅读路线,从快速上手到进阶扩展,还包含宠物零食网站、招商 PPT、宣传视频等五个完整案例,甚至教你怎么接入第三方模型。内容用 Markdown 编写,版本控制在 GitHub,通过 HTML 渲染,可生成 PDF 离线阅读,结构像一本精心编排的教材。

Codex 发布后,你兴冲冲装好 App,打开终端输入命令,结果面对自动化、Skill、MCP、云端运行这些概念,官方文档像一本字典,每个词都解释了,但你就是不知道怎么串起来做一个真实项目。你在 YouTube 和博客间跳来跳去,看了三个小时,还是没跑通一个完整流程。这个仓库上线一天就拿到 700 多颗星,正是因为它填补了这个“从零到一”的空白。它没有重复官方文档,而是用一本结构化的橙皮书,直接告诉你“先看这里,再做这个,然后你就能交付一个宠物零食网站”。

你作为开发者或...

GitHubhot newcomer

omnigent-ai/omnigent

545 forks4615 stars

想象一下你是一个全栈开发者,手头有三个项目:一个用 React 写前端,一个用 Python 做后端 API,还有一个是给客户演示的 POC。你同时装了 Claude Code、Codex 和 Cursor,因为每个工具在不同任务上各有优势。但问题来了:Claude Code 在终端里跑,Codex 在 VS Code 插件里,Cursor 是个独立编辑器。你想让 Claude Code 帮你重构一个函数,然后让 Codex 检查测试覆盖率,最后用 Cursor 改个 UI 样式。每次切换,你都得重新登录、重新加载项目、重新告诉 AI 上下文。更烦的是,你不敢让 Claude Code 直接改生产环境的配置文件,因为它没有权限控制,一旦它自作主张改了数据库连接字符串,你就等着线上事故吧。你每天花在“伺候”这些 AI 上的时间,比写代码还多。

Omnigent 就是来解决这个混乱的。你作为开发者或团队负责人,先安装它,然后在配置文件里声明你要用哪些 AI 工具:Claude Code、Codex、Cursor,甚至你自己写的自定义 agent。系统会把这些工具统一注册到一个“元工具”里...

GitHubhot newcomer

vercel/eve

183 forks2454 stars

想象一下你是个独立开发者,正在做一个自动处理客户邮件的代理。你打开编辑器,开始写代码:调用 OpenAI API,解析回复,管理状态,处理错误,还要考虑安全沙箱。一周后,你的代码变成了一团乱麻——API 调用散落在各个文件里,状态管理靠全局变量,错误处理全靠 try-catch 堆砌。你甚至不敢部署,因为一旦某个环节出错,整个代理就会卡死。这就是没有 eve 时的状态:你花 80% 的时间在搭架子,只有 20% 的时间在真正写业务逻辑。

eve 就是来解决这个问题的。它不是一个现成的 AI 助手,而是一个让你自己造 AI 助手的工具箱。你是一个开发者,你用 TypeScript 写一个工作流定义文件,告诉 eve 你的代理要做什么:比如“每天早上 8 点检查新邮件,如果是退款请求就调用 Stripe API 查询订单状态,然后根据金额和客户等级决定自动处理还是标记人工”。eve 拿到这个定义后,会在一个沙箱环境里运行你的代理,管理它的生命周期、状态持久化、工具调用和错误恢复。输出是一个可以部署到 Vercel 的代理实例,或者一个可以嵌入到你现有应用里的模块。上下游接什么?它原生对接...

GitHubtrending growth

这个项目是一套给 Claude Code 用的工程化操作手册。它把“想到什么说什么”的 vibe coding,翻译成有分工、有流程、可复用的 agentic engineering。你不再只是和一个通用助手聊天,而是通过预定义的子代理、命令和技能文件,让 Claude Code 像一支微型工程团队那样工作——有人负责写代码,有人负责审查,有人管测试,还有人编排整个流水线。核心差异在于,它把散落在推文、博客和试错里的 Claude Code 高阶用法,沉淀成一套可克隆、可修改、可立刻跑起来的目录结构。底层完全基于 Claude Code 自身的 sub-agent、hook 和 MCP 机制,用 Markdown 和 YAML 定义行为,不引入额外运行时。

最近让它突然爆发的,是 Boris Cherny 这类资深开发者在 X 上反复推荐。很多人用 Claude Code 已经能写出能跑的代码,但项目稍微复杂一点就失控:上下文窗口被塞满,同一个 bug 反复出现,每次开新会话都要重新教一遍规则。你感觉自己像个不断重复指令的监工,而不是在真正做架构。这个仓库正好踩中了这个集体痛点——它...

GitHubhot newcomer

sums001/Windows-Copilot-API

207 forks567 stars

你是个独立开发者,正在做一个自动写周报的小工具。你想用 GPT-4 来生成内容,但打开 OpenAI 的官网,先要注册账号,绑定信用卡,然后每个月盯着账单,生怕调用次数超了。更烦的是,你只是写个个人项目,不想为了一点点 AI 能力去填一堆表格、签一堆协议。你试过用免费的 Claude,但它的 API 也要申请,而且额度有限。最后你只能手动复制粘贴到网页版 ChatGPT,然后复制回来,效率低得让人想砸键盘。你真正想要的,就是一个能直接调用的接口,不关心账单,不关心密钥,只关心能不能跑起来。

Windows-Copilot-API 就是给这种处境的人准备的。它本质上是一个 Python 写的本地服务,你把它跑起来之后,它会监听一个端口,比如 localhost:5000。然后你只需要像调用 OpenAI 的 API 一样,发一个 POST 请求过去,带上你的消息,它就会返回 GPT-4 或 GPT-5 的回复。你不需要去微软注册任何东西,不需要申请任何密钥,甚至不需要知道 Windows Copilot 是什么。你只需要在代码里把 API 地址改成 localhost,其他一切照旧。它...

GitHubtrending growth

code-yeongyu/oh-my-openagent

5175 forks63424 stars

想象一下你下午三点接到一个任务:改一个三个月前写的支付模块,因为客户投诉退款逻辑有 bug。你打开项目,发现这个模块横跨五个文件,里面塞满了条件判断和回调,注释只有一行“// TODO: 优化”。你开始翻文件,从入口文件一路追到工具函数,中间还要记住变量是怎么传的。你打开浏览器搜“如何快速理解复杂代码”,结果跳出来一堆广告。你切回编辑器,手动打印日志,跑测试,再改代码,再跑测试。等你终于找到那个 bug,已经快六点了,你还没写一行新代码。这就是没有好工具时的日常——大部分时间花在“找”和“理解”上,而不是“改”上。

oh-my-openagent 就是来解决这个问题的。你是一个开发者,你把它装进你的终端或者 IDE 里。你输入一个任务,比如“找到退款逻辑里金额校验失败的原因,并修复它”。系统会先扫描整个代码库,理解文件之间的依赖关系,然后定位到相关代码块。它不会一次性把整个项目塞给 AI,而是像人一样,先看目录结构,再读关键文件,最后聚焦到具体函数。输出是一段修改建议,或者直接生成补丁。它接你的代码仓库,也接你用的 AI 模型——比如 Claude、GPT、Gemini,你选哪个它就...

GitHubhot newcomer

Johell1NS/browser-search

16 forks145 stars

browser-search 是一个给 AI agent 用的技能包。它把 OpenCode、Claude Code、Cursor 这类 AI 编程助手,变成能自己搜索和阅读网页的研究助理。你用自然语言布置一个调研任务,agent 就会按照这套指令,自动去搜、去点开链接、去读内容,最后把整理好的信息交给你。

和那些需要付费 API key 的搜索插件不同,browser-search 的核心是把 SearXNG、Camofox、CloakBrowser 三个开源工具拧成一股绳。SearXNG 负责元搜索,同时从多个搜索引擎拿结果;Camofox 是一个可以通过 REST API 操控的浏览器,用来打开普通网页;CloakBrowser 则是隐身浏览器,专门对付 Cloudflare、Akamai 这类反爬系统。skill 指令里写好了升级逻辑——遇到受保护的网站,自动切换到 CloakBrowser。整套东西用 Docker 跑在你自己的机器上,不需要任何外部服务。

这个仓库上线一天就拿到 145 颗星,因为它踩中了一个被忽视很久的痛点。你让 AI agent 做深度研究,它必须能...

GitHubhot newcomer

Agent Apprenticeship 是一个开源的 agent 学徒训练生态。它把本地 agent 执行真实任务的过程,转化成可积累、可交换的学习信号。你用 `npx agent-apprenticeship init` 接入,agent 干活的同时自动记录执行轨迹,提炼出可复用的经验教训,再回馈给整个生态。

和绝大多数 agent 框架只关心“这一次能不能跑通”不同,Agent Apprenticeship 盯的是“下一次能不能跑得更好”。它内置了一套迭代工作流循环,让学徒 agent 跟着导师 agent 或人类专家完成长周期任务,每完成一次,就产出一组训练信号。底层是一个 npm 包,直接对接 Claude Code、Cursor、Codex、OpenCode 等本地 agent,种子数据集已经塞进了 500 多个真实任务、495 条可复用教训、上千条完整执行轨迹。

这个仓库上线四天就冲到 800 多 star,因为它戳中了一个被忽视的集体焦虑:你的 agent 今天写了个爬虫脚本,明天换个网站又要从头调 prompt,它永远在失忆。每个开发者都在私下教自己的 agent...

GitHubtrending growth

openai/codex

13769 forks93085 stars

你正盯着终端里那个红色的测试失败信息,已经看了十五分钟。你记得这个函数应该处理边界情况,但你不确定是哪里漏了。你打开浏览器,搜索“Python 列表切片边界”,翻了三篇 Stack Overflow,又切回编辑器,加了一行 if 判断,重新跑测试——还是红的。你又切回浏览器,这次搜的是“为什么我的 for 循环跳过了最后一个元素”。你来回切了六次窗口,最后发现是索引写错了。这个 bug 你花了四十分钟,而它本质上只是少了一个 `-1`。

Codex 就是为这种时刻设计的。它是一个用 Rust 写的命令行工具,你装好之后,直接在终端里敲 `codex "修复这个测试"`,它就会读取你当前项目的文件结构、代码内容、测试输出,然后自己分析问题、生成修改方案,甚至直接帮你把代码改了。你不需要打开任何网页,不需要复制粘贴错误信息,不需要手动定位文件。你只需要告诉它你想干什么,它自己看代码、自己动手。

具体怎么工作的?你打开终端,cd 到项目目录,然后输入 `codex "给用户列表加一个分页功能"`。Codex 会先扫描你项目里的所有文件,理解你的代码风格、依赖关系、已有的 API 结构。然...

More From Today

Product Huntsignal

Cotypist

342 votes73 comments

Cotypist 是一个在 Mac 上本地运行的 AI 自动补全工具,它能学习你的写作风格,在任何应用里帮你续写句子。

Product Huntsignal

Latitude

329 votes46 comments

Latitude 是一个帮你找到 AI agent 到底在哪一步出错的调试工具,像给 AI 装了个行车记录仪。

Product Huntsignal

Thumbmagic

309 votes65 comments

Thumbmagic 是一个专门盯着 YouTube 上那些点击量爆炸的缩略图来训练自己的 AI 工具,你给它一个视频主题,它就能吐出几张大概率能骗你点进去的封面图。

Product Huntsignal

Hush

181 votes23 comments

Hush 是一个开源的噪声抑制工具,专门给语音 AI agent 用的,让它们能在嘈杂环境里听清人话。

Product Huntsignal

Jotform AI App Builder

164 votes15 comments

Jotform AI App Builder 是一个让你用一句话描述想法、几秒钟生成一个能用的应用的无代码工具。

Product Huntsignal

Steam Machine

173 votes12 comments

Steam Machine 是一台能塞进背包、插上电视就能玩 3A 大游戏的小电脑。

Product Huntsignal

Blazly SEO

135 votes15 comments

Blazly SEO 是一个用 AI 帮你批量生产 SEO 内容的操作系统,不是写一篇文章,而是管理整个内容生产流程。

Product Huntsignal

Sakana Fugu

141 votes8 comments

Sakana Fugu 是一个让你用一个 API 调用所有 AI 模型的工具,就像给每个模型配一个翻译官。

GitHubtrending growth

openclaw/openclaw

79619 forks380187 stars

一个自托管的个人 AI 助手,把你日常用的所有聊天软件变成同一个私人助理的入口,数据留在自己手里。

GitHubtrending growth

heygen-com/hyperframes

2858 forks30619 stars

一个让 AI 编程助手通过写 HTML 来生成视频的开源框架。

GitHubhot newcomer

eooce/transfer-api

1535 forks332 stars

transfer-api 是一个让你用 Cloudflare 的全球网络来中转 AI 请求的小工具,专门给那些想低成本、快速调用 OpenAI 和 Anthropic 模型的开发者用。

GitHubhot newcomer

一本非官方的Codex全链路使用指南,把零散的官方文档和社区经验变成可下载的系统化橙皮书。

GitHubhot newcomer

omnigent-ai/omnigent

545 forks4615 stars

Omnigent 是一个开源工具,让你在一个地方管理所有 AI 编程助手,比如 Claude Code、Codex、Cursor,还能给它们设规则、限制权限,并实时协作。

GitHubhot newcomer

vercel/eve

183 forks2454 stars

eve 是 Vercel 推出的一个框架,让你用 TypeScript 造出能自己干活的 AI 代理。

GitHubhot newcomer

sums001/Windows-Copilot-API

207 forks567 stars

Windows-Copilot-API 是一个把微软 Windows Copilot 拆开、重新包装成 OpenAI 风格 API 的开源工具,让你不用花钱、不用申请密钥就能调用 GPT-4 和 GPT-5。

GitHubtrending growth

code-yeongyu/oh-my-openagent

5175 forks63424 stars

oh-my-openagent 是一个给开发者用的 AI 编程助手,专门处理那些又大又乱的代码库,帮你省下翻文件、猜逻辑的时间。

GitHubhot newcomer

Johell1NS/browser-search

16 forks145 stars

一个教 AI agent 用三个开源工具自托管搜索和浏览网页的 skill,免费且能绕过反爬保护。

GitHubtrending growth

openai/codex

13769 forks93085 stars

Codex 是一个跑在你终端里的轻量级编码代理,能直接理解你的代码库并帮你改代码。

2026-06-23

今日值得看:DietrichGebert/ponytail

DietrichGebert/ponytail 是今天最值得先看的信号。ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

今日 Brief

  • 产品侧可以先看 Skybridge:Skybridge 是一个开源的 React 全栈框架,专门用来快速搭建基于 MCP 协议的 AI 应用。
  • 开源侧可以先看 DietrichGebert/ponytail:ponytail 是一个让 AI 代码助手学会偷懒的工具,它教你的 AI 像最资深但最不想干活的高级工程师那样写代码——只写必须写的,绝不写多余的。

More Signals

Product Huntsignal

Alai 2.0

249 votes48 comments

你明天要见投资人,PPT 还差十页。你打开 Google Slides,盯着空白页面,光标一闪一闪。你想起上周花三个小时调一个柱状图的颜色,最后发现配色方案跟公司 logo 完全不搭。你试过用模板,但模板里那些花里胡哨的图标跟你数据一点关系都没有。你甚至想过外包给设计师,但设计师说排期要三天,而你只有今晚。你最后只能自己硬着头皮做,结果做出来的东西连你自己都不想看第二遍。这不是你一个人的问题。每个需要做 presentation 的人——创业者、产品经理、市场运营——都在这条船上。你明明有想法、有数据,但把它们变成视觉语言这件事,就像让你用左手写书法。

Alai 2.0 就是冲着这个场景来的。它不是一个让你从零开始拖拽的编辑器,而是一个能听懂你需求的 AI 设计搭档。你打开 Alai,输入一句话,比如“做一个三页的融资 deck,第一页讲市场规模,第二页讲产品优势,第三页讲团队”。系统会理解你的意图,然后自动生成一整套幻灯片,包括布局、配色、字体、图标,甚至帮你把数据做成图表。你不需要告诉它“标题用 36 号字,副标题用 24 号”,它自己会判断。你还可以继续跟它对话:“第二页的图表改成饼图,颜色用蓝色系。”它立刻调整。输出的是可以直接用的 PPT 或 PDF 文件,能导出到 Google Slides、PowerPoint,或者直接分享链接。上下游接什么?你从 Notion 或文档里复制一段文字进来,Alai 吃掉它,吐出一套视觉方案。你不需要打开 Figma,不需要学设计软件。

它的核心机制,你可以想象成一个“会画画的翻译官”。你脑子里有一团想法,像一堆散落的乐高积木。Alai 不是帮你拼积木,而是先问你“你想拼什么?城堡还是飞船?”,然后它自己从积木堆里挑出合适的零件,按它学过的上千种优秀设计案例,帮你搭出一个结构。你只需要说“这里再加一个塔”,它就知道往哪加。它不替你思考内容,但替你思考怎么呈现。

对比一下真实竞品 Canva。Canva 的路径是“给你海量模板,你自己选,自己改”。它像一个巨大的素材超市,你推着购物车进去,自己挑背景、挑字体、挑贴纸,然后手动拼在一起。好处是自由度极高,坏处是你得自己知道要什么。如果你没有设计直觉,你会在几千个模板里迷失,最后选了一个跟别人一模一样的。Alai 的路径是“你告诉我目标,我来出方案”。它像一个私人设计师,你描述需求,它给你几个选项,你挑一个,再微调。能力差异在哪?在“从零到一”的速度。如果你要做一个全新的、没有现成模板的页面,比如一个结合了数据图表和产品截图的竞品分析页,Canva 需要你手动布局,Alai 可以一句话生成。这个差异在时间紧迫、内容复杂的时候特别重要。

当然,Alai 不是万能的。它最擅长的是“有明确结构”的内容——演示文稿、社交媒体帖子、简单的海报。如果你要做一套完整的品牌 VI 手册,或者需要像素级精确的印刷品,它可能不够细。它的设计风格偏向现代、干净、通用,如果你需要非常独特、带有强烈个人风格的视觉,它可能给不了你那种“一眼就认出是你”的感觉。风险在于:你可能会过度依赖它,不再自己思考布局逻辑,导致所有输出看起来都像同一个 AI 做的。另外,它生成的图表数据需要你核对,AI 偶尔会误解你的数字。

想象一下这个场景:晚上十点,你坐在咖啡店,手机响了,老板发消息说“明天早上九点前把季度汇报 PPT 发我”。你打开 Alai,输入“季度汇报,四个部分:业绩回顾、问题分析、下季度计划、资源需求。数据在附件里。”然后你上传一个 Excel 表格。三十秒后,Alai 生成了一套 12 页的幻灯片,每页都有对应的图表和要点。你扫了一遍,发现第三页的饼图把“其他”项标成了最大,你打字说“把‘其他’放到最后,颜色改成灰色”。它改了。你导出,发出去。整个过程十五分钟。你合上电脑,喝了一口已经凉了的咖啡,心想:要是去年有这个,我少熬多少夜。

Product Huntsignal

AgentX

335 votes118 comments

你花了两周时间写了一个 AI agent,用来自动处理客户退款申请。你精心设计了 prompt,接上了 Stripe 和 CRM,测试了几十个场景,看起来一切正常。上线第一天,客服主管就冲过来:agent 把一笔 200 美元的老客户退款直接拒绝了,客户气得要投诉。你打开日志,看到 agent 调用了“拒绝退款”工具,但不知道它为什么这么选。是 prompt 里某个词被误解了?是 CRM 返回的客户等级字段格式不对?还是模型自己抽风了?你只能手动复制当时的输入,一遍遍重跑,改 prompt,再试,再改。一个下午就没了。

AgentX 就是来解决这个问题的。它不是一个帮你写 agent 的平台,而是一个专门用来“查问题”的工具。你用它的时候,只需要把 agent 的调用记录——包括每次输入、输出、调用了哪些工具、工具返回了什么、模型中间思考了什么——全部丢进去。AgentX 会自动分析这些数据,像代码调试器一样,定位到具体哪一步出了问题。比如它发现 agent 在某个分支里错误地解析了客户等级字段,因为 CRM 返回的是“Gold”而不是“gold”,而你的 prompt 里只写了小写。然后 AgentX 会直接给出修复建议:要么改 prompt 里的匹配规则,要么在调用前加一个大小写转换。你点一下“一键修复”,它就把修改后的 prompt 或工具调用逻辑推送到你的 agent 配置里。整个过程不需要你手动翻日志、猜原因。

它的工作流很直接。你作为开发者或 AI 工程师,把 agent 的 trace 数据(比如通过 API 或 SDK 自动上报)接入 AgentX。系统先做一次全量分析,把每个步骤的输入输出、工具调用链、模型 token 消耗、决策路径都可视化出来。然后它用一套规则引擎加小模型,自动标记异常:比如某个工具返回了空值但 agent 没处理、某个 prompt 指令被模型忽略、某个分支条件永远不满足。最后生成一个报告,列出问题列表,每个问题都附带“一键修复”按钮。修复后,你可以重新跑一遍测试用例,确认没问题再上线。上下游接的是你的 agent 框架(比如 LangChain、CrewAI)的日志系统,以及你的 CI/CD 管道——修复后自动触发回归测试。

你可以把 AgentX 想象成一个给 AI agent 用的 X 光机。普通日志只能看到骨头有没有断,但 X 光机能告诉你断在哪里、怎么断的、需不需要手术。AgentX 就是那个能自动读片、写诊断报告、甚至帮你打石膏的机器。

对比一下传统的做法。大多数团队现在调试 agent 靠的是手动加 print 语句、看 LangSmith 或 LangFuse 的 trace 图。这些工具能告诉你 agent 调用了什么工具、花了多少时间,但不会告诉你“这里有问题”。你得自己盯着数据猜。AgentX 走的是另一条路:它不满足于展示,而是主动诊断。它内置了常见 agent 故障模式的知识库,比如“工具调用参数类型不匹配”、“模型在长上下文里丢失指令”、“循环调用死锁”。当你的 agent 出现这些模式时,它直接指出来,而不是让你自己从几百行 trace 里找。这个能力在 agent 变复杂、有多个工具和分支时特别重要。你不可能每次上线前都手动跑一百个场景,但 AgentX 可以自动扫描历史 trace,发现你根本没注意到的边缘情况。

当然,AgentX 不是万能的。它依赖 agent 的 trace 数据质量——如果你的 agent 没有完整记录中间思考过程,它分析不了。它更适合那些有一定复杂度的 agent,比如有 3 个以上工具调用、多步推理的场景。如果你只是写一个简单的“根据关键词回复”的 bot,用它就像用杀牛刀切葱花。另外,一键修复虽然方便,但自动修改 prompt 或工具逻辑可能引入新问题。你需要信任它的修复建议,或者至少跑一遍测试。对于关键业务场景,建议把修复先放到 staging 环境验证。

想象一下你是一个 SaaS 公司的 AI 负责人。早上到公司,打开 AgentX 的 dashboard,看到昨晚 agent 处理了 1200 个请求,其中 3 个被标记为“异常”。你点开第一个:agent 在处理一个客户取消订阅的请求时,错误地调用了“升级套餐”工具。AgentX 分析发现,是因为客户消息里写了“我想取消,但你们套餐太贵了”,agent 把“太贵了”误解为“需要更便宜的套餐”,于是调用了升级。AgentX 建议在 prompt 里加一条规则:“如果客户明确提到取消或退款,优先执行取消流程,忽略其他信息”。你点了一下“应用修复”,然后看到第二个异常:agent 在调用 CRM 查询客户等级时,API 返回了 500 错误,agent 没有重试,直接拒绝了请求。AgentX 建议增加重试逻辑。你又点了一下。前后不到五分钟,三个问题全部解决。你关掉电脑,去冲了杯咖啡。这就是 AgentX 想给你的日常。

Product Huntsignal

readywhen

193 votes44 comments

你刚开完一个客户会议,聊了四十分钟,最后你说“我周五前把方案发给你”。对方点头,你记在脑子里。然后你回到工位,打开邮箱,发现三封紧急邮件,一个同事在 Slack 上问你数据,老板又拉了个群说下午要汇报。你埋头处理这些,周五早上客户发来消息:“方案怎么样了?”你一拍脑袋——忘了。这不是你懒,是你根本记不住。你每天要跟多少人说话,开多少会,随口答应多少事?没人能全记住。但客户不会管你忙不忙,他只记得你说了“周五前”。

readywhen 就是来解决这个问题的。它不是一个让你手动输入待办事项的 app,而是一个能自动从你的对话里挖出承诺的 AI。你把它连上你的 Gmail、Outlook、Slack、日历,甚至 Zoom 的转录。它每天扫描这些地方,找出所有“我会……”“我答应……”“我回头给你……”这类句子,然后自动生成一个承诺清单。每个承诺都带上下文:谁说的、什么时候说的、截止日期是什么(如果提到了)。然后它帮你设提醒,甚至能自动帮你写一封跟进邮件草稿,你只需要点发送。

它的工作流是这样的:你开完会,会议录音被转成文字,readywhen 的模型跑一遍,识别出“我周五前发方案”这句话。它自动在系统里创建一个任务,关联客户的名字,设截止日期为周五。然后它每天检查进度,周四晚上给你发一条 Slack 消息:“你答应周五给客户发方案,还没发,需要帮你起草邮件吗?”你点一下,它调出你之前写的方案草稿,生成一封邮件,你改两句话就发出去了。下游它还能连你的 CRM,自动把这次跟进记录到客户档案里。

你可以把它想象成一个永远不睡觉的私人助理,坐在你办公桌旁边,手里拿着一个小本子,你每说一句“我会做”,它就记下来。然后它每隔一段时间翻翻本子,戳你一下:“这个还没做,那个快到期了。”区别是,这个助理不会累,不会漏,也不会因为你语气不好就辞职。

跟 Todoist 或 Asana 比,readywhen 走了一条完全不同的路。Todoist 是个好工具,但它需要你主动去创建任务。你得在开会时掏出手机,手动输入“周五前发方案”,然后设提醒。问题是,你经常忘了输入,或者当时觉得能记住,结果转头就忘。readywhen 不依赖你的主动性,它被动地监听你的沟通,自动提取。这听起来简单,但实际差别很大:当你一天有二十个承诺时,手动录入的摩擦会让你放弃一半。而 readywhen 让你不用改变任何习惯,它自己从你的日常对话里捞东西。

当然,它也有代价。它需要读取你的邮件、聊天记录、会议转录,这意味着你要信任它处理敏感信息。如果你在高度保密的行业,或者你老板不允许任何第三方访问公司数据,那 readywhen 可能进不了门。另外,它可能会误判——比如你说“我会考虑一下”,它可能当成一个承诺,实际上你只是敷衍。你得多花时间清理误报。它最适合那些承诺多、节奏快、对隐私要求不极端的人,比如销售、项目经理、创业者。如果你每天只开一个会,只答应一件事,那手动记一下更省事。

想象一下你是一个 SaaS 公司的客户成功经理。早上九点,你打开 readywhen 的仪表盘,看到昨晚跟三个客户的沟通里被识别出五个承诺:一个答应发使用指南,一个答应查 bug 进度,一个答应安排培训。系统已经自动生成了三封邮件草稿,你扫了一眼,改了两个日期,全部点发送。十点,你收到一条提醒:“你上周答应客户周三前更新合同,今天周三了,还没发。”你赶紧调出合同,改完发出去。下午五点,readywhen 弹出一条总结:“今天你完成了 4 个承诺,还有 2 个明天到期,需要提前准备吗?”你关掉电脑,发现今天没有一个人追着你问“你答应我的事呢”。这就是 readywhen 想给你的日常。

Product Huntsignal

HAQQ Legal AI on Mobile

184 votes8 comments

你晚上十一点坐在出租屋的床边,手机屏幕上是房东发来的微信:“押金不退,因为你弄坏了地板。”你明明记得搬进来时地板就有划痕,但当时没拍照。你想争,但不知道法律上怎么说。你打开百度搜“租房押金不退怎么办”,出来一堆广告和律师咨询页面,点进去要填手机号,然后第二天就有陌生号码打过来:“您好,我们是XX律所……”你挂掉电话,觉得更烦了。你需要的不是推销,是现在、立刻、有人告诉你:我有没有胜算?该发什么消息给房东?如果去法院,流程是什么?

HAQQ Legal AI on Mobile 就是为这种时刻做的。它是一个手机App,你打开它,像跟朋友聊天一样输入你的情况:“我租的房子,地板本来就有划痕,房东现在说是我弄坏的,要扣我2000押金,我该怎么办?”它不会让你填手机号,也不会转接给真人律师。它直接分析你描述的事实,对照相关法律条文和判例,然后给你一个清晰的回答:你的情况属于“承租人正常使用损耗”,根据《民法典》第七百一十条,出租人应当承担维修义务,押金不能随意扣除。它还会建议你下一步做什么——比如先发一条微信给房东,引用这条法律,语气怎么措辞;如果房东坚持不退,可以去街道调解委员会,或者申请小额诉讼,流程大概多久,需要什么材料。

这个工作流很简单:你输入自然语言描述的场景,HAQQ 在后台把这段话拆解成关键事实要素——主体(租客、房东)、标的(押金)、争议点(地板损坏原因)、金额(2000元)。然后它匹配到对应的法律领域(租赁合同纠纷),再调用它训练过的法律知识库和判例数据,生成一个结构化的回答。输出不是一堆法条堆砌,而是分三段:第一段告诉你法律上怎么认定,第二段给你具体行动建议,第三段列出你可能需要的证据清单。它还能接你手机里的备忘录或截图,你拍下合同条款照片,它能 OCR 识别后分析条款是否有效。

你可以把它想象成一个在法学院图书馆泡了三年、又在小额法庭旁听了两年实习生。它不会替你出庭,但它能帮你把案情理清楚,把法律语言翻译成人话,把下一步行动列成清单。你不需要懂“不当得利”或“违约责任”,你只需要说人话。

跟传统法律咨询App比,比如“华律网”或者“找法网”,那些平台本质上是一个律师黄页。你提交问题,平台分发给注册律师,律师免费回答几句,然后引导你付费咨询或委托代理。它们的商业模式靠的是撮合交易,所以回答天然带有销售倾向——律师会暗示“你这个案子比较复杂,最好当面聊”。HAQQ 走的是另一条路:它不卖律师服务,它卖的是法律理解本身。它用AI直接给出答案,不经过中间人。这意味着你不需要等24小时,不需要接推销电话,不需要判断这个律师是不是在吓唬你。代价是,它不能替你写起诉状,不能替你出庭,不能替你谈判。如果你的案子涉及几十万的标的、复杂的证据链,或者对方也有律师,你仍然需要真人律师。HAQQ 的边界很清楚:它解决的是“我该不该维权”和“我第一步该做什么”,而不是“帮我打赢官司”。

它也有风险。法律是地域性很强的领域,不同省份的司法解释、地方条例可能不同。如果HAQQ的训练数据覆盖不全,或者你描述的事实有遗漏,它给出的建议可能不准确。比如你忘了说合同里有一条“租客承担一切维修费用”,那它的结论就可能偏了。所以它会在回答末尾加一句:“以上建议仅供参考,重大决策请咨询执业律师。”这不是免责声明,是实话。

想象一下你那个晚上。你打开HAQQ,输入问题,三十秒后看到回答。你截图发给房东,附上一句:“根据《民法典》第七百一十条,正常使用损耗由出租人承担,押金应全额退还。如果你坚持扣除,我会向街道调解委员会申请调解。”五分钟后房东回你:“算了,押金退你,但下次注意。”你关掉手机,觉得今晚能睡个好觉。这就是HAQQ想创造的日常。

Product Huntsignal

uwait

155 votes33 comments

你肯定遇到过这种情况。打开 ChatGPT,输入一段提示词,等它慢慢吐出几百个字。或者用 Midjourney 生成一张图,盯着进度条转圈。或者让 Claude 分析一份 PDF,它说“正在思考,请稍候”。这几秒、十几秒、甚至一分钟里,你什么都干不了,只能盯着屏幕发呆。你刷了一下手机,回来发现它已经写完了,但你错过了开头。你重新读一遍,又浪费了时间。这种等待是 AI 时代的“碎片时间”——你没法用它做正经事,因为随时可能被打断。

uwait 想做的事很简单:把这些等待时间变成你的收入。它不是让你去挖矿或者看广告,而是让你在 AI 思考的过程中,系统自动给你塞点小活儿——比如快速判断一张图片里的物体、给一段文字打标签、或者回答一个简单的是非题。这些任务不需要你动脑子,几秒钟就能完成,而且每完成一个,你的账户里就多几美分。等你回到 AI 的输出界面,任务已经做完,钱也到账了。

具体怎么运作?你装一个浏览器插件或者桌面客户端,然后正常使用任何 AI 工具——ChatGPT、Claude、Gemini、Perplexity 都行。当你提交一个请求,AI 开始“思考”的时候,uwait 会在屏幕角落弹出一个微型任务窗口。任务来自它的合作方——广告主、数据标注公司、搜索引擎优化团队——他们需要大量人工判断来训练模型或优化结果。你点一下“是”或“否”,或者选一个选项,任务就完成了。系统自动记录你的贡献,按任务难度和时长结算。等你回到 AI 的回复页面,任务窗口自动消失。整个过程不会打断你的工作流,因为 AI 本来就在转圈。

你可以把它想象成一个“等待税”的反向操作。以前你等电梯、等公交、等咖啡,那些时间被白白浪费了。现在 AI 替你等,但 AI 等的时候你也在等。uwait 把这段“双倍等待”变成了一个微型劳动力市场——你出的是注意力碎片,买的是零钱。

和它最像的竞品是那些“被动赚钱”的浏览器扩展,比如 Honey 或者 Swagbucks。但那些东西是在你购物时返现,或者让你看广告赚积分。它们的路径是“你主动做一件事,然后得到回报”。uwait 的路径是“你本来就在等,顺便做一件事,然后得到回报”。区别在于:前者需要你改变行为——你得记得去点返现链接,或者专门打开一个网站看广告。后者不需要你改变任何行为——你本来就要用 AI,你本来就要等。这个差异在“高频低价值”场景里特别重要。如果你每天用 AI 几十次,每次等 10 秒,一个月下来就是好几个小时的碎片时间。用 uwait,这些时间能变成几十美元。而用传统返现工具,你根本不会为了几毛钱去专门看广告。

当然,它也有明显的边界。首先,它只在你用 AI 的时候生效。如果你不用 AI,它就是个摆设。其次,任务的质量和数量取决于合作方的需求。如果某天没有任务,你就赚不到钱。另外,那些需要深度思考的 AI 任务——比如写长文、做复杂分析——等待时间可能很长,但任务窗口可能在你思考时弹出,反而干扰你。最合适的场景是那些“短等待、高频次”的 AI 使用:比如用 AI 翻译一句话、生成一个标题、搜索一个事实。这时候等待时间刚好够你点两下任务。

还有一个风险:隐私。uwait 需要知道你在用哪个 AI 工具、什么时候提交请求。它会不会读取你的输入内容?官方说不会,但这类工具天然让人不放心。如果你处理敏感信息,最好别用。

我认识一个做内容运营的朋友,每天用 AI 写几十条社交媒体文案。每条文案生成大概等 8 到 12 秒。他装了 uwait 之后,每天顺手点掉一百多个小任务,一个月多赚了 40 美元。他说最爽的不是那 40 美元,而是“终于不用盯着那个转圈圈发呆,感觉自己像个资本家,连 AI 的思考时间都要榨出油来”。

Product Huntsignal

你是一个独立开发者,周末想试一个新想法——用 AI agent 自动抓取某个电商网站的价格变动,然后发邮件通知你。你打开 Cloudflare Workers 的页面,准备写几行代码,结果第一步就卡住了:你得先注册一个 Cloudflare 账号,填邮箱、设密码、验证手机号,然后创建项目、绑定域名、配置 API 密钥。等你搞完这些,那股冲劲已经凉了一半。更烦的是,你只是想跑个实验,根本不想把个人信息绑在一个可能只用一次的项目上。

Cloudflare Temporary Accounts 就是冲着这个场景来的。它让你在用户注册之前,就能让 AI agent 直接部署和运行。具体怎么用?你作为开发者,在 Cloudflare 的界面里点一下“创建临时账户”,系统立刻生成一个独立的、有完整权限的临时环境——包括一个临时子域名、一组临时 API 密钥、一个可用的 Workers 运行时。你把这个临时账户的凭证直接塞给你的 AI agent,比如一个用 LangChain 写的爬虫 agent,它就能立刻登录、部署代码、开始跑任务。整个过程不需要你本人注册任何永久账号。临时账户有默认的存活时间,比如 24 小时,到期后自动销毁,所有数据、日志、密钥一并清除。

你可以把这个机制想象成酒店前台给访客发一张临时房卡。你不用办会员、不用交押金、不用填身份证,前台直接给你一张卡,告诉你“房间在 302,明天中午前退房”。你进去住一晚,第二天走人,卡自动失效。Cloudflare 的临时账户就是那张房卡——它给了 AI agent 一个临时的“房间”,让 agent 能进去干活,干完就走,不留痕迹。

对比一下主流的替代方案。AWS 的 Lambda 或者 Vercel 的 Edge Functions 也允许你快速部署代码,但它们的前提是你必须先有一个永久账号。AWS 甚至要求你绑定信用卡才能创建第一个函数。这条路的设计逻辑是“先建立信任,再提供服务”——你得证明你是谁,平台才敢给你资源。Cloudflare 选了另一条路:“先提供服务,再建立信任”。它赌的是,大多数临时使用场景不会造成破坏,而且临时账户的权限天然受限(比如不能访问持久化存储、不能修改 DNS 记录),风险可控。这种差异在什么场景下重要?当你是一个在黑客马拉松上现场写 demo 的开发者,或者是一个需要给客户做快速原型演示的售前工程师,或者是一个只想跑一次数据抓取的业余爱好者——这些场景里,注册流程的摩擦直接决定了你愿不愿意动手。

当然,临时账户不是万能的。它的边界很清楚:你不能用它跑生产环境,因为 24 小时后一切消失;你不能用它存储用户数据,因为临时环境没有持久化数据库;你也不能用它做需要长期身份绑定的操作,比如绑定信用卡、开通付费服务。如果你是一个需要长期维护 AI agent 的团队,临时账户反而会成为障碍——你每次都要重新配置环境、重新部署代码。它的真正战场是“试一下”这个动作:降低从想法到验证的门槛,让 agent 能在你决定注册之前就先跑起来。

想象一下,你坐在咖啡馆里,突然想到一个用 AI 自动回复客服邮件的点子。你打开笔记本,在 Cloudflare 的临时账户里粘贴了一段代码,创建了一个临时邮箱接收端点,然后把 agent 的 webhook 指向它。五分钟后,你往那个临时邮箱发了一封测试邮件,agent 自动回复了。你笑了笑,合上电脑,临时账户在第二天凌晨自动消失。你甚至没记住那个临时子域名是什么。这就是 Cloudflare Temporary Accounts 想创造的日常——让“先试试”变得比“先注册”更容易。

Product Huntsignal

AirJelly

127 votes9 comments

你打开电脑,桌面上有五个便签、三个待办清单、两个笔记软件、一个收藏夹、一个稍后阅读工具。你记得上周看到过一篇关于竞品定价的文章,但你不确定是存在 Notion 里、浏览器书签里、还是微信收藏里。你花了十五分钟翻来翻去,最后放弃了,重新搜了一遍。然后你发现,你其实已经存过那篇文章了,就在你昨天刚建的那个叫“临时”的文件夹里。这种场景你太熟了——信息越多,脑子越乱,越觉得自己记性差。但问题不是你的记性,是你没有一个能主动帮你整理的东西。

AirJelly 想解决的就是这个。它不是一个你主动去“记”的工具,而是一个你扔进去就行的容器。你往里面丢任何东西:网页链接、截图、语音备忘录、邮件、PDF、随手写的想法。它自己会读、会分类、会关联。你不需要给它建文件夹、打标签、设提醒。它自己会判断哪些东西重要,哪些东西需要你注意,然后主动推给你。比如你存了一篇关于“如何做用户访谈”的文章,三天后你收到一条推送:“你之前保存的用户访谈指南,和下周要做的客户调研相关,要不要看看?”它不是在等你问,它自己觉得该提醒你了。

工作流是这样的:你装好 AirJelly 的浏览器插件或者手机 App,看到任何有用的东西,一键保存。系统后台会做几件事——先 OCR 图片里的文字,再提取全文,然后用一个轻量的模型理解内容主题,再跟库里已有的所有内容做相似度匹配。如果发现新内容和旧内容有关联,它会自动建立链接。比如你保存了一份“定价策略”的 PDF,它发现你上周存过一篇“SaaS 定价模型”的博客,就会把这两份东西关联起来,生成一个叫“定价相关”的自动集合。你不需要手动操作,它自己长出了结构。输出端,它给你一个搜索框、一个时间线、一个“今天值得看”的卡片。它还能接你的日历和待办清单,比如你日历上有个“产品评审会”,它会在会前把相关的笔记、文章、历史记录整理成一个摘要推给你。

用一个比喻来说,AirJelly 像你雇了一个图书管理员,但这个管理员不是坐在前台等你来借书,而是每天在你办公室转一圈,看到你桌上堆了一堆文件,自己帮你分类、装订、贴上标签,然后放在你最容易拿到的地方。你甚至不用告诉他“把红色文件夹放左边”,他自己会判断。

现在市面上有很多“第二大脑”工具,比如 Notion、Obsidian、Roam Research。它们走的路是给你一个强大的编辑器,让你自己建结构、写链接、画图谱。你花大量时间在“整理”上——建数据库、设属性、写模板。AirJelly 选了另一条路:它替你干整理这件事。Notion 是给你一堆乐高,你自己拼房子;AirJelly 是给你一个自动组装机,你把砖块扔进去,它自己拼。差别在哪?如果你是一个喜欢手动整理、享受构建知识体系的人,Notion 会让你很爽。但如果你是一个每天被信息淹没、根本没时间整理的人,AirJelly 的“自组织”就很重要。比如你是一个产品经理,每天要读几十篇用户反馈、竞品动态、行业报告,你不可能每篇都手动分类。AirJelly 能让你只负责“存”,剩下的它来。

当然,代价也很清楚。自组织意味着你放弃了控制权。你不知道它怎么分类的,它可能把一篇关于“定价”的文章和一篇关于“用户留存”的文章关联起来,但你觉得它们不相关。你没法手动调整它的分类逻辑,至少目前看起来不行。如果你是一个对信息组织有强迫症的人,你会觉得它不够精确。另外,它依赖 AI 理解内容,如果内容很冷门、专业术语很多,或者语言不是主流语言,它的理解可能出错。还有一个风险:你把所有信息都扔进去,等于把知识管理完全托付给一个黑盒。如果它哪天服务挂了,或者你换平台,数据迁移可能很麻烦。它适合那些信息量大、但不需要精细分类的人,不适合那些需要严格知识图谱的研究者。

想象一下你是一个创业公司的运营负责人。你每天要盯十几个渠道的信息:行业新闻、竞品动态、用户反馈、内部文档。你以前的做法是每天花半小时手动整理,然后写一个简报给团队。用了 AirJelly 两周后,你发现每天早上打开手机,它已经给你生成了一份“今日简报”,里面有三条:一条是你昨晚保存的竞品融资新闻,关联了你之前存过的竞品分析报告;一条是用户反馈里提到的一个 bug,关联了你们的产品文档;还有一条是你上周收藏的一篇增长策略文章,它提醒你下周要开增长会。你只需要扫一眼,然后转发给对应的人。你甚至不需要打开任何笔记软件。这就是 AirJelly 想给你的日常。

Product Huntsignal

MediaSeg

120 votes19 comments

你刚录完一场两小时的团队复盘会,视频文件 4.2GB。你想把它发到 Slack 频道,结果拖进去转圈三分钟,最后弹出一行红字:“文件过大,最大支持 1GB。”你试压缩,画质糊成马赛克;你试分两段,得手动找时间点、用 QuickTime 剪、导出、重命名、再上传。搞完已经过了半小时,中间还因为导出格式不对被同事问“怎么打不开”。这不是你的错,是工具从来没认真对待过“上传”这件事。

MediaSeg 就是来解决这个的。你打开它,把那个 4.2GB 的 .mov 拖进窗口,输入你想切成的块大小——比如 900MB。它自动分析文件,在尽量不打断内容的地方(比如静音段或场景切换点)切开,输出几个命名清晰的片段,比如“复盘会_1.mov”“复盘会_2.mov”。然后你直接拖到 Slack 或 Google Drive 里,每个都小于 1GB,秒传。它不转码,不压缩,只做一件事:切。上下游接的就是你本地的 Finder 和你的上传目的地。

你可以把它想象成一个智能的切蛋糕刀。蛋糕太大,盘子装不下,你不需要把蛋糕烤小,也不需要把蛋糕压扁,只需要一把知道哪里是奶油层、哪里是水果层的刀,沿着自然缝隙切下去,每块刚好能放进盘子。MediaSeg 就是那把刀,它读的是媒体文件里的时间轴和音频波形,找到那些“这里可以断一下”的位置,而不是像普通分割器那样硬生生在 1 小时 23 分 15 秒处一刀切。

市面上有替代方案,比如 HandBrake 或 FFmpeg。HandBrake 的路径是“转码+压缩”,它把整个文件重新编码一遍,输出一个更小的文件。代价是耗时——4GB 文件转码可能要 20 分钟,而且画质损失明显。FFmpeg 更灵活,但你要记命令行参数,比如 `ffmpeg -i input.mp4 -ss 00:00:00 -t 00:30:00 -c copy output.mp4`,还得自己算时间点,切出来的片段可能正好卡在说话中间。MediaSeg 的路径是“智能分割+不转码”,它用 macOS 的底层媒体框架直接复制数据流,不重新编码,所以几秒就切完,画质零损失。这个差异在什么场景下重要?当你需要保留原始画质用于剪辑或存档,或者你赶时间、不想等转码的时候,MediaSeg 就是唯一合理的选择。

当然它也有边界。如果你的文件本身编码有问题或者损坏,任何分割工具都救不了。另外,它只做分割,不做压缩、格式转换、字幕嵌入。如果你需要把 4K 视频压成 1080p 发给客户,它帮不上忙。还有一个限制:它依赖 macOS 原生支持的媒体格式,如果你拿一个罕见的 .rmvb 或 .wmv,它可能认不出来。风险在于,如果你切的时候选了“按固定大小”而不是“按场景”,可能会在对话中间断开,但你可以手动调整切点——它提供了预览功能。

想象一下你是个播客制作人,刚录完一期 3 小时的访谈,原始文件 2.8GB。你要把前 30 分钟试听片段发到社交媒体,把完整版分三段上传到播客托管平台(每段限 1GB)。以前你得打开 Audacity,找到时间点,导出三段,再分别检查音量。现在你打开 MediaSeg,拖入文件,输入“每段 900MB”,它自动切出三段,文件名带时间戳。你直接把第二段拖到 Twitter 上,配一句“嘉宾在 1 小时 10 分讲了个重磅消息”,然后去喝咖啡。这就是 MediaSeg 想给你的日常。

Product Huntsignal

Clawd

113 votes15 comments

你正在查一个开源项目的文档,开了十几个标签页,GitHub 仓库、Stack Overflow 问答、官方 API 参考、一篇 Medium 教程。你来回切换,复制代码片段,记笔记,脑子像一团乱麻。突然想起刚才在某个页面看到过一个关键参数,但你忘了是哪个标签页,只能一个个点回去翻。这时候你多希望有个人能帮你记住所有上下文,在你需要的时候直接递过来。但你不敢用那些云端 AI 助手,因为你的浏览记录里可能包含公司内部代码、未公开的 API key、或者你不想让任何人知道的搜索历史。

Clawd 就是来解决这个问题的。它是一个 Chrome 扩展,装好之后你的浏览器里会多出一只小宠物——一个卡通形象,可能是只猫或者别的什么,具体长什么样不重要。重要的是,它一直在看着你。不是偷窥,而是像你桌面上的一只电子宠物,默默记录你当前在看什么、之前看过什么、哪些页面之间有联系。所有数据都留在你的电脑里,因为它的 AI 模型是 100% 本地运行的,不需要把任何信息发到云端。

怎么用呢?你正常浏览网页,Clawd 在后台分析页面内容。当你需要帮助时,比如你想总结当前页面、提取关键信息、或者问一个关于之前看过内容的问题,你直接点一下它,或者用快捷键呼出对话框。输入你的问题,比如“刚才那个仓库的安装命令是什么”,它就会从本地存储的上下文里找到答案,直接显示出来。它还能主动提醒你:当你打开一个跟之前某个页面相关的页面时,它会弹个小提示,说“你之前看过这个库的 issue,要不要回顾一下?”它不依赖任何外部 API,所有推理都在你的 CPU 或 GPU 上完成,用的是像 Llama 或 Phi 这样的小型本地模型。

你可以把它想象成一只坐在你肩膀上的小精灵。你工作的时候它不说话,只是看着。当你需要的时候,它凑到你耳边,递给你一张小纸条,上面写着刚才你漏掉的东西。它不会把你的话传给别人,因为它根本没有嘴巴往外说——所有数据都锁在你的电脑里。

跟市面上那些浏览器 AI 助手比,比如 Monica 或者 ChatGPT 侧边栏,它们走的是云端路线。你把问题发过去,它们调用大模型,返回结果。好处是模型能力强,能处理复杂推理。坏处是你得信任它们不会记录你的数据,而且每次都要联网,速度取决于网络。Clawd 选了另一条路:完全本地。这意味着它的模型能力肯定不如 GPT-4,但换来了绝对的隐私和离线可用。你在飞机上、地铁里、或者公司内网环境,它都能工作。而且它不需要你手动复制粘贴上下文——它自己看着你,知道你在做什么。这个差异在什么场景下重要?当你浏览的内容涉及敏感信息时,比如医疗记录、财务数据、公司内部代码,你不敢让任何云端服务碰。Clawd 就是为你这种人准备的。

当然,代价也很明显。本地模型的大小受限于你的电脑性能,所以它没法做长篇大论的写作,也没法理解非常复杂的逻辑。如果你需要写一份完整的市场分析报告,用它就像用自行车去拉货。它的真正战场是那些需要快速回顾、提取、关联信息的场景——你正在读一篇技术文章,突然想不起之前看过的某个概念,问它一句,它立刻告诉你。另外,它需要占用一定的本地计算资源,如果你的电脑本身就很卡,装它可能会让风扇转起来。

想象一下这个画面:你正在调试一个 bug,打开了 GitHub 上的一个 PR,里面有人提到了一个类似的 issue。你点进去看,然后 Clawd 的图标闪了一下,弹出一条消息:“这个 issue 的解决方案在你昨天打开的 Stack Overflow 回答里,需要我帮你打开吗?”你点了一下,它直接跳转到那个页面。你不需要回忆,不需要翻历史记录,甚至不需要中断当前的工作流。这就是 Clawd 想给你的日常。

GitHubhot newcomer

vercel/eve

162 forks2272 stars

想象一下你是个独立开发者,正在做一个自动处理客户邮件的代理。你打开编辑器,开始写代码:调用 OpenAI API,解析回复,管理状态,处理错误,还要考虑安全沙箱。一周后,你的代码变成了一团乱麻——API 调用散落在各个文件里,状态管理靠全局变量,错误处理全靠 try-catch 堆砌。你甚至不敢部署,因为一旦某个环节出错,整个代理就会卡死。这就是没有 eve 时的状态:你花 80% 的时间在搭架子,只有 20% 的时间在真正写业务逻辑。

eve 就是来解决这个问题的。它不是一个现成的 AI 助手,而是一个让你自己造 AI 助手的工具箱。你是一个开发者,你用 TypeScript 写一个工作流定义文件,告诉 eve 你的代理要做什么:比如“每天早上 8 点检查新邮件,如果是退款请求就调用 Stripe API 查询订单状态,然后根据金额和客户等级决定自动处理还是标记人工”。eve 拿到这个定义后,会在一个沙箱环境里运行你的代理,管理它的生命周期、状态持久化、工具调用和错误恢复。输出是一个可以部署到 Vercel 的代理实例,或者一个可以嵌入到你现有应用里的模块。上下游接什么?它原生对接 Vercel 的部署平台,也支持你自定义的外部 API——比如 Slack、Stripe、GitHub 这些你已经在用的服务。

你可以把 eve 想象成一个“代理工厂”。你不需要自己造螺丝、焊电路板、设计流水线。你只需要画一张图纸——用 TypeScript 写一个工作流定义——然后工厂自动帮你把代理组装好、测试通过、打包发货。图纸上写的是“如果 A 发生,就调用 B 工具,然后根据 C 结果决定下一步”,工厂负责把这句话变成真正能跑起来的代码。

和 LangChain 这类框架比,eve 走了一条完全不同的路。LangChain 给你一堆抽象概念——链、代理、记忆、工具——让你自己拼装。它像一盒乐高,零件很多,但你要自己看说明书、自己搭结构、自己保证拼出来的东西不会散架。eve 选择的是“给你一个固定的流水线,你只需要填业务逻辑”。它内置了沙箱执行、状态管理、错误重试和可观测性。这意味着什么?在 LangChain 里,你要自己写代码处理代理卡死、API 超时、状态丢失这些生产环境问题。在 eve 里,这些是框架默认提供的。如果你只是做个原型,LangChain 够用。但如果你要把代理部署到线上,每天处理几百个真实请求,eve 的沙箱和错误恢复机制就变得很重要。

当然,eve 不是万能的。它目前有 70 个开放 issue,说明还在快速迭代中。如果你只是想做一个简单的问答机器人,用 eve 就像用货车去买菜——能装,但没必要。它的真正战场是那些需要长期运行、涉及多个步骤、需要安全隔离的生产级代理。比如一个自动处理 GitHub issue 的代理:它要读取 issue 内容,调用 OpenAI 分类,然后根据分类结果打标签、分配负责人、回复评论。这个流程涉及多个 API 调用、状态切换和错误处理,用 eve 的沙箱和工作流定义来管理,比你自己写一堆回调函数要靠谱得多。

还有一个代价:eve 目前只支持 TypeScript。如果你团队的主力语言是 Python,那它暂时不适合你。另外,它深度绑定 Vercel 生态——虽然你可以自己部署,但默认的部署路径就是 Vercel。如果你已经用了 AWS 或 GCP,迁移成本需要考虑。

说个具体的场景。你是一个开源项目的维护者,每天有几十个 issue 涌入。你写了一个 eve 工作流:当新 issue 创建时,代理读取内容,调用 OpenAI 判断是 bug、feature 还是 question,然后自动打标签、分配负责人、回复一条模板消息。你把它部署到 Vercel,设置一个 GitHub webhook 触发。第二天早上,你打开 GitHub,发现 47 个 issue 已经被自动分类,其中 3 个 bug 被标为高优先级,2 个重复 issue 被自动关闭。你只需要处理那 3 个高优先级的 bug,剩下的时间可以写代码。这就是 eve 想创造的日常——不是让你写更少的代码,而是让你写的每一行代码都真正在解决业务问题,而不是在搭架子。

GitHubhot newcomer

BuilderIO/skills

130 forks2451 stars

你是一个前端开发者,正在用 Cursor 或 Copilot 写一个 React 组件。你输入“帮我写一个带搜索和分页的用户列表”,AI 生成了代码,但样式不对,分页逻辑有 bug,而且它不知道你用的是 Tailwind 还是 Ant Design。你花十分钟改 prompt:“用 Tailwind,分页用 usePagination hook,列表数据从 /api/users 拿”。AI 这次对了,但下次你让它写一个“带拖拽排序的表格”,它又忘了你的技术栈偏好。你开始怀疑:这 AI 是不是每次都在“重新学习”怎么干活?

Skills 就是来解决这个问题的。它是一个给编码代理用的“技能库”,由 BuilderIO 开源,发布 12 天就拿到了 2451 颗星。它的思路很简单:把 AI 能做的事拆成一个个独立的“技能”,每个技能是一个 JavaScript 模块,定义了输入、输出、上下文和调用方式。你不需要写复杂的 prompt,只需要告诉 AI“用这个技能”,它就知道怎么处理。

具体怎么用?假设你是一个团队的技术负责人,你们用 Cursor 写代码,但每次让 AI 生成 API 接口文档,它都格式不对。你可以创建一个“生成 API 文档”的技能:输入是路由文件路径和注释,输出是 Markdown 格式的文档,上下文里绑定了你们团队的文档模板和字段规范。然后把这个技能注册到 Skills 库里。下次你的队友在 Cursor 里输入“给 /users 路由生成文档”,AI 会自动加载这个技能,按你的模板输出,不用再反复调教。Skills 本身不跑代码,它只是一个“技能描述”的仓库,真正的执行靠 Cursor、Copilot 这类编码代理去调用。上下游接的是你的编辑器、你的代码仓库、你的文档系统。

你可以把 Skills 想象成给 AI 助手装上的“外挂插件”。就像游戏里的角色,基础能力是走路、攻击、跳跃,但装上“火焰剑”插件就能放火,装上“飞行背包”就能上天。Skills 就是这些插件,每个插件教会 AI 一个特定领域的“绝活”。没有 Skills,AI 就像一个只会基础动作的裸装角色,每次遇到新任务都要从零学起。

对比一下 OpenAI 的 Function Calling。OpenAI 的路径是“让 AI 学会调用你定义的函数”,你需要写函数签名、参数、返回值,然后 AI 在对话里决定要不要调用。这条路的问题是:函数是死的,AI 只能按你写好的逻辑执行,不能自己“学会”新函数。Skills 的路径是“让 AI 学会使用你定义的技能”,技能本身可以包含上下文、示例、甚至子技能,AI 可以组合多个技能完成复杂任务。差异在哪?Function Calling 适合“执行一个确定操作”,比如“调用 sendEmail 函数发邮件”;Skills 适合“完成一个不确定流程”,比如“根据用户反馈和代码历史,自动生成修复方案”。如果你的场景是固定的、重复的,Function Calling 够用;如果你的场景是变化的、需要 AI 自己判断的,Skills 更灵活。

但 Skills 不是万能药。它的代价是:你需要花时间写技能定义,而且技能的质量直接决定 AI 的表现。如果你写的技能描述模糊、示例太少,AI 可能用错或不用。另外,Skills 目前依赖编码代理去加载,如果你的编辑器不支持 Skills 协议,它就是个空架子。目前 Skills 的生态还在早期,只有 BuilderIO 自家的 Agent Native 平台原生支持,其他工具需要手动集成。还有一个风险:技能是公开的,你写的技能可能被别人看到或修改,虽然 MIT 许可证允许,但如果你有商业机密,得自己托管私有版本。

想象一下这个场景:你的团队新来了一个实习生,他第一次用 Cursor 写代码。他输入“帮我修复这个 CSS 布局问题”,AI 自动加载了“CSS 修复技能”,这个技能包含了你们项目里所有常见的布局模式、浏览器兼容性处理、以及你们团队偏好的 Flexbox 写法。AI 不仅修复了问题,还加上了注释说明为什么这么改。实习生看了一眼,说:“这 AI 怎么这么懂我们?”他不知道,是你们团队的技术负责人提前写好了那个技能,放在 Skills 库里。

GitHubhot newcomer

sums001/Windows-Copilot-API

119 forks342 stars

你是个独立开发者,正在做一个自动写周报的小工具。你想用 GPT-4 来生成内容,但打开 OpenAI 的官网,先要注册账号,绑定信用卡,然后每个月盯着账单,生怕调用次数超了。更烦的是,你只是写个个人项目,不想为了一点点 AI 能力去填一堆表格、签一堆协议。你试过用免费的 Claude,但它的 API 也要申请,而且额度有限。最后你只能手动复制粘贴到网页版 ChatGPT,然后复制回来,效率低得让人想砸键盘。你真正想要的,就是一个能直接调用的接口,不关心账单,不关心密钥,只关心能不能跑起来。

Windows-Copilot-API 就是给这种处境的人准备的。它本质上是一个 Python 写的本地服务,你把它跑起来之后,它会监听一个端口,比如 localhost:5000。然后你只需要像调用 OpenAI 的 API 一样,发一个 POST 请求过去,带上你的消息,它就会返回 GPT-4 或 GPT-5 的回复。你不需要去微软注册任何东西,不需要申请任何密钥,甚至不需要知道 Windows Copilot 是什么。你只需要在代码里把 API 地址改成 localhost,其他一切照旧。它背后做的事情是:拦截你的请求,通过反向工程的手段,跟微软的 Windows Copilot 服务通信,拿到结果再返回给你。你的上游是你自己的代码或工具,下游是微软的 Copilot 服务器,中间这个 API 就是翻译官和快递员。

你可以把它想象成一条从你家后院挖到微软后厨的地道。别人要进微软的餐厅吃饭,得先买票、排队、出示身份证。你不需要,你直接从地道钻进去,在后厨拿一份菜就走。这条地道就是 Windows-Copilot-API,它帮你绕过了所有前台手续,直接拿到了后厨的食材。

跟 OpenAI 官方 API 比,这条路完全不同。OpenAI 走的是正规军路线:你要注册、付费、遵守使用条款,换来的是稳定的服务、明确的 SLA、以及随时可以找客服。Windows-Copilot-API 走的是游击队路线:免费、无需注册、即开即用,但代价是你完全依赖微软的 Windows Copilot 服务是否稳定、是否改接口、是否封杀这种用法。OpenAI 的 API 适合做商业产品,你可以在上面跑用户数据,出了问题有人负责。Windows-Copilot-API 适合做个人实验、快速原型、或者预算为零的项目。如果你只是想验证一个想法,花 5 分钟搭起来跑一下,它比任何官方方案都快。

但代价也很清楚。第一,它依赖 Windows Copilot 这个服务,微软随时可能更新协议或接口,导致这个工具失效。第二,它没有官方支持,出了问题你只能去 GitHub 提 issue,而作者 sums001 只有一个人,项目才 3 天,342 个 star,119 个 fork,还挂着 1 个 open issue。第三,它可能违反微软的服务条款,你用它跑商业项目,风险自己扛。第四,它只支持文本对话,不能处理图片、文件、或者流式输出,功能比官方 API 少得多。如果你需要稳定、合规、全功能,别碰它。如果你只是想花 10 分钟让 GPT-4 帮你写一段代码,或者测试一个 prompt,它可能是你见过最爽的工具。

想象一下,你周五晚上坐在电脑前,想试试 GPT-5 写诗的能力。你打开终端,pip install 几个依赖,python run.py,然后打开另一个终端,curl 过去一句“写一首关于程序员失眠的诗”。几秒钟后,终端里跳出一段文字,押韵、有画面、还带点自嘲。你没有注册任何账号,没有绑定任何信用卡,没有等任何审批。你只是跑了一个开源项目,就拿到了微软最新模型的能力。这就是 Windows-Copilot-API 给你的体验。

GitHubtrending growth

想象一下周一早上九点,你坐在工位上,面前是三个浏览器标签页:Jira 里 47 个待办任务,Confluence 里 12 篇需要审阅的文档,还有 Slack 里产品经理催你更新 Sprint 进度的消息。你开始手动复制粘贴:把 Jira 的任务标题和状态复制到 Confluence 的周报模板里,再打开另一个页面查某个需求的原始讨论记录,然后切回 Slack 回复“进度正常”。这个过程你每周重复一次,每次花掉四十分钟。更烦的是,你想让 AI 帮你干这事,但你的公司不允许把 Jira 数据喂给 ChatGPT——合规部门盯着呢。

Atlassian MCP Server 就是来解决这个尴尬的。它是一个跑在远程的服务器,专门负责在 AI 和你的 Atlassian 工具之间当翻译和保安。你不需要把 Jira 或 Confluence 的数据导出、复制、粘贴到任何第三方 AI 平台。你只需要让你的 AI 助手——比如你 IDE 里的 Copilot、你 Slack 里的 bot、或者你自建的 agent——通过 MCP 协议连上这个服务器。然后你就可以用自然语言说:“帮我查一下这个 Sprint 里所有状态是‘进行中’的任务,按优先级排序,然后总结成一段话。”服务器收到指令后,会用你的身份凭证去 Jira 查询,把结果格式化,再安全地返回给你的 AI。整个过程,你的数据没有离开 Atlassian 的围墙。

它的工作流很直接。谁用它?主要是开发者和产品经理,但也可以是任何需要频繁从 Jira 和 Confluence 拉数据的人。输入是你对 AI 说的一句话,比如“把昨天 Confluence 上更新的文档标题列出来”。系统先通过 MCP 协议解析你的意图,然后服务器端用 OAuth 验证你的身份,再调用 Jira 或 Confluence 的 REST API。输出是结构化的数据——JSON、Markdown、或者直接是 AI 帮你整理好的摘要。上下游接什么?上游是你的 LLM、IDE 或者 agent 平台,下游是 Atlassian 的云服务。它不存数据,只做实时查询。

你可以把它想象成一个外交官。你(AI 助手)想进 Jira 和 Confluence 这两个国家办事,但你不能直接闯进去翻文件,因为你不懂当地语言,也没有签证。这个 MCP 服务器就是你的外交官,它懂两边的语言,持有合法的通行证,每次你提出请求,它帮你翻译、递交、取回结果。它不会把整个国家的档案库搬出来给你,只会给你你要的那一份文件。

对比一下直接让 AI 调用 Jira API 的方案。很多团队自己写脚本,让 AI 直接调 Jira 的 REST API。这条路的问题是:你得自己管理 API 密钥、处理认证过期、写错误重试逻辑,还得确保 AI 不会乱发请求——比如不小心删掉一个任务。Atlassian 的 MCP 服务器选择了另一条路:它把所有这些脏活封装好,并且加了一层安全控制。你不需要在 AI 的 prompt 里写 API 密钥,不需要担心 AI 误操作,因为服务器只允许读操作和有限制的写操作(比如更新任务状态)。这个差异在团队协作场景下特别重要。当你让一个共享的 AI bot 去查项目进度时,你不想它因为某个人的 prompt 写错了,就把整个 Sprint 的任务全删了。

当然,它也有边界。如果你的团队只有三个人,Jira 里只有二十个任务,你手动复制粘贴可能更快。这个工具的价值在于规模——当你有几百个任务、几十个文档、每周要出报告时,它才值得你花时间配置。另外,它依赖网络和 Atlassian 的云服务,如果你的公司用的是自托管的 Jira 数据中心版,这个远程 MCP 服务器可能连不上。还有,它目前有 76 个 open issues,说明还在迭代中,不是每个边缘情况都处理好了。如果你需要 AI 做复杂的跨项目关联分析,比如“找出所有被阻塞的任务并关联到对应的 Confluence 设计文档”,它可能做不到,因为 MCP 协议本身对多步骤推理的支持还在完善。

说个具体的场景。你是一个后端工程师,正在 IDE 里写代码。你的同事在 Slack 里@你,说“那个用户登录的 bug 修好了吗?对应的 Jira 任务更新一下状态”。你不想切出编辑器,于是你打开 Copilot 的聊天窗口,输入:“把 JIRA-1234 的状态改成‘已修复’,并在 Confluence 的‘发布检查清单’文档里,把‘登录模块’这一项勾上。”Copilot 通过 MCP 服务器,用你的账号执行了这两个操作。三十秒后,Slack 里同事回了一句“看到了,谢谢”。你没离开过代码编辑器,没打开过一个浏览器标签页。

More From Today

Product Huntsignal

Alai 2.0

249 votes48 comments

AI design partner for presentations, social posts, and more

Product Huntsignal

AgentX

335 votes118 comments

Evaluate AI agent, pinpoint issues, and fix with one click.

Product Huntsignal

readywhen

193 votes44 comments

Your 24/7 AI Chief of Staff for commitments and follow-ups

Product Huntsignal

MediaSeg

120 votes19 comments

Split large media files into upload-ready chunks on macOS

Product Huntsignal

Clawd

113 votes15 comments

A context-aware browser mascot with 100% local offline AI

GitHubhot newcomer

sums001/Windows-Copilot-API

119 forks342 stars

Reverse engineered Windows Copilot into an OpenAI-compatible API. Access GPT-4 and GPT-5 models through a simple REST interface without API keys or billing.

2026-06-22

今日值得看:Agent 37 Cloud

Agent 37 Cloud 是今天最值得先看的信号。Agent 37 Cloud 是一个让企业给每个客户分配一个专属 AI agent 的平台,每个 agent 独立运行、独立配置、独立权限。

今日 Brief

  • 产品侧可以先看 Agent 37 Cloud:Agent 37 Cloud 是一个让企业给每个客户分配一个专属 AI agent 的平台,每个 agent 独立运行、独立配置、独立权限。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

Cloudback MCP Server

127 votes20 comments

你正在 Cursor 里改一个紧急 bug,改到一半突然想起:今天还没备份生产数据库。你叹了口气,切到终端,敲 `pg_dump`,等它跑完,再检查日志,确认没报错。整个过程大概五分钟,但每次切换上下文都像被人从水里拽出来。更烦的是,你经常忘了备份,直到某天凌晨三点被报警短信吵醒——数据库挂了,而上次备份是三天前。那一刻你盯着屏幕,脑子里只有一个念头:为什么不能直接跟编辑器说一句“备份一下”?

Cloudback MCP Server 就是干这个的。它不是一个备份工具本身,而是一个翻译官——把你的自然语言指令,转成备份系统能理解的操作。你不需要离开 Claude、Cursor 或 VS Code,不需要打开浏览器,不需要记命令。你只需要在聊天框里说:“把 staging 数据库备份到 S3,保留最近 7 天。” 然后 Cloudback 的 MCP 服务器收到这条消息,通过 Model Context Protocol 解析你的意图,调用 Cloudback 的 API 去执行备份,最后把结果——成功还是失败、备份文件多大、存在哪里——直接回复给你。整个过程发生在你写代码的同一个窗口里,你甚至不用切换标签页。

谁在用这个?主要是那些每天跟多个环境、多个数据库、多个云存储打交道的开发者。你可能是后端工程师,也可能是 DevOps,或者一个全栈创业者。你的输入就是一句自然语言,系统处理的核心是 MCP 协议——它让 AI 模型(比如 Claude)知道“备份”这个动作对应哪个 API、需要哪些参数。输出是一个确认消息,或者一个错误提示。上下游接的是 Cloudback 的备份服务,它本身支持 GitHub、GitLab、Bitbucket 的仓库备份,也支持数据库和文件系统。所以你可以说“备份一下这个仓库”,它就知道去拉 Cloudback 的配置。

用一个比喻来理解:想象你有一个私人管家,你坐在书房里写东西,突然想起要浇花。你不需要站起来去拿水壶、接水、走到阳台。你只需要说一句“把阳台的花浇了”,管家就去做了。Cloudback MCP Server 就是这个管家,而 Claude、Cursor 就是你的书房。传统的备份工具是水壶和水龙头——你得自己动手。这个产品把“动手”变成了“动嘴”。

对比一下真实竞品。比如你之前可能用 Backblaze 或 AWS Backup,它们都有 Web 控制台或 CLI。你要备份一个数据库,得先登录控制台,找到备份策略,点几下,或者写一个 shell 脚本定时跑。这条路很成熟,但问题是它要求你离开当前工作流。另一个替代方案是直接在编辑器里装一个插件,比如 VS Code 的备份扩展,但那些插件通常只能备份文件,不能理解“备份生产数据库并发送通知”这种复合指令。Cloudback 选择了一条不同的路径:它不跟编辑器抢界面,而是通过 MCP 协议把 AI 助手变成你的备份操作入口。这造成的能力差异是:你可以用自然语言组合多个动作,比如“备份 staging 数据库,然后发一条 Slack 消息给团队”。传统工具做不到,因为 Slack 和备份是两个系统。而 MCP 服务器可以串联它们——只要 Cloudback 的 API 支持,你就能在一条指令里完成。

当然,这个产品有明确的边界和代价。它不适合那些需要精细控制备份策略的场景。比如你要做增量备份、指定压缩算法、设置复杂的保留规则,用自然语言描述可能比直接写脚本还麻烦。另外,它依赖 AI 模型的理解能力。如果你说“备份一下那个重要的”,AI 可能不知道“那个”指的是什么。风险在于权限:如果你在编辑器里给了 AI 执行备份的权限,它误操作了怎么办?比如你说“备份所有数据库”,但你的生产库有 500GB,备份一次要一小时,还影响性能。所以 Cloudback 需要你提前配置好哪些环境、哪些操作是允许的,就像给管家一把只能开特定门的钥匙。

最后,讲一个用起来什么样的小故事。周五下午四点,你准备收工。你在 Cursor 里对 Claude 说:“把本周所有改过的仓库都备份一次,然后发一份备份报告到我的邮箱。” 你按下回车,看到 Claude 回复:“正在处理,预计需要 3 分钟。” 你关掉电脑,去接孩子放学。周一早上打开邮箱,看到一封来自 Cloudback 的邮件,标题是“备份报告:7 个仓库成功,0 个失败”。你点开,每个备份的大小、时间、存储位置都列得清清楚楚。你甚至不记得自己做过这件事——但备份确实在那里。

Product Huntsignal

Laguna by Poolside

141 votes5 comments

你是一个后端工程师,早上十点被拉进一个紧急会议。产品经理说,支付模块要从 Stripe 迁移到 Braintree,API 接口必须保持完全兼容,旧数据要平滑过渡,整个改动涉及 12 个文件、3 个微服务、一个数据库迁移脚本。你估算了一下,光理解现有代码结构就要两小时,改完至少一整天,中间还得反复切回文档查 Braintree 的 SDK 用法。你打开 VS Code,盯着那一堆文件,脑子里已经开始排今晚加班的外卖了。这不是你一个人的问题。所有写代码的人都知道,最耗时的不是写那几行逻辑,而是“理解上下文、规划步骤、跨文件协调、反复验证”这一整套流程。现有的 AI 助手——GitHub Copilot、Cursor 的补全、甚至 Claude 的对话窗口——它们擅长的是“你问一句,它答一句”,或者“你写个函数名,它补完函数体”。但当你需要它帮你完成一个需要持续半小时、涉及多个模块、中间还要自己查文档、自己跑测试的任务时,它们就断片了。因为它们没有“长期记忆”,没有“任务规划”,没有“自我验证”的能力。

Laguna 就是冲着这个缺口来的。它是 Poolside 公司训练的一个基础模型,专门为“智能体编程”和“长时间跨度工作”设计。你不需要把它当成一个聊天机器人。你把它当成一个能独立工作的远程程序员。你给它一个目标,比如“把支付模块从 Stripe 迁移到 Braintree,保持 API 兼容”,它自己会先扫描整个代码仓库,理解当前的结构,然后规划出步骤:第一步,安装 Braintree SDK;第二步,修改支付服务里的核心逻辑;第三步,更新数据库迁移脚本;第四步,写单元测试;第五步,跑一遍集成测试并修复失败。每一步它都会执行,执行完会检查结果,如果测试挂了它会回头改代码,直到全部通过。最后它会给你一个总结:改了哪些文件,测试覆盖率多少,还有两个边缘情况需要你人工确认。你全程不需要盯着它,你可以去开下一个会,或者去喝杯咖啡。

用一个比喻来理解 Laguna 的核心机制:它像一个特别靠谱的实习生,你给他一个项目目标,他就能自己查资料、写代码、跑测试、改 bug,中间不会每五分钟跑来问你“这个函数怎么调”。你只需要在开始的时候说清楚目标,在结束的时候检查结果。而传统的 AI 编程助手更像一个“超级搜索引擎加打字员”——你问它“这个函数怎么写”,它给你一段代码;你问它“这个 bug 怎么修”,它给你一个建议。但你不能让它自己去完成一个完整的任务,因为它没有“任务意识”,它只响应你的每一次提问。

对比一下真实竞品。GitHub Copilot 是目前最流行的 AI 编程助手,它的路径是“逐行补全”或“对话式生成”。你写一个注释,它补出函数体;你问一个问题,它回答一段文字。它的优势是快、轻、零配置,适合写短代码片段、查语法、写测试用例。但它的劣势也很明显:它没有“长期规划”能力。你让它“重构整个模块”,它只能帮你改当前文件,然后你就得手动切到下一个文件,再问一次。它记不住你之前说了什么,也理解不了整个项目的依赖关系。Laguna 走的是另一条路:它不追求每毫秒的响应速度,而是追求“一次任务,完整交付”。它需要更长的思考时间,但交付的是一个可运行的、经过测试的代码变更。这个差异在什么场景下重要?当你需要改一个跨多个文件、涉及多个服务的功能时,Copilot 帮不上忙,你只能自己动手;而 Laguna 可以替你完成 80% 的体力活。反过来,如果你只是要写一个简单的排序函数,用 Laguna 就像用货车去买菜——太笨重了。

当然,Laguna 的代价也很明显。首先,它很慢。一个复杂的任务可能需要几分钟甚至十几分钟才能完成,因为模型要反复思考、执行、验证。你不能像用 Copilot 那样边打字边等补全。其次,它需要明确的边界。如果你给的目标太模糊,比如“优化这个项目的性能”,它可能会跑偏,改了一堆不该改的地方,或者陷入无限循环。你需要把任务拆解成可验证的、有明确成功标准的子目标。第三,它仍然会犯错。模型生成的代码可能有逻辑漏洞,或者用了不安全的 API,或者忽略了某些边界条件。你必须在它交付后做代码审查,不能完全信任。最后,它的计算成本比普通 AI 助手高得多——每次任务都要消耗大量 GPU 算力,如果你是个人开发者,可能用不起;如果是团队,需要评估 ROI。

想象一下你实际用起来的样子。你是一个中小型创业公司的技术负责人,团队只有五个人,但产品迭代压力很大。你早上到办公室,打开 Slack,看到产品经理发了一条消息:“用户反馈支付页面加载太慢,需要优化。”你以前会花一整天分析性能瓶颈、改代码、部署、测试。现在你打开终端,输入一条命令,告诉 Laguna:“分析支付页面的加载性能,找出最慢的三个环节,并给出优化方案,生成对应的代码变更。”然后你去处理另一个紧急的线上 bug。四十分钟后,你回来看到 Laguna 已经提交了一个 Pull Request,里面包含了性能分析报告、修改了三个文件的代码、以及一个基准测试结果——页面加载时间从 2.3 秒降到了 0.8 秒。你快速扫了一眼代码,发现它把数据库查询改成了缓存,把图片懒加载了,还优化了 JavaScript 的打包。你点了“合并”,然后去回复产品经理:“搞定了。”这就是 Laguna 想创造的日常——不是取代你,而是把那些需要你连续专注几小时才能完成的苦活,变成后台任务。

Product Huntsignal

Plansera AI

108 votes13 comments

你打算申请美国 E-2 签证,需要一份商业计划书。这不是随便写写的东西——移民局要看你的生意是不是真实、可行、能创造就业。你去找律师,报价 3000 到 5000 美元,还要等两周。你自己写?你试过。打开 Word,盯着空白页,光标一闪一闪。你搜了十篇模板,每篇都告诉你“要写市场分析、财务预测、管理团队”,但你连自己餐厅的客单价预测都算不清楚。你花了一个周末,写出来三页,自己读一遍都觉得像小学生作文。你不敢交,又舍不得花几千块。最后你卡住了,签证申请进度条停在“商业计划书”这一格,一动不动。

Plansera AI 就是冲这个来的。你打开它的网页,输入你的基本信息:你打算开什么店、投多少钱、雇几个人、在哪个州。系统背后调用了什么模型?它没说,但你可以猜——它大概接了一个能理解商业结构和移民法规的 LLM,加上一些预置的财务模板和行业数据。几分钟后,你拿到一份完整的商业计划书,有执行摘要、市场分析、营销策略、财务预测,甚至还有 SWOT 分析。你下载成 PDF,可以直接拿去给律师审,或者直接附在签证申请里。上下游呢?上游是你自己填的表,下游是移民律师或者 USCIS 的收件窗口。它不帮你递交,只帮你把那份最头疼的文档搞定。

你可以把它想象成一个“签证文书自动填表机”,但不是填表格,而是填一份 20 页的论证报告。你告诉它“我要在迈阿密开一家奶茶店,投资 10 万美元,雇两个美国人”,它就像个熟悉移民局口味的文书助理,帮你把“为什么选迈阿密”“为什么奶茶有市场”“10 万美元怎么花”“两个员工怎么招”这些逻辑串起来,写成移民官爱看的格式。

和传统律所比,Plansera 走的是完全不同的路。律所卖的是律师的时间和对移民局审案习惯的经验,你付的钱里一半是沟通成本、一半是专业判断。Plansera 卖的是模板加 AI 填充,它没有律师的脑子,但它有 100 份成功案例的结构。代价是:它不会帮你判断你的商业计划是否真的合理。比如你写“第一年营收 500 万美元”,它可能不会提醒你这个数字在奶茶店行业有多离谱。律师会问“你凭什么这么算”,AI 只会说“好的,已写入财务预测”。所以它适合的场景是:你已经对自己的生意有清晰的想法,只是需要一份格式正确、语言专业的文档去敲门。如果你连自己开什么店都没想好,或者你的商业模式很特殊(比如做 AI 培训的咨询公司),那 AI 生成的模板可能漏洞百出,反而让移民官起疑。

另一个替代方案是那些“商业计划书模板网站”,比如 LivePlan 或者 Enloop。它们也让你填数据、生成报告,但它们是通用型的,不针对 E-2 签证。你填完还得自己改,把“吸引投资人”的语言改成“符合移民局要求”的语言。Plansera 直接锁定了 E-2 这个场景,输出的每一段都在回答移民官可能问的问题:你的投资是不是“substantial”?你的生意是不是“marginal”?你有没有“control”?这些词在通用模板里根本不会出现。

当然,它也有明显的边界。它只做 E-2,不做 L-1、EB-5 或者其他签证。如果你需要的是更复杂的移民策略,它帮不了你。而且它生成的内容质量取决于你输入的信息——你填得越模糊,它输出得越空洞。另外,它毕竟不是律师,移民局如果要求补充材料或者面试,你还是要找真人。风险在于:有人可能以为有了这份计划书就能自己递交,结果因为财务预测不合理被拒,反而浪费了申请费和时间。

我认识一个朋友,叫老张,他想在德州开一家汽车维修店。他找律师问价,律师说 4000 美元,两周。他嫌贵,自己写了三天,写出来的东西他自己都不信。后来他试了 Plansera,花了 20 分钟填了店址、投资额、员工数、预计月收入。系统生成了一份 18 页的计划书,他读了一遍,觉得“比我写的好十倍”。他拿给律师看,律师说“框架没问题,但你的市场分析里把竞争对手的数量写少了,我帮你改一下”。最后律师只收了他 500 美元的审阅费,省了 3500 美元。老张说,那个周末他终于能睡个好觉了。

Product Huntsignal

Notchkin

117 votes22 comments

你正盯着屏幕改一个设计稿,突然脑子里蹦出一个想法——比如“把按钮改成圆角,用户测试时反馈更好”。你下意识想记下来,但手边没有纸,手机在充电,电脑上开着十几个标签页。你只能最小化当前窗口,找到备忘录应用,点开,新建一条,打字,再切回去。这一套动作大概花你十秒,但那个想法已经凉了半截。更常见的情况是,你懒得动,告诉自己“等会儿再记”,然后永远忘了。

Notchkin 就是冲着这个瞬间来的。它不是一个全功能的笔记软件,它只做一件事:让你在 MacBook 的刘海区域里直接写笔记。那个刘海,就是你屏幕顶部摄像头旁边那块黑色区域,平时除了显示时间、Wi-Fi 图标,基本是浪费的。Notchkin 把它变成了一个常驻的便签条。你安装之后,刘海会显示一行文字——比如你最近记的一句话,或者一个图标。鼠标移上去,或者按个快捷键,就会弹出一个极简的输入框。你打字,回车,内容就存进去了。下次你再看刘海,那行字就更新了。

它的工作流简单到离谱。你不需要打开任何应用窗口,不需要切换桌面。你的输入就是一句话,系统把它存成一个纯文本文件,可能放在本地,也可能同步到 iCloud(取决于开发者怎么设计,但产品描述里没提同步,所以别假设)。输出就是刘海里的那行字。它不接任何上下游系统,不跟 Notion、Evernote 联动,也不做标签、分类、搜索。它就是你的“临时大脑缓存”。

用一个比喻来说,Notchkin 就像你在电脑屏幕的额头位置贴了一张便利贴。便利贴的好处是你一抬头就能看见,不用翻抽屉找本子。坏处是它只能写几个字,贴久了会掉,而且别人也能看见。Notchkin 就是那张数字便利贴,只不过它永远不会掉,而且只有你能看到(除非你让别人看你的屏幕)。

对比一下真正的竞品。Apple 自带的备忘录,或者 Bear、Notion,它们走的是“强大”路线:富文本、文件夹、标签、搜索、图片、协作。你可以在里面写几千字的文章,整理成知识库。但代价是,每次记录都需要一个完整的“打开应用→找到位置→新建笔记”流程。Notchkin 走的是“零摩擦”路线:它不给你任何选择,只给你一个输入框。你记下的东西可能只有一行字,但这一行字在你需要的时候永远挂在屏幕最上方。这两种路径的能力差异很明显:当你需要深度整理时,Notchkin 完全没用;当你需要闪电般捕捉一个念头时,备忘录太慢了。这个场景有多重要?想想你一天有多少次“先记一下,回头再说”的念头——大部分都丢了。

当然,Notchkin 的边界也很清楚。它只适合 MacBook 有刘海的机型,比如 2021 年之后的 MacBook Pro 和 Air。如果你的电脑是旧款或者外接显示器,刘海不存在,这个应用就失去了意义。另外,刘海区域能显示的文字非常有限——大概十几个字符。你没法用它记一段完整的会议纪要,也没法用它做待办清单。它甚至可能遮挡摄像头指示灯,让你不确定摄像头是否开着。还有一个风险:如果你把敏感信息写在上面,比如密码,别人路过你工位一眼就能看到。所以它最适合记那种“过期就扔掉”的临时想法,比如“买牛奶”“回邮件”“试试这个配色”。

想象一下你下午三点在咖啡店写代码。你盯着一个 bug 看了十分钟,突然意识到问题出在某个函数的参数顺序上。你不想停下敲键盘的手去打开备忘录,于是你按了一下快捷键,刘海弹出一个输入框,你打了三个字“swap args”,回车。刘海显示“swap args”。你继续写代码。五分钟后你改完,抬头看到刘海里的提示,确认自己已经改了,就双击刘海把那行字删掉。整个过程不到两秒,你的思路没断。这就是 Notchkin 想给你的日常。

GitHubsignal

NousResearch/hermes-agent

35334 forks198979 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

thedotmack/claude-mem

7230 forks83564 stars

你用过 AI agent 吗?就是那种你让它写代码、查资料、整理文档的“数字实习生”。刚开始用的时候挺爽,你告诉它“帮我重构这个模块”,它刷刷刷就干完了。但问题出在第二天。你打开一个新的会话,想让它继续昨天的工作,结果它一脸茫然地看着你,好像你们从没见过。你不得不把昨天的上下文、代码结构、你的偏好重新说一遍。更烦的是,如果你同时在跑好几个 agent——一个在写测试,一个在调 API,一个在分析日志——每个 agent 都像得了失忆症,每次对话都是第一次见面。你花在“重新介绍”上的时间,比让它们干活的时间还多。

claude-mem 就是来解决这个问题的。它不是一个 agent 本身,而是一个记忆层,可以插到任何 agent 后面。你用的 agent 是 Claude Code、OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode——随便哪个——只要接上 claude-mem,它就开始自动记录。记录的不是原始对话日志,而是经过 AI 压缩和提炼的“记忆”。比如你让 agent 调试一个 bug,它试了三种方案,最后用第二种解决了。claude-mem 不会记下你说了什么废话,而是记下“用户偏好第二种调试路径,该 bug 的根因是内存泄漏”。下次你再遇到类似问题,agent 打开新会话时,claude-mem 会自动把这条记忆注入进去,agent 就会直接说:“上次我们遇到类似情况,你选了第二种方案,要不要再试试?”

它的工作流是这样的:你启动 agent,agent 启动时加载 claude-mem 插件。agent 每做一件事——调用工具、写代码、查文档——claude-mem 都在后台抓取这些操作,然后用 AI 模型把它们压缩成结构化的记忆片段,存到本地数据库里。它支持 SQLite 和 ChromaDB 两种存储后端,前者轻量,后者适合做向量检索。下次 agent 启动时,claude-mem 会根据当前任务的关键词,从数据库里检索相关的旧记忆,然后像塞小纸条一样塞进 agent 的上下文窗口里。agent 看到这些纸条,就知道“哦,这个用户之前做过这个,那个项目有坑”。整个过程对你是透明的,你不需要手动管理任何东西。

你可以把 claude-mem 想象成给 AI agent 装了一个“私人助理”。这个助理不干活,但它有一本笔记本,随时记下 agent 做过什么、你喜欢什么、哪些方案失败了。每次 agent 开始新任务,助理就把相关的笔记翻出来放在桌上。agent 不用再问“你上次是怎么做的”,直接看笔记就行。

市面上已经有类似的项目,比如 Mem0、Supermemory、OpenMemory。它们的目标都是给 AI 加记忆,但路径不同。Mem0 走的是“记忆即服务”路线,它自己管理一个向量数据库,提供 API 让你存和查。Supermemory 更偏向个人知识管理,像一个 AI 版的 Notion。claude-mem 的选择是“嵌入 agent 的工作流”。它不是让你手动去存笔记,而是自动抓取 agent 的每一个操作,然后压缩、索引、注入。这意味着你不需要改变使用 agent 的习惯,装个插件就行。这种路径的好处是“零摩擦”——你不需要学习新工具,不需要手动分类记忆,agent 自己就学会了记住你。坏处是,它依赖 agent 的插件系统,如果某个 agent 不支持插件,你就用不了。目前它支持的主流 agent 已经很多了,但如果你用的是某个小众的 agent,可能就得等社区适配。

代价也很清楚。第一,它需要额外的计算资源。每次会话结束后,它都要跑一次 AI 压缩,把原始操作变成记忆。如果你一天开几十个会话,这个压缩过程会消耗不少 token 和本地算力。第二,记忆的质量取决于压缩模型。如果模型压缩得太狠,可能会丢失关键细节;如果压缩得太松,记忆会膨胀,占用上下文窗口。第三,隐私问题。所有记忆都存本地,但如果你用的是云端 agent,你的操作数据会被传到 agent 的服务器,claude-mem 只能保证本地存储的安全,管不了传输过程。第四,它不适合那些“每次任务都完全不同”的场景。比如你让 agent 每天写一篇不同的新闻稿,昨天的记忆对今天几乎没有帮助,那 claude-mem 就白费力气了。

想象一下这个场景:你是一个独立开发者,维护着一个开源项目。你让 Claude Code 帮你写测试、修 bug、重构代码。以前你每天打开终端,输入“继续昨天的重构”,Claude Code 会问“哪个模块?什么重构目标?你上次改到哪了?”你得翻聊天记录,找到昨天的对话,复制粘贴。装了 claude-mem 之后,第三天早上你打开终端,输入“继续昨天的重构”,Claude Code 直接说:“好的,继续重构 user 模块的认证逻辑。你昨天已经完成了单元测试,今天要改的是 session 管理部分。上次你提到想用 JWT 替代 cookie,要现在开始吗?”你愣了一下,然后笑了。它记住了。

GitHubsignal

bytedance/deer-flow

9827 forks72551 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

GitHubsignal

code-yeongyu/oh-my-openagent

5110 forks63154 stars

想象一下你下午三点接到一个任务:改一个三个月前写的支付模块,因为客户投诉退款逻辑有 bug。你打开项目,发现这个模块横跨五个文件,里面塞满了条件判断和回调,注释只有一行“// TODO: 优化”。你开始翻文件,从入口文件一路追到工具函数,中间还要记住变量是怎么传的。你打开浏览器搜“如何快速理解复杂代码”,结果跳出来一堆广告。你切回编辑器,手动打印日志,跑测试,再改代码,再跑测试。等你终于找到那个 bug,已经快六点了,你还没写一行新代码。这就是没有好工具时的日常——大部分时间花在“找”和“理解”上,而不是“改”上。

oh-my-openagent 就是来解决这个问题的。你是一个开发者,你把它装进你的终端或者 IDE 里。你输入一个任务,比如“找到退款逻辑里金额校验失败的原因,并修复它”。系统会先扫描整个代码库,理解文件之间的依赖关系,然后定位到相关代码块。它不会一次性把整个项目塞给 AI,而是像人一样,先看目录结构,再读关键文件,最后聚焦到具体函数。输出是一段修改建议,或者直接生成补丁。它接你的代码仓库,也接你用的 AI 模型——比如 Claude、GPT、Gemini,你选哪个它就用哪个。上下游就是你的 Git 和你的编辑器。

它的核心机制像是一个“代码导游”。你站在一个陌生城市(代码库)里,导游不会把整张地图拍在你脸上,而是先带你走主干道,再拐进小巷,最后停在你要找的那家店门口。oh-my-openagent 就是那个导游,它知道什么时候该看全局,什么时候该钻细节,不会让你在无关的文件里迷路。

跟 Cursor 或者 GitHub Copilot 比,它们走的是另一条路。Cursor 更像一个“超级自动补全”,你写一行它猜下一行,适合写新代码或者改小段逻辑。但当你面对一个几千行、跨多个模块的老项目时,自动补全就帮不上忙了,因为它不知道整个项目的上下文。oh-my-openagent 选择的是“先理解再动手”,它花更多时间在分析代码结构上,而不是即时生成代码。这个差异在重构遗留系统、接手别人项目、或者排查深层 bug 时特别重要。你不需要自己先花半小时搞清楚代码怎么组织的,它帮你做了。

当然,它也有边界。如果你的项目只有几个文件,逻辑简单得像一个计算器,用它就像用大炮打蚊子,反而比直接手动改更慢。它依赖 AI 模型,所以每次调用都要消耗 token,如果你每天跑几十次,账单会涨得很快。而且它目前有 687 个 open issues,说明还在快速迭代中,有些边缘情况可能处理不好。如果你对代码安全要求极高,比如金融系统的核心交易逻辑,你可能会犹豫要不要让 AI 直接改代码——毕竟它只是建议,最终决定权还在你手上。

我有个朋友,上周接手了一个三年前的 Rails 项目,里面混着 Ruby 和 JavaScript,文件散落在十几个目录里。他需要加一个导出 CSV 的功能,但不知道数据从哪里来。他打开 oh-my-openagent,输入“找到用户数据的来源,并生成一个 CSV 导出函数”。几秒钟后,终端里跳出了分析结果:数据来自三个模型,关联关系是 A 有多个 B,B 属于 C。然后它直接生成了一个函数,连 CSV 的列名都按项目命名规范写好了。他复制粘贴,跑测试,通过。整个过程不到十分钟。他关掉终端的时候说了一句话:“以前这种事,我得先喝杯咖啡再开始。”

More From Today

GitHubsignal

thedotmack/claude-mem

7230 forks83564 stars

Persistent Context Across Sessions for Every Agent – Captures everything your agent does during sessions, compresses it with AI, and injects relevant context back into future sessions. Works with Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot, OpenCode + More

GitHubsignal

bytedance/deer-flow

9827 forks72551 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

GitHubsignal

code-yeongyu/oh-my-openagent

5110 forks63154 stars

omo/lazycodex: The coding agent for tokenmaxxers;the one and only agent harness for complex codebases. For your Codex, for your OpenCode

2026-06-21

今日值得看:WorkClaw

WorkClaw 是今天最值得先看的信号。WorkClaw 是一个在 Slack 里和你一起工作的主动型 AI 同事,它不等着你问问题,而是自己干活、汇报结果。

今日 Brief

  • 产品侧可以先看 WorkClaw:WorkClaw 是一个在 Slack 里和你一起工作的主动型 AI 同事,它不等着你问问题,而是自己干活、汇报结果。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

Pixlie

100 votes3 comments

你花了一下午写脚本、找素材、剪了三个版本,最后甲方说“把那个蓝色杯子换成红色,人物往左移一点”。你深吸一口气,打开视频编辑软件,开始一帧一帧地抠图、调色、重新渲染。如果用的是现在主流的 AI 视频生成器,你连这个“换杯子”的机会都没有——它们像一台自动爆米花机,你扔进去一段文字,它“嘭”一声吐出一段视频,好看是好看,但里面的人物、物体、背景全是随机组合,你没法说“把那个杯子换成红色”,因为 AI 根本不知道杯子的概念,它只是生成了像素。你只能重新写提示词,祈祷下一次运气好一点。这就是大多数 AI 视频工具的真实状态:生成快,但不可控。

Pixlie 想解决的就是这个“不可控”。它不是一个黑盒子,而是一个你可以“上手调”的视频工作室。你用它的时候,输入可以是文字描述,也可以是一张图片——比如你拍了一张产品照片,或者一张概念草图。系统会先理解你的输入,然后生成一段视频,但关键在后面:你可以在生成之后,对画面里的具体元素进行修改。比如你指着画面里的一个物体说“把它换成蓝色”,或者“让这个人物向右走两步”,Pixlie 会重新计算,只改动你指定的部分,而不是整个画面重来。输出是一段可以直接用的视频,你可以导出到剪辑软件里继续加工,或者直接发到社交媒体。上下游接什么?上游接你的创意素材(文字、图片),下游接你的剪辑流程或发布平台。

用一个比喻来理解 Pixlie 的核心机制:它像是一个“可编程的摄影棚”。传统 AI 视频生成器是给你一个已经搭好的布景,你只能站在外面看,不能动里面的道具。而 Pixlie 给了你一个遥控器,你可以让演员走位、换衣服、调灯光,甚至把背景墙拆了重搭。这个“遥控器”就是它对画面元素的独立控制能力——不是整体重生成,而是局部编辑。

对比一下市面上最主流的 AI 视频工具,比如 Runway 或 Pika。它们走的是“端到端生成”路线:你输入提示词,模型直接输出视频。这条路的好处是快,几秒钟就能看到结果,适合做灵感探索、快速原型。但代价是你几乎无法控制细节。你想让一只猫从左边走到右边,而不是从右边走到左边?你得反复试提示词,或者靠运气。Pixlie 走的是另一条路:它把视频生成拆成“理解场景”和“局部编辑”两步。先让 AI 理解画面里有什么物体、什么关系,然后允许你针对这些物体做修改。这个差异在商业场景里特别重要——比如电商产品视频,你需要让产品保持品牌色、特定角度,不能随机生成。或者广告片,你需要让演员做指定动作,而不是 AI 自由发挥。在这些场景下,Pixlie 的“控制”就是生产力。

当然,Pixlie 也有它的边界和代价。首先,局部编辑意味着计算量更大,生成速度可能比纯端到端工具慢。如果你只是想要一个快速的概念视频,不在乎细节,那用 Runway 可能更省时间。其次,控制能力取决于 AI 对场景的理解深度——如果画面里物体太多、太复杂,AI 可能分不清哪个是杯子哪个是花瓶,局部编辑就会出错。另外,Pixlie 目前看起来是移动端优先(Android 话题),这意味着它的操作界面受限于手机屏幕,复杂编辑可能不如桌面端顺手。如果你需要做 4K 长视频、多图层合成,它可能不是最佳选择。最后,100 个投票、3 条评论说明它还处于早期,社区反馈和文档可能不够完善,遇到 bug 时你得有耐心。

想象一下你是一个做短视频的创作者,接了一个客户需求:拍一条 15 秒的产品展示视频,产品是一个红色保温杯。你用 Pixlie 上传了一张产品图,输入文字“杯子在桌面上旋转,背景是渐变色”。AI 生成了一段视频,杯子转得挺好,但背景是蓝色,客户想要橙色。你不需要重新生成整个视频,只需要在界面上点一下背景区域,输入“改成橙色渐变”,几秒后背景变了,杯子还在原地转。你又发现杯子的反光太强,你调整了“光泽度”参数,反光变柔和了。整个过程不到五分钟,你导出视频发给客户,对方回复“可以,就这个”。这就是 Pixlie 想让你拥有的日常——不是碰运气,而是真的在“做”视频。

Product Huntsignal

Foyer

113 votes4 comments

你正坐在咖啡馆里写一份方案,耳机里是隔壁桌打电话的声音、咖啡机蒸汽声、还有门口的风铃。你其实需要一点背景音来隔绝这些,但打开网易云音乐找歌单太分心,搜“白噪音”又全是广告。你试过打开一个叫 Noisli 的网页,但浏览器标签一多就忘了关,等你想切回来的时候,它已经被埋在一堆文档下面了。你甚至试过用 Spotify 播“雨声”,但播到一半突然插进来一首歌,节奏完全不对。最后你放弃了,干脆戴上降噪耳机,世界安静了,但你也觉得太安静了,像被关在一个隔音盒子里,反而更焦虑。

这就是 Foyer 想解决的事。它不是一个播放器,不是一个网站,它是一个“房间”——一个藏在你的 MacBook 刘海里的声音房间。你不需要打开任何窗口,不需要切换应用,甚至不需要看它一眼。你只需要把鼠标移到屏幕顶部的刘海区域,点一下,雨声就来了。再点一下,换成壁炉噼啪声。再点一下,变成咖啡馆的模糊人声。它就在那里,像你桌角放了一个小音箱,但你看不见它,因为它住在你的刘海里面。

谁会用 Foyer?任何一个在 Mac 上工作、需要背景音但又不想被工具打断的人。你输入的是点击——点一下刘海,系统就切换一个声音场景。Foyer 怎么处理?它在你电脑后台运行一个极轻量的音频引擎,预加载了几种环境音样本,每次点击就切换播放。输出就是声音,直接通过你的耳机或扬声器出来。它不接任何上下游系统,不连 Spotify,不连 Apple Music,不连你的日历。它就是一个独立的小东西,只做一件事:在刘海里面给你一个声音房间。

用一个比喻来理解 Foyer 的核心机制:它就像你办公室门上的那个小窗户。你不需要开门,不需要站起来,只需要透过窗户看一眼外面,就知道天气怎么样。Foyer 就是那个窗户,只不过它传递的不是光,是声音。你不需要打开一个 App,不需要加载一个页面,只需要瞥一眼刘海,就能听到你想听的环境。它把“切换背景音”这个动作压缩到了几乎为零——从你想听到听到,中间只隔了一次点击,而且那个点击发生在你鼠标本来就会经过的屏幕顶部。

对比一下真实的竞品。比如 Endel,它也是一个环境音应用,但它的路径完全不同。Endel 会分析你的心率、时间、活动状态,然后实时生成一个自适应音轨。它很聪明,但它需要你打开一个全屏界面,需要你授权健康数据,需要你订阅每月 10 美元。Foyer 选了另一条路:它不分析你,不生成你,它只是给你几个预设好的声音房间,让你自己选。Endel 像一个智能调酒师,会根据你的心情调一杯鸡尾酒;Foyer 像一个只有四个按钮的自动售货机,你按哪个就出哪个。能力差异很明显:Endel 能给你更精准、更个性化的体验,但代价是复杂和侵入感;Foyer 牺牲了所有个性化,换来了极致的轻量和无感。在什么场景下这个差异重要?当你正在赶一个截止日期,脑子已经快炸了,你不想再跟任何 App 交互,你只想“啪”一下听到雨声然后继续写——这时候 Foyer 赢了。但如果你想要一个能跟着你一天节奏变化的声音伴侣,Endel 更合适。

当然,Foyer 的边界和代价也很清楚。它只适合 Mac 用户,而且必须是带刘海的 MacBook Pro 或 MacBook Air。如果你用的是外接显示器,或者老款 MacBook,它就没法用。它的声音选择很有限——从产品描述看,它可能只内置了少数几种环境音,比如雨声、壁炉、咖啡馆、海浪。你不能自定义,不能导入自己的音频,不能调整音量平衡。如果你对声音有很挑剔的要求,比如想要 8 小时不间断的森林鸟鸣,或者想要精确控制混响,Foyer 满足不了你。还有一个风险:它把交互入口放在刘海区域,而刘海本身是 Mac 系统菜单栏的一部分。如果你菜单栏图标太多,或者你经常用鼠标点刘海来触发其他功能(比如某些刘海插件),可能会冲突。另外,它毕竟是一个第三方应用,需要常驻后台,虽然它声称极轻量,但任何后台进程都会消耗一点电和内存——在电池焦虑的 MacBook 用户眼里,这可能是个问题。

想象一下你用起来的样子。现在是下午三点,你刚写完一段代码,准备调试。你戴上 AirPods,鼠标自然地滑到屏幕顶部,你看到刘海旁边多了一个小圆点——那是 Foyer 的图标。你点了一下,听到雨声,不大不小,刚好盖住办公室空调的嗡嗡声。你开始调试,十分钟后,雨声停了——可能是你误触了,也可能是 Foyer 默认只播一段时间。你又点了一下,这次换成壁炉噼啪声。你继续工作,直到同事拍你肩膀说“下班了”,你才意识到自己已经听了三个小时壁炉声,而你的刘海里面那个小房间,一直安安静静地待在那里,没打扰过你一次。

Product Huntsignal

Are you in the Weights?

112 votes3 comments

你有没有过这种感觉:你写了一篇博客,发了一条推文,录了一期播客,然后某天你问 ChatGPT 一个关于你自己的问题,它居然答对了。你心里咯噔一下——它怎么知道的?它看过我的东西?它把我的话吞进去了?但你又没法确认。你只能猜。你甚至不知道它到底记住了你多少,是只记住了你的名字,还是连你十年前在论坛上发的那个冷笑话都记得。这种不确定感很烦人,尤其是当你的工作、创作、甚至个人生活都开始依赖这些模型的时候。你想知道答案,但没人给你一个搜索框。

“Are you in the Weights?” 就是那个搜索框。你打开它的网页,输入你的名字,或者一段你写过的文字,或者你的社交媒体账号。系统会去扫描那些公开的大模型训练数据——比如 Common Crawl 的网页快照、维基百科、Reddit 的公开帖子、GitHub 的代码库。它把这些数据里和你输入匹配的内容找出来,然后告诉你:这段文字出现在 GPT-4 的训练集里,那段出现在 Llama 3 里,还有一段被 Claude 用上了。你看到结果,就像看到自己的 DNA 片段散落在不同的模型大脑里。你终于知道,你确实“活”在它们的权重里。

这个产品的核心机制,其实就是一个巨大的反向搜索引擎。想象一下,搜索引擎是让你输入关键词,找到网页。而“Are you in the Weights?” 是让你输入你自己,找到那些把你吞进去的模型。它不生成新东西,它只是把已经公开的训练数据索引起来,然后做匹配。你输入一段话,它去查那些公开的数据集哈希表,看有没有一模一样的片段。如果有,它就告诉你“找到了,在这里”。如果没有,它就告诉你“目前没发现,但未来可能”。就这么简单。

和它最像的竞品是“Have I Been Trained?”——那个工具让你上传一张图片,检查它是否被 LAION 数据集收录,从而被 Stable Diffusion 等图像模型训练过。但那个只查图片,而且只查一个特定的数据集。而“Are you in the Weights?” 针对的是文本,覆盖多个主流大模型的训练数据来源。更重要的是,它把这件事做成了游戏。你查完自己,还可以查你的朋友、你的偶像、你的竞争对手。你甚至能查一段你讨厌的营销文案,看看它是不是被模型学去了。它把“隐私焦虑”变成了“数字考古”的乐趣。

当然,这个工具有明显的边界。它只能查公开的训练数据。很多大模型(比如 GPT-4 的完整训练集)并没有完全公开,它只能查那些被泄露或公开的部分。所以如果你查不到自己,不代表你没被记住,只是可能数据没公开。另外,它只能做精确匹配或近似匹配,不能理解语义。你写了一句“今天天气真好”,模型可能记住了这句话,但如果你换了个说法“今天阳光明媚”,它就查不到了。它是个机械的指纹比对,不是个侦探。而且,它本质上是个娱乐工具——你查到了,然后呢?你没法删除,没法控制。它只是告诉你一个事实,不提供任何行动选项。

想象一下你是一个独立开发者,叫小林。你花了一年时间写了一个技术博客,内容很硬核,但流量一直不大。有一天你朋友发来一个链接,说“快查查你的博客”。你打开“Are you in the Weights?”,输入你博客的 URL。几秒钟后,结果出来了:你的三篇文章被 GPT-4 的训练集收录了,还有一篇被 Llama 3 用了。你盯着屏幕,突然觉得这一年没白写。你的文字,真的活在了那些模型的脑子里。你甚至开始想,也许以后面试的时候,面试官问的问题,答案就来自你的博客。你笑了笑,截图发了个推文。然后你继续写下一篇。

Product Huntsignal

Basedash Access Controls

110 votes5 comments

你公司里最值钱的东西,不是办公室的咖啡机,也不是那台 MacBook Pro,而是数据库里那堆数字。客户名单、销售漏斗、财务流水、产品路线图——随便一个实习生误操作,或者一个离职员工顺手拷走,损失可能比丢十台电脑还大。但现实是,大多数公司的数据权限管理,还停留在“要么全看,要么全不看”的原始阶段。

想象一下这个场景:你是公司的数据负责人,刚上线了一个新的 BI 仪表盘,销售总监要看客户转化率,市场部要看渠道来源,财务要看回款周期。你怎么办?最省事的办法是给所有人开一个只读账号,密码写在 Slack 里。但你知道这有多危险——销售总监能看到财务的毛利率,市场部能看到销售的个人业绩,甚至一个刚入职的运营专员,也能导出全公司的用户邮箱。你每天晚上睡不着,怕哪天有人点错按钮,把整张表删了。更可怕的是,你根本不知道谁看了什么、谁下载了什么。

Basedash Access Controls 就是来解决这个问题的。它不是让你重新搭一套权限系统,而是直接嵌在你现有的数据工具里。谁用它?公司的数据管理员、安全负责人,或者任何一个需要给团队分权限的人。你输入什么?你输入的是“谁”和“能做什么”:比如“销售团队可以看客户表,但不能看成本列”,“市场部只能看本月数据,不能看历史”,“财务可以读写,但不能删除”。系统怎么处理?它把这些规则翻译成细粒度的访问策略,直接作用在数据库层面。输出什么?每个用户登录后,只能看到自己被允许看到的数据行和列,其他内容就像不存在一样。上下游接什么系统?它通常接在你的数据库(PostgreSQL、MySQL 等)和 BI 工具(Metabase、Superset 等)之间,或者直接作为 Basedash 平台的一个模块——Basedash 本身是一个让你用 SQL 查数据的工具,而 Access Controls 就是给这个工具加了一把智能锁。

你可以把它想象成一家公司的门禁系统。传统做法是:大门一把锁,所有人用同一把钥匙。谁都能进,谁都能翻文件柜。Basedash Access Controls 的做法是:每个人发一张门禁卡,刷卡只能进自己该进的房间。销售只能进销售办公室,财务只能进财务室,而且每个房间里还有上锁的抽屉——比如销售能看到客户名字,但看不到客户利润率。这张卡还能记录你几点进了哪个房间、待了多久、有没有带东西出来。

对比一下真实竞品。很多公司用的是数据库自带的权限功能,比如 PostgreSQL 的 GRANT 语句。这条路的问题是:太技术了。你得懂 SQL,得手动写几十行 grant 命令,而且一旦表结构变了,权限就得重新配。更麻烦的是,它只能控制到表级别,不能控制到行级别或列级别。比如你想让销售只能看自己负责的客户,用原生 SQL 几乎不可能优雅实现。另一条路是用 IAM 系统,比如 AWS IAM 或 Okta。它们能控制谁可以登录,但控制不了登录之后能看到哪些数据行。Basedash Access Controls 走的是第三条路:在应用层和数据库层之间加一层策略引擎,让你用界面拖拽或写简单的规则,就能实现行级、列级的细粒度控制。这个能力在什么场景下重要?当你公司有几十个部门、几百个用户、数据表有几千行的时候,原生权限和 IAM 都扛不住,而 Basedash 的规则可以批量生效。

当然,它也有边界和代价。首先,它只对 Basedash 平台内的数据查询生效。如果你的团队还用 Excel 导出、或者直接连数据库客户端,那它管不了。其次,配置权限本身需要花时间——你得先梳理清楚每个角色该看什么,这往往是组织问题,不是技术问题。如果你们公司只有三个人,所有数据都公开也没关系,那用它就像给自行车装防盗锁,多余。另外,它依赖 Basedash 作为数据访问入口,如果你已经重度使用了其他 BI 工具,迁移成本需要考虑。风险在于:权限规则越细,越容易配错。比如你给市场部开了“查看用户邮箱”的权限,但忘了关掉“导出”,那数据泄露的风险依然存在。所以它需要配合审计日志一起用,而 Basedash Access Controls 本身是否自带审计功能?从产品描述看,它主要控制“谁能访问”,但“谁访问了什么”可能需要额外配置。

最后,讲一个用起来什么样的小故事。李姐是某电商公司的数据管理员,公司用 Basedash 做数据分析。以前每次有新员工入职,她都要手动在数据库里跑 grant 命令,还要反复确认对方是不是只该看自己部门的数据。有一次她不小心把“delete”权限给了实习生,吓得她半夜爬起来改回来。自从上了 Access Controls,她花了一个下午把权限规则写好:运营组只能看订单表的前 10 列,不能看成本;客服组只能看最近 30 天的退款记录;管理层可以看所有汇总数据,但不能看个人明细。之后新员工入职,她只需要在 Basedash 里点一下“添加用户”,选一个角色,权限自动生效。上周销售总监想偷偷看财务的毛利率,登录后发现那列数据直接是灰色的,点不了。李姐在后台看到了一条被拒绝的访问日志,笑了笑,没说话。

Product Huntsignal

ReleaseDock

101 votes3 comments

你是一个 SaaS 产品的创始人,团队就三个人。每天早上一打开电脑,你面对的是四个标签页:Zendesk 里 23 条未回复的客户工单,Intercom 上 7 个聊天窗口在闪,Notion 里那篇帮助中心文章已经三个月没更新了,还有一封邮件问“你们上周发的那个新功能到底怎么用?”你翻了一遍自己的发布记录——其实你上周只改了一个按钮颜色,但客户以为你加了什么大东西。你开始怀疑自己到底是做产品的,还是做客服的,还是做文档的。更糟的是,你发现同一个客户在三个渠道问了同一个问题,你回了三次。

ReleaseDock 想解决的就是这种混乱。它把三个东西——AI 客服机器人、帮助中心(知识库)、以及产品更新日志——全部合并到一个界面里,叫“收件箱”。你不需要再在五个工具之间来回跳。谁用它?就是你这种小团队,或者大公司里负责客户沟通的运营人员。输入很简单:客户发来的任何消息,不管是邮件、网站聊天还是 Slack 里的提问,都会流进同一个收件箱。系统先让 AI 自动判断:这个问题帮助中心里有没有现成答案?如果有,AI 直接回复,并把那篇帮助中心文章附上。如果没有,AI 会把它标记成“需要人工”,同时自动搜索最近的更新日志,看看是不是新功能导致的疑问。输出就是一条清晰的对话记录,附带相关文档链接。上下游接什么?它应该能连你的网站、邮件、Slack 和 Discord,但具体集成列表你得上官网看。

核心机制可以用一个比喻来理解:ReleaseDock 就像一个同时兼任客服、图书管理员和公告员的智能前台。客户走进来问“你们那个新功能怎么用?”前台先翻一下公告板(更新日志),发现上周贴了说明,然后从书架上抽出那本帮助手册(知识库),直接递给客户。如果客户的问题手册里没有,前台就喊你出来亲自接待。你不需要自己跑去翻公告板,也不用担心手册放错位置。

对比一下真实竞品。Intercom 和 Zendesk 是两条不同的路。它们也提供 AI 客服、知识库和公告功能,但它们是三个独立的产品模块,各自有独立的界面、独立的设置、独立的定价。你买了 Intercom 的客服模块,还得再买它的帮助中心模块,然后更新日志可能得用另一个工具比如 Headway 或者自己写邮件。ReleaseDock 的选择是把这三样东西硬塞进同一个收件箱。代价是什么?功能深度。Intercom 的 AI 客服可以训练复杂的对话流,Zendesk 的工单系统有 SLA 和自动分配规则,而 ReleaseDock 的 AI 可能只能处理简单问答。如果你需要精细的工单路由、多级 SLA、或者自定义的聊天机器人流程,它可能不够用。它的真正战场是那些“客户问题不复杂但渠道多、团队小、没时间维护多个工具”的场景。

边界和代价也很清楚。如果你的客户问题高度专业、需要人工判断,AI 回复反而会惹恼人。比如一个医疗 SaaS 的客户问“这个报告里的数据为什么和昨天不一样?”AI 没法回答,你还是要亲自上。另外,把更新日志和帮助中心混在一起,意味着你每次发布新功能都得在 ReleaseDock 里写一条,而不是像以前那样只在产品里弹个窗。如果你习惯用专门的 changelog 工具(比如 Beamer)来收集用户反馈,迁移成本也不低。还有,101 票、3 条评论——这个产品还很新,社区和文档可能都不够成熟,出了问题你只能找创始人 Siddhant Chaudhary 一个人。

想象一下你试用 ReleaseDock 的第一周。周一早上,你把它接上网站聊天和邮箱。一个客户发来消息:“你们的定价页面打不开。”AI 自动回复:“抱歉,我们正在修复,这是临时帮助页面链接。”你甚至没看到这条消息。另一个客户问:“上个月说的批量导出功能上线了吗?”AI 查了一下更新日志,发现你上周确实发布了,于是回复:“已上线,这是操作指南。”你只收到一条通知:“有 1 个问题需要你处理——客户投诉退款流程太复杂。”你点开,看到 AI 已经把相关帮助中心文章和最近的更新记录都贴在了对话里。你回了一句“我手动处理”,然后关掉电脑去喝咖啡。这就是 ReleaseDock 想给你的日常。

GitHubsignal

NousResearch/hermes-agent

35167 forks198296 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

thedotmack/claude-mem

7220 forks83396 stars

你用过 AI agent 吗?就是那种你让它写代码、查资料、整理文档的“数字实习生”。刚开始用的时候挺爽,你告诉它“帮我重构这个模块”,它刷刷刷就干完了。但问题出在第二天。你打开一个新的会话,想让它继续昨天的工作,结果它一脸茫然地看着你,好像你们从没见过。你不得不把昨天的上下文、代码结构、你的偏好重新说一遍。更烦的是,如果你同时在跑好几个 agent——一个在写测试,一个在调 API,一个在分析日志——每个 agent 都像得了失忆症,每次对话都是第一次见面。你花在“重新介绍”上的时间,比让它们干活的时间还多。

claude-mem 就是来解决这个问题的。它不是一个 agent 本身,而是一个记忆层,可以插到任何 agent 后面。你用的 agent 是 Claude Code、OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode——随便哪个——只要接上 claude-mem,它就开始自动记录。记录的不是原始对话日志,而是经过 AI 压缩和提炼的“记忆”。比如你让 agent 调试一个 bug,它试了三种方案,最后用第二种解决了。claude-mem 不会记下你说了什么废话,而是记下“用户偏好第二种调试路径,该 bug 的根因是内存泄漏”。下次你再遇到类似问题,agent 打开新会话时,claude-mem 会自动把这条记忆注入进去,agent 就会直接说:“上次我们遇到类似情况,你选了第二种方案,要不要再试试?”

它的工作流是这样的:你启动 agent,agent 启动时加载 claude-mem 插件。agent 每做一件事——调用工具、写代码、查文档——claude-mem 都在后台抓取这些操作,然后用 AI 模型把它们压缩成结构化的记忆片段,存到本地数据库里。它支持 SQLite 和 ChromaDB 两种存储后端,前者轻量,后者适合做向量检索。下次 agent 启动时,claude-mem 会根据当前任务的关键词,从数据库里检索相关的旧记忆,然后像塞小纸条一样塞进 agent 的上下文窗口里。agent 看到这些纸条,就知道“哦,这个用户之前做过这个,那个项目有坑”。整个过程对你是透明的,你不需要手动管理任何东西。

你可以把 claude-mem 想象成给 AI agent 装了一个“私人助理”。这个助理不干活,但它有一本笔记本,随时记下 agent 做过什么、你喜欢什么、哪些方案失败了。每次 agent 开始新任务,助理就把相关的笔记翻出来放在桌上。agent 不用再问“你上次是怎么做的”,直接看笔记就行。

市面上已经有类似的项目,比如 Mem0、Supermemory、OpenMemory。它们的目标都是给 AI 加记忆,但路径不同。Mem0 走的是“记忆即服务”路线,它自己管理一个向量数据库,提供 API 让你存和查。Supermemory 更偏向个人知识管理,像一个 AI 版的 Notion。claude-mem 的选择是“嵌入 agent 的工作流”。它不是让你手动去存笔记,而是自动抓取 agent 的每一个操作,然后压缩、索引、注入。这意味着你不需要改变使用 agent 的习惯,装个插件就行。这种路径的好处是“零摩擦”——你不需要学习新工具,不需要手动分类记忆,agent 自己就学会了记住你。坏处是,它依赖 agent 的插件系统,如果某个 agent 不支持插件,你就用不了。目前它支持的主流 agent 已经很多了,但如果你用的是某个小众的 agent,可能就得等社区适配。

代价也很清楚。第一,它需要额外的计算资源。每次会话结束后,它都要跑一次 AI 压缩,把原始操作变成记忆。如果你一天开几十个会话,这个压缩过程会消耗不少 token 和本地算力。第二,记忆的质量取决于压缩模型。如果模型压缩得太狠,可能会丢失关键细节;如果压缩得太松,记忆会膨胀,占用上下文窗口。第三,隐私问题。所有记忆都存本地,但如果你用的是云端 agent,你的操作数据会被传到 agent 的服务器,claude-mem 只能保证本地存储的安全,管不了传输过程。第四,它不适合那些“每次任务都完全不同”的场景。比如你让 agent 每天写一篇不同的新闻稿,昨天的记忆对今天几乎没有帮助,那 claude-mem 就白费力气了。

想象一下这个场景:你是一个独立开发者,维护着一个开源项目。你让 Claude Code 帮你写测试、修 bug、重构代码。以前你每天打开终端,输入“继续昨天的重构”,Claude Code 会问“哪个模块?什么重构目标?你上次改到哪了?”你得翻聊天记录,找到昨天的对话,复制粘贴。装了 claude-mem 之后,第三天早上你打开终端,输入“继续昨天的重构”,Claude Code 直接说:“好的,继续重构 user 模块的认证逻辑。你昨天已经完成了单元测试,今天要改的是 session 管理部分。上次你提到想用 JWT 替代 cookie,要现在开始吗?”你愣了一下,然后笑了。它记住了。

GitHubsignal

bytedance/deer-flow

9771 forks71993 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

Product Huntsignal

Pixlie

100 votes3 comments

AI video studio: text & image to video, with real control

Product Huntsignal

Foyer

113 votes4 comments

Build a room of ambient sound that lives in your notch

GitHubsignal

thedotmack/claude-mem

7220 forks83396 stars

Persistent Context Across Sessions for Every Agent – Captures everything your agent does during sessions, compresses it with AI, and injects relevant context back into future sessions. Works with Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot, OpenCode + More

GitHubsignal

bytedance/deer-flow

9771 forks71993 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

2026-06-20

今日值得看:Zernio WhatsApp API

Zernio WhatsApp API 是今天最值得先看的信号。Zernio WhatsApp API 是一个把 WhatsApp 的消息、通话和 AI 智能体打包成一个接口的开发者工具。

今日 Brief

  • 产品侧可以先看 Zernio WhatsApp API:Zernio WhatsApp API 是一个把 WhatsApp 的消息、通话和 AI 智能体打包成一个接口的开发者工具。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

just f***ing send it

141 votes13 comments

你肯定遇到过这种时刻。对方在微信上发来一个1.2G的视频文件,你等了十分钟,进度条卡在87%,然后弹出一行字:“文件过大,请使用其他方式传输。”你翻出百度网盘,上传花了半小时,生成链接后对方下载又得半小时,中间还弹出“下载速度慢,开通会员加速”。你气得想砸电脑。或者更常见的场景:你在办公室,同事在隔壁工位,你俩需要交换一个几百兆的设计稿。你试了AirDrop,但一个用Windows一个用Mac,不行。你试了钉钉,提示“文件超过100M”。你试了邮件,附件大小限制25M。最后你掏出U盘,插上,复制,拔下,走过去,插上,粘贴。整个过程耗时三分钟,但那种“我居然还在用U盘传文件”的荒谬感,能让你郁闷一整天。

just f***ing send it 就是冲着这个痛点来的。它的名字已经把态度说清楚了——别废话,直接发。你打开它的网页,不需要注册,不需要登录,不需要下载任何软件。页面上就两个按钮:一个“发送”,一个“接收”。发送方点“发送”,浏览器会生成一个六位数的房间码,同时打开一个文件选择窗口。你选好文件,不管多大——1G、10G、100G,理论上没有上限——然后系统会通过WebRTC技术在你的浏览器和接收方的浏览器之间建立一条直连通道。接收方在另一个浏览器里输入同样的房间码,文件就开始传输了。整个过程数据不经过任何服务器中转,你的文件直接从你的电脑飞到对方的电脑。传输速度取决于你们俩的网速,而不是某个云盘服务器的带宽。传完之后,房间码失效,通道关闭,不留痕迹。

用一个比喻来理解:这就像你在咖啡馆里,把一张照片从你的手机直接递给对面的人,而不是先拍下来发到朋友圈,再让对方去朋友圈下载。中间没有“朋友圈服务器”这个环节,照片只在你们俩之间流动。just f***ing send it 就是那个“递”的动作——它不存你的东西,不看你传了什么,只是帮你把数据从A点搬到B点。

和它最像的竞品是WeTransfer。WeTransfer也允许你传大文件,但它的路径是:你上传到WeTransfer的服务器,服务器生成一个下载链接,你把链接发给对方,对方从服务器下载。这个路径有两个问题。第一,上传和下载都要经过WeTransfer的服务器,服务器带宽有限,高峰期慢得像蜗牛。第二,文件在服务器上会保留一段时间(通常是7天),这意味着你的数据在别人的硬盘上躺了一周。just f***ing send it 选择了一条完全不同的路:不走服务器,直接P2P。这带来的能力差异很明显——传输速度只受限于你们俩的网速,而不是中间服务器的瓶颈;隐私性更好,因为文件从未离开过你们的设备;而且没有文件大小限制,因为服务器不需要存储任何东西。这个差异在什么场景下重要?当你传的是机密合同、未发布的视频、或者超大体积的3D模型时,你不想让任何第三方碰你的文件,哪怕只是暂存。

当然,它也有边界和代价。P2P传输依赖WebRTC,而WebRTC在某些网络环境下会被防火墙或NAT阻挡。比如在公司内网、酒店WiFi、或者某些严格限制P2P的校园网里,连接可能建立失败。这时候你就得退回到传统方式。另外,因为文件不经过服务器,所以发送方和接收方必须同时在线——你不能像WeTransfer那样先上传,等对方有空再下载。如果对方关机了,或者浏览器关了,传输就中断了。还有一个现实问题:WebRTC在传输超大文件时,如果网络不稳定,断点续传能力有限,可能得从头再来。所以它最适合的场景是:你和对方都在线,网络环境相对开放,文件一次性传完。

想象一下这个画面。你正在赶一个项目,需要把一段4K视频素材发给剪辑师。你打开just f***ing send it,点“发送”,选好文件,生成房间码。你拿起手机给剪辑师发微信:“房间码是4821,快开网页。”他打开浏览器输入房间码,进度条开始跑。你俩各自干自己的事,两分钟后,他发来一条消息:“收到了,清晰度完美。”你关掉网页,继续工作。整个过程没有注册、没有等待、没有“文件过大”的提示。这就是just f***ing send it想给你的日常。

Product Huntsignal

Unreal Engine 5.8

147 votes3 comments

你是一个独立游戏开发者,一个人扛美术、程序、策划三个岗位。凌晨两点,你盯着编辑器里那个半成品森林场景,想给地面加一层苔藓材质,但得先打开 Quixel Bridge 下载贴图,再拖进材质编辑器,连节点,调粗糙度,然后手动刷到地形上。这一套流程你做过几百次了,闭着眼都能完成,但每次都要花十五分钟。更烦的是,你脑子里正构思一个 BOSS 战的触发逻辑,刚有点灵感,就被这些重复劳动打断了。你打开浏览器搜“如何快速给地形刷苔藓”,结果跳出来的教程全是三年前的。你叹了口气,决定先睡,明天再说。

Unreal Engine 5.8 想解决的就是这种“创意被体力活打断”的日常。它不是一个单独的 AI 工具,而是直接长在编辑器里的 AI agent 系统。你打开 UE5.8,会发现编辑器侧边栏多了一个叫“Agent Panel”的面板。你可以在这里创建多个 agent,每个 agent 有自己的角色描述和权限。比如你创建一个“环境美术师 agent”,告诉它“我是做低多边形风格,色调偏暖”,然后你只需要在场景里框选一块地形,输入“铺一层苔藓,密度 0.3,颜色偏黄绿”,它就会自动执行:打开材质库,找到合适的苔藓材质,实例化,调整参数,然后刷到地形上。整个过程你不需要离开编辑器,甚至不需要动鼠标——你说话,它干活。

它的工作流是这样的:你输入自然语言指令,系统先解析意图,然后拆解成一系列编辑器操作——比如“打开材质编辑器”、“创建材质实例”、“设置参数”、“应用笔刷”。这些操作由 agent 调用 UE 内部的 Python API 或蓝图接口完成。agent 还能访问你的项目资产库,知道哪些贴图已经导入、哪些模型还没优化。它甚至能记住你的偏好:你上次用过的粗糙度值、你习惯的灯光色温。上下游接的是你的版本控制系统(比如 Perforce 或 Git LFS),agent 每次操作都会自动生成一个变更记录,方便你回滚。

用一个比喻来理解:Unreal Engine 5.8 的 agent 就像你雇了一个实习生,这个实习生不会自己创造,但你把所有重复性工作的 SOP 写成纸条塞给他,他就能按纸条执行。你不需要教他什么是“粗糙度”,你只需要说“让地面看起来有点湿”,他就会去调粗糙度、加反射。他不是天才,但他不会累,不会分心,不会在凌晨两点刷手机。

对比一下真正的竞品——比如 Unity 的 Muse 或者一些第三方 AI 插件(像 Scenario 的 AI 生成素材工具)。Muse 走的是“AI 帮你生成内容”的路线:你输入“生成一个苔藓纹理”,它给你一张 2K 贴图,然后你手动导入、手动应用。Unreal Engine 5.8 走的是“AI 帮你完成流程”的路线:它不生成新素材,而是帮你操作编辑器里已有的工具和资产。区别在于:Muse 适合你缺素材的时候,UE5.8 适合你已经有素材但懒得动手的时候。如果你是一个需要快速迭代原型的独立开发者,UE5.8 的 agent 能让你把时间花在决策上,而不是执行上。但如果你需要全新的、独特的视觉风格,Muse 那种生成式 AI 可能更直接。

当然,UE5.8 的 agent 不是万能的。它的边界很明显:它只能操作编辑器里已有的功能,不能创造新功能。比如你想实现一个引擎本身不支持的渲染效果,agent 帮不了你,它只能调用现有的节点和参数。另外,agent 依赖你的指令清晰度。如果你说“让这个场景更好看”,它可能不知道从哪下手。你需要学会用“加一个点光源,强度 500,颜色偏蓝”这种具体指令。还有一个风险:如果你同时让多个 agent 操作同一个资源,可能会冲突。比如环境 agent 在刷地形,同时光照 agent 在调全局光,结果地形刷完光照变了,你得手动协调。目前 UE5.8 的 agent 是独立工作的,没有内置的协作仲裁机制。

想象一下你用了 UE5.8 之后的一个下午。你打开项目,对 agent 说:“把昨天那个城堡模型放到场景中央,缩放 0.8,旋转 45 度。”它照做了。你又说:“在城堡周围生成一圈火把,间距 5 米,光照范围 10 米。”它开始计算位置,自动放置点光源,每个火把的光照颜色随机偏橙或偏红。你看着屏幕,觉得火把太亮了,说:“整体亮度降 30%。”它立刻调整所有火把的强度。这时候你突然想到一个 BOSS 战机制,你打开蓝图编辑器,对另一个“逻辑 agent”说:“当玩家进入城堡大门时,触发一个事件:关闭大门,生成三个小怪,播放一段动画。”agent 开始自动创建蓝图节点,连接事件、分支、生成 actor。你只需要检查一下逻辑是否正确,然后点保存。整个下午,你几乎没有手动拖拽过任何节点或参数。你唯一做的事就是喝咖啡、思考、下指令。这就是 Unreal Engine 5.8 想给你的日常。

Product Huntsignal

frontpage.sh

140 votes12 comments

你打开 frontpage.sh,页面干净得像一张白纸,只有八个方块整整齐齐排着。每个方块下面跳着一个数字——当前出价,和一个倒计时。这不是你见过的任何广告位。它不卖一个月,不卖一周,它卖的是“现在”。你出价,你赢,你的广告就出现在那个方块里。但下一秒,别人出更高价,你的广告就消失,换他的。永远没有终点。

先想想传统广告位是怎么折磨人的。你是个独立开发者,做了个新工具,想在某个科技博客的侧边栏挂一周广告。你得先发邮件问报价,等三天回复,然后签合同、打款、等排期。广告上线那天,你盯着后台,发现点击率还行,但一周后广告下架,流量立刻归零。你想再续,又得重新走一遍流程。更糟的是,你根本不知道隔壁那个方块是谁在投,也不知道他出了多少钱。整个过程像在跟一个看不见的官僚机构打交道,慢、贵、不透明。

frontpage.sh 把这一切简化成一场永不结束的拍卖。你不需要注册账号?不,你大概需要连接一个钱包——因为它是 Web3 项目,用加密货币出价。你打开页面,看到八个方块,每个方块旁边有当前最高出价和剩余时间。你输入一个更高的价格,确认交易,你的广告就立刻替换上去。系统怎么处理?它把每个方块当成一个独立的拍卖品,采用“英式拍卖”的变体:每次出价都会重置一个计时器(比如 24 小时),如果计时器归零,当前出价者就赢得这个方块直到下一次出价。但“永续”意味着永远有人可以出价,所以实际上没有“赢得”这回事,只有“暂时持有”。输出就是:你的广告图片或链接出现在那个方块里,直到被超越。上下游接什么?它接你的加密货币钱包(比如 MetaMask),接你的广告素材(一张图或一个链接),也接区块链上的交易记录——所有出价历史公开可查。

用一个比喻来理解:这就像酒吧里抢麦克风。谁往罐子里扔的钱多,谁就能唱一首歌。但只要你唱完,下一个人扔更多钱,你就得下来。没有“今晚的驻唱”,只有“此刻的麦霸”。frontpage.sh 的八个方块就是八个麦克风,永远有人在抢。

对比一下真实竞品。最像的是“百万美元主页”——那个 2005 年的经典项目,把网页分成一万个像素格子,每个格子卖 100 美元,卖完就没了。那是“一次性买断”模式,你付钱,格子永远是你的。frontpage.sh 选了完全不同的路径:永续拍卖。这意味着什么?能力差异很明显:百万美元主页适合做“历史遗迹”式的品牌展示,你买一个格子,十年后还能看到自己的 logo。但 frontpage.sh 适合做“实时注意力”的投机——你今天出价 0.1 ETH 占住一个方块,明天可能有人出 0.2 ETH 把你挤掉,你的广告只存在了 24 小时。这在你需要短期引爆某个活动时很重要,比如新产品发布、限时折扣、或者单纯想制造话题。但如果你想要长期稳定的曝光,永续拍卖就是噩梦——你得不断加价,像在 eBay 上跟人抢一个永远不结束的拍卖。

边界和代价也很清楚。frontpage.sh 不适合正经品牌做年度广告计划。你没法预算,因为价格完全由市场情绪决定。如果突然有几个人盯上同一个方块,价格可能飙到离谱。而且它只有八个方块,竞争天然激烈。另一个风险是:它依赖加密货币和 Web3 基础设施,如果你的目标用户不熟悉钱包、Gas 费、私钥,他们根本没法参与。更实际的问题是:这八个方块到底有多少真实流量?如果 frontpage.sh 本身没多少访客,你花大价钱抢到的广告位可能只有你自己在看。它本质上是一个投机工具,而不是广告工具——你买的不是曝光,是“在某个小圈子里炫耀出价能力”的资格。

想象一下这个场景:你叫小林,做了一个 AI 生成头像的小工具。你听说 frontpage.sh 上有个方块正在被一个 NFT 项目占着,出价 0.05 ETH。你想,我的工具正好面向同一批人,不如抢过来试试。你出价 0.06 ETH,交易确认,你的广告立刻出现在那个方块上——一张戴着墨镜的猫头,旁边写着“用 AI 生成你的专属头像”。你兴奋地截图发到推特。第二天早上,你发现那个 NFT 项目又出价 0.08 ETH 抢回去了。你的广告只活了 14 个小时,但那条推特获得了 200 个赞,有人留言问“这是什么玩法?”你意识到,你花的 0.06 ETH 买的不是广告位,而是一个故事。

Product Huntsignal

Ask Ad Manager by Google Ads

133 votes6 comments

你是一个广告优化师,每周一早上打开 Google Ads 后台,面对的是十几个广告系列、上百个关键词、几十张报表。你要找出上周哪个广告组 ROI 掉了,哪个关键词的点击成本突然涨了,哪个受众群体的转化率在下降。你熟练地打开“报表”标签,选时间范围,拖维度,点“应用”,等五秒,看到一张表格。然后你复制到 Excel 里,再拉个透视表,再画个折线图。整个过程四十分钟,你喝了两口咖啡,发现咖啡凉了。更烦的是,老板突然在 Slack 上问你:“昨天那个新上的搜索广告效果怎么样?”你又得重新拉一遍数据,因为刚才那套报表是针对上周的,不是昨天的。

Ask Ad Manager 就是来解决这个问题的。它是 Google Ads 官方出的一个 AI 助手,跑在 Gemini 模型上。你不需要学任何查询语法,不需要记报表路径,甚至不需要知道数据存在哪个表里。你直接在 Google Ads 界面里打字,像跟人说话一样:“上周哪个关键词的转化成本最高?”或者“帮我对比一下两个广告系列过去七天的点击率。”系统收到你的问题后,Gemini 会先理解你的意图,然后自动去拉 Google Ads 里的原始数据——展示次数、点击、花费、转化、收入这些字段——再根据你的问题做聚合、排序、对比,最后把结果用一句话或者一张小图直接回给你。整个过程大概十秒。它接的是 Google Ads 自己的数据管道,所以不需要你额外授权,也不需要接什么第三方工具。你问完,它答完,你直接就能做决策:关掉那个高成本的关键词,或者给那个高点击率的广告组加预算。

你可以把它想象成一个坐在你工位旁边的数据分析实习生。你不需要教他 SQL,不需要告诉他数据在哪,你只要开口问,他就立刻去查,然后回来告诉你答案。这个实习生不会帮你做复杂的多维度交叉分析,也不会帮你写周报,但他能帮你把那些“看一眼就知道”的问题从四十分钟压缩到十秒。

跟市面上其他广告分析工具比,Ask Ad Manager 走了一条完全不同的路。比如 Supermetrics 或者 Looker Studio,它们给你的是“搭积木”的能力:你拖拽维度、选指标、设过滤器,拼出一张自定义报表。这条路的好处是灵活,你想怎么切数据都行,坏处是每次搭积木都要花时间,而且你得知道你要搭什么。Ask Ad Manager 反过来,它不让你搭积木,它让你直接问问题。你不需要提前想好报表结构,你只需要知道你想知道什么。这个差异在什么场景下重要?就是当你被老板突然问一句、或者开会前五分钟需要快速确认一个数字的时候。那种时候你根本没时间搭积木,你只想有人直接告诉你答案。但反过来,如果你要做一份每周固定的深度复盘,需要同时看十几个维度的交叉数据,那搭积木的方式反而更可靠,因为你可以精确控制每个细节。

当然,Ask Ad Manager 也有它的边界和代价。它只能回答跟 Google Ads 数据直接相关的问题。你问它“这个关键词的搜索趋势跟季节有什么关系?”它可能答不上来,因为它没有外部数据。你问它“帮我预测下个月的花费”,它可能只能给你一个简单的线性外推,而不是复杂的预测模型。另外,它依赖你问问题的准确性。如果你问“哪个广告效果最好”,它可能不知道你指的“效果”是点击率还是转化率还是 ROI,你需要说清楚。还有,它目前看起来只支持英文,中文用户可能暂时用不了。最核心的风险是:它给出的答案是基于你账户里的原始数据,但原始数据本身可能有延迟或者错误。如果昨天某个转化追踪代码出了问题,它给你的“转化成本最高”的结论就是错的。所以你不能完全信任它,尤其是涉及大金额决策的时候,最好还是去后台手动核对一下。

想象一下这个场景:周三下午三点,你正在写下周的投放计划,老板突然在走廊里喊你:“小张,过来一下,客户问我们那个品牌词广告最近三天花了多少钱,转化了多少?”你打开 Google Ads,点进 Ask Ad Manager 的对话框,打字:“品牌词广告系列最近三天的花费和转化数。”两秒后,它回你:“花费 $1,230,转化 47 次,转化成本 $26.17。”你直接走到老板办公室,把数字报给他。老板点点头,说“行,继续。”你回到座位,咖啡还是热的。

Product Huntsignal

Blazly Backlinker

116 votes15 comments

你是一个做独立站的小老板,或者一个在创业公司里管 SEO 的人。你每天早上打开 Ahrefs 或者 Semrush,看到竞争对手的外链数量又涨了,而你的网站还卡在同一个数字上。你知道外链是 Google 排名的命门,但你也知道手动去搞外链有多恶心:你要花几个小时搜博客、找编辑邮箱、写定制化的 outreach 邮件、跟进、记录。你试过外包给 freelancer,结果对方发了一堆垃圾链接,反而被 Google 惩罚。你也试过用模板群发,回复率低到让你怀疑人生。最后你只能自己干,一边写邮件一边骂,时间全耗在这上面,产品本身反而没空优化。

Blazly Backlinker 就是冲着这个场景来的。它的用法很直接:你给它一个目标网站(比如你的电商站),再给它几个核心关键词。然后它自己开始干活。它先扫描整个互联网,找出那些可能接受 guest post、资源页、或者 broken link 的网站。接着它分析这些网站的内容,自动生成一封看起来不像模板的邮件——会提到对方网站上的某篇文章,说“我注意到你有一篇关于 X 的文章,我这里有一篇关于 Y 的补充内容,也许你的读者会喜欢”。邮件发出去之后,它跟踪回复,如果有人感兴趣,它继续跟进,直到链接被放上去。整个过程你不需要碰键盘。最后它会给你一个仪表盘,告诉你哪些链接已经成功、哪些还在沟通、哪些被拒绝了。

这个工作流的核心,其实就是一个自动化的外链建设机器人。你可以把它想象成一个虚拟的 SEO 实习生,但这个实习生不会偷懒、不会抱怨、不会把链接发到色情网站上去。它每天的工作就是:找机会、写邮件、发邮件、跟进、记录。你只需要每天早上花五分钟看一眼进度,然后决定要不要调整策略。

和市面上已有的外链工具比,Blazly 走了一条不同的路。像 Pitchbox 或者 BuzzStream 这类工具,它们本质上是一个外链 outreach 的 CRM——帮你管理联系人、模板、跟进,但邮件内容还是要你写,目标网站还是要你手动找。它们把流程数字化了,但没把人力省掉。而 Blazly 想做的,是把“找目标”和“写邮件”这两个最耗脑子的环节也自动化了。代价是,你失去了对邮件内容的完全控制。如果你是一个对品牌语气极其敏感的人,或者你的行业非常垂直(比如医疗、法律),自动生成的邮件可能会显得不够专业,甚至冒犯对方。

另一个替代方案是买链接,或者用 PBN(私有博客网络)。但那是灰色地带,Google 一旦发现,你的网站可能直接被降权。Blazly 走的是白帽路线——它只做 guest post、资源页添加、broken link 替换这些 Google 认可的方式。所以它的速度不会像买链接那么快,但风险也低得多。

当然,Blazly 不是万能的。它的效果高度依赖你给的关键词和网站质量。如果你选的关键词太冷门,或者你的网站本身内容很薄,它可能找不到多少合适的 target。另外,自动生成的邮件再聪明,也还是比不上一个真正懂行业的人写的定制化邮件。如果你的 niche 需要非常深度的专业交流(比如跟学术期刊编辑打交道),那它可能帮倒忙。还有,它需要接入你的邮箱来发信,如果你用的是 Gmail 或者 Outlook 的免费版,发送量一大就可能被限流甚至封号。你得准备好一个专门的发信域名,或者用 SendGrid 这类服务。

我认识一个做户外装备电商的朋友,他之前每个月花 20 个小时手动搞外链,效果还一般。他试了 Blazly 之后,把关键词设成“hiking gear review”“camping checklist”,然后让它跑了两个星期。第一个星期它发了 80 封邮件,回复率大概 12%,其中 6 个博主同意放链接。第二个星期又发了 60 封,又拿到 4 个。一个月下来,他的外链从 23 个涨到 33 个,域名权重从 28 涨到 32。他说最爽的不是排名涨了,而是他再也不用在周五晚上对着 Excel 表发呆了。现在他每周花 10 分钟看看 Blazly 的报表,剩下的时间全用来拍产品视频。

GitHubsignal

NousResearch/hermes-agent

34988 forks197633 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

bytedance/deer-flow

9731 forks71689 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

GitHubsignal

bytedance/deer-flow

9731 forks71689 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

2026-06-19

今日值得看:Upstream

Upstream 是今天最值得先看的信号。Upstream 是一个同时为人类和 AI 代理设计的收件箱,让邮件不再混在一起。

今日 Brief

  • 产品侧可以先看 Upstream:Upstream 是一个同时为人类和 AI 代理设计的收件箱,让邮件不再混在一起。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

Viktor for Microsoft Teams

182 votes38 comments

值得关注是因为它顺应了企业用户不改变现有工作流的偏好,将 AI 嵌入 Teams 能降低推广阻力。但可能被高估的是其最强大的营销话术,在微软原生 Copilot 的强势竞争下,第三方 AI 助手的差异化壁垒及实际留存率仍需验证,当前票数属于常规热度,暂无爆发信号。

Product Huntsignal

VoiceOS

159 votes28 comments

值得关注是因为“系统级语音助手”是 AI Agent 落地的重要形态,代表人机交互演进方向。但可能只是噱头或信息不足在于:目前仅有 PH 页面,无独立官网和具体功能演示,无法证明其真正解决了系统级控制的延迟、准确率和系统权限问题,实际落地效果存疑。

Product Huntsignal

Elvin

222 votes28 comments

值得关注是因为它代表了 AI 从被动响应向主动代理演进的趋势,日榜第 5 证明该概念具吸引力。但可能被高估或只是噱头,因为主动完成任务极度依赖上下文理解与权限控制,在缺乏具体技术细节和实际案例支撑下,极易沦为过度承诺的包装概念。

Product Huntsignal

Juno

140 votes27 comments

你大概有过这种经历:坐在咖啡馆里采访一个创业者,对方语速飞快,你一边点头一边在笔记本上狂写,三分钟后手就酸了,字迹潦草到连自己都认不出。或者你是个产品经理,在头脑风暴会上突然冒出一个好想法,你掏出手机录音,心想“回头再整理”,结果那个录音文件在手机里躺了三个月,再打开时你已经完全忘了当时在兴奋什么。更常见的是,你是个学生,上课时老师讲得正嗨,你拼命记笔记,结果漏掉了后半段的关键推导。你试过用手机上的语音转文字 App,但要么要付费,要么必须联网,要么识别出来一堆错别字,还得手动改。最烦的是,你不敢把敏感内容——比如商业计划、病历、法律条款——传到云端,谁知道那些录音会被谁看到。

Juno 就是冲着这个痛点来的。它是一款免费、开源、完全在本地运行的语音转文字工具,核心卖点就三个字:实时、本地、免费。你打开它,点一下录音按钮,对着麦克风说话,屏幕上立刻出现文字,你说完它停,文字就留在那里了。整个过程不需要联网,你的声音不会离开你的电脑。它用的是本地 AI 模型,不需要 GPU 也能跑——当然,如果你有块好显卡,速度会更快。

谁会用 Juno?记者、学生、内容创作者、会议记录员、程序员——任何需要把口头信息快速变成文字的人。输入就是你的声音,系统怎么处理?它加载一个轻量级的语音识别模型(比如 Whisper 的本地版本),实时把音频流切成片段,逐段识别,然后拼接成连贯的文字。输出就是一段干净的文本,你可以直接复制到笔记软件、邮件、文档里。上下游接什么?它本身不绑定任何系统,但你可以把它当成一个“语音输入法”来用:打开 Juno,说话,复制文字,粘贴到 Notion、Obsidian、Google Docs 或者你的代码注释里。如果你是个开发者,它甚至提供了 API,你可以把它嵌入到自己的工具链里。

用一个比喻来理解 Juno 的核心机制:它就像你桌上放了一个永不疲倦的速记员。这个速记员只为你工作,不联网,不偷看你的笔记,你说什么他立刻写下来,而且写完之后你可以直接拿走那张纸。他不需要打电话回总部去查字典,因为他自己就带着一本厚厚的词典——那本词典就是本地 AI 模型。你不用担心他把你说的秘密泄露出去,因为他根本不跟外界通信。

对比一下市面上常见的替代方案。最直接的竞品是 Otter.ai,它也是实时语音转文字,但它是云端服务。你说话,音频上传到 Otter 的服务器,识别完再传回来。好处是模型大、准确率高、能区分说话人、还能自动生成摘要。坏处是:免费版每月只有 300 分钟,超过就要付费;而且你的所有录音都存在别人服务器上,隐私是个大问题。另一个替代方案是 Google Docs 的语音输入,它也是云端,而且只能在浏览器里用,识别质量依赖网络。Juno 选择了一条完全不同的路:本地运行。这意味着它不依赖网络,不消耗你的流量,不把你的数据交给任何人。代价是什么?本地模型的准确率通常不如云端大模型,尤其是在口音重、背景噪音大的情况下。而且你需要自己下载模型文件,初次设置可能需要几分钟,不像 Otter 那样打开网页就能用。但如果你经常处理敏感信息——比如律师整理客户谈话、医生记录病历、创业者讨论未公开的产品——那么本地运行就是刚需。你不可能为了省几分钟设置时间,把客户的隐私数据传到云端。

边界和代价也很清楚。Juno 不适合需要极高准确率的专业场景,比如法庭记录、医学听写,因为本地模型可能把“心肌梗死”识别成“心急梗死”,这种错误在医疗场景里是致命的。它也不适合多人会议,因为它目前没有区分说话人的能力——如果三个人同时说话,它只会输出一团乱麻。另外,它需要一定的计算资源:如果你的电脑是五年前的轻薄本,CPU 跑起来可能会风扇狂转,识别速度也会变慢。开源项目还有一个风险:维护者可能某天不更新了,或者模型版本落后了。但好处是,你可以自己改代码,或者等社区贡献。

最后,讲一个用起来什么样的小故事。我有个朋友是科技记者,经常在嘈杂的展会现场采访。以前他每次采访完,都要花两小时听录音、打字。后来他装了 Juno,在采访前打开它,把手机放在桌上当麦克风(Juno 支持任何系统输入设备)。采访过程中,他一边听对方说话,一边看着屏幕上实时跳出的文字,偶尔纠正一下识别错误。采访结束,他直接复制文字到稿件里,稍微润色一下就能发。他说,以前两小时的工作现在十五分钟搞定,而且再也不用担心录音文件丢失了。有一次他在飞机上写稿,没有网络,他对着 Juno 口述了整篇专栏,落地时文字已经在了。这就是 Juno 想给你的日常。

Product Huntsignal

Retool

132 votes7 comments

你是一个创业公司的 CTO,团队二十个人,散落在三个时区。你们用 Retool 搭了十几个内部工具——客户管理、订单审核、库存预警、财务对账。但最近你发现,市场部的人偷偷用 Airtable 搭了一个客户跟进表,运营部在 Google Sheets 里写了一个自动计算物流费用的脚本,甚至有个工程师用 Python 写了个爬虫,直接连了生产数据库。没人知道这些工具谁在用、数据流到哪里、有没有安全漏洞。你半夜被报警短信吵醒,说某个 API 被调了十万次,你翻遍所有系统都找不到是谁干的。这就是没有治理的后果——你给了团队自由,但失去了控制。

Retool 的新方向就是解决这个矛盾。它不强迫你只能在 Retool 的编辑器里写应用。你可以用 VS Code、用 Cursor、甚至用 AI 聊天工具生成代码,然后把那个应用“注册”到 Retool 里。一旦注册,Retool 就接管了所有脏活:谁可以访问这个应用、它连接哪些数据库、每次操作有没有日志、版本怎么回滚。你不需要改一行代码,只需要在 Retool 的控制台里点几下,就能给每个应用贴上标签、分配权限、设置审批流程。输入是你的代码或配置,输出是一个受管的应用,上下游接的是你的数据库、API、以及企业 SSO。

想象一下,你有一个团队用“Vibe coding”——就是那种让 AI 帮你写代码、你只管说“再改一下”的玩法。他们可能一天生成十几个小工具,每个都连不同的数据源。如果没有治理,这些工具就是定时炸弹。Retool 的做法是:你尽管用 AI 写,写完之后扔进 Retool 的“治理层”,它会自动扫描依赖、检测敏感数据、生成审计日志。就像一个安检通道,你带什么行李都行,但必须过 X 光机。

这和 Airtable 或 Notion 的路径完全不同。Airtable 让你搭数据库和界面,但它本质上是一个超级表格,权限只能做到“谁可以看这个表”,做不到“谁可以执行这个操作”。Notion 更偏向文档和知识库,它的权限模型是页面级的,不适合处理带业务逻辑的工具。Retool 选择的是“开发自由 + 集中治理”——它不限制你用什么工具写,但要求所有应用最终都跑在它的运行时里,受它的策略控制。这个差异在合规场景下特别重要。比如你要过 SOC 2 审计,审计员会问:“你们所有内部工具的数据流有没有记录?谁有权限修改生产数据?”用 Airtable 你很难回答,用 Retool 你可以直接导出一份完整的审计报告。

当然,这个方案有代价。它假设你的团队愿意把应用“交出来”统一管理。如果你们只有两三个人,所有工具都是一个人写的,那治理就是多余的成本。而且 Retool 本身的学习曲线不低——你要理解它的权限模型、环境变量、部署策略。如果你只是想快速搭一个一次性脚本,用 Retool 就像用集装箱卡车运一袋米。它的真正战场是那些“团队在扩张、工具在爆炸、审计在敲门”的公司。

我认识一个运维主管,他团队里有个实习生用 Claude 写了一个自动重启服务器的工具,直接连了 AWS 的 root 账号。主管发现后吓出一身冷汗,但没骂实习生,而是把那个工具导入 Retool,加了一条规则:所有涉及生产环境的操作,必须经过另一个有权限的人确认。现在那个工具还在用,但每次重启都会发一条 Slack 消息给主管,他点一下确认才执行。三个月后审计来了,他直接导出操作日志,审计员看了一眼说“没问题”。这就是 Retool 想给你的日常——你可以继续用你喜欢的方式写代码,但安全和控制,交给它。

GitHubsignal

NousResearch/hermes-agent

34783 forks196989 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

thedotmack/claude-mem

7190 forks83142 stars

你用过 AI agent 吗?就是那种你让它写代码、查资料、整理文档的“数字实习生”。刚开始用的时候挺爽,你告诉它“帮我重构这个模块”,它刷刷刷就干完了。但问题出在第二天。你打开一个新的会话,想让它继续昨天的工作,结果它一脸茫然地看着你,好像你们从没见过。你不得不把昨天的上下文、代码结构、你的偏好重新说一遍。更烦的是,如果你同时在跑好几个 agent——一个在写测试,一个在调 API,一个在分析日志——每个 agent 都像得了失忆症,每次对话都是第一次见面。你花在“重新介绍”上的时间,比让它们干活的时间还多。

claude-mem 就是来解决这个问题的。它不是一个 agent 本身,而是一个记忆层,可以插到任何 agent 后面。你用的 agent 是 Claude Code、OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode——随便哪个——只要接上 claude-mem,它就开始自动记录。记录的不是原始对话日志,而是经过 AI 压缩和提炼的“记忆”。比如你让 agent 调试一个 bug,它试了三种方案,最后用第二种解决了。claude-mem 不会记下你说了什么废话,而是记下“用户偏好第二种调试路径,该 bug 的根因是内存泄漏”。下次你再遇到类似问题,agent 打开新会话时,claude-mem 会自动把这条记忆注入进去,agent 就会直接说:“上次我们遇到类似情况,你选了第二种方案,要不要再试试?”

它的工作流是这样的:你启动 agent,agent 启动时加载 claude-mem 插件。agent 每做一件事——调用工具、写代码、查文档——claude-mem 都在后台抓取这些操作,然后用 AI 模型把它们压缩成结构化的记忆片段,存到本地数据库里。它支持 SQLite 和 ChromaDB 两种存储后端,前者轻量,后者适合做向量检索。下次 agent 启动时,claude-mem 会根据当前任务的关键词,从数据库里检索相关的旧记忆,然后像塞小纸条一样塞进 agent 的上下文窗口里。agent 看到这些纸条,就知道“哦,这个用户之前做过这个,那个项目有坑”。整个过程对你是透明的,你不需要手动管理任何东西。

你可以把 claude-mem 想象成给 AI agent 装了一个“私人助理”。这个助理不干活,但它有一本笔记本,随时记下 agent 做过什么、你喜欢什么、哪些方案失败了。每次 agent 开始新任务,助理就把相关的笔记翻出来放在桌上。agent 不用再问“你上次是怎么做的”,直接看笔记就行。

市面上已经有类似的项目,比如 Mem0、Supermemory、OpenMemory。它们的目标都是给 AI 加记忆,但路径不同。Mem0 走的是“记忆即服务”路线,它自己管理一个向量数据库,提供 API 让你存和查。Supermemory 更偏向个人知识管理,像一个 AI 版的 Notion。claude-mem 的选择是“嵌入 agent 的工作流”。它不是让你手动去存笔记,而是自动抓取 agent 的每一个操作,然后压缩、索引、注入。这意味着你不需要改变使用 agent 的习惯,装个插件就行。这种路径的好处是“零摩擦”——你不需要学习新工具,不需要手动分类记忆,agent 自己就学会了记住你。坏处是,它依赖 agent 的插件系统,如果某个 agent 不支持插件,你就用不了。目前它支持的主流 agent 已经很多了,但如果你用的是某个小众的 agent,可能就得等社区适配。

代价也很清楚。第一,它需要额外的计算资源。每次会话结束后,它都要跑一次 AI 压缩,把原始操作变成记忆。如果你一天开几十个会话,这个压缩过程会消耗不少 token 和本地算力。第二,记忆的质量取决于压缩模型。如果模型压缩得太狠,可能会丢失关键细节;如果压缩得太松,记忆会膨胀,占用上下文窗口。第三,隐私问题。所有记忆都存本地,但如果你用的是云端 agent,你的操作数据会被传到 agent 的服务器,claude-mem 只能保证本地存储的安全,管不了传输过程。第四,它不适合那些“每次任务都完全不同”的场景。比如你让 agent 每天写一篇不同的新闻稿,昨天的记忆对今天几乎没有帮助,那 claude-mem 就白费力气了。

想象一下这个场景:你是一个独立开发者,维护着一个开源项目。你让 Claude Code 帮你写测试、修 bug、重构代码。以前你每天打开终端,输入“继续昨天的重构”,Claude Code 会问“哪个模块?什么重构目标?你上次改到哪了?”你得翻聊天记录,找到昨天的对话,复制粘贴。装了 claude-mem 之后,第三天早上你打开终端,输入“继续昨天的重构”,Claude Code 直接说:“好的,继续重构 user 模块的认证逻辑。你昨天已经完成了单元测试,今天要改的是 session 管理部分。上次你提到想用 JWT 替代 cookie,要现在开始吗?”你愣了一下,然后笑了。它记住了。

GitHubsignal

bytedance/deer-flow

9703 forks71541 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

Product Huntsignal

VoiceOS

159 votes28 comments

A voice assistant that's a real JARVIS for your computer

Product Huntsignal

Elvin

222 votes28 comments

Proactive AI that finds and finishes work before you ask

Product Huntsignal

Juno

140 votes27 comments

Free, local AI powered Voice to Text w/ live transcriptions

GitHubsignal

thedotmack/claude-mem

7190 forks83142 stars

Persistent Context Across Sessions for Every Agent – Captures everything your agent does during sessions, compresses it with AI, and injects relevant context back into future sessions. Works with Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot, OpenCode + More

GitHubsignal

bytedance/deer-flow

9703 forks71541 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

2026-06-18

今日值得看:Framer 3.0

Framer 3.0 是今天最值得先看的信号。Framer 3.0 是一个让设计师用 AI 代理协作建网站的工具,它把网站设计从“一个人画完所有页面”变成了“你指挥一群 AI 助手各自干活”。

今日 Brief

  • 产品侧可以先看 Framer 3.0:Framer 3.0 是一个让设计师用 AI 代理协作建网站的工具,它把网站设计从“一个人画完所有页面”变成了“你指挥一群 AI 助手各自干活”。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

Android 17

174 votes4 comments

值得关注是因为头部移动操作系统全面转向 AI 原生,将重塑移动端应用生态;但缺乏具体的技术实现或落地场景数据,可能仅为常规版本更新的营销概念,暂不值得下结论。

Product Huntsignal

Tapfree for Chrome

122 votes29 comments

值得关注是因为它切入了“上下文感知”这一 AI 交互升级方向,试图解决传统语音输入的痛点。但 122 票和 29 评论属于常规热度,且缺乏对其“自适应”技术实现和实际效果的验证,可能只是利用 AI 噱头包装的传统语音听写工具,需进一步观察真实评价。

Product Huntsignal

Dualora

108 votes12 comments

值得关注是因为它精准切中多平台分发痛点,降低重复拍摄成本。但可能只是噱头或信息不足在于:仅108票且未说明是软件裁剪还是真双摄录制;若仅为软件实时裁剪,可能面临画质损失,且主流剪辑软件或系统相机已具备类似功能,独立工具的长期壁垒和留存存疑。

Product Huntsignal

Deep Work Plan

106 votes11 comments

值得关注是因为它切中了 AI Agent 开发中上下文与规划的核心痛点,且开源属性利于传播;但具体技术实现和实际效果未明,可能只是轻量级概念包装。

Product Huntsignal

memi

100 votes7 comments

值得关注是因为它试图将 AI Agent 概念从通用开发引入到垂直的设计领域,推动设计工具的工程化。但可能只是包装概念,因为目前缺乏关于其具体功能、实际落地场景和技术实现细节的证据,100 票的热度也可能仅源于“AI Agent”这一热门标签的早期包装。

GitHubsignal

NousResearch/hermes-agent

34525 forks196175 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

thedotmack/claude-mem

7187 forks82991 stars

你用过 AI agent 吗?就是那种你让它写代码、查资料、整理文档的“数字实习生”。刚开始用的时候挺爽,你告诉它“帮我重构这个模块”,它刷刷刷就干完了。但问题出在第二天。你打开一个新的会话,想让它继续昨天的工作,结果它一脸茫然地看着你,好像你们从没见过。你不得不把昨天的上下文、代码结构、你的偏好重新说一遍。更烦的是,如果你同时在跑好几个 agent——一个在写测试,一个在调 API,一个在分析日志——每个 agent 都像得了失忆症,每次对话都是第一次见面。你花在“重新介绍”上的时间,比让它们干活的时间还多。

claude-mem 就是来解决这个问题的。它不是一个 agent 本身,而是一个记忆层,可以插到任何 agent 后面。你用的 agent 是 Claude Code、OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode——随便哪个——只要接上 claude-mem,它就开始自动记录。记录的不是原始对话日志,而是经过 AI 压缩和提炼的“记忆”。比如你让 agent 调试一个 bug,它试了三种方案,最后用第二种解决了。claude-mem 不会记下你说了什么废话,而是记下“用户偏好第二种调试路径,该 bug 的根因是内存泄漏”。下次你再遇到类似问题,agent 打开新会话时,claude-mem 会自动把这条记忆注入进去,agent 就会直接说:“上次我们遇到类似情况,你选了第二种方案,要不要再试试?”

它的工作流是这样的:你启动 agent,agent 启动时加载 claude-mem 插件。agent 每做一件事——调用工具、写代码、查文档——claude-mem 都在后台抓取这些操作,然后用 AI 模型把它们压缩成结构化的记忆片段,存到本地数据库里。它支持 SQLite 和 ChromaDB 两种存储后端,前者轻量,后者适合做向量检索。下次 agent 启动时,claude-mem 会根据当前任务的关键词,从数据库里检索相关的旧记忆,然后像塞小纸条一样塞进 agent 的上下文窗口里。agent 看到这些纸条,就知道“哦,这个用户之前做过这个,那个项目有坑”。整个过程对你是透明的,你不需要手动管理任何东西。

你可以把 claude-mem 想象成给 AI agent 装了一个“私人助理”。这个助理不干活,但它有一本笔记本,随时记下 agent 做过什么、你喜欢什么、哪些方案失败了。每次 agent 开始新任务,助理就把相关的笔记翻出来放在桌上。agent 不用再问“你上次是怎么做的”,直接看笔记就行。

市面上已经有类似的项目,比如 Mem0、Supermemory、OpenMemory。它们的目标都是给 AI 加记忆,但路径不同。Mem0 走的是“记忆即服务”路线,它自己管理一个向量数据库,提供 API 让你存和查。Supermemory 更偏向个人知识管理,像一个 AI 版的 Notion。claude-mem 的选择是“嵌入 agent 的工作流”。它不是让你手动去存笔记,而是自动抓取 agent 的每一个操作,然后压缩、索引、注入。这意味着你不需要改变使用 agent 的习惯,装个插件就行。这种路径的好处是“零摩擦”——你不需要学习新工具,不需要手动分类记忆,agent 自己就学会了记住你。坏处是,它依赖 agent 的插件系统,如果某个 agent 不支持插件,你就用不了。目前它支持的主流 agent 已经很多了,但如果你用的是某个小众的 agent,可能就得等社区适配。

代价也很清楚。第一,它需要额外的计算资源。每次会话结束后,它都要跑一次 AI 压缩,把原始操作变成记忆。如果你一天开几十个会话,这个压缩过程会消耗不少 token 和本地算力。第二,记忆的质量取决于压缩模型。如果模型压缩得太狠,可能会丢失关键细节;如果压缩得太松,记忆会膨胀,占用上下文窗口。第三,隐私问题。所有记忆都存本地,但如果你用的是云端 agent,你的操作数据会被传到 agent 的服务器,claude-mem 只能保证本地存储的安全,管不了传输过程。第四,它不适合那些“每次任务都完全不同”的场景。比如你让 agent 每天写一篇不同的新闻稿,昨天的记忆对今天几乎没有帮助,那 claude-mem 就白费力气了。

想象一下这个场景:你是一个独立开发者,维护着一个开源项目。你让 Claude Code 帮你写测试、修 bug、重构代码。以前你每天打开终端,输入“继续昨天的重构”,Claude Code 会问“哪个模块?什么重构目标?你上次改到哪了?”你得翻聊天记录,找到昨天的对话,复制粘贴。装了 claude-mem 之后,第三天早上你打开终端,输入“继续昨天的重构”,Claude Code 直接说:“好的,继续重构 user 模块的认证逻辑。你昨天已经完成了单元测试,今天要改的是 session 管理部分。上次你提到想用 JWT 替代 cookie,要现在开始吗?”你愣了一下,然后笑了。它记住了。

GitHubsignal

bytedance/deer-flow

9684 forks71420 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

Product Huntsignal

memi

100 votes7 comments

The AI agent harness for product design teams

GitHubsignal

thedotmack/claude-mem

7187 forks82991 stars

Persistent Context Across Sessions for Every Agent – Captures everything your agent does during sessions, compresses it with AI, and injects relevant context back into future sessions. Works with Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot, OpenCode + More

GitHubsignal

bytedance/deer-flow

9684 forks71420 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

2026-06-17

今日值得看:Goldfish

Goldfish 是今天最值得先看的信号。Goldfish 是一个 Mac 上的 AI 助手,按一下 Option 键,它就能根据你当前的工作内容,用你的语气帮你写好回复。

今日 Brief

  • 产品侧可以先看 Goldfish:Goldfish 是一个 Mac 上的 AI 助手,按一下 Option 键,它就能根据你当前的工作内容,用你的语气帮你写好回复。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

Zoona AI

145 votes34 comments

值得关注是因为它切入了客服自动化的刚需场景,且强调利用历史对话学习,比单纯基于文档的问答更贴近真实业务语境。但可能只是包装概念,AI 客服赛道已极度红海,且缺乏独立官网和具体技术壁垒展示,仅凭早期投票不足以证明其具备长期竞争力。

Product Huntsignal

GitHits beta 0.9

137 votes23 comments

值得关注是因为 AI 编程代理正从本地上下文向开源代码库上下文演进,提供此类基础设施具有平台潜力;但可能只是噱头或信息不足在于:目前仅为 beta 0.9,缺乏具体技术实现细节(如检索效率、版权合规)和大规模验证,137 票的早期热度不足以证明其长期价值。

Product Huntsignal

Stride

119 votes17 comments

值得关注是因为它试图将 AI 从单点辅助推向全生命周期工作区,契合 Vercel 倡导的端到端交付理念;但可能只是包装概念,因缺乏独立官网、具体功能演示和技术细节,需警惕大而全导致的落地困难

Product Huntsignal

MindReader v1

106 votes18 comments

值得关注是因为它触及了脑机接口和神经 UX 的前沿概念,降低了数据获取门槛;但可能被高估,因为“读心”和“模拟 fMRI”带有强烈的噱头色彩,且缺乏真实硬件或临床数据支撑,实际落地价值信息不足。

Product Huntsignal

Dirac

108 votes23 comments

值得关注是因为它代表了AI从内容生成向个人数据代理(Inbox Agent)演进的趋势,切中创始人痛点;但可能被高估的是,它或许只是现有邮件AI总结功能的重新包装,且缺乏独立官网,产品成熟度与技术壁垒信息不足,暂不判断其长期壁垒。

GitHubsignal

NousResearch/hermes-agent

34298 forks195334 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

thedotmack/claude-mem

7171 forks82775 stars

你用过 AI agent 吗?就是那种你让它写代码、查资料、整理文档的“数字实习生”。刚开始用的时候挺爽,你告诉它“帮我重构这个模块”,它刷刷刷就干完了。但问题出在第二天。你打开一个新的会话,想让它继续昨天的工作,结果它一脸茫然地看着你,好像你们从没见过。你不得不把昨天的上下文、代码结构、你的偏好重新说一遍。更烦的是,如果你同时在跑好几个 agent——一个在写测试,一个在调 API,一个在分析日志——每个 agent 都像得了失忆症,每次对话都是第一次见面。你花在“重新介绍”上的时间,比让它们干活的时间还多。

claude-mem 就是来解决这个问题的。它不是一个 agent 本身,而是一个记忆层,可以插到任何 agent 后面。你用的 agent 是 Claude Code、OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode——随便哪个——只要接上 claude-mem,它就开始自动记录。记录的不是原始对话日志,而是经过 AI 压缩和提炼的“记忆”。比如你让 agent 调试一个 bug,它试了三种方案,最后用第二种解决了。claude-mem 不会记下你说了什么废话,而是记下“用户偏好第二种调试路径,该 bug 的根因是内存泄漏”。下次你再遇到类似问题,agent 打开新会话时,claude-mem 会自动把这条记忆注入进去,agent 就会直接说:“上次我们遇到类似情况,你选了第二种方案,要不要再试试?”

它的工作流是这样的:你启动 agent,agent 启动时加载 claude-mem 插件。agent 每做一件事——调用工具、写代码、查文档——claude-mem 都在后台抓取这些操作,然后用 AI 模型把它们压缩成结构化的记忆片段,存到本地数据库里。它支持 SQLite 和 ChromaDB 两种存储后端,前者轻量,后者适合做向量检索。下次 agent 启动时,claude-mem 会根据当前任务的关键词,从数据库里检索相关的旧记忆,然后像塞小纸条一样塞进 agent 的上下文窗口里。agent 看到这些纸条,就知道“哦,这个用户之前做过这个,那个项目有坑”。整个过程对你是透明的,你不需要手动管理任何东西。

你可以把 claude-mem 想象成给 AI agent 装了一个“私人助理”。这个助理不干活,但它有一本笔记本,随时记下 agent 做过什么、你喜欢什么、哪些方案失败了。每次 agent 开始新任务,助理就把相关的笔记翻出来放在桌上。agent 不用再问“你上次是怎么做的”,直接看笔记就行。

市面上已经有类似的项目,比如 Mem0、Supermemory、OpenMemory。它们的目标都是给 AI 加记忆,但路径不同。Mem0 走的是“记忆即服务”路线,它自己管理一个向量数据库,提供 API 让你存和查。Supermemory 更偏向个人知识管理,像一个 AI 版的 Notion。claude-mem 的选择是“嵌入 agent 的工作流”。它不是让你手动去存笔记,而是自动抓取 agent 的每一个操作,然后压缩、索引、注入。这意味着你不需要改变使用 agent 的习惯,装个插件就行。这种路径的好处是“零摩擦”——你不需要学习新工具,不需要手动分类记忆,agent 自己就学会了记住你。坏处是,它依赖 agent 的插件系统,如果某个 agent 不支持插件,你就用不了。目前它支持的主流 agent 已经很多了,但如果你用的是某个小众的 agent,可能就得等社区适配。

代价也很清楚。第一,它需要额外的计算资源。每次会话结束后,它都要跑一次 AI 压缩,把原始操作变成记忆。如果你一天开几十个会话,这个压缩过程会消耗不少 token 和本地算力。第二,记忆的质量取决于压缩模型。如果模型压缩得太狠,可能会丢失关键细节;如果压缩得太松,记忆会膨胀,占用上下文窗口。第三,隐私问题。所有记忆都存本地,但如果你用的是云端 agent,你的操作数据会被传到 agent 的服务器,claude-mem 只能保证本地存储的安全,管不了传输过程。第四,它不适合那些“每次任务都完全不同”的场景。比如你让 agent 每天写一篇不同的新闻稿,昨天的记忆对今天几乎没有帮助,那 claude-mem 就白费力气了。

想象一下这个场景:你是一个独立开发者,维护着一个开源项目。你让 Claude Code 帮你写测试、修 bug、重构代码。以前你每天打开终端,输入“继续昨天的重构”,Claude Code 会问“哪个模块?什么重构目标?你上次改到哪了?”你得翻聊天记录,找到昨天的对话,复制粘贴。装了 claude-mem 之后,第三天早上你打开终端,输入“继续昨天的重构”,Claude Code 直接说:“好的,继续重构 user 模块的认证逻辑。你昨天已经完成了单元测试,今天要改的是 session 管理部分。上次你提到想用 JWT 替代 cookie,要现在开始吗?”你愣了一下,然后笑了。它记住了。

GitHubsignal

bytedance/deer-flow

9668 forks71331 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

Product Huntsignal

Zoona AI

145 votes34 comments

Automated support that learns from docs + past conversations

Product Huntsignal

Stride

119 votes17 comments

The AI workspace that plans, designs and ships with you.

Product Huntsignal

Dirac

108 votes23 comments

The AI inbox that briefs founders every morning

GitHubsignal

thedotmack/claude-mem

7171 forks82775 stars

Persistent Context Across Sessions for Every Agent – Captures everything your agent does during sessions, compresses it with AI, and injects relevant context back into future sessions. Works with Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot, OpenCode + More

GitHubsignal

bytedance/deer-flow

9668 forks71331 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

2026-06-16

今日值得看:Novu Connect

Novu Connect 是今天最值得先看的信号。Novu Connect 是一个让开发者把 AI agent 直接塞进用户已经在用的聊天工具里的开源工具。

今日 Brief

  • 产品侧可以先看 Novu Connect:Novu Connect 是一个让开发者把 AI agent 直接塞进用户已经在用的聊天工具里的开源工具。
  • 开源侧可以先看 affaan-m/ECC:ECC 是一个给 AI 编码助手装“大脑”和“工具箱”的系统,让它们更聪明、更安全、更懂你的项目。

More Signals

Product Huntsignal

PandaProbe Cloud

176 votes17 comments

值得关注是因为 Agent 工程化和全托管切中了 AI 应用走向生产的痛点,且获得日榜第 5 的早期热度;暂不值得下结论是因为产品描述极度简略,缺乏具体功能和技术架构证据,可能只是概念包装。

Product Huntsignal

Sulsaly

117 votes9 comments

值得关注是因为它展示了“Agentic AI+垂直区域市场”的落地路径,证明AI销售工具在特定区域存在本地化壁垒和差异化机会;但可能只是包装概念,117票和9条评论显示社区热度一般,且缺乏具体技术细节,是否真正具备Agentic能力或只是传统自动化套壳仍需验证。

Product Huntsignal

MockPilot

124 votes16 comments

值得关注是因为它切中了前端重构和竞品分析的效率痛点,124 票证明其在早期社区有一定吸引力。但可能被高估的点在于:网页逆向工程通常面临 CSS 复杂性、响应式布局和动态交互难以完美还原的技术瓶颈,实际可编辑的程度和代码质量可能不及预期,需观察后续真实用户反馈。

Product Huntsignal

Reignat

110 votes12 comments

值得关注是因为隐私与轻量仍是开发者建站标配,110票证明其在 Maker 圈层有基础共鸣。但暂不值得下结论是因为该赛道已高度成熟,缺乏明显的技术颠覆证据,可能只是又一个同质化竞品,需观察其 API 集成等差异化能力。

Product Huntsignal

Synopsule

111 votes16 comments

值得关注是因为它切中了企业使用云端AI的最大痛点即隐私合规,端侧AI是明确趋势;但可能被高估的是,端侧模型的转录和总结能力目前可能仍落后于云端大模型,且111票仅说明概念受认可,实际效果与留存有待验证。

GitHubsignal

NousResearch/hermes-agent

34089 forks194433 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

code-yeongyu/oh-my-openagent

5052 forks62345 stars

想象一下你下午三点接到一个任务:改一个三个月前写的支付模块,因为客户投诉退款逻辑有 bug。你打开项目,发现这个模块横跨五个文件,里面塞满了条件判断和回调,注释只有一行“// TODO: 优化”。你开始翻文件,从入口文件一路追到工具函数,中间还要记住变量是怎么传的。你打开浏览器搜“如何快速理解复杂代码”,结果跳出来一堆广告。你切回编辑器,手动打印日志,跑测试,再改代码,再跑测试。等你终于找到那个 bug,已经快六点了,你还没写一行新代码。这就是没有好工具时的日常——大部分时间花在“找”和“理解”上,而不是“改”上。

oh-my-openagent 就是来解决这个问题的。你是一个开发者,你把它装进你的终端或者 IDE 里。你输入一个任务,比如“找到退款逻辑里金额校验失败的原因,并修复它”。系统会先扫描整个代码库,理解文件之间的依赖关系,然后定位到相关代码块。它不会一次性把整个项目塞给 AI,而是像人一样,先看目录结构,再读关键文件,最后聚焦到具体函数。输出是一段修改建议,或者直接生成补丁。它接你的代码仓库,也接你用的 AI 模型——比如 Claude、GPT、Gemini,你选哪个它就用哪个。上下游就是你的 Git 和你的编辑器。

它的核心机制像是一个“代码导游”。你站在一个陌生城市(代码库)里,导游不会把整张地图拍在你脸上,而是先带你走主干道,再拐进小巷,最后停在你要找的那家店门口。oh-my-openagent 就是那个导游,它知道什么时候该看全局,什么时候该钻细节,不会让你在无关的文件里迷路。

跟 Cursor 或者 GitHub Copilot 比,它们走的是另一条路。Cursor 更像一个“超级自动补全”,你写一行它猜下一行,适合写新代码或者改小段逻辑。但当你面对一个几千行、跨多个模块的老项目时,自动补全就帮不上忙了,因为它不知道整个项目的上下文。oh-my-openagent 选择的是“先理解再动手”,它花更多时间在分析代码结构上,而不是即时生成代码。这个差异在重构遗留系统、接手别人项目、或者排查深层 bug 时特别重要。你不需要自己先花半小时搞清楚代码怎么组织的,它帮你做了。

当然,它也有边界。如果你的项目只有几个文件,逻辑简单得像一个计算器,用它就像用大炮打蚊子,反而比直接手动改更慢。它依赖 AI 模型,所以每次调用都要消耗 token,如果你每天跑几十次,账单会涨得很快。而且它目前有 687 个 open issues,说明还在快速迭代中,有些边缘情况可能处理不好。如果你对代码安全要求极高,比如金融系统的核心交易逻辑,你可能会犹豫要不要让 AI 直接改代码——毕竟它只是建议,最终决定权还在你手上。

我有个朋友,上周接手了一个三年前的 Rails 项目,里面混着 Ruby 和 JavaScript,文件散落在十几个目录里。他需要加一个导出 CSV 的功能,但不知道数据从哪里来。他打开 oh-my-openagent,输入“找到用户数据的来源,并生成一个 CSV 导出函数”。几秒钟后,终端里跳出了分析结果:数据来自三个模型,关联关系是 A 有多个 B,B 属于 C。然后它直接生成了一个函数,连 CSV 的列名都按项目命名规范写好了。他复制粘贴,跑测试,通过。整个过程不到十分钟。他关掉终端的时候说了一句话:“以前这种事,我得先喝杯咖啡再开始。”

GitHubsignal

bytedance/deer-flow

9655 forks71241 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

Product Huntsignal

Sulsaly

117 votes9 comments

#1 Agentic AI sales leads &outreach platform for MENA Region

Product Huntsignal

Reignat

110 votes12 comments

Privacy-friendly web analytics platform built for makers

GitHubsignal

code-yeongyu/oh-my-openagent

5052 forks62345 stars

omo/lazycodex: The coding agent for tokenmaxxers;the one and only agent harness for complex codebases. For your Codex, for your OpenCode

GitHubsignal

bytedance/deer-flow

9655 forks71241 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.

2026-06-15

今日值得看:Slashy

Slashy 是今天最值得先看的信号。Slashy 是一个能替你读邮件、写回复、管理收件箱的 AI 助手,你只需要授权它访问你的邮箱,剩下的它自己搞定。

今日 Brief

  • 产品侧可以先看 Slashy:Slashy 是一个能替你读邮件、写回复、管理收件箱的 AI 助手,你只需要授权它访问你的邮箱,剩下的它自己搞定。
  • 开源侧可以先看 NousResearch/hermes-agent:Hermes是一个能随着你的使用习惯和业务需求自动进化的AI代理,像养一个会自己长大的数字员工。

More Signals

Product Huntsignal

Memoriq

113 votes12 comments

值得关注是因为它切中了多模型时代的上下文割裂痛点,试图在模型之上建立统一的个人数据层。但可能只是噱头,因为各大模型正原生强化记忆功能,且跨模型注入上下文的技术实现、Token 消耗及体验面临挑战,长期价值需观察其实际留存与官方功能的博弈。

Product Huntsignal

Allergo

100 votes7 comments

值得关注是因为它切中了过敏人群在跨语言环境下的真实痛点,属于小切口深需求的实用工具。但可能被高估的地方在于,它可能只是简单的翻译卡片集合,缺乏技术壁垒,且无独立官网,可能只是噱头或早期概念,长期商业价值信息不足。

Product Huntsignal

Reverie.fm

93 votes4 comments

值得关注是因为它切中了反算法推荐和离线优先的逆向趋势,将音乐与物理空间结合创造情感价值。但可能只是小众玩具,93票和4条评论显示受众极窄,且完全离线限制了社交传播与商业化潜力,长期留存信息不足。

Product Huntsignal

Pool

70 votes1 comments

值得关注是因为“截图即保存”的极简交互符合降低工具使用门槛的趋势;但可能只是噱头,因为缺乏对截图后如何处理(如AI识别、自动分类)的描述,若仅是基础截图工具则极易被高估,当前数据不足以证明其具备破圈潜力。

GitHubsignal

NousResearch/hermes-agent

33842 forks193502 stars

你每天花多少时间在重复的、规则明确但又不完全一样的工作上?比如,你是一个独立开发者,每天要回复几十封用户邮件,每封邮件的问题都差不多,但语气、紧急程度、用户身份各不相同。你试过用ChatGPT写回复模板,但每次都要手动复制粘贴、调整语气、检查是否漏了关键信息。你试过用Claude Code写脚本,但脚本只能处理固定格式,遇到用户发来一个带截图的奇怪问题,脚本就卡住了。你甚至想过招个实习生,但预算不够,而且培训成本比自己做还高。你每天就在这种“重复但又不完全重复”的泥潭里挣扎,时间被切成碎片,真正需要你判断的决策反而没时间做。

Hermes就是来解决这个问题的。它不是一个固定的机器人,而是一个能自己长大的AI代理。你不需要写复杂的规则,也不需要给它喂一堆训练数据。你只需要开始用,告诉它你想做什么,比如“帮我回复用户邮件”。然后,你正常干活,Hermes在旁边看着。你回复一封邮件,它学一次。你调整了语气,它记下来。你拒绝了某个退款请求,它分析原因。三天后,它开始主动给你建议:“这封邮件和昨天你处理过的第7封很像,要不要用类似的回复?”一周后,它开始自己处理那些它已经确认过多次的邮件,只把拿不准的推给你。一个月后,你发现你每天只需要处理20%的异常情况,剩下的80%已经被Hermes默默搞定了。

它的工作流是这样的:你作为用户,在终端或者你常用的工具里输入一个任务目标,比如“监控竞品价格变动,每天生成一份对比表”。Hermes会先理解这个目标,然后自己规划步骤——它需要访问哪些网站、用什么格式输出、多久检查一次。它不需要你告诉它每一步怎么做,它会自己尝试。第一次可能搞错了格式,你纠正一次,它就记住了。它会把结果输出到你指定的地方,比如一个Google Sheet或者一个Slack频道。上下游接什么系统?它自己会去探索。你给它一个API密钥,它就知道怎么用。你给它一个网页地址,它就知道怎么爬。它就像一个刚入职的新人,第一天什么都不会,但学得飞快,而且永远不会忘记。

你可以把Hermes想象成一个会自己长大的数字盆栽。你不需要每天给它浇水、修剪、换土。你只需要把它放在你的工作环境里,它自己会从你的操作中吸收养分,慢慢长出新的枝叶。一开始它只是一棵小苗,只能处理最简单的任务。随着你不断使用,它会长出新的分支,学会更复杂的操作。你不需要告诉它怎么长,它自己会朝着最需要它的方向伸展。有些分支可能长歪了,你剪掉一次,它就不会再往那个方向长。

和Claude Code或者Codex这类工具相比,Hermes走了一条完全不同的路。Claude Code和Codex更像是给你一把精准的手术刀,你告诉它切哪里、切多深,它执行得又快又好。但如果你自己都不知道该切哪里,或者每次要切的东西都不一样,手术刀就没用了。Hermes更像一个学徒,它先看你做一遍,然后模仿,然后改进,最后独立操作。Claude Code适合那些任务明确、步骤固定的场景,比如“把这段Python代码转成TypeScript”。Hermes适合那些任务模糊、规则会变、需要判断力的场景,比如“帮我处理客服工单,但要根据客户等级和问题类型调整优先级”。在后者这种场景里,Claude Code会因为你没给它明确的规则而卡住,而Hermes会从你的历史操作中自己总结出规则。

当然,Hermes的代价也很明显。它需要时间成长。如果你今天就要处理100封紧急邮件,它帮不了你,它还在学习阶段。它需要你愿意花时间纠正它的错误。前一周,你可能要花比自己做更多的时间来教它。它也不是万能的。如果任务本身需要大量领域知识,比如法律合同审核,它需要你先给它一些样本,它才能学会。而且,因为它会自己探索,有时候它会尝试一些你没想到的操作,比如访问了一个你不想让它访问的网站。你需要给它设定边界,告诉它哪些地方不能去。另外,它的开源性质意味着你完全掌控数据,但也要自己负责部署和维护。如果你不想折腾服务器,可能更适合用托管服务。

想象一下,你是一个电商小团队的运营负责人。你招了一个Hermes,告诉它“帮我处理退货申请”。第一天,它什么都不懂,你手把手教它怎么看退货原因、怎么判断商品状态、怎么计算退款金额。你处理了50个申请,它看了50遍。第二天,它开始主动给你建议:“这个用户的商品已经拆封了,按规则只能退50%,要确认吗?”你点了确认。第三天,它开始自己处理那些未拆封、金额低于100元的申请,只把异常情况推给你。一周后,你发现你每天只需要花15分钟审核它处理的结果,剩下的时间你可以去研究怎么优化退货流程。一个月后,你甚至忘了当初自己是怎么处理退货的。这就是Hermes想创造的日常。

GitHubsignal

Chrome官方下场提供MCP Server,意味着AI Agent操控浏览器底层调试协议获得官方背书,极大降低Agent调试前端应用的门槛。但4.3万星可能包含对AI概念的跟风关注,且91个未解决issue表明复杂调试场景下的稳定性仍需验证,短期热度可能高于实际生产落地率。

GitHubsignal

code-yeongyu/oh-my-openagent

5039 forks62221 stars

想象一下你下午三点接到一个任务:改一个三个月前写的支付模块,因为客户投诉退款逻辑有 bug。你打开项目,发现这个模块横跨五个文件,里面塞满了条件判断和回调,注释只有一行“// TODO: 优化”。你开始翻文件,从入口文件一路追到工具函数,中间还要记住变量是怎么传的。你打开浏览器搜“如何快速理解复杂代码”,结果跳出来一堆广告。你切回编辑器,手动打印日志,跑测试,再改代码,再跑测试。等你终于找到那个 bug,已经快六点了,你还没写一行新代码。这就是没有好工具时的日常——大部分时间花在“找”和“理解”上,而不是“改”上。

oh-my-openagent 就是来解决这个问题的。你是一个开发者,你把它装进你的终端或者 IDE 里。你输入一个任务,比如“找到退款逻辑里金额校验失败的原因,并修复它”。系统会先扫描整个代码库,理解文件之间的依赖关系,然后定位到相关代码块。它不会一次性把整个项目塞给 AI,而是像人一样,先看目录结构,再读关键文件,最后聚焦到具体函数。输出是一段修改建议,或者直接生成补丁。它接你的代码仓库,也接你用的 AI 模型——比如 Claude、GPT、Gemini,你选哪个它就用哪个。上下游就是你的 Git 和你的编辑器。

它的核心机制像是一个“代码导游”。你站在一个陌生城市(代码库)里,导游不会把整张地图拍在你脸上,而是先带你走主干道,再拐进小巷,最后停在你要找的那家店门口。oh-my-openagent 就是那个导游,它知道什么时候该看全局,什么时候该钻细节,不会让你在无关的文件里迷路。

跟 Cursor 或者 GitHub Copilot 比,它们走的是另一条路。Cursor 更像一个“超级自动补全”,你写一行它猜下一行,适合写新代码或者改小段逻辑。但当你面对一个几千行、跨多个模块的老项目时,自动补全就帮不上忙了,因为它不知道整个项目的上下文。oh-my-openagent 选择的是“先理解再动手”,它花更多时间在分析代码结构上,而不是即时生成代码。这个差异在重构遗留系统、接手别人项目、或者排查深层 bug 时特别重要。你不需要自己先花半小时搞清楚代码怎么组织的,它帮你做了。

当然,它也有边界。如果你的项目只有几个文件,逻辑简单得像一个计算器,用它就像用大炮打蚊子,反而比直接手动改更慢。它依赖 AI 模型,所以每次调用都要消耗 token,如果你每天跑几十次,账单会涨得很快。而且它目前有 687 个 open issues,说明还在快速迭代中,有些边缘情况可能处理不好。如果你对代码安全要求极高,比如金融系统的核心交易逻辑,你可能会犹豫要不要让 AI 直接改代码——毕竟它只是建议,最终决定权还在你手上。

我有个朋友,上周接手了一个三年前的 Rails 项目,里面混着 Ruby 和 JavaScript,文件散落在十几个目录里。他需要加一个导出 CSV 的功能,但不知道数据从哪里来。他打开 oh-my-openagent,输入“找到用户数据的来源,并生成一个 CSV 导出函数”。几秒钟后,终端里跳出了分析结果:数据来自三个模型,关联关系是 A 有多个 B,B 属于 C。然后它直接生成了一个函数,连 CSV 的列名都按项目命名规范写好了。他复制粘贴,跑测试,通过。整个过程不到十分钟。他关掉终端的时候说了一句话:“以前这种事,我得先喝杯咖啡再开始。”

GitHubsignal

bytedance/deer-flow

9644 forks71161 stars

你是一个独立开发者,接了一个外包项目:给一家小公司做一个内部工具,从零开始。你打开浏览器,先搜技术方案,翻十几篇博客,对比框架,决定用哪个。然后打开 IDE,写代码,跑起来发现报错,再回去查文档。中间还要去 Slack 问同事某个 API 的用法,等回复。一个下午过去了,你还在研究怎么搭数据库连接池。这不是你懒,是这类任务天然就长——它需要你切换五六个工具,记住一堆上下文,还要在等待中保持思路不断。你真正需要的不是另一个聊天机器人,而是一个能自己从头干到尾的“数字员工”。

deer-flow 就是干这个的。它不是一个你问一句它答一句的助手,而是一个能接受一个模糊目标,然后自己规划、执行、调整、直到完成的系统。你给它一个任务,比如“研究一下当前最好的开源 RAG 方案,写一个对比报告,并生成一个 demo 代码”。它不会只给你一段文字,它会自己启动一个沙盒环境,在里面搜索、阅读文档、写代码、测试、甚至调用子代理来并行处理不同部分。最后,你拿到的是一个完整的输出:一份报告加一个能跑的 demo。

它的工作流是这样的:你通过消息网关(Message Gateway)丢进去一个任务。deer-flow 的核心引擎会先拆解这个任务,判断需要哪些技能——比如“搜索”、“写 Python 代码”、“分析文档”。然后它分配子代理(Subagents)去干具体的事,每个子代理有自己的记忆(Memories)和工具(Tools),可以调用外部 API 或数据库。所有操作都在沙盒(Sandbox)里执行,不会污染你的系统。如果某个子代理卡住了,主代理会重新规划,换一条路径。整个过程就像你有一个项目经理,带着几个工程师,各自在自己的工位上干活,项目经理随时协调。

你可以把它想象成一个“AI 项目组”。你不是在跟一个 AI 对话,而是给一个项目组下达了一个任务。这个项目组有自己的会议室(沙盒)、白板(记忆)、工具箱(工具)、专家(子代理)和前台(消息网关)。你不需要知道谁在干什么,你只需要说“我要这个”,然后等结果。

跟 AutoGPT 比,deer-flow 走了一条更工程化的路。AutoGPT 更像一个单兵作战的超级士兵,什么都能干一点,但容易跑偏,而且没有清晰的边界。deer-flow 从一开始就设计了沙盒隔离、子代理分工、记忆持久化这些结构。这意味着它能处理更复杂的任务,比如“研究一个开源项目,理解它的架构,然后写一个插件”,而不会在中间因为上下文丢失而胡来。代价是,它比 AutoGPT 重,启动慢,配置复杂。如果你只是想让它帮你写一封邮件,用 AutoGPT 就够了。但如果你要它做一个需要几个小时、涉及多个步骤的研究和开发任务,deer-flow 的架构优势就出来了。

当然,它也有边界。deer-flow 不是给非技术人员用的。你需要懂一点命令行,能配置 Python 环境,理解什么是沙盒和子代理。它的学习曲线比一个聊天机器人陡得多。另外,它依赖 LLM 的质量——如果底层的模型不够聪明,子代理之间的协调就会出问题,任务可能卡住或跑偏。目前 GitHub 上还有 938 个 open issues,说明它还在快速迭代中,不是那种开箱即用的产品。如果你只是想快速验证一个想法,可能用现成的 SaaS 工具更省心。

我认识一个做技术调研的朋友,他每周要花两天时间研究竞品的技术栈,写报告。他试了 deer-flow,给了一个任务:“研究最近三个月发布的五个开源 AI 框架,对比它们的性能、社区活跃度和文档质量,输出一个表格和一段总结。”他早上丢进去,去开了个会,回来发现 deer-flow 已经跑完了:沙盒里有一个 CSV 文件,一个 Markdown 报告,甚至还有一个自动生成的对比图。他只需要检查一下数据来源,改几个措辞,就交差了。那天下午他提前下班了。

More From Today

Product Huntsignal

Memoriq

113 votes12 comments

Your private AI memory for ChatGPT, Claude, Gemini and Grok

GitHubsignal

code-yeongyu/oh-my-openagent

5039 forks62221 stars

omo/lazycodex: The coding agent for tokenmaxxers;the one and only agent harness for complex codebases. For your Codex, for your OpenCode

GitHubsignal

bytedance/deer-flow

9644 forks71161 stars

An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.