本周 GitHub 热门:4 个火到爆的 AI 开源项目,个个都是实力派!
本周逛逛 GitHub,发现 AI Agent 这个赛道真的杀疯了!今天推荐 4 个这周在 GitHub 上燃起来的开源项目,有字节跳动出品的超级 Agent,有 7 天狂揽 35k stars 的 AI 代理军团,还有让你彻底掌控 NotebookLM 的 Python 神器,外加一个专门「测毒」
本周逛逛 GitHub,发现 AI Agent 这个赛道真的杀疯了!今天推荐 4 个这周在 GitHub 上燃起来的开源项目,有字节跳动出品的超级 Agent,有 7 天狂揽 35k stars 的 AI 代理军团,还有让你彻底掌控 NotebookLM 的 Python 神器,外加一个专门「测毒」AI 提示词的红队工具……话不多说,赶紧来瞧瞧!
01 DeerFlow
DeerFlow —— 字节跳动出品的开源超级 Agent,3月初登顶 GitHub Trending 第一!

你有没有想过,有一个 AI 能帮你做几小时的深度研究,顺便生成报告、PPT、网页,还能写代码、调用工具……而这一切,都在一个开源项目里?
字节跳动开源的 DeerFlow(Deep Exploration and Efficient Research Flow)就是干这事儿的。它本质上是一个「超级 Agent 调度框架」,能根据任务复杂度,自动编排多个子 Agent 协作完成任务——简单的对话几秒搞定,复杂的研究型任务可以跑好几个小时,最后输出多份文件。
DeerFlow 底层基于 LangGraph 和 LangChain,开箱就带沙盒执行环境、持久化记忆、内置技能包(研究、生成报告、制作 PPT、生成图片/视频等),简直是 AI 工程师的「梦中情工具」。它在今年 3 月 1 日刚发布 2.0 版本,立刻冲上 GitHub Trending 第一名,目前 Star 数已超 25,000。
实用场景:
- 适合需要做竞品研究、行业分析的产品经理和研究员
- 开发者可以用它来自动化复杂的多步骤编码任务
- 内容创作者可以用它一键生成深度报告和演示文稿
核心功能:
- 自动编排多个子 Agent 完成复杂任务,支持任务耗时从几秒到几小时
- 内置沙盒执行环境,Agent 可以安全运行代码
- 持久化记忆系统,让 Agent 记住上下文
- 内置研究、报告生成、PPT 制作、网页生成、图片/视频生成等技能包
- 支持自定义扩展 Skills,打造专属 Agent 流水线
02 agency-agents
agency-agents —— 61 个 AI 专家代理团队,7 天 35k Stars,把 AI 变成你的「数字员工」!

这个项目一上来就让我眼前一亮——它不是一个框架,不是一个模型,而是一个现成的 AI 代理团队,有前端工程师、后端架构师、产品经理、增长黑客、UX 研究员……甚至还有「玩梗注入官」(Whimsy Injector)和「Reddit 社区忍者」😂
agency-agents 的核心理念很简单:每一个 Agent 都是一个精心设计的 Markdown 文件,里面定义了它的身份、个性、工作流程、交付物和成功标准。你只需要把这些文件塞给支持的 AI 工具,就能召唤出一个「知道自己在干什么」的专业角色。
更牛的是,你可以让多个 Agent 协作——比如让「产品经理 Agent」先做市场调研,再让「后端架构师 Agent」给出技术方案,最后让「前端工程师 Agent」写出代码。一套流程下来,简直像在指挥一个迷你创业团队!
目前项目包含 61 个 Agent 定义文件,分布在 9 个职能部门,原生支持 Claude Code、GitHub Copilot、Cursor、Aider、Gemini CLI 等主流 AI 工具。发布短短数天就积累了 35,000+ Stars,Reddit 和 X 上讨论度超高。
实用场景:
- 独立开发者可以「雇用」一整个 AI 团队来推进产品
- 需要快速出原型的创业公司,用它来做分工协作
- 想让 AI 有更专业、更个性化角色感的开发者
核心功能:
- 61 个专业 Agent,覆盖工程、设计、产品、运营、增长等 9 大职能
- 每个 Agent 有独特个性、专属工作流和可衡量的交付标准
- 多 Agent 协作模式,适合复杂多步骤任务
- MIT 协议,完全免费,商用无忧
- 支持所有主流 AI 编码工具,一套 Agent 多处复用
03 notebooklm-py
notebooklm-py —— Google NotebookLM 的非官方 Python API,把 NotebookLM 的隐藏技能全解锁!

用过 Google NotebookLM 的朋友都知道,它做读文献、生成播客摘要、自动问答这些事情真的很强。但有一个痛点:它没有官方 API,所有操作只能在网页上手动点。
然后,notebooklm-py 出现了!
这是一个非官方的 Python API 库,让你能用代码完全控制 NotebookLM——不只是它网页上能做的那些,还有网页 UI 根本没有暴露的隐藏功能。批量导入 URL、PDF、YouTube 视频、Google Drive 文件,自动生成音频、测验、闪卡、PPT、信息图……全部可以用一行 Python 代码搞定。
更香的是,它还支持直接和 Claude Code、OpenClaw 等 AI 代理集成,用自然语言告诉 AI「帮我把这 20 篇论文导入 NotebookLM,生成一份综述报告」,AI 自动调用 API 完成全流程。版本 0.3.3 于 2026 年 3 月 3 日发布,加入了 FastMCP 服务器支持,目前约有 5,000 Stars。
实用场景:
- 研究人员:批量处理文献,自动生成读书笔记和综述
- 内容创作者:把文章/视频素材批量入库,快速生成播客脚本
- 开发者:在 AI Agent 工作流中自动化调用 NotebookLM 的各种功能
核心功能:
- 完整的 Python API,支持所有 NotebookLM 功能(包括网页 UI 未开放的)
- 批量导入数据源:URL、PDF、YouTube、Google Drive 一网打尽
- 自动生成音频摘要、视频、测验、闪卡、PPT、思维导图、信息图
- CLI 工具,命令行直接使用,无需写代码
- 支持 MCP 服务器模式,可接入 AI Agent 工作流
- 兼容 Python 3.10+
04 promptfoo
promptfoo —— 专门给 AI 提示词「找茬」的红队测试神器,10k Stars 实力稳!

你有没有遇到过这种情况:精心写了一个提示词,感觉效果不错,上线后却发现 AI 在某些输入下乱说话,或者被人一顿「越狱」就崩了?
promptfoo 就是来解决这个问题的——它是一个专门用来测试、评估、红队攻击你的 AI 提示词和应用的开发工具。
简单说,你用 YAML 写好测试用例,描述「期望的输出行为」,然后 promptfoo 会帮你批量跑这些测试,生成结构化报告,告诉你哪些场景通过了、哪些挂了。支持 GPT、Claude、Gemini、Llama 等所有主流模型,可以同时跑多个模型做横向对比。
更厉害的是它的「红队模式」:能模拟 50+ 种攻击类型(越狱、提示注入、数据泄露等),自动扫描你的 AI 应用有没有安全漏洞。这功能对要上线 AI 产品的团队来说简直是救命稻草!目前 10,300 Stars,被 127 家 Fortune 500 企业使用,这战绩相当能打。

实用场景:
- AI 产品团队:上线前做完整的提示词质量测试和安全扫描
- LLM 开发者:对比不同模型在同一任务上的表现差异
- 安全研究员:对 AI 应用进行红队测试,发现潜在漏洞
核心功能:
- 声明式 YAML 配置,写好测试用例即可自动批量执行
- 支持 GPT、Claude、Gemini、Llama 等几十种 LLM 提供商
- 红队测试模式:自动模拟 50+ 种攻击类型,扫描 AI 安全漏洞
- 可视化 Web UI,直观查看测试报告和模型对比结果
- 支持 CI/CD 集成(GitHub Actions),把 AI 测试加入发布流水线
- MIT 开源,免费使用
总结
本周推荐的这 4 个项目,可以说把 AI Agent 的上下游都覆盖了。
- DeerFlow 适合需要「超级 Agent 完成复杂长任务」的开发者和研究者,字节出品质量有保障
- agency-agents 适合想让 AI 有「专业角色感」的独立开发者和创业团队,召唤即用,超级省事
- notebooklm-py 适合研究人员和内容创作者,把 NotebookLM 从网页工具变成可编程 API
- promptfoo 适合所有要做 AI 产品的团队,上线前别忘了用它跑一遍测试!
有需要的小伙伴赶紧去 Star ⭐ 收藏起来!