camofox-browser – 开源 AI Agent 反检测浏览器
camofox-browser是什么
Camofox Browser 是开源 AI Agent 反检测浏览器服务器,基于 Camoufox(Firefox C++ 级指纹魔改版)构建。通过 REST API 为 AI 提供结构化网页快照(体积缩减 90%+),生成稳定元素引用(如 e1、e2)供 AI 直接交互。Camofox Browser内置 C++ 层指纹伪造,可绕过 Cloudflare 等主流反爬验证;支持 Cookie 导入、会话持久化及 15+ 搜索宏。

camofox-browse的主要功能
-
C++ 级反检测浏览: 底层基于 Camoufox 魔改 Firefox,在 C++ 实现层伪造硬件并发数、WebGL 渲染器、AudioContext、屏幕几何与 WebRTC 等指纹信息,JavaScript 层无法识破。
-
结构化网页快照: 将原始 HTML 提炼为带编号标签的 accessibility 快照(体积减少 90% 以上),AI 可直接通过
e1、e2等稳定引用与页面交互。 -
Cookie 导入与会话持久化: 支持导入 Netscape 格式 Cookie 文件实现免登录访问,用户会话的 Cookie 与 localStorage 自动持久化到本地,重启后保持登录状态。
-
搜索宏快捷指令: 内置 15+ 主流平台搜索宏(如
@google_search、@reddit_search、@youtube_search),一行命令直达目标页面,Reddit 宏直接返回 JSON 数据。 -
代理与 GeoIP 自动匹配: 支持住宅代理与 Backconnect 旋转代理,自动根据代理出口 IP 设置浏览器时区、语言与地理坐标,保持指纹一致性。
-
YouTube 字幕提取: 集成 yt-dlp 快速提取任意 YouTube 视频字幕,无需 API Key,支持多语言筛选。
-
VNC 可视化交互登录: 通过 noVNC 在浏览器中手动完成复杂网站的交互式登录,导出存储状态供后续 Agent 自动化复用。
-
会话追踪与调试: 支持按会话开启 Playwright 追踪,生成包含截图、DOM 快照与网络请求的
.zip文件,便于事后排查。 -
轻量部署与弹性伸缩: 空闲时内存占用约 40MB,支持 Docker、Fly.io、Railway 一键部署,浏览器引擎懒加载 + 空闲自动关闭。
camofox-browse的技术原理
-
C++ 层指纹欺骗: Camoufox 在 Firefox 源码层修改
navigator.hardwareConcurrency、WebGL 渲染字符串、AudioContext 指纹、屏幕分辨率与 WebRTC 等属性,反爬系统在 JS 执行前即收到伪造参数。 -
Accessibility Tree 快照: 用 Playwright 的 accessibility 树提取页面语义结构,生成带稳定引用的文本化快照,替代原始 DOM 传递给 LLM。
-
Playwright 浏览器上下文隔离: 每个用户对应独立的
BrowserContext,Cookie、localStorage、缓存完全隔离,避免会话串扰。 -
懒加载与空闲回收: 首次请求时启动 Camoufox 引擎(约 300MB),无活跃会话 5 分钟后自动关闭进程,降低常驻资源占用。
-
结构化 JSON 日志: 所有请求与响应输出单行 JSON 对象,包含
reqId便于分布式环境下的日志聚合与链路追踪。
如何使用camofox-browse
-
安装依赖: 执行
npm install @askjo/camofox-browser,首次安装会自动下载约 300MB 的 Camoufox 引擎。 -
本地启动: 克隆仓库后运行
npm install && npm start,服务默认监听http://localhost:9377。 -
配置访问密钥(生产环境): 生成 32 位十六进制密钥并设置环境变量
CAMOFOX_ACCESS_KEY,所有请求需携带Authorization: Bearer <key>。 -
导入 Cookie 实现免登录: 将浏览器导出的 Netscape 格式 Cookie 文件放入
~/.camofox/cookies/目录,通过 API 或 OpenClaw 插件调用导入工具注入会话。 -
创建标签页并获取快照: 向
/tabs发送 POST 请求创建标签页,再调用/tabs/:id/snapshot获取带e1、e2引用的结构化页面摘要。 -
执行页面交互: 通过
/tabs/:id/click或/tabs/:id/type传入元素引用编号与文本内容,实现点击与输入操作。 -
使用搜索宏导航: 调用
/tabs/:id/navigate并传入"macro": "@google_search"与"query": "关键词",直接获取搜索结果页。 -
Docker 部署: 在项目根目录执行
make up,Makefile 会自动检测 CPU 架构并预下载二进制文件,约 30 秒完成构建启动。
camofox-browse的核心优势
-
绕过主流反爬与验证码: 由于指纹在 C++ 层即被伪造,可稳定通过 Google、Cloudflare 等平台的 bot 检测,避免频繁触发人机验证。
-
Token 效率极高: 结构化快照比原始 HTML 缩减 90% 以上体积,大幅降低 LLM 上下文窗口占用与 API 调用成本。
-
元素引用稳定可靠: 页面布局微调后,
e1、e2等引用仍可通过 accessibility 树保持有效,减少 Agent 因 DOM 变化而操作失败的概率。 -
开箱即用的搜索能力: 15+ 搜索宏覆盖主流信息源,无需 Agent 自行构造搜索 URL 与解析页面,Reddit 等站点直接返回结构化 JSON。
-
生产级安全模型: Cookie 导入默认关闭(需
CAMOFOX_API_KEY),支持全局 Access Key 鉴权,路径遍历防护,所有敏感数据运行时注入,零硬编码密钥。
camofox-browse的项目地址
- GitHub仓库:https://github.com/jo-inc/camofox-browser
camofox-browse的同类竞品对比
| 维度 | Camofox Browser | Puppeteer / Playwright | Selenium WebDriver |
|---|---|---|---|
| 反检测能力 | C++ 层指纹伪造,原生绕过 Cloudflare 与 Google 验证 | 需额外安装 stealth 插件,插件本身可能成为新指纹 | 无原生反检测,需配合外部指纹浏览器或代理池 |
| AI 交互效率 | 结构化 accessibility 快照,体积缩减 90%+,带稳定元素引用 | 返回完整 HTML,需自行解析或截图给 AI 识别 | 返回完整 HTML,解析成本高,无原生元素编号机制 |
| 部署资源占用 | 空闲约 40MB,懒加载 + 自动关闭 | 常驻 Chromium 进程,内存占用较高 | 常驻浏览器实例,资源开销大 |
| Cookie/会话管理 | 内置 Netscape Cookie 导入、会话持久化与 VNC 交互登录 | 需手动编写 Cookie 注入与上下文管理代码 | 需手动配置 profile 与 Cookie 注入 |
| 搜索快捷指令 | 内置 15+ 平台搜索宏,Reddit 直接返回 JSON | 无内置搜索宏,需自行构造 URL 与解析逻辑 | 无内置搜索宏 |
| 代理集成 | 原生支持住宅代理与 Backconnect,自动同步时区/语言/坐标 | 需手动配置代理参数,无自动 GeoIP 匹配 | 需手动配置代理,无自动 GeoIP 匹配 |
| 适用场景 | AI Agent 反检测浏览、云端自动化、生产级数据采集 | 前端测试、通用网页自动化、爬虫开发 | 传统端到端测试、复杂企业级测试框架 |
camofox-browse的应用场景
-
AI Agent 网页自动化: 为基于 LLM 的智能体提供可编程浏览器后端,执行数据抓取、表单填写、信息检索等任务。
-
电商与竞品监控: 绕过平台反爬机制,自动化抓取商品价格、库存与评价信息,支持登录态下的账号级数据采集。
-
社交媒体自动化: 导入 Cookie 后自动运营 Twitter、LinkedIn、Instagram 等账号,执行内容发布、互动与数据分析。
-
学术与舆情研究: 用搜索宏快速检索 Google、Wikipedia、Reddit 信息,提取 YouTube 视频字幕进行内容分析。
-
云端自动化测试: 部署在 VPS 或容器环境中,作为无头浏览器服务支撑 CI/CD 流程中的端到端测试与网页监控。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。
粤公网安备 123456789号