AI项目

Mavis – MiniMax Agent 推出的多 Agent 协作模式

Mavis 是 MiniMax Agent 推出的多 Agent 协作模式,用 MiniMax as a Jarvis 为命名理念。突破传统单 Agent 模式,构建 Leader 统筹、Worker 执行、Verifier 验收的三角色协作体系,通过 Team Engine 引擎驱动任务自动拆解、并发调度与对抗循环质检。

Lumen Flow – AI 漫剧自动生成平台,AI 剧本一键成片

Lumen Flow 是基于 Seedance 2.0 的端到端 AI 漫剧自动生产线,由字节系背景的 AI Native 团队推出。用户上传剧本,Agent 可自动完成分镜拆解、角色设计、场景生成、动态视频合成与配音,实现真正零门槛的一键成片。

如何用 AI 多智能体打造精品视频内容 – 附精选提示词

VibePaper 深度基于原生多模态多 Agent 与知识图谱处理能力,是一张可以发挥一切创造力的"像素画纸"。从剧本拆解到成片交付,通过对话与点击交互即可深度智能化实现精品内容的端到端创作。VibePaper 能覆盖全创作流程。

AGenUI – 高德联合阿里开源的原生 A2UI 框架

AGenUI 是高德地图联合阿里千问 C 端应用团队推出的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。

OpenMontage – 开源 AI Agentic 视频制作系统

OpenMontage 是全球首个开源的 Agentic 视频制作系统,由 AI 编程助手自主编排完成从概念到成片的全流程。

9Router – 开源 AI 编程路由代理工具,智能调度模型

9Router 是开源的 AI 编程路由代理工具,可将 Claude Code、Codex、Cursor、Cline 等主流 AI 编程工具统一接入本地代理层,智能调度 40+ 供应商与 100+ 模型。

Okara AI CMO – AI营销智能体系统,自动搞定全渠道获客

Okara AI CMO是新加坡Okara推出的AI营销智能体系统,输入网站URL即可自动部署SEO、GEO、Reddit、Hacker News等多Agent团队,7×24小时自动化执行增长任务。

ELF – 何恺明团队推出的首个扩散语言模型

ELF(Embedded Language Flows)是何恺明团队推出的首个扩散语言模型,采用连续扩散范式替代传统自回归路线。模型全程在连续 embedding 空间中去噪生成文本,在最后一步离散化为 token。

InsForge – 面向 AI 编程 Agent 的开源后端平台

InsForge 是面向 AI 编程 Agent 的开源后端平台。工具通过 MCP Server 和 CLI 接口,让 Cursor、Claude Code、Copilot 等 Agent 像后端工程师一样自主操作数据库、认证、存储、Edge Function、模型网关和部署,实现全栈开发端到端自动化,无需人工切换控制台配置。

Anijam – 寻酷科技推出的 AI 动画创作 Agent

Anijam是寻酷科技推出的AI动画创作Agent,定位视频版Cursor。用户通过自然语言对话可驱动Agent自动完成从故事大纲、角色设计、分镜拆解、关键帧生成到视频合成与配音的完整动画制作流程。

AudioLib – 开发者音频基础设施平台,单 API 调用海量音乐

AudioLib 是杨樾与 43Music 团队推出的音频版OpenRouter,将团队一年多创作的 10 万+首原创音乐用 API 形式开放给开发者。无需 SDK、播放器、版权谈判或曲库管理,一个 Key 和一个曲库名称,POST 请求可返回 CDN 音频直链。

Daybreak – OpenAI 推出的 AI 网络安全防御工具

Daybreak 是 OpenAI推出的 AI 网络安全防御工具,融合 OpenAI 大模型推理能力与 Codex 的 Agent 扩展框架,帮助防御者跨代码库发现隐蔽漏洞、验证修复方案、分析陌生系统,并安全审查、威胁建模、补丁验证、依赖风险分析等能力嵌入日常开发流程。

MiniCPM-V 4.6 – OpenBMB 开源的端侧多模态大模型

MiniCPM-V 4.6 是 OpenBMB 推出的端侧多模态大模型,LLM 参数量仅 1.3B,专为移动设备本地部署优化。模型基于 llama.cpp 框架实现,支持 iOS、Android、HarmonyOS NEXT 三大平台完全离线运行,模型体积约 1.6GB(Q4_K_M 量化),最低 6GB 内存可流畅运行。

AI Job Search – 开源 AI 求职框架,自动匹配与搜索职位

AI Job Search是基于Claude Code的开源AI求职框架,通过/setup建立详细职业档案,/scrape智能评估职位匹配度,/apply启动"起草-复审"双代理工作流,自动生成定制化的LaTeX简历与求职信。

HiDream-O1-Image – 智象未来开源的原生统一图像生成模型

HiDream-O1-Image 是智象未来开源的 8B 像素级原生统一图像生成模型,采用全球首创的 UiT 架构,无需 VAE 和独立文本编码器即可在单一 token 空间内直接生成 2048×2048 高清图像,在 GenEval、HPSv3 等六项基准测试中超越 FLUX.2、Qwen-Image 及 GPT Image 2。

camofox-browser – 开源 AI Agent 反检测浏览器

Camofox Browser 是开源 AI Agent 反检测浏览器服务器,基于 Camoufox(Firefox C++ 级指纹魔改版)构建。通过 REST API 为 AI 提供结构化网页快照(体积缩减 90%+),生成稳定元素引用(如 e1、e2)供 AI 直接交互。

agents-cli – 谷歌云智能体开源的官方命令行工具

Agents CLI 是谷歌云智能体平台推出的官方命令行工具,专为简化 AI Agent 全生命周期设计。工具将工程化知识打包为 7 个独立技能模块,覆盖从项目脚手架、ADK 开发、本地评估到 Cloud Run / GKE 部署及 Gemini Enterprise 发布的完整流程。

灵珠 – AI 应用创作平台,零门槛生成完成产品

灵珠是面向非程序员的零门槛AI应用创作平台。用户通过自然语言描述需求,系统可自动生成完整可用的产品。平台全面接入DeepSeek V4进行需求分析,采用多国产大模型协同完成代码生成,单日Token消耗已突破50亿。

MoMA – 中国移动推出的首个开放普惠大模型聚合平台

MoMA(Mobile Model Access)是中国移动推出的国内首个开放普惠大模型聚合平台,被誉为 AI 界的"模型超市"。平台一站式接入超 300 款主流国产大模型(DeepSeek、通义千问、文心一言、GLM、九天等),通过统一 API 与独创的智能路由技术,实现"一次接入、全域调用"。

OpenAI CLI – OpenAI 推出的命令行界面工具

OpenAI CLI 是 OpenAI 官方推出的命令行界面工具,由 Codex 团队开发者体验工程师 Jason Liu 主导推出。