AI框架

InternSVG – 上海AI Lab推出的统一 SVG 建模套件

InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准,以及基于InternVL3-8B的统一多模态大模型。

JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型

JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与智能图像修改,具备多模态理解能力,可精准解析文本指令并对图像局部或整体进行编辑。

Qwen3.6-Plus – 阿里通义推出的原生视觉语言模型

Qwen3.6-Plus是阿里通义实验室推出的全新原生视觉语言模型,主打编码智能体能力跃升。模型默认支持100万token超长上下文,在SWE-bench、Terminal-Bench等代码修复与终端自动化基准测试中领先国内同尺寸模型。

Wan2.7-Image – 阿里通义推出的 AI 图像生成与编辑模型

Wan2.7-Image是通义实验室推出的AI图像生成与编辑模型,支持深度自定义人物形象(脸型、眼型、骨相等),告别千篇一律的「AI标准脸」,可精准生成4000+字符及中文简繁体、英日韩德法等多种语言内容,告别乱码困扰。

TeamClaw – AI Agent管理平台,智能拆解任务、分派协作

TeamClaw 是AI 员工团队管理平台,定位"一个人的 AI 办公室"。平台能让用户像招聘真实员工一样定义 AI 岗位(CEO、分析师等),角色秒级到岗;支持为 AI 安装专业技能,自动拆解任务并分派协作;可连接数据库、飞书、钉钉等业务系统,让 AI 真正落地到实际工作流。

Lightpanda – 开源的 AI 浏览器,兼容主流自动化框架

Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器,用 Zig 语言从零编写,不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16,执行速度快 9 倍,支持 JavaScript 执行并通过 CDP 协议兼容 Playwright、Puppeteer 等主流自动化框架。

Veo 3.1 Lite – 谷歌推出的 AI 视频生成模型

Veo 3.1 Lite 是 Google 最新推出的AI视频生成模型,成本比 Veo 3.1 Fast 降低 50% 以上,同时保持同等生成速度。模型支持文本/图像生成视频,可灵活切换横竖屏(16:9/9:16)与 720p/1080p 分辨率,提供 4/6/8 秒三种时长选项。

ColaMD – 开源 Markdown 编辑器,实时同步修改内容

ColaMD 是开源的 Markdown 编辑器。工具解决了传统编辑器在 AI 修改文件后需手动刷新才能看到更新的痛点,实现 Agent 后台修改与前台内容的实时同步,如同观看 AI 现场写作。

harrier-oss-v1 – 微软开源的多语言文本嵌入模型

harrier-oss-v1 是微软开源的多语言文本嵌入模型,在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构,通过最后 token 池化和 L2 归一化生成密集向量,适用检索、聚类、语义相似度、分类等任务。

LongCat-AudioDiT – 美团开源的文本转语音模型

LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音(TTS)模型,核心创新在于直接在波形潜空间进行扩散生成,非传统梅尔频谱等中间表示,有效避免误差累积并大幅简化流程。

wecom-cli – 企业微信官方开源的命令行工具

wecom-cli(企业微信 CLI) 是企业微信官方团队开源的命令行工具,让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文档、智能表格 7 大核心能力,提供 12 个开箱即用的 AI Agent Skills,适配主流 AI 工具。

Mureka V9 – 昆仑万维推出的最新AI音乐模型

Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品,登顶Artificial Analysis人声和乐器双榜单全球第一。

OpenCLI – 开源 AI 命令行工具,网站一键转为命令行接口

OpenCLI 是开源的命令行工具,能将任意网站和 Electron 桌面应用转化为命令行接口。工具通过 Chrome 浏览器扩展连接本地守护进程,复用用户已登录的账号权限,无需额外配置 API 密钥。

MiniMax Office Skills – 稀宇科技开源的生产级办公文档引擎

MiniMax Office Skills 是稀宇科技开源的一套生产级办公文档引擎。工具包含四个核心组件,MiniMax-docx(Word)、MiniMax-xlsx(Excel)、MiniMax-pdf(PDF)和 PPTX-generator(PPT)。

New API – 开源的AI大模型网关与资产管理系统

New API 是新一代 AI 网关与资产管理系统,作为 AI 基座平台,提供统一基础设施接入全球 30+ 主流 AI 服务(OpenAI、Claude、Gemini、DeepSeek 等)。

ChatClaw – 智麻开源的AI智能体,支持多平台接入

ChatClaw是智麻开源的AI智能体,30MB极小安装包支持macOS/Windows/Linux。工具内置本地知识库、技能市场、MCP扩展、长期记忆和计划任务,可接入钉钉、飞书、企微、QQ等10+通讯平台。

EdgeClaw – 面壁智能联合清华等开源的AI智能体框架

EdgeClaw 是面壁智能联合清华、OpenBMB 推出的开源 AI 智能体框架,主打端云协同、本地部署、安全可控。框架首创三层数据安全协议(S1/S2/S3),让公开信息上云、敏感数据脱敏、隐私内容锁死本地;搭配双轨记忆机制和 GuardAgent 协议,实现全流程数据管控。

NemoClaw – 英伟达开源的企业级AI Agent框架

NemoClaw是英伟达开源的企业级AI Agent框架。NemoClaw作为OpenClaw插件运行,通过OpenShell运行时提供安全沙箱和策略引擎,解决企业使用AI Agent的安全顾虑。

Mistral Small 4 – Mistral AI开源的多模态大模型

Mistral Small 4 是 Mistral AI 开源的多模态大模型,模型首次将推理(Magistral)、多模态(Pixtral)和智能体编码(Devstral)能力统一于单一架构,支持文本与图像输入,可通过 reasoning_effort 参数灵活切换快速响应与深度推理模式。

Leanstral – Mistral AI推出的首个开源AI代码智能体

Leanstral 是Mistral AI推出的首个开源AI代码智能体,专为Lean 4定理证明器设计。模型采用120B总参数/6B激活参数的稀疏架构,能自动生成形式化证明并验证代码正确性。