AI项目
openPangu 2.0 – 华为开源的盘古大模型升级版
openPangu 2.0 是华为开源的盘古大模型重大升级版,提供最高 505B 参数的 Pro 版本与 92B 的 Flash 版本,模型统一搭载 512K 超长上下文,原生深度调优昇腾与麒麟芯片。
iArt.ai – AI动态图形生成工具,专注矢量动态图形
iArt.ai 是 AI 驱动的动态图形生成工具,定位为 Adobe After Effects 的零学习曲线替代方案。用户只需用自然语言描述创意、上传 Figma 设计或输入音频,AI 代理即可在 30 秒内自动完成布局、排版、动画、转场和节奏,生成广播级矢量动画。
SkillSpector – 英伟达开源的 AI Agent 技能安全扫描工具
SkillSpector 是 NVIDIA 开源的 AI Agent 技能安全扫描工具,能在安装 Claude Code、Codex CLI、Gemini CLI 等平台的技能之前自动检测漏洞、恶意模式及安全风险。
Kimi K2.7 Code – 月之暗面开源的新一代编程专用模型
Kimi K2.7 Code 是月之暗面(Moonshot AI)开源的新一代编程专用模型。相比 K2.6,在长上下文编程场景的指令遵循能力、长程任务性能上显著提升,改善了过度思考倾向,平均 token 消耗减少 30%。
SwarmFlow – openJiuwen 开源的多智能体工作流编排框架
SwarmFlow 是 openJiuwen 开源的多智能体可控工作流编排框架,将编排与智能分离,协作流程由系统稳定执行,推理判断交给 Agent 处理。
EvoQuality – 字节跳动开源的图像质量评估模型
EvoQuality 是字节跳动与香港城市大学联合推出的自进化视觉语言模型框架,专注于无参考图像质量评估。
Plazmapunk – AI 音乐视频生成器,视觉效果自动与音频同步
Plazmapunk 是专为音乐人打造的 AI 音乐视频生成器,由 Florian Woeste 和 Anton Wiehe 联合创立。用户只需上传音频文件,可在几分钟内生成与节拍完美同步的专业级视觉内容。
html-ppt-skill – 开源 AI PPT 生成 Skill,支持 HTML 文件
html-ppt-skill 是基于 HTML 的 AI 演示文稿 Skill,工具支持输出浏览器原生支持的 HTML 文件,内置 36 套主题、31 种布局、47 个动效和 15 套完整模板,Agent 通过自然语言可组合生成精致演示文稿。
HPC-Ops – 腾讯混元开源的工业级高性能大模型推理算子库
HPC-Ops是腾讯混元AI Infra团队开源的工业级高性能大模型推理算子库,覆盖Attention、MoE、GEMM、采样及通信融合等核心模块,原生支持BF16/FP8与混合精度。
Meoo CLI – 阿里秒悟 Meoo 推出的开源命令行工具
Meoo CLI 是阿里秒悟Meoo推出的开源命令行工具,定位为本地 AI 编程 Agent 与云端基础设施之间的连接入口。工具解决了本地 AI 编程助手,如 Claude Code、Codex、Cursor,生成项目后只能本地运行的痛点。
Tuanjie Cowork – Unity 中国推出的 AI Agent 编程智能体
Tuanjie Cowork 是 Unity 中国推出的面向 Unity引擎、团结引擎的专属 AI Agent 编程智能体。Tuanjie Cowork 基于引擎独家授权,围绕游戏项目代码结构、玩法逻辑和资源管线深度打造。
Hojo-ASR-V1 – Hojo 开源的自动语音识别模型
Hojo-ASR-V1 是初创团队 Hojo 开源的自动语音识别模型,采用Whisper 特征提取 + Qwen3-Omni 音频编码 + Conformer 适配 + Qwen3-4B 语言模型解码的架构。
Decitron – 中科闻歌推出的全球首个通用决策大模型
Decitron 是中科闻歌推出的 AI 多主体博弈推演平台,通过世界建模、多智能体模拟与决策求解技术,将复杂决策问题拆解为主体、变量、路径和触发条件,在沙盘观察舱中分阶段推演各方行动与反应,生成多条概率路径与学术级报告。
DiffusionGemma – 谷歌开源的实验性文本扩散模型
DiffusionGemma是 Google DeepMind推出的实验性开源文本扩散模型。模型基于 Gemma 4 架构与 Gemini Diffusion 研究成果构建,采用 26B MoE 设计,通过并行去噪 256-token 文本块,在单张 NVIDIA H100 上实现 1000+ tokens/秒的生成速度。
MiMo Code – 小米开源的终端 AI 编程助手
MiMo Code 是小米大模型团队推出的开源终端 AI 编程助手,基于 OpenCode 二次开发并采用 MIT 协议。MiMo Code内置限时免费的 MiMo-V2.5 多模态模型,同时支持 DeepSeek、Kimi、GLM 等第三方模型。
SpaceMind – 科大讯飞推出的智慧空间Agentic架构
SpaceMind是科大讯飞推出的智慧空间Agentic架构,将空间升级为具备感知、理解、记忆、决策与执行能力的L2.5阶段主动智能体。
Meshy 3D Agent – Meshy 推出的首个 3D 创作 AI Agent
Meshy 3D Agent 是 Meshy 推出全球首个 3D 创作 AI Agent,通过多轮对话将用户的模糊想法转化为可直接使用的 3D 资产。
Khala – 中央音乐学院联合清华开源的 AI 音乐模型
Khala 是中央音乐学院与清华大学联合推出的开源 AI 音乐大模型,面向高保真歌曲生成。模型采用 64 层深度声学 Token 层级结构,支持根据文本描述和歌词条件生成完整歌曲,在人声清晰度、乐器分离度与歌词节奏对齐方面达到开源第一梯队水准。
North Mini Code – Cohere 开源的 Agentic 编码模型
North Mini Code 是 Cohere 开源的 Agentic 编码模型。模型采用 MoE 架构,总参数 30B、激活仅 3B,支持 256K 上下文与 64K 输出。
QMuse – 蚂蚁集团推出的 AI 应用生成平台
QMuse 是蚂蚁集团(支付宝)推出的 AI 应用生成平台,定位为"懂你的 AI 创作助手"。平台以"让灵感触手可及,让需求极速上线"为核心理念,用户仅需通过自然语言描述一句话,可快速生成可运行的应用作品,实现从创意到产物的零门槛跨越。
粤公网安备 123456789号