MindDR 1.5 – 理想汽车推出的多智能体深度研究框架

MindDR 1.5 是理想汽车信息智能体团队推出的多智能体深度研究框架,用仅约 30B 参数规模在 DeepResearch Bench 取得 52.54 分,达到业界领先水平。

Hy-MT1.5-1.8B-1.25bit – 腾讯混元开源的手机端离线翻译模型

Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队推出的极致量化压缩版手机端离线翻译大模型。模型基于混元翻译大模型 Hy-MT1.5-1.8B(18亿参数)打造,通过创新的 Sherry 稀疏三值量化技术 将模型压缩至仅 440MB。

天狼星AI标书 – AI标书辅助平台,从解析到生成一站式解决

天狼星AI标书是湖南天狼星智能科技推出的智能投标辅助平台,专为投标人提供从招标文件解析到标书生成的一站式AI解决方案。产品融合DeepSeek、Kimi、豆包、文心一言等主流大模型与自研10W+标书训练模型,覆盖服务、工程、货物、监理、暗标等全场景类型。

星火X2-Flash – 科大讯飞推出的MoE架构大语言模型

星火X2-Flash是科大讯飞发布的MoE架构大语言模型,总参数30B,支持256K超长上下文,基于华为昇腾910B国产算力集群训练。

One-Eval – 北大开源的自动化大模型评测框架

One-Eval 是北京大学 OpenDCAI 团队开源的自动化 Agent 驱动大模型评测框架,基于 DataFlow 与 LangGraph 构建,主打 NL2Eval(自然语言转评测)能力。

Step Image Edit 2 – 阶跃星辰推出的图像生成编辑模型

Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型,参数量仅 3.5B,能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒,主打极速响应与高质量输出。

帧赞 – 智象未来推出的专业级AI影视创作与协作智能体

帧赞是智象未来推出的全球首个专业级AI影视创作与协作智能体,定位为"为专业团队而生的AI影视创作引擎"。平台依托自研多模态大模型,打通"剧本解析—分镜设计—画面生成—视频制作—AI粗剪—配音配乐"全流程,支持导演、分镜师、美术、剪辑师等多角色在线协同。

Agent Skills – 谷歌开源的 AI 编程 Agent 技能包

Agent Skills 是谷歌 Gemini 团队主管 Addy Osmani 开源的 AI 编程 Agent 技能包。Agent Skills 将 Google 资深工程师的工作流与工程规范封装为 20 个 Skill、7 个 Slash 命令和 3 个 Agent 人设,覆盖定义、规划、构建、验证、评审、发布六个开发阶段。

Nemotron 3 Nano Omni – 英伟达推出的多模态推理模型

Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列,是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构,将视觉、音频、文本感知统一至单一模型,替代传统的碎片化多模型堆栈,在文档智能、视频理解、音频理解等基准测试中达到领先水平。

SenseNova U1 – 商汤日日新推出的原生统一多模态模型

SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间,开源Lite版包含8B-MoT稠密模型与A3B-MoE模型。

CodeBanana – 出门问问推出的 AI 项目管理与协作平台

CodeBanana 是出门问问推出的 AI 原生项目管理与协作开发系统,将即时沟通、Agent 执行与代码工作空间深度融合,定位为"Slack + Jira + GitHub + AI 编程模型"的一体化平台。

EAPO – 阿里通义推出的全新强化学习框架

EAPO是阿里通义实验室推出的长文本推理强化学习框架,通过引入"证据奖励"机制,将监督信号从最终答案下沉到证据提取过程。

Tolaria – 开源本地AI笔记工具,融合 Notion 与 Obsidian

Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsidian 的本地数据主权理念,用纯 Markdown + YAML 文件存储笔记,内置 Git 版本控制,支持双向链接与 Type 分类视图。

TIPSv2 – 谷歌 DeepMind 开源的多模态模型

TIPSv2 是 Google DeepMind 推出的多模态模型,模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新,解决密集图像块与文本嵌入的精准对齐难题。

find-skill – Vercel Labs 推出的 Skill 搜索工具

find-skills 是 Vercel Labs 推出的「元 Skill」,属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills 包中,安装后可直接在 Cursor 等 AI 工具里通过自然语言搜索、发现并一键安装社区中的各类 Skill。

腾讯研究院推出《AI Coding 观察报告 2.0》

《丰饶之后:AI Coding 观察报告 2.0》是腾讯研究院推出的AI透镜系列深度研究报告,由曹士圯、余一、袁晓辉执笔,覆盖2025下半年至2026第一季度。

国产大模型Vibe Coding横评:DeepSeek V4和GLM-5.1实测对比

DeepSeek V4 系列模型预览版上线了,最明显的变化就是把 1M 上下文变成了 DeepSeek 所有官方服务的标配。

guizang-ppt-skill – 开源网页 PPT生成 Skill,输出 HTML

guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill,能将提示词转化为单文件 HTML 横向翻页PPT。

怎么用 AI 制作数据可视化大屏,爱图表一键生成

不知道大家有没有遇到这样的情况,手里有一堆数据,不知道如何呈现?

Lovart 上线 GPT Image 2 模型,会员首月不限量使用

最近Image2出圈了,网上梗图满天飞。苹果CEO库克前脚刚代言了华为。