LingBot-World – 蚂蚁灵波科技开源的交互式世界模型

LingBot-World 是蚂蚁灵波科技开源的交互式世界模型。模型通过可扩展数据引擎从大规模游戏环境学习物理规律与因果关系,实现动作驱动的精准生成。

Qwen3-ASR – 阿里通义开源的系列语音识别模型

Qwen3-ASR 是阿里云通义千问团队开源的系列语音识别模型,包含 1.7B 高精度版、0.6B 高效版两个 ASR 模型,以及专用的 Qwen3-ForcedAligner-0.6B 强制对齐模型。

SenseNova-MARS – 商汤科技开源的多模态自主推理模型

SenseNova-MARS是商汤科技开源的多模态自主推理模型,提供8B和32B两种参数规模。作为首个支持动态视觉推理与图文搜索深度融合的Agentic VLM,模型能像智能体一样自主规划任务步骤,灵活调用图像裁剪、文本搜索、图像搜索三大工具,无需人工干预可完成复杂的多跳推理。

SkyReels-V3 – 昆仑万维开源的多模态视频生成模型

SkyReels-V3是昆仑万维开源的多模态视频生成模型,用单一架构实现专业级视频创作。模型能将静态图像转化为动态影像,支持智能延长视频时长和电影级转场,让数字人音视频精准同步。

LongCat-Flash-Lite – 美团LongCat开源的大语言模型

LongCat-Flash-Lite是美团推出的新一代高效大语言模型。模型采用创新的混合专家(MoE)+ N元语法嵌入架构,总参数量达685亿,每次推理仅激活约29~45亿参数,兼顾强大的能力与极高的效率。

Mureka V8 – 昆仑万维推出的AI音乐模型

Mureka V8是昆仑万维推出的AI音乐大模型,基于MusiCoT(Music Chain-of-Thought)技术架构,实现从声音拼接到类人创作逻辑的跨越。

Zopia – AI短剧创作Agent,自然语言完成全链条制作

Zopia 是全流程AI短剧创作Agent,定位为"对话式AI影像工作室"。用户通过自然语言描述创意,系统可自动完成从剧本拆解、角色设计、分镜生成到视频成片的全链条制作,支持动漫、真人、3D等多种风格。

实测 Kimi K2.5 ,最接近Gemini 3 Pro 的国产开源模型

大模型时代,代码确实越来越廉价了。大数据每天都会推一堆 AI 生成的网页,看多了真的有点审美疲劳。这些网页总有一股浓浓的 AI 味,千篇一律的圆角卡片、卡片阴影、Tailwind 紫、 emoji 表情包...

MiniMax-M2-her – MiniMax推出的AI角色扮演模型

MiniMax-M2-her 是 MiniMax 专深度 AI 陪伴场景推出的角色扮演模型,是服务星野/Talkie 的底层模型。模型通过三大核心能力,独特的世界体验、有节奏的故事推进、精准的用户偏好理解,解决长对话中的角色崩坏、剧情重复等痛点。

MiniMax Music 2.5 – MiniMax推出的AI音乐创作模型

MiniMax Music 2.5是MiniMax推出的新一代AI音乐创作模型,在「段落级强控制」与「物理级高保真」两大技术难题上实现突破。模型支持14种音乐结构标签(如前奏、副歌、桥段等)的精准控制,让创作者能像专业编曲人一样设计情绪曲线。

DeepSpeed-MII – 微软DeepSpeed开源的模型推理库

DeepSpeed-MII 是 DeepSpeed 团队开源的 Python 库,提供高效模型推理。DeepSpeed-MII用阻塞 KV 缓存、连续批处理和动态 SplitFuse 等创新手段,显著提高推理吞吐量并降低延迟,在处理大型语言模型时表现出色。

Earth-2 – 英伟达开源的AI气象预测模型家族

NVIDIA Earth-2 是英伟达推出的全球首套完全开源的 AI 气象预测模型家族,基于 Atlas、StormScope、HealDA 三大核心架构,分别实现 15 天全球中期预报、0-6 小时公里级临近预报和秒级初始条件生成。

Prism – OpenAI推出的免费AI科研写作平台

Prism 是 OpenAI 推出的免费云端科研写作平台。平台以 LaTeX 为核心,深度集成 GPT-5.2 模型,为用户提供一体化的写作与协作环境。

Kimi Code – Kimi推出的AI编程工具

Kimi Code 是 Kimi推出的AI编程工具,可在终端(CLI)、VS Code 、 Cursor 、JetBrains 和 Zed 等主流编辑器中直接运行,支持图片和视频输入辅助编程。

Lucy 2 – Decart AI推出的实时视频生成模型

Lucy 2.0 是 Decart AI推出的实时世界转换模型,支持让高保真视频编辑从离线渲染跃升为可交互的实时体验。

inSai Hilight – AI营销视频Agent平台,多Agent深度协同

inSai Hilight是全球首个AI原生电商视频Multi-Agent平台。平台通过十余个AI Agent的深度协同,仅需输入商品链接即可生成可直投的完整营销视频。

Noema Lab 创作实验室 – AI歌词与音乐创作一站式服务平台

Noema Lab 创作实验室是专注于AI音乐创作的平台,提供从歌词生成到音乐制作的一站式服务。输入主题关键词,AI可自动生成结构完整、韵律优美的专业歌词。支持多种语言(如中文、英文、粤语等),并可自定义风格、情感和主题方向。

DeepSeek-OCR 2 – DeepSeek团队开源的二代OCR模型

DeepSeek-OCR 2 是 DeepSeek 团队推出的第二代 OCR 模型,通过引入 DeepEncoder V2 架构,实现从固定扫描到语义推理的范式转变。模型采用因果流查询和双流注意力机制,能动态重排视觉 Token,更精准地还原复杂文档的自然阅读逻辑。

LingBot-Depth – 蚂蚁灵波科技开源的空间感知模型

LingBot-Depth 是蚂蚁灵波科技开源的高精度空间感知模型,专为解决机器人在透明、反光物体(如玻璃)场景下的深度感知难题设计。

ViduQ2参考生Pro – Vidu推出的万物参考视频生成模型

Vidu Q2参考生Pro是全球首创的「万物可参考」视频模型,模型通过支持多模态输入(2个视频和4张图片),为创作者提供强大的功能。