Veo 3.1 Lite – 谷歌推出的 AI 视频生成模型
Veo 3.1 Lite 是 Google 最新推出的AI视频生成模型,成本比 Veo 3.1 Fast 降低 50% 以上,同时保持同等生成速度。模型支持文本/图像生成视频,可灵活切换横竖屏(16:9/9:16)与 720p/1080p 分辨率,提供 4/6/8 秒三种时长选项。
Vision2Web – 清华联合智谱AI推出的视觉网站开发评估基准
Vision2Web是清华大学和智谱AI联合推出的视觉网站开发评估基准,用于评估多模态AI Agent的端到端建站能力。Vision2Web包含193个真实网站任务,分为三层递进难度:静态网页生成、交互式前端开发、全栈网站构建。
ColaMD – 开源 Markdown 编辑器,实时同步修改内容
ColaMD 是开源的 Markdown 编辑器。工具解决了传统编辑器在 AI 修改文件后需手动刷新才能看到更新的痛点,实现 Agent 后台修改与前台内容的实时同步,如同观看 AI 现场写作。
harrier-oss-v1 – 微软开源的多语言文本嵌入模型
harrier-oss-v1 是微软开源的多语言文本嵌入模型,在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构,通过最后 token 池化和 L2 归一化生成密集向量,适用检索、聚类、语义相似度、分类等任务。
LongCat-AudioDiT – 美团开源的文本转语音模型
LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音(TTS)模型,核心创新在于直接在波形潜空间进行扩散生成,非传统梅尔频谱等中间表示,有效避免误差累积并大幅简化流程。
wecom-cli – 企业微信官方开源的命令行工具
wecom-cli(企业微信 CLI) 是企业微信官方团队开源的命令行工具,让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文档、智能表格 7 大核心能力,提供 12 个开箱即用的 AI Agent Skills,适配主流 AI 工具。
办公场景下哪款 Claw 最好用?5 个智能体实测对比
今年的百虾大战可谓比当时接入 DeepSeek 还要盛况空前!各大厂都在办公场景中投入了大量资源,推出了自己的 OpenClaw 龙虾,引发全民养虾潮。
PixVerse V6 – 爱诗科技推出的最新 AI 视频生成模型
PixVerse V6 是爱诗科技推出的最新 AI 视频生成模型。模型在镜头控制、角色表现和多镜头音视频生成方面实现突破,运镜更精准,角色情绪跨帧连贯,物理交互更真实,生成时长最长可达 15s;支持单提示词生成带原生音频的多镜头短片,无需后期剪辑。
Pretext – 开源 AI 前端开发工具,解决中文字布局性能瓶颈
Pretext 是前 React 核心成员 Cheng Lou 开源的,纯 JavaScript/TypeScript 的多行文本测量与布局库,用于纯算术方式精确测量多行文本尺寸,完全绕过 DOM 重排。
Multi-Shot – Runway 推出的 AI 视频生成应用
Multi-Shot 是 Runway 推出的 AI 视频生成应用,支持实现"一键成片"。用户只需输入场景描述,系统自动拆解为最多5个连贯镜头,同步完成构图、运镜、对话、音效和剪辑,直接输出电影感短片。
Qwen3.5-Omni – 阿里通义推出的全模态大模型
Qwen3.5-Omni 是阿里通义实验室推出的全模态大模型,可同时理解文本、图像、音频及音视频输入。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,在215项音频/音视频任务中取得SOTA成绩,超越Gemini-3.1 Pro。
Pascal Editor – 开源 3D 建筑编辑工具,在浏览器直接运行
Pascal Editor 是基于 Web 的开源 3D 建筑编辑器,由 Claude 辅助开发。工具无需安装,浏览器可运行,采用 WebGPU 技术实现高性能渲染。
阿里国际Accio Work实测:电商版OpenClaw,一键自动化运营
最近,阿里国际在海外悄悄上线了一款堪称电商版 OpenClaw 的Agent——Accio Work,既有龙虾 7*24 小时自动化工作的通用能力,又特别擅长生意经营、电商领域。
GigaWorld-1 – 极佳视界开源的具身世界模型
GigaWorld-1 是极佳视界推出的具身世界模型,在 WorldArena 评测中登顶全球第一。模型采用 AC-WM(动作控制世界模型)架构,结合显式动作建模与可微分物理引擎,实现几何一致、物理准确的视频生成。
MicroCoder – 微软联合剑桥等推出的大模型训练优化框架
MicroCoder是微软亚洲研究院联合剑桥大学、普林斯顿大学推出的代码大模型训练优化项目,针对Qwen3等新一代模型训练瓶颈,从算法、数据、评估、经验四维度全面升级。
Mureka V9 – 昆仑万维推出的最新AI音乐模型
Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品,登顶Artificial Analysis人声和乐器双榜单全球第一。
KAT-Coder-Pro V2 – 快手KwaiKAT推出的旗舰级AI编程模型
KAT-Coder-Pro V2是快手KwaiKAT团队推出的旗舰级AI编程模型,专为Agentic Coding场景深度优化。模型原生兼容Claude Code、Cline、OpenClaw等10余种主流AI编码工具,具备强大的脚手架泛化能力与长链路任务执行稳定性。
移动云 MobileClaw – 中国移动推出的桌面级AI办公智能体
移动云 MobileClaw 是中国移动推出的桌面级 AI 办公智能体,深度兼容 OpenClaw 生态。主打"央企自研、安全合规",核心数据本地存储不上云。
Matrix-Game 3.0 – 昆仑万维推出的实时交互式世界模型
Matrix-Game 3.0 是昆仑万维(Skywork AI)推出的实时交互式世界模型,支持720p@40FPS实时生成。模型采用误差缓冲机制实现自校正,结合相机感知记忆检索确保长程一致性,可稳定生成长达数分钟的交互视频。
LibTV Star Video 2.0模型实测:10分钟生成高质量AI短剧
昨天发现 LibTV 悄悄上线了一个新的视频模型 Star Video 2.0,本来想随便测测效果就睡觉,结果半夜越玩越兴奋,直接给我整精神了!
粤公网安备 123456789号