AI项目

One-Eval – 北大开源的自动化大模型评测框架

One-Eval 是北京大学 OpenDCAI 团队开源的自动化 Agent 驱动大模型评测框架,基于 DataFlow 与 LangGraph 构建,主打 NL2Eval(自然语言转评测)能力。

Step Image Edit 2 – 阶跃星辰推出的图像生成编辑模型

Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型,参数量仅 3.5B,能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒,主打极速响应与高质量输出。

帧赞 – 智象未来推出的专业级AI影视创作与协作智能体

帧赞是智象未来推出的全球首个专业级AI影视创作与协作智能体,定位为"为专业团队而生的AI影视创作引擎"。平台依托自研多模态大模型,打通"剧本解析—分镜设计—画面生成—视频制作—AI粗剪—配音配乐"全流程,支持导演、分镜师、美术、剪辑师等多角色在线协同。

Agent Skills – 谷歌开源的 AI 编程 Agent 技能包

Agent Skills 是谷歌 Gemini 团队主管 Addy Osmani 开源的 AI 编程 Agent 技能包。Agent Skills 将 Google 资深工程师的工作流与工程规范封装为 20 个 Skill、7 个 Slash 命令和 3 个 Agent 人设,覆盖定义、规划、构建、验证、评审、发布六个开发阶段。

SenseNova U1 – 商汤日日新推出的原生统一多模态模型

SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间,开源Lite版包含8B-MoT稠密模型与A3B-MoE模型。

CodeBanana – 出门问问推出的 AI 项目管理与协作平台

CodeBanana 是出门问问推出的 AI 原生项目管理与协作开发系统,将即时沟通、Agent 执行与代码工作空间深度融合,定位为"Slack + Jira + GitHub + AI 编程模型"的一体化平台。

Tolaria – 开源本地AI笔记工具,融合 Notion 与 Obsidian

Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsidian 的本地数据主权理念,用纯 Markdown + YAML 文件存储笔记,内置 Git 版本控制,支持双向链接与 Type 分类视图。

TIPSv2 – 谷歌 DeepMind 开源的多模态模型

TIPSv2 是 Google DeepMind 推出的多模态模型,模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新,解决密集图像块与文本嵌入的精准对齐难题。

find-skill – Vercel Labs 推出的 Skill 搜索工具

find-skills 是 Vercel Labs 推出的「元 Skill」,属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills 包中,安装后可直接在 Cursor 等 AI 工具里通过自然语言搜索、发现并一键安装社区中的各类 Skill。

guizang-ppt-skill – 开源网页 PPT生成 Skill,输出 HTML

guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill,能将提示词转化为单文件 HTML 横向翻页PPT。

免费 AI 外观专利检索神器,跨境卖家必备刚需

跨境卖家必囤的免费外观专利检索神器来了!无门槛注册即可每日免费 5 次图片检索,告别单次 1 元付费查专利的高额成本,省钱又高效。月亮树跨境专属专利检索服务,真正把免费做到极致,牢牢守住跨境合规底线。只要做跨境电商,月亮树就是你的专属免费专利保镖!

StepAudio 2.5 ASR – 阶跃星辰推出的自动语音识别模型

StepAudio 2.5 ASR 是阶跃星辰推出的新一代自动语音识别模型,专为语音转写、会议纪要与长音频处理设计。模型采用 Audio Encoder + Linear Adapter + 4B LLM + MTP-5 架构,将多Token预测技术首次引入语音识别领域,实现500 TPS极速推理。

JVS Crew – 阿里云推出的企业级智能体构建平台

JVS Crew 是阿里云推出的企业级智能体构建平台,用"被集成"为核心理念,支持企业零代码将 AI Agent 能力快速嵌入现有 App、SaaS 或智能硬件。

GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统

GBrain 是 Y Combinator 总裁 Garry Tan 开源的个人生产级AI记忆系统,专为 OpenClaw、Hermes Agent 等 AI Agent 平台设计。工具把散落的 Markdown 笔记转化为可搜索、可推理、持续增长的知识图谱,让 Agent 拥有长期记忆。

DeepSeek-V4 – DeepSeek推出的新一代大语言模型系列

DeepSeek-V4是DeepSeek推出的新一代大语言模型系列预览版,拥有百万字超长上下文窗口,在Agent能力、世界知识与推理性能方面达到开源领域领先水平。

GPT-5.5 – OpenAI 推出的最新旗舰大模型

GPT-5.5 是 OpenAI 推出最新旗舰大模型,定位为迄今最智能、最直观的 AI 系统。模型在智能体编程、计算机使用、知识工作和科学研究四大领域实现显著跃升,Terminal-Bench 2.0 达 82.7%,SWE-Bench Pro 达 58.6%。

Hy3 preview – 腾讯混元开源快慢思考融合的混合专家模型

Hy3 preview 是腾讯混元开源的快慢思考融合的混合专家模型,定位为"迄今最智能的模型"。模型采用 MoE 架构,用21B激活参数实现295B总参数规模,兼顾性能与推理成本。

多维秒搭 – 专为飞书多维表格推出的 AI 搭建工具

多维秒搭是专为飞书多维表格推出的AI搭建工具,由前飞书团队创立,解决"业务需求模糊到数据结构落地"的核心痛点。

鼎楷智影 – 鼎楷科技推出的一站式AI全流程视频制作平台

鼎楷智影(DKAI-DV)是鼎楷科技推出的一站式AI全流程视频制作平台,定位"更懂创作人的AI工具"。平台覆盖从故事创意、剧本生成到视觉呈现的全链路创作流程,支持镜头、脚本、画面、场景、角色、物品的自定义控制与AI自动一体化生成

Seed3D 2.0 – 字节跳动推出的新一代 3D 生成大模型

Seed3D 2.0 是字节跳动推出的新一代 3D 生成大模型,围绕几何精度与纹理材质质量进行了系统性架构升级,推动 3D 生成从"可用"迈向"生产可用"。模型采用 MoE 架构与 Coarse-to-Fine 两阶段生成策略,在几何生成和 PBR 纹理材质生成两项核心指标上均达到行业 SOTA 水平。