AI项目
getdesign.md – VoltAgent 团队推出的 AI 原生设计系统库
getdesign.md 是 VoltAgent 团队推出的 AI 原生设计系统库与工具平台,核心提供 60+ 顶级品牌的 DESIGN.md 设计规范文件。基于 Google Stitch 提出的 DESIGN.md 概念,用纯 Markdown 编写的设计系统文档,相当于给 AI 的"视觉规范说明书"。
SenseNova-U1-8B-MoT-Infographic – 商汤科技开源的信息图增强模型
SenseNova-U1-8B-MoT-Infographic 是商汤科技开源的 8B 参数信息图增强模型,基于 SenseNova-U1-8B-MoT 统一架构,通过专项数据训练与 RL 强化学习,显著提升小字准确度、版式稳定性与图表正确性。可生成海报、图表、菜谱及 arXiv 风格论文页,视觉理解不退化。
阿里云百炼 CLI – 阿里云开源的 AI Agent 命令行工具
阿里云百炼CLI是阿里云开源的AI Agent命令行工具,专为智能体场景设计。开发者一行命令,可让Agent自动调用阿里云百炼平台150+多模态模型、10+应用及知识库、记忆、联网搜索等全套能力。
Guizang Social Card Skill – 歸藏开源的小红书图文优化Skill
Guizang Social Card Skill 是歸藏开源的适配 Claude Code / Codex 等 Agent 环境的图文卡片技能,能解决小红书(3:4 竖图)和公众号(21:9 + 1:1 封面)配图难题。
Wall-OSS-0.5 – 自变量机器人开源的国产具身智能模型
Wall-OSS-0.5是自变量机器人开源的国产具身智能模型,属于视觉-语言-动作(VLA)大模型,具备无需任务微调即可在真实机器人上部署的"零样本"能力。模型通过创新的Gradient-Bridge协同训练方法,将动作能力融入基础模型backbone
Cloud Agents – Qoder 推出的全托管 AI Agent 运行平台
Cloud Agents 是阿里 Qoder 推出的全托管 AI Agent 运行平台,提供 Agent 底座、模型服务及运行环境等全栈能力,企业可通过 API 直接调用。
PilotDeck – 清华联合面壁智能开源的 Agent 操作系统
PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以WorkSpace为核心设计范式,为每个项目建立独立的文件系统、记忆存储和技能集,实现多任务并行与物理隔离。
Qwen-Image-Bench – 通义千问推出的文生图模型评测基准
Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度评测各类文生图模型的生成效果,采用 Apache-2.0 协议开源。
Claude Opus 4.8 – Anthropic 推出的旗舰级大语言模型
Claude Opus 4.8 是 Anthropic 推出的旗舰级大语言模型,在 Opus 4.7 基础上提升判断力、诚实性和长时独立工作能力,在编程、智能体推理、多学科推理等基准测试中全面领先 GPT-5.5 和 Gemini 3.1 Pro。
Step 3.7 Flash – 阶跃星辰开源的新一代 Flash 模型
Step 3.7 Flash 是阶跃星辰面向 Agent 生产化阶段推出的新一代开源 Flash 模型,采用稀疏 MoE 架构,最高生成速度达 400 Tokens/s。
Hy-Memory – 腾讯混元推出的 Agent 记忆插件
Hy-Memory 是腾讯混元推出的专为 OpenClaw 等长期协作型 Agent 设计的记忆插件,通过 6 层记忆框架 × System1/System2 双系统 × 演化链三层架构,让 Agent 真正记得住、记得对、记得轻、更懂你。
Dynamic Workflows – Claude Code 推出的动态工作流
Dynamic Workflows 是 Claude Code 推出的动态工作流,目前处于研究预览阶段,支持 Claude 动态编写编排脚本,在单次会话中并行调度数十至数百个子 Agent 协同工作,自动拆分任务、验证结果并断点续跑。
FreeLLMAPI – 开源 AI 模型聚合平台,统一OpenAI兼容格式
FreeLLMAPI 是开源的 OpenAI 兼容代理服务,可将约 14 家 AI 服务商的免费额度聚合为单一 API 端点,每月总计约 13 亿 tokens 的免费推理额度。
Octask – 光魔科技推出的 AI 内容工作室平台
Octask 是深圳光魔科技(MagicLight 团队)推出的 AI 内容工作室平台。将 AI 能力具象化为可协作的数字员工,用户以"Boss"身份组建专属 AI 团队,在一个平台内完成选题研究、文案撰写、图片生成、视频策划、数据复盘等内容创作全流程。
Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型
Mega-ASR 是南洋理工大学(NTU)、新加坡国立大学(NUS)与上海人工智能实验室联合开源的全场景鲁棒语音识别基座模型,模型以 Qwen3-ASR 1.7B 为底层架构,针对真实世界中复杂声学环境(如噪音、远场、回声、遮挡、传输丢包等复合场景)下的语音识别难题,提出了可扩展的复合数据构建与渐进式声学到语义优化框架。
SenseNova-Skills – 商汤团队开源的模块化 AI 办公技能库
SenseNova-Skills 是 OpenSenseNova(商汤)团队开源的模块化 AI 办公技能库,专为 Agent 运行时设计。工具将信息图生成、PPT 制作、Excel 数据分析与深度研究四大办公能力拆解为独立技能,可直接集成到 OpenClaw、hermes-agent 等 Agent 框架中,
LLM Council – Karpathy 开源的多模型协作框架
LLM Council 是 Andrej Karpathy 开源的多模型协作框架,通过 OpenRouter 将用户问题同时分发给多个大模型(如 Claude、GPT、Gemini 等)独立作答,各模型匿名互评打分,最终由指定的 Chairman LLM 综合所有观点输出最优答案,实现多模型交叉验证与集体决策。
Confucius4 – 网易有道开源的多模态推理模型
Confucius4是网易有道AI团队基于Qwen3.5-27B架构推出的开源多模态大语言模型,专为高级数学推理场景设计。模型通过迭代SFT+RL训练范式、纯文本推理数据增强及精细化CoT优化,在同等规模模型中达到SOTA性能,同时实现推理链长度降低43.2%。
陪读蛙 – 开源的 AI 翻译浏览器扩展工具
陪读蛙(ReadFrog)是开源的 AI 沉浸式翻译浏览器扩展工具。工具能翻译和解读浏览器上的任何内容,支持Chrome、Edge、Firefox。通过上下文感知翻译、划词解析、TTS朗读等功能,帮助用户在真实网页中边读边学。
Stable Audio 3 – Stability AI 开源的音频生成模型系列
Stable Audio 3是Stability AI推出的新一代开源音频生成模型系列,基于流匹配潜空间扩散架构,支持文本转音乐与音效、音频编辑及续写。Stable Audio 3提供Small、Medium、Large多规格模型,Small版本可在MacBook Pro本地运行并生成最长2分钟音频,Medium与Large支持超过6分钟的高质量生成。
粤公网安备 123456789号