AI项目

Trooly – AI Native用户研究平台,实时检测受访者情绪信号

Trooly(元生万物)是AI-Native用户研究平台,通过多模态Voice Agent技术提供AI主导的深度访谈服务。平台能以12倍于传统调研机构的速度,在24小时内完成从方案设计、精准用户招募到深度访谈执行的全流程,覆盖全球25个国家约1.8亿潜在受访者。

TripStar – 开源 AI 旅行规划工具,多智能体协作规划旅行

TripStar(旅途星辰)是基于HelloAgents框架的AI文旅智能体应用,通过LLM与多智能体协作解决旅行规划中的信息过载问题。

MiniMax Music 2.6 – MiniMax 推出的全新 AI 音乐生成模型

MiniMax Music 2.6是MiniMax推出的全新AI音乐生成模型,实现从底层架构到创作体验的全维进化。该版本将首包延迟压缩至20秒内,突破性解决"开盲盒"痛点,实现精准的BPM锁定、精细的段落结构控制与深度情绪表达。

FIPO – 阿里通义推出的强化学习算法

FIPO(Future-KL Influenced Policy Optimization)是阿里通义实验室推出的强化学习算法,通过Future-KL机制量化每个token对后续推理轨迹的影响力,实现token级精准信用分配,解决传统RL"奖罚平摊"导致的推理瓶颈。

claude-code-best-practice – 开源的Claude Code系统化使用指南

claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从"氛围编程"进阶到"智能体工程",收录 86+ 条实战技巧,涵盖 Agents、Commands、Skills、Hooks、MCP 等核心模块,对比 10+ 套主流开发工作流。

GO-2 – 智元机器人推出的具身智能基座大模型

GO-2(Genie Operator-2)是智元机器人推出的第二代具身智能基座大模型,能打通"理解-规划-执行"链路,弥合语义与动作间的鸿沟。模型首创"动作思维链"直接在动作空间推理规划,结合"异步双系统"架构实现低频规划与高频执行的稳定协同。

SBTI测试 – B站UP主推出的网络人格测试

SBTI测试是B站UP主「蛆肉儿串儿」推出的网络人格测试,用荒诞解构的方式重新诠释MBTI。测试包含31道题,输出27种戏谑人格标签如"死者""拿捏者""吗喽"等,精准戳中当代年轻人的自嘲与解压需求。

VimRAG – 阿里通义开源的全模态知识库 RAG 框架

VimRAG是阿里通义实验室开源的全模态RAG框架,支持图文视频混合知识库。框架创新采用多模态记忆图(DAG)替代线性上下文,将推理建模为动态有向无环图实现路径可回溯。

Octo – 即梦推出的 AI 原生动态叙事创作工具

Octo 是即梦推出的 AI 原生动态叙事创作工具,主打 "Vibe Create"(共感创作)理念。工具通过对话式交互与创作者深度协作,将 AI 从被动执行工具转变为创意合伙人。

HappyHorse – Artificial Analysis盲测榜首的AI视频生成模型

HappyHorse是空降Artificial Analysis视频生成盲测榜榜首的神秘AI模型,以1347分Elo积分断层领先Seedance 2.0,文生/图生视频双冠。

CutClaw – 湾大联合北交大开源的 AI 视频剪辑工具

CutClaw是大湾区大学GVC实验室与北交大团队开源的AI视频剪辑工具。工具采用多智能体架构,通过"音乐驱动"方式将几小时长视频自动剪辑成节奏精准的短片。

OmniVoice – 小米团队开源的多语言TTS模型

OmniVoice是小米 AI 实验室新一代 Kaldi 团队开源的超大规模多语言TTS模型,支持600+语种零样本语音克隆。模型采用极简非自回归扩散架构,结合全码本随机Mask与LLM初始化技术,实现40倍实时推理速度。

Muse Spark – Meta 推出的原生多模态大模型

Muse Spark是Meta超级智能实验室推出的首个原生多模态大模型。作为Meta AI重组后的旗舰产品,模型在Artificial Analysis基准测试中从18分跃升至52分,多模态理解与健康问答能力超越GPT-5.4。

Claude Managed Agents – Anthropic 推出的全托管 Agent 平台

Claude Managed Agents 是 Anthropic 推出的全托管 Agent 平台,通过 API 让开发者在云端构建、部署生产级 AI Agent。将"大脑"(Claude 控制器)与"双手"(沙箱执行环境)解耦,平台自动处理基础设施、安全沙箱、凭证管理和持久化存储。

MMX-CLI – MiniMax 推出的全模态命令行工具

MMX-CLI 是 MiniMax 专为 AI Agent 打造的全模态命令行工具,支持文本、图像、视频、语音、音乐生成及视觉理解等能力。Agent 可在 Claude Code、OpenClaw 等环境直接调用,无需编写 MCP Server。

ListenHub CLI – ListenHub 开源的AI内容创作命令行工具

ListenHub CLI是开源的AI内容创作命令行工具,基于Node.js,支持在终端一键生成音乐、播客、PPT、语音及AI绘画。工具支持本地文件上传、JSON输出和异步模式,方便脚本集成与自动化工作流。

QBotClaw – 腾讯推出的国内首个浏览器原生AI智能体

QBotClaw是腾讯推出的国内首个浏览器原生AI智能体,深度集成于QQ浏览器。用户无需下载安装,打开浏览器可通过自然语言指令让AI自动操控网页、跨软件执行任务,支持通过微信远程控制电脑。

Seeduplex – 字节跳动推出的原生全双工语音大模型

Seeduplex是字节跳动Seed团队推出的原生全双工语音大模型,实现"边听边说"的实时交互。模型能精准抗干扰(误打断率降50%)、动态判停(抢话率降40%),在嘈杂环境、多人对话等复杂场景下表现自然流畅。

LifeSim – 复旦与上海创智学院推出的长程用户生活模拟框架

LifeSim是复旦大学与上海创智学院推出的首个长程用户生活模拟框架,用于评测个性化AI助手。框架基于BDI认知模型,同时建模用户内部认知(信念、愿望、意图)与外部环境(时间、地点、天气),生成连贯的生活轨迹和多轮交互。

Claude Mythos – Anthropic推出的最新AI模型

Claude Mythos是Anthropic推出的最新AI模型,在编程、网络安全等领域性能远超前代Opus 4.6。模型能自主发现零日漏洞、构建复杂攻击链,曾表现出掩盖操作痕迹的"欺骗"行为。