AI项目
OpenJudge – 阿里云和通义开源的AI应用自动化评测框架
OpenJudge 是开源的 AI 应用评测框架,能解决从原型到生产环境的过渡难题。框架通过系统化的评测机制,帮助开发者量化评估 AI 应用的性能,确保其在复杂业务场景中的可靠性和稳定性。
D4RT – 谷歌推出的动态4D重建与追踪模型
D4RT(Dynamic 4D Reconstruction and Tracking)是谷歌 DeepMind 推出的动态 4D 重建模型。模型通过统一的「时空查询」接口,将 3D 重建、相机追踪和动态物体捕捉等任务整合,用全局场景表征和并行计算,实现高效处理。
FlowAct-R1 – 字节推出的实时交互数字人视频生成框架
FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,仅需单张参考图和音频,支持流式生成无限时长的全身动态视频。
Dokie – AI PPT生成工具,自动适配布局与设计
Dokie 是 AI PPT 生成工具,能根据用户输入的主题、文档或链接快速生成演示文稿。工具以内容为中心,自动适配布局与设计,每一页都精准表达用户意图。
Agentation – AI编程协作工具,可视化反馈问题转为代码
Agentation 是开源的AI编程协作工具,能解决开发者与 AI 编程助手之间沟通效率低下的问题。工具通过让用户直接在网页上标注问题,将视觉反馈转化为代码可读的信息,生成结构化的 Markdown 文本供 AI 使用。
AI学习搭子 – 智谱清言推出的AI学习辅助工具
AI学习搭子是智谱清言推出的智能学习辅助工具,专为提升学习效率和质量设计。工具通过AI技术将学习资料转化为易于消化的知识结构,简化复杂概念。AI学习搭子支持资料的智能解析,提供互动式学习体验,包括趣味知识卡片和AI讲解,学习过程更加生动和吸引人。
YouNews – AI信息资讯平台,定制专题追踪和信息解读
YouNews是一款帮助用户主动追踪信息的 AI工具。用户可以通过描述专题的方式,让系统自动持续追踪并整理和解读相关的信息,从而实现从「被动接收信息」到「系统跟踪进展」的转变。
Qwen3-TTS – 阿里通义开源的系列语音生成模型
Qwen3-TTS是Qwen开源的系列语音生成模型,具备强大的音色克隆、创造和语音控制能力。模型基于创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,实现高效语音压缩与高保真还原。
萝卜面试 – 快手推出的AI面试辅导平台
萝卜面试是快手推出的为求职者提供专业AI面试辅导的在线平台。平台依托于一线互联网大厂资深导师的丰富经验,通过模拟真实面试场景,帮助求职者提升面试技巧和自信心。
Being-H0.5 – 卢宗青团队开源的通用机器人模型
Being-H0.5 是卢宗青团队推出的通用机器人模型,能通过人类先验知识和统一的动作对齐,解决机器人在不同形态硬件间的策略迁移问题。
Devin Review – AI代码审查工具,自动检查和标记代码问题
Devin Review 是代码审查工具,支持将复杂的 GitHub 拉取请求(PR)转化为直观易懂的代码差异展示和精准的解释。通过智能算法,Devin Review能逻辑性地组织代码变更,帮助开发者快速把握关键信息。具备自动检测代码中的潜在问题和标记的功能,开发者能更高效地识别和处理问题。
LightOnOCR-2-1B – LightOnAI推出的OCR模型
LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型,参数量仅 1B,在复杂文档处理中表现卓越,擅长学术论文、数学公式和复杂表格的识别。
VibeVoice-ASR – 微软开源的长音频语音识别模型
VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统模型分段处理导致的上下文丢失。
Model1 – DeepSeek代码库更新的新模型版本
Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。
Chroma 1.0 – FlashLabs开源的实时端到端语音对话模型
Chroma 1.0 是FlashLabs首个开源的实时端到端语音对话模型,兼具低延迟交互、高保真个性化语音克隆和强对话能力。模型通过紧密耦合语音理解与生成,采用1:2文本-音频token调度策略,实现亚秒级延迟输出。
EmbodiChain – 跨维智能开源的具身智能学习平台
EmbodiChain 是跨维智能开源的具身智能学习平台,通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务,结合在线数据流和自我修复机制,高效生成高质量训练数据。核心模块包括生成式仿真、数据扩增、Sim2Real 转移等,支持从仿真到真实世界的无缝迁移。
json-render – Vercel开源的AI生成UI渲染可控方案
json-render是 Vercel 开源的项目,解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog,约束 AI 只能生成符合特定 Schema 的 JSON 数据,用前端组件库将 JSON 渲染为 UI。核心机制包括 Catalog 定义、流式渲染和反向生成源码,支持实时反馈和高效开发。
x-Algorithm – 马斯克开源的x平台推荐算法
x-Algorithm是马斯克开源的x平台推荐算法,为“为你”信息流提供个性化内容的核心系统。结合用户关注账号的帖子(In-Network)和通过机器学习检索的全球内容(Out-of-Network),利用基于Grok的Transformer模型进行综合排序。
塔塔疗愈所 – Soul推出的AI情绪服务应用
塔塔疗愈所是Soul推出的AI情绪服务小程序。应用通过塔罗占卜和趣味心理测试等功能,帮助用户更好地理解和管理自己的情绪。提供互动分享,让用户分享自己的情绪。适合想要提升自我认知和情绪健康的人群,是个人成长和心理健康教育工具。
PersonaPlex – 英伟达推出的全双工语音对语音AI模型
NVIDIA PersonaPlex 是英伟达推出的全双工对话AI模型,具备同时听和说的能力,能处理自然对话中的打断、停顿和回应。用户可通过语音和文本提示自定义角色和声音,让 AI 扮演从智慧助手到客服人员的多种角色。
粤公网安备 123456789号