第40页_最新AI项目_AI导航爱途网络

PersonaPlex – 英伟达推出的全双工语音对语音AI模型

NVIDIA PersonaPlex 是英伟达推出的全双工对话AI模型，具备同时听和说的能力，能处理自然对话中的打断、停顿和回应。用户可通过语音和文本提示自定义角色和声音，让 AI 扮演从智慧助手到客服人员的多种角色。

AI项目

2026-01-20

GLM-4.7-Flash – 智谱开源的混合思考模型

GLM-4.7-Flash 是智谱开源、免费的混合思考模型，具有300亿参数和30亿激活参数。模型在性能与效率上达到平衡，尤其在编程、中文写作、翻译等多场景表现出色，综合性能超越同类开源模型。

AI项目

2026-01-20

VerseCrafter – 复旦联合腾讯开源的动态真实视频世界模型

VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型，具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练，能处理复杂动态场景，保持强时空一致性。

AI项目

2026-01-19

AudioPod AI – AI音频处理工具，提供创作和编辑综合服务

AudioPod AI 是综合性的 AI 音频处理工具，专注于提升音频创作和编辑的效率与质量。具备强大的语音克隆功能，仅需5秒音频样本即可生成自然语音，支持多种语言和多说话者场景，广泛应用于播客、视频配音等领域。

AI项目

2026-01-19

NovaSR – 开源音频超分模型，能将低音质转换为高音质音频

NovaSR 是开源的音频超分辨率模型，仅有 52KB 能将 16kHz 的低采样率音频（如电话音质）提升到 48kHz 的高采样率音频（如录音室级音质）。模型通过神经网络预测并生成高频信息，实现音质的显著改善。

AI项目

2026-01-19

Playwriter – 开源AI浏览器自动化工具，人机协作无缝切换

Playwriter 是开源的 Chrome 插件，基于微软 Playwright 打造，专为 AI 操作浏览器设计。工具通过插件形式无缝接入 Chrome，将 AI 的能力直接嵌入用户的浏览器环境中，让 AI 能像人类一样直接操作网页。

AI项目

2026-01-19

FrogBoss – 微软开源的系列编程模型

FrogBoss 是微软研究院推出的系列编程模型。模型通过创新的复杂漏洞生成方法（BugPilot）进行训练，该方法通过让语言模型代理（LLM）在代码库中添加新功能来无意中引入漏洞，生成更具挑战性和多样性的训练数据。

AI项目

2026-01-18

Prompt Manager – 开源AI提示词管理工具，智能分类

Prompt Manager （PromptX）是高效管理 AI 提示词的工具，专为提升 AI 工作效率设计。工具支持个人提示词的创建、编辑、分类和版本管理。通过智能分类和全局搜索功能，用户能快速找到所需提示词。

AI项目

2026-01-18

OpenWork – 开源AI桌面工作流平台，Claude Cowork平替

OpenWork 是开源的桌面应用程序，为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建，提供简洁的引导式操作界面。

AI项目

2026-01-17

星火教师助手 – 科大讯飞推出的AI备课工具

星火教师助手是科大讯飞基于星火认知大模型推出的AI备课工具，能简化教师的备课流程，提升教学效率，为教师提供个性化的教学资源和设计支持。工

AI项目

2026-01-17

TranslateGemma – 谷歌开源的系列翻译模型

TranslateGemma 是谷歌推出的基于 Gemma 3 的新一代开源系列翻译模型。模型通过监督微调和强化学习相结合的方式，支持 55 种语言的高质量翻译，显著提升翻译准确性和效率。

AI项目

2026-01-16

FLUX.2 [klein] – Black Forest Labs开源的图像生成模型

FLUX.2 [klein] 是 Black Forest Labs 开源的高效图像生成与编辑模型。模型具备亚秒级推理速度，能在 0.5 秒内完成高质量图像生成和编辑，支持文生图、图生图及多参考生成。

AI项目

2026-01-16

上头蛙 – 腾讯推出的沉浸式AI互动剧情创作平台

上头蛙是腾讯推出的沉浸式互动剧情创作平台，以微信小程序形态向用户开放。平台通过拆解故事为多个分支，让用户在阅读时做出选择推动剧情发展，增强参与感。

AI项目

2026-01-16

国产Nano Banana开源平替，10个案例实测GLM-Image

智谱发布并开源了最新的多模态模型 GLM-Image，文字准确率 0.9116，是目前文本渲染准确率最高的开源模型。NED指标也同样顶级，对提示词的遵循度很高，错字、漏字情况更少。目前 GLM-Image 有3种体验方式，直接在 BigModel 在线体验或者调用 API，都是0.1元/张，且原生支持 1024*1024 到 2048*2048 任意尺寸的图像。

AI教程

2026-01-15

Moras – AI商业内容创作工具，高效实现电商变现

Moras 是全球首个全自动商业 Agentic AI 工具，能帮助达人和创作者实现内容电商的高效变现。工具主要面向 TikTok 上的创作者和个体商家，通过 AI 算法实现智能选品、自动化视频创作和数据分析，帮助用户快速生成带货视频和优化商业变现。

AI项目

2026-01-15

Step-Audio-R1.1 – 阶跃星辰开源的原生语音推理模型

Step-Audio-R1.1 是阶跃星辰推出的全球首个开源原生语音推理模型。模型以96.4%的准确率登顶全球权威语音推理榜单，超越众多一线模型。模型具备深度语音推理、实时响应和可扩展的链式思考能力，能在端到端处理语音时像人类一样实时思考。

AI项目

2026-01-15

AgentCPM-Explore – 清华联合面壁智能开源的智能体模型

AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数，在多个长程任务评测基准上超越同尺寸甚至更大模型，展现出极高的能力密度。

AI项目

2026-01-15

ArenaRL – 通义与高德开源的开放域对比式强化学习方法

ArenaRL 是通义 DeepResearch 团队联合高德开源的，面向开放域智能体的对比式强化学习方法。ArenaRL通过引入锦标赛机制，将传统的绝对打分转变为组内相对排序，用高效的种子单败淘汰赛拓扑结构。

AI项目

2026-01-15

Workus – AI销售Agent平台，精准识别定位高意向用户

Workus 是专注于 B2B 销售领域的智能平台，通过 AI 技术为企业提供高意向客户的开发与跟进服务。能深度理解企业的业务需求，自动读取官网、文档和客户画像，精准定位关键决策人，通过多渠道（如邮件、LinkedIn、WhatsApp）与潜在客户进行个性化沟通。

AI项目

2026-01-14

MedGemma 1.5 – 谷歌开源的多模态AI医疗模型

MedGemma 1.5 是谷歌开源的多模态AI医学模型，专为处理医学影像和文本数据设计。模型支持高维医学影像（如CT和MRI）、全切片病理影像、纵向影像分析、解剖定位、医学文档理解和电子健康记录（EHR）解读等功能。

AI项目

2026-01-14

AI导航 爱途网络

AI导航爱途网络