AI项目
塔塔疗愈所 – Soul推出的AI情绪服务应用
塔塔疗愈所是Soul推出的AI情绪服务小程序。应用通过塔罗占卜和趣味心理测试等功能,帮助用户更好地理解和管理自己的情绪。提供互动分享,让用户分享自己的情绪。适合想要提升自我认知和情绪健康的人群,是个人成长和心理健康教育工具。
PersonaPlex – 英伟达推出的全双工语音对语音AI模型
NVIDIA PersonaPlex 是英伟达推出的全双工对话AI模型,具备同时听和说的能力,能处理自然对话中的打断、停顿和回应。用户可通过语音和文本提示自定义角色和声音,让 AI 扮演从智慧助手到客服人员的多种角色。
GLM-4.7-Flash – 智谱开源的混合思考模型
GLM-4.7-Flash 是智谱开源、免费的混合思考模型,具有300亿参数和30亿激活参数。模型在性能与效率上达到平衡,尤其在编程、中文写作、翻译等多场景表现出色,综合性能超越同类开源模型。
VerseCrafter – 复旦联合腾讯开源的动态真实视频世界模型
VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型,具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练,能处理复杂动态场景,保持强时空一致性。
AudioPod AI – AI音频处理工具,提供创作和编辑综合服务
AudioPod AI 是综合性的 AI 音频处理工具,专注于提升音频创作和编辑的效率与质量。具备强大的语音克隆功能,仅需5秒音频样本即可生成自然语音,支持多种语言和多说话者场景,广泛应用于播客、视频配音等领域。
NovaSR – 开源音频超分模型,能将低音质转换为高音质音频
NovaSR 是开源的音频超分辨率模型,仅有 52KB 能将 16kHz 的低采样率音频(如电话音质)提升到 48kHz 的高采样率音频(如录音室级音质)。模型通过神经网络预测并生成高频信息,实现音质的显著改善。
Playwriter – 开源AI浏览器自动化工具,人机协作无缝切换
Playwriter 是开源的 Chrome 插件,基于微软 Playwright 打造,专为 AI 操作浏览器设计。工具通过插件形式无缝接入 Chrome,将 AI 的能力直接嵌入用户的浏览器环境中,让 AI 能像人类一样直接操作网页。
FrogBoss – 微软开源的系列编程模型
FrogBoss 是微软研究院推出的系列编程模型。模型通过创新的复杂漏洞生成方法(BugPilot)进行训练,该方法通过让语言模型代理(LLM)在代码库中添加新功能来无意中引入漏洞,生成更具挑战性和多样性的训练数据。
Prompt Manager – 开源AI提示词管理工具,智能分类
Prompt Manager (PromptX)是高效管理 AI 提示词的工具,专为提升 AI 工作效率设计。工具支持个人提示词的创建、编辑、分类和版本管理。通过智能分类和全局搜索功能,用户能快速找到所需提示词。
OpenWork – 开源AI桌面工作流平台,Claude Cowork平替
OpenWork 是开源的桌面应用程序,为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建,提供简洁的引导式操作界面。
星火教师助手 – 科大讯飞推出的AI备课工具
星火教师助手是科大讯飞基于星火认知大模型推出的AI备课工具,能简化教师的备课流程,提升教学效率,为教师提供个性化的教学资源和设计支持。工
TranslateGemma – 谷歌开源的系列翻译模型
TranslateGemma 是谷歌推出的基于 Gemma 3 的新一代开源系列翻译模型。模型通过监督微调和强化学习相结合的方式,支持 55 种语言的高质量翻译,显著提升翻译准确性和效率。
FLUX.2 [klein] – Black Forest Labs开源的图像生成模型
FLUX.2 [klein] 是 Black Forest Labs 开源的高效图像生成与编辑模型。模型具备亚秒级推理速度,能在 0.5 秒内完成高质量图像生成和编辑,支持文生图、图生图及多参考生成。
上头蛙 – 腾讯推出的沉浸式AI互动剧情创作平台
上头蛙是腾讯推出的沉浸式互动剧情创作平台,以微信小程序形态向用户开放。平台通过拆解故事为多个分支,让用户在阅读时做出选择推动剧情发展,增强参与感。
Moras – AI商业内容创作工具,高效实现电商变现
Moras 是全球首个全自动商业 Agentic AI 工具,能帮助达人和创作者实现内容电商的高效变现。工具主要面向 TikTok 上的创作者和个体商家,通过 AI 算法实现智能选品、自动化视频创作和数据分析,帮助用户快速生成带货视频和优化商业变现。
Step-Audio-R1.1 – 阶跃星辰开源的原生语音推理模型
Step-Audio-R1.1 是阶跃星辰推出的全球首个开源原生语音推理模型。模型以96.4%的准确率登顶全球权威语音推理榜单,超越众多一线模型。模型具备深度语音推理、实时响应和可扩展的链式思考能力,能在端到端处理语音时像人类一样实时思考。
AgentCPM-Explore – 清华联合面壁智能开源的智能体模型
AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数,在多个长程任务评测基准上超越同尺寸甚至更大模型,展现出极高的能力密度。
ArenaRL – 通义与高德开源的开放域对比式强化学习方法
ArenaRL 是通义 DeepResearch 团队联合高德开源的,面向开放域智能体的对比式强化学习方法。ArenaRL通过引入锦标赛机制,将传统的绝对打分转变为组内相对排序,用高效的种子单败淘汰赛拓扑结构。
Workus – AI销售Agent平台,精准识别定位高意向用户
Workus 是专注于 B2B 销售领域的智能平台,通过 AI 技术为企业提供高意向客户的开发与跟进服务。能深度理解企业的业务需求,自动读取官网、文档和客户画像,精准定位关键决策人,通过多渠道(如邮件、LinkedIn、WhatsApp)与潜在客户进行个性化沟通。
MedGemma 1.5 – 谷歌开源的多模态AI医疗模型
MedGemma 1.5 是谷歌开源的多模态AI医学模型,专为处理医学影像和文本数据设计。模型支持高维医学影像(如CT和MRI)、全切片病理影像、纵向影像分析、解剖定位、医学文档理解和电子健康记录(EHR)解读等功能。
粤公网安备 123456789号