AI项目
SceneGen – 上海交大推出的3D场景生成框架
SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发,通过一次前向传播,直接生成包含完整几何结构、纹理和空间布局的3D场景。创新之处在于端到端的生成流程,无需依赖耗时的优化过程或从资产库中检索组装,显著提升了生成效率。
Code2Video – 国立大学推出的AI教学视频生成框架
Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责将知识点转化为结构化故事板,Coder将故事板转为可执行Manim代码,Critic优化视觉布局。
Auralix – AI学习工具,语音互动讲解笔记内容
Auralix 是创新的 AI 语音辅导工具,通过实时语音互动帮助用户高效学习。工具支持将学习材料转化为清晰的笔记,通过 AI 教练进行一对一的语音辅导,支持打断提问、即时反馈和个性化测验。
UntitledPen – AI语音生成平台,自由选择定制声音
UntitledPen 是AI语音生成平台,能将文字快速转换为自然流畅的语音,支持多种语言和语音风格,提供智能写作、语音定制、音频编辑等功能。
Ming-UniAudio – 蚂蚁集团开源的音频多模态模型
Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语音分词器,能有效整合语义和声学特征。基于此,Ming-UniAudio 开发了一个端到端的语音语言模型,平衡了生成和理解能力,并通过扩散头确保高质量的语音合成。
Agent Kit – OpenAI推出的AI Agent开发工具
Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,支持拖拽节点设计复杂工作流,无需从零编写代码
TextWell – AI写作辅助工具,从不同角度进行优化
TextWell是AI写作辅助工具,能提升文档质量与吸引力,通过模拟AI评审团,从不同角度对文档进行批评和建议,帮助用户优化内容。
OpenLens AI – 清华推出的医学研究AI助手
OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流程自动化,极大提升医学研究效率,将科研周期从“月级”缩短至“小时级”。
ReceiptHero – 开源AI记账工具,拍照生成数字化账单
ReceiptHero 是开源的 AI 记账工具,能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术,用高达 95% 的准确率提取收据上的日期、金额、商户名称等关键信息,支持自动对支出进行智能分类,如餐饮、交通等。
Dreamer 4 – DeepMind推出的新型世界模型智能体
Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)游戏中,Dreamer 4 仅使用离线数据就成功获得了钻石,是该领域的一个重要突破。
Mano – 明略科技推出的GUI智能操作模型
Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2Web 和 OSWorld 两大基准测试中取得 SOTA 成绩。
SciToolAgent – 浙大开源知识图谱驱动的科学领域Agent
SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等多领域,可处理数据处理、分子建模、文献分析等任务。
xLLM – 京东开源的智能推理框架
xLLM 是京东开源的高效智能推理框架,专为国产芯片优化,支持端云一体部署。框架用服务-引擎分离架构,服务层负责请求调度与容错,引擎层专注运算优化,具备多流并行、图融合、动态负载均衡等特性。
在哪儿问问 – 滴滴推出的AI图寻应用
在哪儿问问是滴滴推出的AI图寻小程序,用户可通过上传照片,让AI识别照片中的地点,获取其大致位置。提供地点查找功能,能推荐相似地点及照片中的相关产品,兼具实用性和探索性。
Meta ARE – Meta推出的AI Agent动态环境评估平台
Meta ARE(Agents Research Environments)是Meta推出的用在训练和评估AI Agents的动态模拟研究平台。平台通过创建随时间演变的环境,模拟真实世界的复杂多步骤任务,要求Agents在新信息出现和条件变化时调整策略。
FireRedChat – 小红书推出的全双工语音交互系统
FireRedChat 是小红书智创音频团队开发的全双工语音交互系统,具有实时双向对话能力,支持可控打断功能。采用模块化设计,包括转录控制模块、交互模块和对话管理器等,支持级联和半级联架构,可灵活部署。
TRUEBench – 三星开源的AI性能基准测试工具
TRUEBench(Trustworthy Real-world Usage Evaluation Benchmark)是三星电子推出的 AI 基准测试工具,用在评估人工智能在实际工作场景中的生产力,解决现有AI基准测试的局限性,如主要以英语为中心、仅限于单轮问答结构等。
Tacore – AI编程工具,多Agent协同工作全流程
Tacore 是创新的 AI 编程工具,基于AI技术重塑数字服务开发流程,工具用多智能体(Agent)协同工作,实现从需求分析到 UI 设计、代码生成、测试和部署的全流程自动化。
AIMangaStudio – 开源AI漫画创作工具,实现一站式创作
AIMangaStudio是开源的AI漫画创作工具,为创作者提供了一套完整的漫画创作流水线,包括剧情生成、分镜设计、角色设定等功能,能简化从脚本到漫画页面的制作流程。
roomGPT官网体验入口 AI家居设计软件app免费下载地址
roomGPT是一款创新的AI技术产品,专为家居设计和房间改造而设计。它允许用户上传现有的房间照片,然后利用先进的AI技术生成多种风格的房间设计效果供用户选择。那么,你在哪里可以体验这项服务呢?下面就给大家带来roomGPT官网体验入口和免费app下载地址。点击前往roomGPT官网体验入口roomGPT使用控制网(ControlNet)机器学习模型,可以生成房间的不同变体,包括中式风格、欧式风格
粤公网安备 123456789号