AI项目
ReceiptHero – 开源AI记账工具,拍照生成数字化账单
ReceiptHero 是开源的 AI 记账工具,能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术,用高达 95% 的准确率提取收据上的日期、金额、商户名称等关键信息,支持自动对支出进行智能分类,如餐饮、交通等。
Dreamer 4 – DeepMind推出的新型世界模型智能体
Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)游戏中,Dreamer 4 仅使用离线数据就成功获得了钻石,是该领域的一个重要突破。
Mano – 明略科技推出的GUI智能操作模型
Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2Web 和 OSWorld 两大基准测试中取得 SOTA 成绩。
SciToolAgent – 浙大开源知识图谱驱动的科学领域Agent
SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等多领域,可处理数据处理、分子建模、文献分析等任务。
xLLM – 京东开源的智能推理框架
xLLM 是京东开源的高效智能推理框架,专为国产芯片优化,支持端云一体部署。框架用服务-引擎分离架构,服务层负责请求调度与容错,引擎层专注运算优化,具备多流并行、图融合、动态负载均衡等特性。
在哪儿问问 – 滴滴推出的AI图寻应用
在哪儿问问是滴滴推出的AI图寻小程序,用户可通过上传照片,让AI识别照片中的地点,获取其大致位置。提供地点查找功能,能推荐相似地点及照片中的相关产品,兼具实用性和探索性。
Meta ARE – Meta推出的AI Agent动态环境评估平台
Meta ARE(Agents Research Environments)是Meta推出的用在训练和评估AI Agents的动态模拟研究平台。平台通过创建随时间演变的环境,模拟真实世界的复杂多步骤任务,要求Agents在新信息出现和条件变化时调整策略。
FireRedChat – 小红书推出的全双工语音交互系统
FireRedChat 是小红书智创音频团队开发的全双工语音交互系统,具有实时双向对话能力,支持可控打断功能。采用模块化设计,包括转录控制模块、交互模块和对话管理器等,支持级联和半级联架构,可灵活部署。
TRUEBench – 三星开源的AI性能基准测试工具
TRUEBench(Trustworthy Real-world Usage Evaluation Benchmark)是三星电子推出的 AI 基准测试工具,用在评估人工智能在实际工作场景中的生产力,解决现有AI基准测试的局限性,如主要以英语为中心、仅限于单轮问答结构等。
Tacore – AI编程工具,多Agent协同工作全流程
Tacore 是创新的 AI 编程工具,基于AI技术重塑数字服务开发流程,工具用多智能体(Agent)协同工作,实现从需求分析到 UI 设计、代码生成、测试和部署的全流程自动化。
AIMangaStudio – 开源AI漫画创作工具,实现一站式创作
AIMangaStudio是开源的AI漫画创作工具,为创作者提供了一套完整的漫画创作流水线,包括剧情生成、分镜设计、角色设定等功能,能简化从脚本到漫画页面的制作流程。
roomGPT官网体验入口 AI家居设计软件app免费下载地址
roomGPT是一款创新的AI技术产品,专为家居设计和房间改造而设计。它允许用户上传现有的房间照片,然后利用先进的AI技术生成多种风格的房间设计效果供用户选择。那么,你在哪里可以体验这项服务呢?下面就给大家带来roomGPT官网体验入口和免费app下载地址。点击前往roomGPT官网体验入口roomGPT使用控制网(ControlNet)机器学习模型,可以生成房间的不同变体,包括中式风格、欧式风格
突破性AI方法WHAM:精确有效地预测视频中3D人体运动
在最新的研究中,卡内基梅隆大学(CMU)和马克斯·普朗克智能系统研究所的研究人员共同发布了一项名为WHAM(World-grounded Humans with Accurate Motion)的创新性AI方法。这一方法在精准性和效率方面实现了从视频中准确估计3D人体运动的突破。3D人体运动重建是一个复杂的过程,涉及准确捕捉和建模人体在三维空间中的运动。当处理由移动摄像机在现实世界环境中拍摄的视频
Imagen2官网体验入口 谷歌AI文生图软件app免费下载地址
Imagen2 是Google DeepMind开发的最先进的文本到图像扩散技术产品,可生成高品质、逼真的图像,与用户的文字提示紧密对齐。这款技术利用其训练数据的自然分布生成更逼真的图像,而不是采用预设的风格。开发者和Cloud客户可以通过Google Cloud Vertex AI上的Imagen API体验Imagen2 的强大功能。Google艺术与文化团队也在他们的「文化图标」实验中部署了
推开新时代PC的大门,英特尔全新“AI处理器”解析
此前在今年9月,我们三易生活曾经结合当时最新的架构资料,以及所拿到的一些独家内部数据,率先为大家“解析”了英特尔的最新一代移动处理器架构。当然,现在大家都已经知道,当时我们所“解析”的对象就是刚刚发布的第一代酷睿Ultra处理器的某个ES版本。不过平心而论,当时我们拿到的资料毕竟还比较早期,所以它尽管已经讲得十分详细,但距离最终上市的版本还是有着一些差距,这也就是为什么我们非常要关注2023年12
粤公网安备 123456789号