Agent Kit – OpenAI推出的AI Agent开发工具

Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,支持拖拽节点设计复杂工作流,无需从零编写代码

TextWell – AI写作辅助工具,从不同角度进行优化

TextWell是AI写作辅助工具,能提升文档质量与吸引力,通过模拟AI评审团,从不同角度对文档进行批评和建议,帮助用户优化内容。

OpenLens AI – 清华推出的医学研究AI助手

OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流程自动化,极大提升医学研究效率,将科研周期从“月级”缩短至“小时级”。

ReceiptHero – 开源AI记账工具,拍照生成数字化账单

ReceiptHero 是开源的 AI 记账工具,能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术,用高达 95% 的准确率提取收据上的日期、金额、商户名称等关键信息,支持自动对支出进行智能分类,如餐饮、交通等。

Tinker API – Thinking Machines Lab推出的模型微调API

Tinker API 是 Thinking Machines Lab 发布的首款产品,专为语言模型微调而设计。简化语言模型的微调流程,让研究人员和开发者能专注于算法和数据,无需担心复杂的分布式训练基础设施。提供底层操作原语,如forward_backward和sample,让开发者能构建自定义微调或强化学习算法,支持从小到大的各类开放权重模型,切换模型仅需修改代码中的一个字符串。

LONGLIVE – 英伟达等推出的交互式长视频生成框架

LONGLIVE 是英伟达等顶尖机构联合推出的实时交互式长视频生成框架。框架通过帧级自回归(AR)模型,结合 KV-recache 机制、流式长视频微调和短窗口注意力 + 帧汇入技术,解决长视频生成中效率和质量的双重瓶颈。

怎么用飞书多维表格做自媒体内容工作流?一文看懂

如果让我只推荐一个真能让大多数人省事的工具,我会毫不犹豫说:飞书多维表格。这不是我一个人的偏爱。我身边不少做AI内容的朋友都在用,甚至像 DeepSeek、Kimi、MiniMax、阶跃这些大厂团队,也都把飞书多维表格当成日常的效率中枢。那这篇文章,我就来聊聊:飞书多维表格到底好用在哪,为什么一旦开始用就停不下来。

通义万相Wan2.5模型实测,可生成音画同步视频

2025云栖大会终于来啦!今年的主题是“云智一体•硅碳共生”,全球50多个国家的2000多位演讲嘉宾齐聚杭州,围绕Agentic AI与Physical AI等前沿话题展开对话,场面堪称一场科技春晚。今天上午倍受关注的还是阿里最新的大模型——通义万相 Wan2.5-Preview 系列模型。

Manus开源平替,AiPy本地部署免费用L5级Agent

直到最近,我发现了一个“本地版Manus”——AiPy,国内就可以直接免费用。不同的是,Manus 只能通过虚拟浏览器执行任务,比如发邮件、填写网页表单。而 AiPy 则是 L5 级 Agent,它不仅能理解你的目标,还能自己拆解步骤,用 Python 写代码,执行任务,再在出错时自我修正。整个过程中,你完全不用插手。

腾讯推出《企业级智能体产业落地研究报告》(PDF文件)

《企业级智能体产业落地研究报告》是腾讯云、腾讯研究院联合国际权威研究机构Gartner共同推出的,报告深入探讨企业级智能体的产业落地情况。

横评Kimi OK Computer、Manus、Lovable:厂商型Agent与第三方有何不同?

前几天,Kimi 静悄悄发了条推文,官宣 Kimi Agent 模式「OK Computer」开始小规模灰度测试。这次Kimi对它的定位是全栈白领,能搜索、规划、调用工具,用户负责提出想法,OK Computer负责产出报告、PPT、APP和网页。

如何用Nano Banana制作海马体写真照?

本文提供详细的用Nano Banana生成AI海马体写真制作指南,包括详细专业的提示词模板,讲解如何通过上传照片和修改提示词用AI工具生成海马体风格肖像照的具体方法和注意事项。

Sora2邀请码 – 怎么获取Sora 2邀请码?附免费领取方式

Sora 2 是 OpenAI 推出的新一代AI视频生成模型,被誉为视频领域的“GPT-3.5 时刻”。Sora 2 目前需要邀请码才能注册体验。每个用户注册成功后会生成1个邀请码,每个邀请码能被使用4次。

如何用Gemini将视频生成Blog文章?附提示词教程

本文是一份详细的创作指南,能帮助创作者将YouTube视频内容转化为深度博客文章。创作者需将复杂信息转化为启迪思想的内容,而非简单搬运文字。

Anthropic发布《AI Agent 上下文工程指南》

在人工智能应用领域,提示工程(prompt engineering)曾长期占据焦点地位,而如今一个新兴术语正逐渐崭露头角:语境工程(context engineering)‍。基于语言模型的构建工作,已不再局限于寻找完美的提示词句,而是转向回答更宏观的问题:“何种语境配置最有可能激发模型产生预期行为?”本文将探讨这一新兴的语境工程技术,并提供一套精炼的心智模型,用于构建可控且高效的人工智能体(ag

Sora2教程玩法合集,附20个热门视频提示词

OpenAI发布了最新的视频生成模型Sora 2。对比Sora 1,这次可谓是全方位的提升。画面更真实,声音和画面同步了,而且完全免费!国庆第一天,就看到了奥特曼的视频各种刷屏:整理了Sora 2 的热门玩法和提示词,带大家一起玩一玩~

Dreamer 4 – DeepMind推出的新型世界模型智能体

Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)游戏中,Dreamer 4 仅使用离线数据就成功获得了钻石,是该领域的一个重要突破。

Mano – 明略科技推出的GUI智能操作模型

Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2Web 和 OSWorld 两大基准测试中取得 SOTA 成绩。

SciToolAgent – 浙大开源知识图谱驱动的科学领域Agent

SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等多领域,可处理数据处理、分子建模、文献分析等任务。

xLLM – 京东开源的智能推理框架

xLLM 是京东开源的高效智能推理框架,专为国产芯片优化,支持端云一体部署。框架用服务-引擎分离架构,服务层负责请求调度与容错,引擎层专注运算优化,具备多流并行、图融合、动态负载均衡等特性。