DataClaw – 开源AI对话数据导出工具,一键转为标准训练集

DataClaw 是开发者Peter O'Malle开源的AI对话数据导出工具。能自动抓取用户与Claude Code、Codex CLI、Gemini CLI等AI编程助手的完整对话历史,将其转换为结构化的JSONL训练数据集,支持一键发布到Hugging Face平台供社区使用。

MeowTXT – AI音视频转文字工具,智能说话人识别

MeowTXT 是在线 AI 音视频转文字工具,主打极速、精准的转录体验。用户只需拖拽上传 MP3、MP4、WAV 等文件,或直接粘贴 YouTube 链接,可在数分钟内获得文字稿。其 AI 引擎以 40 倍实时速度处理内容,准确率高达 97.5%,新用户可免费体验前 10 分钟。

TinyClaw – TinyAGI开源的轻量级多智能体协作框架

TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架,专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent(如 @coder、@writer),智能体间可通过链式执行和扇出模式协作完成任务。

OpenFang – 开源AI Agent操作系统,自动执行完整工作流

OpenFang 是用 Rust 构建的开源 Agent 操作系统,核心创新是 Hands——7 个预置的自主能力包,让 AI 无需人工触发可 7×24 小时自动执行任务(如监控竞品、挖掘客户、剪辑视频)。

Transcript LOL – AI音视频转录工具,智能区分说话人

Transcript LOL 是面向专业人士的 AI 音视频转录工具,已服务全球 10 万+用户。基于 OpenAI Whisper 技术,可在数秒内将音频或视频高精度转为文字,支持 70+ 语言、单次长达 10 小时的文件处理。

水产市场 – AI Agent能力进化平台,涵盖多种实用技能

水产市场(Seafood Market)是为 OpenClaw 构建的 AI Agent 生态平台。平台汇聚了 700+ 技能资产,涵盖 SEO 优化、PPT 生成、周报撰写、多源新闻聚合等实用能力,Agent 可通过一行命令自主安装学习。

AngelSlim – 腾讯混元开源的全模态大模型压缩工具包

AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音模型提供高效、易用的压缩与加速解决方案。

OpenMusic AI – AI音乐生成平台,一站式完成从创作到发行

OpenMusic AI 是一站式 AI 音乐生成平台,专为 YouTube、Spotify 和 TikTok 等主流平台创作免版税音乐而设计。用户只需描述想要的音乐风格、选择情绪,AI 可在 60 秒内生成最长 8 分钟的完整歌曲,可直接用于商业发布。

万镜一刻 – 阿里云推出的AI视频创作工具

万镜一刻是阿里云推出的AI视频创作工具,以"万镜生辉·一刻成片"为核心理念,为不同需求的创作者提供从内容解析到故事板生成的一站式解决方案。产品目前处于内测阶段,核心功能包括故事板创作、主体创作、在线剪辑和资产管理四大模块,覆盖从剧本生成到后期处理的全流程闭环。

SkyReels V4 – 昆仑万维推出的AI多模态视频基础模型

SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成1080p/32FPS/15秒影院级同步音视频。

Arrow 1.0 – Quiver AI推出的SVG原生AI生成模型

Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同,模型能直接输出可缩放矢量图形代码,图像基于数学公式构建,支持无限放大而不失真。

pplx-embed – Perplexity推出的系列文本嵌入模型

pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。

LiblibAI视频特效教程 – 不用写提示词,0基础复刻电影级特效

AI 发展的太快了,2 年前的 AI 生成的图像、视频各种扭曲、鬼畜,一眼假,而现在,不仅画面真假难辨,还可以直接生成完整的有运镜、有特效的视频。

华为云码道 – 华为云推出的AI编程工具

华为云码道(CodeArts)是华为云推出的AI编程工具,深度融合IDE、自主开发模式与代码大模型,支持GLM-5.0、DeepSeek-V3.2及鸿蒙专属模型,提供项目级代码生成、智能续写、单元测试生成等功能。

LocoOperator-4B – LocoreMind开源的代码探索智能体模型

LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体,基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code 等编程助手的本地子智能体,专门处理代码库搜索、文件读取、目录遍历等探索任务,实现零 API 成本。

Nano Banana 2 – 谷歌推出的新一代图像生成模型

Nano Banana 2 是 Google DeepMind 推出的新一代图像生成模型(Gemini 3.1 Flash Image)。模型接入 Gemini 知识库和实时网络搜索,可精准绘制真实场景、生成多语言文字,支持单次生成保持 5 个角色或 14 个物品的一致性。

Imagine – AI全栈应用开发工具,自然语言生成完整应用

Imagine 是 AI 全栈应用开发工具,能直接生成包含后端、数据库、身份验证的生产级应用。用户无需繁琐的环境配置,通过自然语言描述可快速构建 SaaS 平台、CRM 仪表盘、游戏或着陆页等产品。

MoodMax – 一站式AI漫剧创作平台,自动拆解分镜脚本

MoodMax 是一站式AI漫剧创作平台,是为创作者和工作室打造工业级漫剧生产工作台。用户无需绘画基础,通过智能剧本创作、自动分镜拆解、短片合成三步即可完成专业漫剧制作。

Ctrl-World – 清华联合斯坦福推出的具身世界模型

Ctrl-World 是清华陈建宇与斯坦福 Chelsea Finn 团队联合推出的具身世界模型,在 WorldArena 权威评测中斩获具身任务能力全球第一、视频生成质量全球第二。

Talksign-1 – Talksign推出的AI实时美式手语翻译模型

Talksign-1是专为美式手语(ASL)设计的AI实时翻译模型,支持双向转换,能通过摄像头捕捉3D人体关键点识别250个ASL词汇,或将语音/文字转为手语视频。