AI框架

NeuTTS Air – Neuphonic开源的语音合成模型

NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS(文本到语音)模型。具备高拟真语音合成能力,声音自然流畅,几乎能以假乱真。支持本地运行,提供 GGML 格式,兼容 CPU,可部署在手机、笔电或树莓派等设备上,无需联网即可使用。

Androidify – 谷歌开源的如何构建AI Android应用项目

Androidify 是谷歌推出的一个开源项目,帮助开发者学习如何在 Android 上构建 AI 驱动的应用。项目使用了谷歌最新的技术,如 Jetpack Compose、Gemini API(通过 Firebase AI Logic SDK)、CameraX 和 Navigation 3。

OpenAgents – 构建AI Agent网络的开源框架

OpenAgents 是用在构建AI Agent网络的开源框架,将Agent连接到网络实现开放式协作。框架通过创建持久化的Agent网络,让Agent能像人类一样长期在线、相互协作、共享知识,完成复杂任务。

Tinker API – Thinking Machines Lab推出的模型微调API

Tinker API 是 Thinking Machines Lab 发布的首款产品,专为语言模型微调而设计。简化语言模型的微调流程,让研究人员和开发者能专注于算法和数据,无需担心复杂的分布式训练基础设施。提供底层操作原语,如forward_backward和sample,让开发者能构建自定义微调或强化学习算法,支持从小到大的各类开放权重模型,切换模型仅需修改代码中的一个字符串。

LONGLIVE – 英伟达等推出的交互式长视频生成框架

LONGLIVE 是英伟达等顶尖机构联合推出的实时交互式长视频生成框架。框架通过帧级自回归(AR)模型,结合 KV-recache 机制、流式长视频微调和短窗口注意力 + 帧汇入技术,解决长视频生成中效率和质量的双重瓶颈。