LibTV Star Video 2.0模型实测:10分钟生成高质量AI短剧
昨天发现 LibTV 悄悄上线了一个新的视频模型 Star Video 2.0,本来想随便测测效果就睡觉,结果半夜越玩越兴奋,直接给我整精神了!
Lark CLI – 飞书开源的命令行工具,让Agent直接操作飞书
Lark CLI 是飞书开源的命令行工具,专为 AI Agent 设计,让 Claude Code、Codex 等 AI 助手能直接操作飞书。
AnyClaw – 专为 AI Agent 设计的开源智能转接头
AnyClaw 是专为 AI Agent 设计的开源智能转接头,扮演"Agent 互联网与传统互联网的连接器"角色。能将传统互联网分散的 API、脚本、网页自动化工作流等工具,转换成 Agent 可直接调用的 MCP、Skills 或 CLI 格式。
Star Office UI – 开源 AI 可视化看板,Agent实时工作状态
Star Office UI 是开源的像素风格的 AI 可视化状态看板,支持将 AI 助手的工作状态实时可视化。Star Office UI 支持 6 种状态映射到不同办公区域,配备昨日工作记录、多 Agent 协作、AI 生图装修等功能。
FeelFish 3.0 发布 – 小说创作,正式迈入多智能体时代
当 AI 还在以「单智能体问答」的方式帮你改一句台词时,FeelFish 已经在思考一个更宏大的问题:如果每一个创作环节都有一位专属的 AI 专家坐镇,写作会变成什么样?今天,答案来了。FeelFish 3.0 基于业内最前沿的 MCP、多智能体协作与可复用技能(Skill)体系,带来的不只是功能更新——是一次创作范式的跃迁,让「智能体协作写作」从概念走进每一位作者的桌面。
商汤输入法AudioClaw – 商汤科技推出的 AI 语音输入工具
商汤输入法AudioClaw是商汤科技基于日日新多模态大模型推出的智能语音输入工具。工具集语音转文字、智能润色、即时翻译、口语净化、AI会议助手于一体,支持毫秒级精准识别与多语种方言互译。
SenseAudio – 商汤科技推出的 AI 语音开放平台
SenseAudio 是商汤科技推出的 AI 语音开放平台,主打"自然好听、富有情绪的 AI 语音"。平台集成 70+ 精品音色,提供文本转语音、声音克隆(3秒素材即可复刻)、人声提取、语音识别(支持 20+ 语言)等核心能力,同时涵盖 AI 音视频创作、虚拟角色对话、智能语音输入法等功能。
SciClaw – AI 科研 Agent,支持自主运行实验
SciClaw是专为科研领域打造的AI Agent产品,定位为"科研龙虾"和"AI同事"。产品能自动完成文献调研、实验设计、数据分析和论文撰写,支持自主运行耗时实验、生成审稿回复、复现顶刊研究。
Voxtral TTS – Mistral AI开源的文本转语音模型
Voxtral TTS 是 Mistral AI开源的文本转语音模型,基于 40 亿参数架构,支持 9 种语言。模型具备 90 毫秒超低延迟和 6 倍实时生成速度,仅需 3-5 秒音频可实现零样本语音克隆。
MOCR – 小红书联合华中科技推出的多模态文档解析模型
MOCR(Multimodal OCR)是华中科技大学与小红书hi lab联合推出的多模态文档解析模型,仅3B参数在文档解析和图形重建上实现突破性表现。
Sand.ai – AI视频生成平台,一键直出完整视频
Sand.ai(北京三呆科技)是AI视频生成平台。平台专注自回归世界模型技术路线,现已开源150亿参数音视频模型daVinci-MagiHuman、分布式训练组件MagiAttention及编译框架MagiCompiler。
Suno v5.5 – Suno推出的 AI 音乐生成模型
Suno V5.5 是Suno推出的 AI 音乐生成模型,标志着从"生成即完成"向"精细化制作"的重大转型。模型新增 Voices 声音定制、Custom Models 自定义模型和 My Taste 个性化推荐三大功能。
Gemini 3.1 Flash Live – 谷歌推出的实时语音模型
Gemini 3.1 Flash Live是Google最新推出的高质量实时语音模型,专为自然流畅的对话交互设计。模型在语调理解、推理能力和响应速度上均有显著提升,能精准识别音高、语速等声学细节,动态响应用户情绪变化。
daVinci-MagiHuman – Sand.ai等开源的音视频生成模型
daVinci-MagiHuman 是上海创智学院 GAIR 实验室与 Sand.ai 联合开源的音视频联合生成基座模型。模型采用 150 亿参数的单流 Transformer 架构,统一建模文本、视频、音频三种模态,无需跨注意力机制。
LongCat-Next – 美团 LongCat 推出的多模态模型
LongCat-Next是美团LongCat推出的多模态模型,核心创新是LoZA稀疏注意力机制。模型通过智能筛查模块重要性,将50%低重要模块替换为流式稀疏注意力,形成全局与局部交错的ZigZag结构。
SClaw – 超算互联网推出的科研专属 AI Agent
SClaw 是超算互联网推出的科研专属 AI Agent(智能体),是基于 OpenClaw 打造、深度集成于 SCNet 客户端。产品支持「对话即指令」的自然交互,无需配置环境即可一键部署。
TurboQuant – 谷歌推出的向量量化算法
TurboQuant 是 Google Research 推出的向量量化算法,可将大模型 KV Cache 从 32-bit 压缩至 3-bit,实现内存降低 6 倍、推理速度提升 8 倍,且精度零损失。
DataChef – 上海AI Lab联合复旦开源的AI数据配方生成模型
DataChef是上海人工智能实验室与复旦大学联合开源的AI数据配方生成模型。模型通过强化学习自动生成大模型适配任务的完整数据处理流水线,包括数据选择、清洗、合成、配比等步骤的可执行代码。
Lyria 3 Pro – 谷歌推出的 AI 音乐生成模型
Lyria 3 Pro 是谷歌推出的 AI 音乐生成模型,支持创作最长 3 分钟的完整音轨,具备结构感知能力,可精准处理前奏、主歌、副歌、桥段等编曲要素。
TuyaClaw – 涂鸦智能推出的 AI 助手,实现物理世界联动
TuyaClaw 是涂鸦智能基于 OpenClaw 架构推出的 AI 自动化助手,主打"让 AI 走出屏幕,进入物理世界"。工具能像数字员工一样操作电脑完成办公任务,控制智能家居设备,实现数字与物理世界的联动。
粤公网安备 123456789号