AI项目
Lumine – 字节跳动推出的3D开放世界通用AI智能体
Lumine是字节跳动推出的在3D开放世界游戏中实时感知、推理和行动的通用AI智能体。Lumine基于Qwen2-VL-7B-Base模型,通过类人交互范式,将感知、思考和行动整合在一起。
Code Wiki – Google推出的AI代码文档生成工具
Code Wiki是Google最新推出的AI代码文档生成工具,能自动扫描GitHub代码仓库并生成结构化Wiki文档,包含系统概览、模块说明及调用关系图。核心优势在于与代码同步更新,集成Gemini智能助手实现交互式问答,例如直接查询代码影响范围或服务入口。
Webjourney – AI网站构建工具,聊天交互设计创建网站
Webjourney 是基于人工智能的无代码网站构建工具,帮助用户快速创建和发布专业网站。通过智能聊天交互功能,让用户无需任何编程知识,只需通过简单的对话即可设计出个性化的网站。
Bee – 清华联合腾讯开源的全栈多模态大模型解决方案
Bee是清华大学和腾讯混元团队联合推出的高质量多模态大语言模型(MLLM)项目,解决开源模型因数据质量不足导致的性能瓶颈。项目的核心贡献包括:Honey-Data-15M,一个包含约1500万问答对的高质量监督微调数据集,通过多步清洗和双层思维链(CoT)扩充策略提升数据质量
InfinityStar – 字节跳动推出的高效视频生成模型
InfinityStar 是字节跳动推出的高效视频生成模型,通过统一的时空自回归框架,实现了高分辨率图像和动态视频的快速合成。模型采用时空金字塔结构,将视频分解为序列片段,有效解耦外观和动态信息,提升生成效率。
SmartResume – 阿里开源的智能简历解析工具
SmartResume 是阿里巴巴开源的智能简历解析工具。SmartResume通过 OCR 文本提取、PDF 元数据解析、版面检测和 LLM 智能结构化处理,将 PDF、图片、Word 等格式的简历自动转换为结构化数据,如姓名、学历、工作经历等。
SIMA 2 – 谷歌DeepMind推出的最新一代AI智能体
SIMA 2是谷歌DeepMind开发的最新一代AI智能体,在虚拟3D世界中展现出强大的交互、推理和学习能力。SIMA 2基于Gemini技术构建,采用“Gemini-SIMA Fusion”三层架构,包括决策中枢、视觉-动作模型和思维令牌桥梁,能快速响应并执行复杂任务。
Koina – 开源的去中心化机器学习模型平台
Koina 是开源的去中心化机器学习平台,专为蛋白质组学研究设计。平台通过标准化接口和在线模型库,让研究人员能轻松上传、共享和调用机器学习模型,无需本地部署获取预测结果。
Astron Agent – 科大讯飞开源的企业智能工作流开发平台
Astron Agent 是企业级、商业友好的智能工作流开发平台,基于科大讯飞的核心技术打造。平台集成 AI 流程编排、模型管理、智能 RPA 自动化等功能,支持高可用部署,能快速构建可扩展的智能代理应用。
CodeFlying – AI应用开发平台,支持多样化应用开发
CodeFlying是AI应用开发平台, 是码上飞的海外版。专为帮助用户快速将创意转化为实际应用设计。平台通过自然语言描述能生成完整的前端、后端及运营管理后台,支持多种应用类型,包括智能助手、商业平台、管理系统等。
文心大模型5.0 – 百度推出的原生全模态大模型
文心大模型5.0(文心5.0)是百度推出的原生全模态大模型,参数量达2.4万亿。模型采用统一自回归架构,实现文本、图像、音频、视频等多模态数据的理解与生成一体化,区别于传统后期融合方式。
BestBlogs – 开源的一站式AI内容聚合平台
BestBlogs是 AI 驱动的内容聚合平台,基于 400 多个 RSS 订阅源,整合全球顶级编程、人工智能、产品设计和商业科技领域的优质内容。平台用大语言模型进行智能摘要、评分和翻译,帮助用户快速筛选高价值文章、播客、视频和推文。
YouArt – AI创意工作平台,自动构建可视化创作工作流
YouArt 是专注于艺术创作领域一体化的AI创意工作室,通过强大的AI图像和视频生成器,将用户的创意想法快速转化为高质量的视觉作品。支持多种AI模型,如GPT-4o和DALL-E,能实现文本转图像、图像编辑、样式转换以及图片转视频等功能。
GPT-5.1 – OpenAI最新推出的升级版AI模型
GPT-5.1 是 OpenAI 对 GPT-5 系列的升级版本,能提升智能性和沟通能力。GPT-5.1包含两个版本,GPT-5.1 Instant 和 GPT-5.1 Thinking。
PitchLab – AI表达练习工具,模拟真实对话优化表达策略
PitchLab 是 AI 表达练习工具,能帮助用户通过模拟对话提升沟通能力。工具用角色智能体模拟受众的反应和风格,同时通过教练智能体诊断表达效果、提供改进建议。
ZOER.AI – Chat2DB 团队推出的全栈AI应用开发平台
ZOER.AI 是Chat2DB 团队推出的全栈AI应用开发平台,通过 AI 技术实现从数据库设计、后端逻辑到前端界面的端到端自动化构建,解决传统 AI Coding工具后端能力不足的问题。
Monologue – AI语音听写工具,根据上下文自动调整语气
Monologue 是专为高效写作设计的智能语音听写工具。工具基于先进的语音识别技术,将用户的口语转化为清晰、规范的文字,同时根据上下文自动调整语气和格式,确保输出内容精准且符合用户习惯。
OiiOii – AI动画创作Agent,多智能体角色协同完成创作
OiiOii 是全球首个专业动画创作Agent工具,通过集成多个智能角色(如艺术总监、编剧、分镜师等)实现动画创作的全流程自动化。用户只需输入简单的提示词或创意,OiiOii 能快速生成从剧本到成片的完整动画内容,支持多种艺术风格和情绪设定。
ERNIE-4.5-VL – 百度文心开源的新一代多模态AI模型
ERNIE-4.5-VL是百度文心开源的新一代多模态AI模型,基于ERNIE-4.5-VL-28B-A3B架构,激活参数3B,主打视觉语言理解与跨模态推理。模型通过海量视觉-语言数据训练强化语义对齐,并采用多模态强化学习提升稳定性,新增视觉定位与"图像思考"功能
LazyCraft – 开源的 AI Agent 应用开发与管理平台
LazyCraft 是开源的 AI Agent 应用开发与管理平台,由商汤基于其开源框架 LazyLLM 构建。帮助开发者以低门槛、低成本快速构建和发布大模型应用。平台提供从应用创建、调试、发布到监控的全流程闭环体验,支持低代码、组件化应用编排。
粤公网安备 123456789号