AI大模型-第 2 页-办公云导航

AI大模型

Goku

Goku视频生成模型是由中国香港大学与字节跳动联合推出的一款AI视频生成工具，能够实现文本到视频、图像到视频以及文本到图像等多种生成方式。

CosyVoice是一款由阿里巴巴通义实验室开发并开源的多语言语音生成模型，专注于自然语音生成、音色克隆和情感控制。

EchoMimic 是蚂蚁集团开发的一款基于音频驱动的肖像动画生成工具，旨在通过音频和面部标志点生成逼真的动态视频。

LivePortrait

LivePortrait

LivePortrait是一款由快手科技与中国科学技术大学、复旦大学共同研发的AI驱动肖像动画工具，旨在将静态肖像图像转化为逼真的动态视频。

DDColor

DDColor 是一种由阿里巴巴达摩院研发的先进图像上色技术，旨在通过深度学习技术将黑白或灰度图像转换为逼真且生动的彩色图像。

Whisper

Whisper 是 OpenAI 开发的一款强大的语音识别模型，具有多语言支持、语音翻译和语言识别等多功能能力。

阶跃星辰

一个基于Step系列千亿参数模型研发而成的开放平台

Voicebox

AI 声音合成模型

VASA-1

微软亚洲研究院开发的一款革命性的 AI 模型，能够将静态照片和音频文件结合生成逼真的说话视频

ChatTTS

个专为对话场景设计的文本转语音（Text-to-Speech, TTS）模型，支持中英文两种语言

眸思大模型

一款多模态大模型，旨在通过视觉和语言的深度融合，提升视障人士的生活便利性

炉米lumi

字节跳动推出的一款AI模型分享社区平台，旨在促进AI技术的交流与应用，为研究人员、开发者和爱好者提供一个开放、高效的合作环境

豆包大模型

豆包大模型

字节跳动推出的一系列人工智能大模型，旨在提供多模态、多场景的AI解决方案

文心大模型

文心大模型

百度文心,产业级知识增强大模型,包含基础通用大模型及面向重点领域和重点任务的大模型,同时有丰富的工具与平台支撑高效便捷的应用开发,学习效率高,可解释性好,大幅降低AI开发与应用门槛

智谱大模型开放平台

智谱大模型开放平台

整合了多种先进的人工智能模型，包括GLM系列、CodeGeeX、CogView等

通义大模型

通义大模型

阿里云自主研发的通义大模型，凭借万亿级超大规模数据训练和领先的算法框架，实现全模态高效精准的模型服务调用。

千帆大模型平台

千帆大模型平台

企业级一站式大模型与AI原生应用开发及服务平台

商汤日日新开放平台

商汤日日新开放平台

商汤日日新开放平台,商汤日日新大模型官网入口

浪潮海若大模型

浪潮海若大模型

浪潮海若大模型定位行业大模型，首批面向政府、交通、应急、制造、医疗、农业六大行业，具备可信赖、易落地、可持续三大核心优势。

左医医疗大语言模型

一款专注于医疗健康领域的大型语言模型，旨在通过先进的AI技术为医疗行业提供高效、精准的智能服务

商汤大装置

商汤大装置

建设高效率、低成本、规模化的 AI 云基础设施，打造专业的深度学习平台及算法模型体系，引领AI创新，助力工业界及学术界探索 AI 边界。

flux1.ai

文本到图像生成模型

商汤商量拟人大模型

商汤商量拟人大模型

一款基于先进人工智能技术开发的对话型AI工具，旨在通过高度拟人化的交互体验，为用户提供丰富的情感陪伴、角色互动和多场景应用能力

Janus-Pro

DeepSeek 推出的一款创新的多模态理解和生成模型

SeedEdit

字节跳动旗下豆包大模型团队推出的一款通用图像编辑模型，旨在通过自然语言指令实现高效、精准的图像编辑操作

Qwen大模型

Qwen大模型

阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列

ZelinAI

零代码构建自己的AI应用

孟子 GPT

帮助用户完成特定场景中的多种工作任务

山海大模型

山海大模型

认知智能大模型

书生通用大模型体系

书生通用大模型体系

定义任意任务和轻量级自适应融合

通义千问

通义千问

阿里云自主研发的大语言模型

智谱AI

大模型MaaS开放平台

零一万物

零一万物

专注于大模型技术的研发和应用

中文法律大模型

云雀大模型

云雀大模型

字节跳动旗下云雀语言模型

APUS大模型

APUS大模型

让AI应用更简单

紫东太初

紫东太初

新一代多模态大模型

生数科技

生数科技

多模态大模型,融合文本,图像,视频,语音,3D等多模态信息

网易伏羲推出的一系列人工智能平台和工具的总称

昇思大模型平台

基于昇思MindSpore AI框架打造的一站式大模型体验平台

123