Vimi 是商汤科技推出的一款基于可控人物视频生成大模型的 AIGC 产品,是全球首个可控人物视频生成大模型。
面壁智能是一家专注于人工智能大模型技术创新与应用的科技公司,致力于构建智能时代的大模型基础设施,加速大模型在典型场景与领域的应用与落地,成为通用智能服务的引领者。
NineF AI是一站式免费主流AI大模型集成平台,集成了GPT、Claude、Llama等全球顶尖AI模型,提供多角度智能解答,助您提升工作效率和决策准确性。
CogVideo 是一个由清华大学和北京人工智能研究院(BAAI)联合开发的开源文本到视频生成模型。
学而思九章大模型(MathGPT)是好未来教育集团自主研发的一款专注于数学问题解决和教学的人工智能应用。
BuboGPT是字节跳动推出的一款多模态大语言模型(LLM),能够处理文本、图像和音频等多种输入模态,并具备对齐和非对齐理解的能力。
Mistral AI发布了多个版本的大型语言模型,包括Mistral Nemo、Mistral Large、Codestral和Mixtral等。
全面收集有明确来源的大模型情况
谷歌推出的一款基于扩散模型的虚拟试衣技术,旨在为用户提供高质量、逼真的试衣体验
AnchorCrafter 是由中国科学院与腾讯联合推出的一项创新技术,旨在通过人工智能生成高保真度的产品推广视频。
Goku视频生成模型是由中国香港大学与字节跳动联合推出的一款AI视频生成工具,能够实现文本到视频、图像到视频以及文本到图像等多种生成方式。
CosyVoice是一款由阿里巴巴通义实验室开发并开源的多语言语音生成模型,专注于自然语音生成、音色克隆和情感控制。
EchoMimic 是蚂蚁集团开发的一款基于音频驱动的肖像动画生成工具,旨在通过音频和面部标志点生成逼真的动态视频。
LivePortrait是一款由快手科技与中国科学技术大学、复旦大学共同研发的AI驱动肖像动画工具,旨在将静态肖像图像转化为逼真的动态视频。
DDColor 是一种由阿里巴巴达摩院研发的先进图像上色技术,旨在通过深度学习技术将黑白或灰度图像转换为逼真且生动的彩色图像。
Whisper 是 OpenAI 开发的一款强大的语音识别模型,具有多语言支持、语音翻译和语言识别等多功能能力。
一个基于Step系列千亿参数模型研发而成的开放平台
AI 声音合成模型
微软亚洲研究院开发的一款革命性的 AI 模型,能够将静态照片和音频文件结合生成逼真的说话视频
个专为对话场景设计的文本转语音(Text-to-Speech, TTS)模型,支持中英文两种语言
一款多模态大模型,旨在通过视觉和语言的深度融合,提升视障人士的生活便利性
字节跳动推出的一款AI模型分享社区平台,旨在促进AI技术的交流与应用,为研究人员、开发者和爱好者提供一个开放、高效的合作环境
字节跳动推出的一系列人工智能大模型,旨在提供多模态、多场景的AI解决方案
百度文心,产业级知识增强大模型,包含基础通用大模型及面向重点领域和重点任务的大模型,同时有丰富的工具与平台支撑高效便捷的应用开发,学习效率高,可解释性好,大幅降低AI开发与应用门槛
整合了多种先进的人工智能模型,包括GLM系列、CodeGeeX、CogView等
阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。
企业级一站式大模型与AI原生应用开发及服务平台
商汤日日新开放平台,商汤日日新大模型官网入口
浪潮海若大模型定位行业大模型,首批面向政府、交通、应急、制造、医疗、农业六大行业,具备可信赖、易落地、可持续三大核心优势。
一款专注于医疗健康领域的大型语言模型,旨在通过先进的AI技术为医疗行业提供高效、精准的智能服务