您的当前位置:首页 > 百科 > 腾讯混元图像2.0发布 实时生图毫秒级速度与超写实画质 正文
时间:2025-09-28 16:38:40 来源:网络整理 编辑:百科
5月16日消息,今天腾讯正式发布了业内首个毫秒级响应的实时生图大模型——混元图像2.0(Hunyuan Image2.0)。目前已在腾讯混元官方网站上线,并对外开放注册体验,该模型主要有两大特点:实时
5月16日消息,腾讯图像今天腾讯正式发布了业内首个毫秒级响应的混元毫秒画质实时生图大模型——混元图像2.0(Hunyuan Image2.0)。目前已在腾讯混元官方网站上线,发布并对外开放注册体验,实时生图该模型主要有两大特点:实时生图、度超超写实画质。写实
相比前代模型,腾讯图像腾讯混元图像2.0模型参数量提升了一个数量级,混元毫秒画质得益于超高压缩倍率的发布图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。实时生图
在同类商业产品每张图推理速度需要5到10秒的度超情况下,腾讯混元可实现毫秒级响应,写实支持用户可以一边打字或者一边说话一边出图,腾讯图像改变了传统“抽卡—等待—抽卡”的混元毫秒画质方式。
除了速度快以外,发布腾讯混元图像2.0模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
提示词:人像摄影,爱因斯坦,背景是东方明珠,自拍视角
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面「怎么表达」。
哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔画出来。
除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。
腾讯混元图像2.0模型生成的图片:
人像摄影风格
动物特写
复古摄影
动漫风格
真实人物风格
《夜族崛起》新史低!免费大更新在线数激增!2025-09-28 16:18
《天国:拯救2》新故事扩展包《匠心永铸》亮相科隆游戏展前发布会2025-09-28 16:09
比尔盖茨访日会见MSX创始人 《合金装备》首发平台2025-09-28 15:40
微软决定暂缓公布ROG Xbox Ally定价 延期至数周后2025-09-28 15:31
《星际:异端先知》女主谈网暴:尼尔叫我忽略它2025-09-28 15:30
Gearbox老板谈《无主之地4》定价:200美元也算合理!2025-09-28 15:22
外媒试玩《空洞骑士:丝之歌》:没有变革但更加精致2025-09-28 14:43
全系列新情报:困兽支持DLSS4,消光1免费周末,消光2优化体力值2025-09-28 14:40
5月登陆XGP游戏名单:《毁灭战士:黑暗时代》等2025-09-28 14:28
大翻车! 多家媒体称《艾尔登法环》Switch2掌机模式运行糟糕2025-09-28 13:58
《招魂4》首曝预告 沃伦夫妇最后一次驱魔2025-09-28 16:07
《生化危机9》新实机演示 女主被白裙女怪追逐2025-09-28 15:59
《街霸6》名场面 Punk开香槟被小孩曾卓君丝血反杀2025-09-28 15:24
英伟达RTX 50系列显卡在欧洲降价 接近10%!2025-09-28 15:05
《无主之地4》将下调战利品掉率 让传奇武器更加珍贵2025-09-28 15:01
微软决定暂缓公布ROG Xbox Ally定价 延期至数周后2025-09-28 14:43
有腰子你就来! 多人合作解密游戏《逃离电诈园区:反诈突围》Steam页面上线2025-09-28 14:14
《打工火柴人》Steam抢先体验开启 物理战斗小清新2025-09-28 14:01
京东宣布iPhone 16 Pro首次支持国补:直降2500元2025-09-28 13:55
2026年春季发售! 经典解密《锈湖》系列发布新作《湖之忠仆》2025-09-28 13:52