HAI 与 NVIDIA ,为开发者提供一键部署及生图的能力,让开发者体验3D 模型的同时,也了解云的便利性。
混元3D 2.0是腾讯推出的尖端3D⽣成模型,能够创建带有⾼分辨率纹理贴图的⾼保真3D资产
参赛报名:https://marketing.csdn.net/questions/Q2503111509331158927?shareId=2244
活动时间:2025年5月13日 - 6月15日
目录
博主作品
下面是博主提交的3D作品,都是通过一张静态图一键生成,非常简单,大概一分钟内都可以出来效果图。
也欢迎大家的投票支持,感谢感谢,感兴趣的也可以点击报名和参赛,好玩有趣,至少都有参与奖~~~
创意赛道
投票地址:
https://marketing.csdn.net/voteDetail/949
作品描述:
这款 3D 手办中的萌萌铠甲小战士超吸睛!身着精巧铠甲,手持武器,圆溜溜眼睛透着机灵,模样可爱又飒爽。
3D表情包
投票地址:
https://marketing.csdn.net/voteDetail/950
作品描述:
3D 小恐龙超凶表情包!张大嘴露利齿,瞪圆眼怒目,前爪挥舞,尾巴摆动,气势汹汹。
更换了表情图
场景创作赛道
投票地址:
https://marketing.csdn.net/voteDetail/965
作品描述:
月光下,一只白色拖鞋孤零零地躺在角落,鞋面还留着半枚模糊的脚印。它始终保持着微微倾斜的弧度,仿佛下一秒就会等来那只熟悉的脚——却永远停在了抬脚瞬间的永恒里。
经验分享
在不进行任何参数精调的情况,要想输出高质量3D实物图,博主的建议是使用尽量简单的静态的3D图,不要太复杂。
尽量不要调参数,否则会远超出生成时间,毕竟部署的服务器资源有限。
在完成满意作品且暂时不使用后,记得销毁资源,否则会多扣费几次的小时费用。
完成报名后,记得找小助手获取优惠卷!
混元3D⼤模型介绍
基本信息
开发者在腾讯云⾼性能应⽤服务(HAI)上部署并使⽤混元3D 2.0⼤模型进⾏3D
资产⽣成。
利⽤先进的AI技术,只需简单的图⽚输⼊或⽂本提示(暂时不支持文生图,本次活动只支持图生图),即可快速创建⾼质量的3D模型和纹理。
混元3D 2.0是腾讯推出的尖端3D⽣成模型,能够创建带有⾼分辨率纹理贴图的⾼保真3D资产。
结合腾讯云HAI提供的⾼性能GPU算⼒,开发者可以低成本地体验专业级3D模型⽣成能⼒,⼤
幅降低3D内容创作⻔槛。
适合对3D资产⽣成感兴趣的开发者、设计师、游戏开发⼈员以及希望探索AI辅助内容创
作的技术爱好者。
⽆需专业的3D建模经验,任意开发者都可轻松完成从零到拥有⾃⼰⽣成的3D资产的全过程。
服务介绍
混元3D模型
混元 3D 2.0 是⼀款先进的⼤规模 3D 资产创作系统,它可以⽤于⽣成带有⾼分辨率纹理贴图的
⾼保真度3D模型。
该系统包含两个基础组件:⼀个⼤规模⼏何⽣成模型 — 混元 3D-DiT,以及⼀个⼤规模纹理⽣成模型 — 混元 3D-Paint。
⼏何⽣成模型基于流扩散的扩散模型构建,旨在⽣成与给定条件图像精确匹配的⼏何模型,为下游应⽤奠定坚实基础。 纹理⽣成模型得益于强⼤的⼏何和扩散模型先验知识,能够为AI⽣成的或⼿⼯制作的⽹格模型⽣成⾼分辨率且⽣动逼真的纹理贴图。 此外,我们打造了混元 3D 功能矩阵,⼀个功能多样、易于使⽤的创作平台,简化了 3D 模型的制作以及修改过程。它使专业⽤户和业余爱好者都能⾼效地对3D模型进⾏操
作,甚⾄制作动画。
腾讯混元Hunyuan3D模型也已上架到腾讯云HAI,通过HAI上更⾼性价⽐的GPU算⼒、模型⼀键
部署能⼒和可视化图形界⾯WebUI,有效降低模型开放和部署⻔槛。
- 附:腾讯3D模型访问地址
Github 地址:
GitHub - Tencent/Hunyuan3D-2: High-Resolution 3D Assets Generation
with Large Scale Hunyuan3D Diffusion Models.
Hugging Face 模型地址:
https://huggingface.co/tencent/Hunyuan3D-2
⾼性能应⽤服务HAI
⾼性能应⽤服务(Hyper Application Inventor,HAI)是⼀款⾯向 AI 和科学计算的 GPU/NPU 应⽤服务产品,提供即插即⽤的强⼤算⼒和常⻅环境。
它可以帮助中⼩企业和开发者快速部署语⾔模型(LLM)、AI 绘图、数据科学等⾼性能应⽤,原⽣集成配套的开发⼯具和组件,⼤⼤提升应⽤层的开发⽣产效率。
环境准备
开通HAI
进⼊HAI官⽹:⾼性能应⽤服务HAI_GPU云服务器_腾讯云
点击图⽚中的 ⽴即使⽤
如未登录腾讯云账号,选择合适的⽅式进⾏账号登录
如未注册请点击注册按钮,按照流程进⾏信息填写即可
登录后会先进⼊优惠券兑换,⽤于后续实验,联系⼩助⼿后进⼊链接:
https://console.cloud.tencent.com/expense/voucher
点击兑换优惠券,输⼊券码即可
兑换成功后进⼊ ⾼性能应⽤服务 的控制台⻚⾯:
https://console.cloud.tencent.com/hai/instance?rid=8
如果是第⼀次使⽤ ⾼性能应⽤服务 会出现开通该服务的提示,点击开通即可
部署⼤模型
点击⻚⾯中的新建按钮
进⼊资源创建⻚⾯后完成下列动作
- 在选择应⽤ tab 栏⽬中点击 社区应⽤
- 在社区应⽤中选择 混元Hunyuan3D-2
- 在点击⽴即购买后会提示勾选协议,勾选后再次点击⽴即购买即可
完成购买后会⾃动跳转回控制台⻚⾯,看到如下情况即表示混元3D⽣成⼤模型正在部署中
等待实例部署完成,看到如下状态即部署完成
温馨提示:请耐⼼等待⼏分钟
连接到混元3D⽣成⼤模型的 Gradio WebUI ,点击算⼒连接,选中Gradio WebUI
看到如下界⾯即可进⼊ 混元3D WebUI 界⾯
⽣成3D图⽚
温馨提示:请在⽣成可共享GIF⽂件之前验证3D资产是否符合预期,因为GIF渲染⾮常慢。
在新窗⼝中,在 Image Prompt 处拖拽或点击上传图⽚。⾮透明背景的图⽚建议勾选 Remove
Background。
根据需求完成3D资产的⽣成
- Generate Shape Only:仅⽣成形状
- Generate Shape and Texture:⽣成形状和纹理
- Generate GIF:⽣成 GIF 动图
下载对应的 GLB 格式⽂件 以及 GIF ⽂件即可到对应赛道进⾏⽂件上传完成提交
HAI 验证截图需要全屏截图,浏览器窗⼝需要露出作品
GIF图 以及 IP端⼝ 例如:
环境清理
完成作品生成后,即可第一时间清理服务器,为避免不必要的资源占⽤和费⽤产⽣。
请按照以下步骤销毁已创建的混元3D实例:
- 返回腾讯云⾼性能应⽤服务HAI控制台
- 在实例列表中找到您部署的混元3D模型实例
- 点击实例右侧的【更多】→【销毁】
- 在弹出的确认窗⼝中,阅读提示信息后点击【销毁资源】
整体操作下来是不是很简单,博主还尝试问过,生成的3D作品是完全可以转为STL格式进行3D实物手办打印的。
辅助工具
Blender
Blender是一款免费开源三维图形图像软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案。
Blender拥有方便在不同工作下使用的多种用户界面,内置绿屏抠像、摄像机反向跟踪、遮罩处理、后期结点合成等高级影视解决方案。Blender内置有Cycles渲染器与实时渲染引擎EEVEE。同时还支持多种第三方渲染器。
Blender为全世界的媒体工作者和艺术家而设计,可以被用来进行三维可视化,同时也可以创作广播和电影级品质的视频,另外内置的实时三维游戏引擎,让制作独立回放的三维互动内容成为可能(游戏引擎在2.8版本被移除)。
DeepSeek+文心一言
如果不知道用什么图片,那么博主的建议是先用DeepSeek简单描述你的目标图片,发挥你的脑洞和想象力,让DeepSeek给你出一些生成你目标图片的提示词。
经过多轮询问和测试,得到还算满意的提示词
将你觉得满意的提示词贴到文心一样里,让它输出图片(博主觉得还算满意,不要复杂的图片内容)
发现生成出来的3D效果不太理想,就进一步询问
编码小技巧
学习AI,自然少不了掌握Python这门编程语言。
一行代码实现「列表元素频率统计」
场景:快速统计一个列表中各元素出现的次数(比如词频统计、数据分布分析)。
传统写法(手动循环 + 字典计数):
words = ["apple", "banana", "apple", "orange", "banana", "apple"]
freq = {}
for word in words:
if word not in freq:
freq[word] = 0
freq[word] += 1
Pythonic 写法(用 collections.Counter
):
from collections import Counter
words = ["apple", "banana", "apple", "orange", "banana", "apple"]
freq = Counter(words) # 一行搞定!
输出:
Counter({'apple': 3, 'banana': 2, 'orange': 1})
进阶技巧(获取最高频的 N 个元素):
top_2 = freq.most_common(2) # 直接输出频率最高的2个
结果:
[('apple', 3), ('banana', 2)]
🌟 优势:
- 代码极简:无需手动处理字典和循环
- 高性能:
Counter
底层优化过,比纯字典操作更快 - 功能丰富:支持直接排序、数学运算(如
freq1 + freq2
)
适用于 NLP 词频统计、数据分析、日志聚合等场景! 🚀