3d渲染测试 3D渲染测试参数

——结构决定性质？

-SOLIDWORKS 2021可视化IRAY测试

-Blender 2.9.3 GPU (CPU)渲染测试

– V-Ray 5基准CUDA、RTX

-OctaneBench 2020渲染测试

– KeyShot查看器基准

-测试平台、供应/价格和类型选择

上接正文：《暗藏Win7支持？NVIDIA RTX A4000专业显卡另类测试》

《PCIe 4.0提升几何？NVIDIA RTX A4000专业显卡测试(1)》

《基准测试的局限：NVIDIA RTX A4000显卡SOLIDWORKS性能分析》

我的微信官方账号写的是关于GPU/显卡/工作站的东西，阅读量往往比服务器和存储少，但还是要坚持计划好的东西。拿到检测结果后，如果不跟大家分享，那就只能留在我手里，有时候整理成图表会发现更多。

在之前的SPECviewperf和SOLIDWORKS测试中，我没有加入GeForce游戏显卡，因为传统的OpenGL 3D设计软件(尤其是制造CAD)是Quadro等专业显卡的强项。但是到了渲染应用，就不一样了。因为它做CUDA计算和RTX光线追踪，理论上GeForce应该更划算。真的是这样吗？本文是对Ampere GPU的又一次验证。

50576505d02d4fe0b3a6d52c2d54eeb3?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=NKSF%2BQUUAXGiRFtkzCCqa7w%2FKQY%3D&index=0

上图为戴尔工作站配置的GeForce RTX 3070显卡，8GB显存，单8-8pin PCIe辅助电源(220WTDP)。这款双风扇显卡的尺寸为2个插槽宽。与我之前介绍的双宽度涡扇RTX 3090(涡轮版)和一些DIY显卡相比，上述散热器可以更好地平衡空间占用和散热噪音。

注：由于功耗原因，戴尔版本的RTX 3080和3090(具有相似的散热器设计)都是2.5插槽宽度。

a20a721b818a4b3cb697c0ef8cbc2e50?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=cM6fq6wZJkZMhHbc4Nxpb4mDqoQ%3D&index=1

我记得我的高中化学老师(后来我们的班主任)经常说，“结构决定性质。”英伟达RTX A4000和GeForceRTX 3070都是GA104内核和PCIe x16 4.0接口。A4000的16GB内存是3070的两倍容量，但两者的内存位宽都是256位，带宽是448 GB/s。

RTX 3070的Shader(CUDA核心)数量为5888，略低于我之前介绍的A4000(6144)。但由于220W的TDP功耗远高于A4000的140W，所以GPU的Boost频率(1725 MHz)也更高。

纵观部分用户的上一代显卡测试结果，QuadroRTX 4000(125W)的渲染性能甚至超过了GeForce RTX 2070(175W)。不过这个对比的功耗差距似乎拉大了一点。在测试之前，我更看好RTX 3070。

SOLIDWORKS 2021 Visualize IRAY渲染测试

120b4179e9774545acd52ec225f32826?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=dJtiwsIclQ0IF2Y6dt800pQiHGc%3D&index=2

背景：《SolidWorks渲染测试：CPU GPU光线追踪性能、画质对比》

第一个测试是SolidWorks2021套件中的Visualize渲染组件。我在2年前就验证过它很好的支持NVIDIA GPU。这次只对比上图的4K分辨率渲染，因为RTX A4000显卡只需要28秒就能完成。

f56193cb63d644ccbc04fffa75cf04c4?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=dFdz0yrE86bOtpOGpvX2yd%2F9IvE%3D&index=3

如上图，SOLIDWORKS Visualize推荐的渲染引擎是NVIDIAIRAY，需要GPU支持CUDA。

142295b07dc247a8ac8296c14fb91ab3?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=pjx2cYjq86793rA80A58kGLyG%2BA%3D&index=4

本次测试中，根据实际画质要求，渲染器选择“精细”，渲染通道设置为“100”，降噪器开启。

97d784deac4f460a93e131dd6331eac0?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=avNMhin6TEVOS5Gx4j7YvHsQzzs%3D&index=5

结果Quadro RTX 5000需要39秒，而A4000和GeForce 3070只需要28秒，可见Ampere架构光线追踪效率的提升。

我想在参考编号为——的移动工作站上添加Quadro RTX 3000专业显卡。在3840×2160的分辨率下渲染同样的画面需要60秒，在这个测试中(排除显存容量的因素)其实比上一代的P5000要快很多。

Blender 2.9.3 GPU (+CPU)渲染测试

b654791d7a6342379f05826647bb529d?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=x8PN7FZglrqpei%2Bsar%2BNdq6gLhA%3D&index=6

在文章《让45W TDP CPU稳跑75W的秘密：Blender渲染测试（含Optix去噪点）》中，我使用了这个优秀的开源动画软件。本次测试安装了新版本2.9.3，已经正式支持NVIDIA OptiX，不再实验。

ba65f71c8254433798aa5d034c0802dc?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=%2BM01O1nTYqzBkR%2BBi2yTymVzsJc%3D&index=7

我们还可以在Blender设置的循环渲染设备中检查GPU和英特尔CPU。下面的测试结果向您展示了CPU的帮助有多大。

66e454e82e4546688f850dd1660e7f81?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=xychIX0YSira%2BHHuzHMVJAFWYMo%3D&index=8

我之前写过，在测试的两个场景中，后面的“Classrom教室”需要使用“降噪点”算法来渲染正常的图像质量。这一次，这里设置为“OptiX”。

2a6eccc07a3d4901862dbbd4f9e8b10d?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=lW%2BWQDBoxDscUf7G6UspxOgZ8p8%3D&index=9

我们来看看Fishycat。CPU计算的16帧(8核16线程)还是比GPU渲染的进度慢。

58eae208bfc84831beb382fac33c21dc?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=mP0OJ8Q8%2BkSMZQSm1JnOB7SKL2Q%3D&index=10

这一次，GeForce RTX 3070只用了57秒就完成了渲染，RTX A4000比夸德罗RTX 5000略慢，后者用了1分16秒。当然，如果增加Corei7-11700K CPU协同工作，RTX A4000可以缩短到50秒。

我还在上图中标注了显卡的TDP功耗。不难看出，RTX A4000的功耗比要优于3070。

8d8de68ab3674a3e8eb77a213475f9f4?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=NCqh%2B752Fy4v2C76jp2REBjsoDI%3D&index=11

这张Classrom教室的图片显示分辨率更高。以上是n卡(A4000)的渲染效果。

51f86d24c69a4098a9ce22b5aa4789a7?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=oTEM2x4xpyjAiml7cJQM%2FIEJ%2Fnc%3D&index=12

教室在这张图中有更多的光照(照度)计算，所以我们可以看到新的安培显卡的优势更大，同时CPU可以贡献的计算能力少一点。

V-Ray 5 Benchmark CUDA、RTX渲染测试

V-Ray是一个非常流行的老渲染器，它为各种3D软件提供渲染插件。

0fd6c2ef93f24f5fba8e17557422cdbe?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=MY7JFtXhqaN8Z%2BK5QowpLl8O6Tw%3D&index=13

贴近应用，V-Ray5基准测试工具在使用三个引擎：CPU、CUDA(评分单位为vpaths)和RTX(评分单位为vrays)时呈现不同的模型，因此不适合跨引擎比较测试结果。

3a13b92cc3424a909fe66cecb40cfc1b?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=XoUlbOueCplqEi74%2F%2BUfKv6Gr3E%3D&index=14

先来看看GPU CUDA测试。从这个图表往下看，分数越高越好。GeForce RTX 3070再次领先于A4000(注：显存容量并未成为瓶颈)。当然，安培架构在渲染上的优势还是那么明显。

eb826181ed124dc3a3acf7dfd53a313a?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=pX93dCBhrSRk65aGvf3s4v3g9Zk%3D&index=15

让我们来看看V-Ray GPU RTX测试结果。

a52e548f5cd047c49642cffb3167deb8?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=7wmPZAPO1e93knT8hpJLAxbmK3s%3D&index=16

使用RT核心光线追迹单元后，安培相对于上一代图灵显卡的优势要大一点。

OctaneBench 2020渲染测试

b7835c5d1b294af5b2bfdc7c96d6e52b?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=a52HKeWQ2Pvq6UyDt4FIXYvmt3Q%3D&index=17

OCE渲染器来自OTOY，它支持NVIDIA RTX光线跟踪更快。OctaneBench测试时，GPU功耗基本可以满负荷运行，内存控制器压力比较大。

cef8b13ad0fa4fa99c6ec00abd24136e?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=Ct%2BkgcaVohUHUZXiqFHEgRKFbD8%3D&index=18

这里三款显卡的竞争情况和之前的渲染测试差别不大。

KeyShot Viewer Benchmark渲染测试

c4165391f3194b759ad0fe561858708d?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=sOW8WmANEJwLoS2EXU49rzwRCsc%3D&index=19

KeyShot也是近年来比较流行的渲染器。本次测试采用了KeyShot Viewer的基准功能。当我们选择先运行CPU和GPU的时候，发现显卡的加速比要高很多，测试时间自然也是一样的。

68ba30a9038b47c8b238bb8cf342fa28?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=EWXCOv1YoxlnMivscmtkrGODtBI%3D&index=20

基准程序渲染了上面的模型。

34f500211def4a21b1e2287aa757f403?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=Rki40Ti0LjHksJr941bbnZSr5xk%3D&index=21

上一次KeyShot测试结果的分析我就不重复了，这也进一步印证了之前的渲染测试结论。

测试平台、供货/价格与选型杂谈

cc50139cdf9e46a088225fedfdeaa672?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=64UCH2U%2FRd61t65UsybPvpBO7XE%3D&index=22

最后，我们简单看一下陪伴我通过这两项测试的Dell Precision 3650塔式工作站主机(主板芯片组W580)。塔式机箱前面板与上一代3640工作站最大的变化是Type-C USB接口速度从10Gb/s提升到20 GB/s。

920666cfa36b4d52a5edf48d7daf01c2?_iz=31825&from=article.detail&x-expires=1702410420&x-signature=4EDjiCKziCfo34F%2B2pRsTMi5DS0%3D&index=23

如上图，在3650塔式工作站的背面界面，我用红框标注了可选的第二个2.5Gb RJ-45有线网口(第一个是1Gb千兆)。之所以在塔式工作站和部分商用PC中仍然保留PS/2键盘鼠标接口，是因为部分用户对数据安全性要求较高，需要禁用USB接口设备。

上一篇文章给大家看了125W CPU的散热器，这次就不给大家看工作站的内部照片了。

最后，由于本人从事技术工作，对RTXA4000、3070等目前的供货情况和价格也只是一知半解。当然，我也无能为力。测试和编写的目的是为读者朋友在选择其他安培显卡时提供参考。

单纯从GPU渲染计算应用的角度来看，GeForce RTX 3090单卡的性能不能说，性价比比专业显卡更好。如果是多卡环境，尤其是高密度部署，RTX A系列(Quadro)将显示其优势。从A4000的能耗比例和16GB显存来看，可以说继承了4000系列“甜品卡”的称号。在这里，我只是希望它的使用能尽快从哈希计算回归到普通工作站用户的怀抱：)

注：本文仅代表作者个人观点，与任何机构无关。如有错误和不足，请在留言中评论指正。如果你想在这个微信官方账号分享你的技术干货，也请联系我：)

尊重知识，转载时请保留全文。感谢您的阅读和支持！

3D渲染测试参数

为了满足创作者的需求，近年来V-Ray渲染器快速迭代，推出了新版本，方便了更多用户。但也有小伙伴使用后反馈：

我的渲染器显然已经升级到最高版本了。为什么渲染时间这么慢？

其实这些情况大多是参数设置不当造成的。V-Ray有5.0以上版本后，官方对渲染参数的设置进行了优化，需要调节的参数相对减少。如今，操作越来越容易。然而，仍有一些敏感参数需要我们注意。对于这些参数，它们设置得越高，效果就越清晰。

1.细分和噪波阈值设置

如上图所示，你应该避免同时设置两个参数“细分”和“噪波阈值”太高。

同时，如果设置高，用户渲染任务时渲染时间会增加。“细分”的官方默认值是24。建议用户在采用默认参数时，适当提高“噪声阈值”参数(0.005-0.003)。如果此时设置过小，会增加渲染负担。

2.细分和样本大小设置

“细分”和“样本大小”也是经常需要手动调整的参数。建议将细分设置在1500-2000范围内。样本大小对时间敏感，其默认参数为0.01。值越小，渲染时间越长(建议保留默认值0.01)。

“在着色最终图像之前着色光子”是炫云提供的免费优化选项之一。另外，“用最新版本的V-Ray渲染”和“按参数计费”都是炫云平台推出的帮助你节省渲染时间的设置。如果用户不知道如何调整参数，可以用最方便的方法，——的隐形操作来节省渲染时间。

一些使用V-Ray和Corona的用户有反馈。打开Cosmos后，一直显示“无法访问该网站”。那么，如何解决这样的问题呢？今天，边肖将与你分享解决问题的方法。

【第一步】在开始界面找到“混沌组”选项。

【第二步】打开后，找到“停止混沌宇宙浏览器”，点击此项，然后点击“启动混沌宇宙浏览器”选项。等几分钟，重启Cosmos，就可以正常使用了。

开启Cosmos后的效果如图(不是V射线就是日冕)。

{{userData.name}}已认证

3d渲染测试 3D渲染测试参数

3D渲染测试参数

美丽的指甲（美丽的指甲贴）

dnf高级碳(地下城碳14有什么用)