在昨天的GTC上,达索systemes的技术顾问闫申申在演讲中多次提到他20年前接触的显卡是GLoria和GLoria II,他还带着回忆谈到了后来的QuadroPlex 7000显卡盒子。当时我想在台下说,我是显卡,以前的机型我还是那么熟悉。有文件为证:《20年变迁:图形工作站 专业显卡——ELSA GLoria-XXL篇》。
明天要早起,但还是想写点东西和大家分享,不到很晚也不会有状态。这又是一个强迫自己学习/思考的过程。只能说我的技术水平还是太有限,很多领域的研究还不够深入。
因为目前的工作,这两年比较关注工作站和专业显卡。这次英伟达GTC发布会的重点还是一些热门领域,比如AI/深度学习、光线追踪、自动驾驶甚至云游戏(很多人想蹭下5G);而拥有庞大用户群的传统股市,比如CAD三维设计,除了每一代Quadro的更新速度,还能有什么新意?
正如我之前在《SolidWorks2020测试:GPU如何速度翻倍 赢画质?》和《SolidWorks测试(3):五款显卡选择指南,AMD、GeForce也来凑热闹》中所写的,如果说达索在之前的软件版本中没能充分发挥显卡的硬件性能,那么现在新版本已经弥补了。但这不应该使用Quadro RTX张量芯和RT芯的新特性。
上面的300帧视频花了我20分13秒在夸德罗RTX 3000(戴尔7540)移动工作站上渲染。至于最终渲染和实时渲染的区别,概念上我就不多写了。感兴趣的朋友可以来GTC合作伙伴展区聊聊。
相反,《SolidWorks渲染测试:CPU GPU光线追踪性能、画质对比》中的新版SolidWorks Visualize渲染组件在最新一代显卡上有了质的提升。可以点击链接查看详细的速度对比,这里就不赘述了。
这次听浩南哥的英伟达技术演讲不禁有点感慨。还记得10年前听浩南哥讲台下工作站:)
前沿技术多少影响了我,比如光线追踪的实时渲染。说到游戏,或者说3DMark中的测试场景,大家都不难理解是为了提升画面效果,同时要达到足够的流畅度(至少30FPS)。而我的重点是工作站上的应用,也就是CAD/CAE制造业。
制造业可视化:达索3DEXPERIENCE和CEI IC.IDO
值得一提的是,3DEXPERIENCE是当年收购的工业可视化领域著名的RTT。
达索3DEXPERIENCE的这个分享我没有详细记录,其中操作视频效果不错,也是光线追迹,但能达到实时交互操作的效果,至少10-15FPS。
再加上来展台交流的EPIC朋友(也就是制作虚幻引擎的公司)说,人在优化场景后也可以实现实时光线追迹。当时我觉得我的SolidWorks演示有点压力,因为用2块RTX 5000显卡渲染一帧要5秒。让玩过传统渲染器的朋友来评论一下。这真的是技术差距吗?
为了找到这个问题的线索,下面重点分享另一家重要的软件厂商CEI,里面列出了很多对比数字。
注:ICIDO(或IC。IDO)是法国ESI集团提供的虚拟现实解决方案和工程虚拟样机仿真分析的协同决策平台。
上面的数字看起来不小,1.5亿个多边形(三角形)。大概尺寸是多少?我在《VR测试:8K、移动工作站和极端挑战》拍了一张对比图。测试中,一个复杂的VR场景只有1000万个三角形。后来我在《NVIDIA 2080Ti两倍于1080性能?8K VR渲染测试(续)》也说过,GeForce RTX 2080 Ti显卡平均帧数只有65。不过也要注意,Unigine叠加测试是同时使用70个光源,模拟真实世界中的纹理(材质)。
然后回头看看上面的3DEXPERIENCE模型。有没有质感?照度计算不会太复杂吧?这与这些应用需求的特征有关。我这里写的是说明:不能孤立的看某一个指标,需要综合比较才有更多的参考意义。
光线追踪和VR,鱼与熊掌?
在NV的发布会上,显卡/GPU的性能提升估计是个永恒的话题。上图我们先注意红圈标记的部分:——Quadro P6000运行到94 FPS,再往下看。
这里两个带NVLINK的Quadro GV100也是90FPS。好像不是同一个测试场景?
OpenGL Mono指的是传统的单屏显示,平均217.2 FPS;VR SLI立体声应该是两块显卡配NVLINK后输出到VR头盔的两块屏幕上。此时帧率仍为197.5,相当于双卡立体显示0.903的效率。
OptiX可能大家都不陌生。我简单写了一篇《实测:光线追踪过去9年有多大改进?》。在光线追踪下,可以看到GV100只运行到13.46 FPS,如果开启全局照明,则下降到8.47帧/秒。
正面是背景,然后RTX8000光线追踪运行到29 FPS,比GV100高123%。哈哈的笑
但是别忘了,此时的分辨率只有2560 x 1440,不是VR。按照这个速度水平,就算加上2号RTX8000和NVLINK,我觉得目前对高质量光线追踪VR的支持也不能流畅吧?更不用说单筒2K和4K VR了。
这个ppt可以作为对比参考。这时候就要用光线追踪VR了,补丁数3900万(别再提1.5亿这个吓人的数字了)。它只反射3级的光,没有全局照明。在这种情况下,谈沉浸式虚拟现实是可以的。
小结
讲真,以现在的硬件水平,PC上的CG游戏,工业可视化中的实时追光效果,都比不上3D动画电影的质量。我看的本土电影比较少。还记得《阿凡达》的效果吗?要知道还是当年的技术水平,一部大片用上百台服务器/工作站最终渲染2-3个月是很正常的。
现在的GPU确实进步了,尤其是光线追踪方面。但同时对内容的要求也在提高,比如4K-8K的分辨率,色彩空间BT.2020,12bit HDR等等。最后花在硬件设备上的钱不一定少很多,计算和存储也是。
光线跟踪只是一种技术,可以以不同的方式使用。不代表只有实时才是最好的,虽然看起来很酷。工业可视化和照片级渲染的质量要求是不一样的。此外,UE4引擎可用于影视特效,常用于游戏场景。反过来,Arnold,VRAY,Blender,SolidWorks Visualize渲染引擎也不是吃素的。
这里有个小广告:国内BIM家装行业领先的软件品牌dresser。最新的“极光渲染引擎”已经创建,它针对RTX显卡的光线跟踪进行了全面优化,以加快渲染效果的渲染速度。据我观察,实际工作中,显卡的负载应该是比较满的,这样显卡的风扇才会长时间保持高速。
最后,让我向您展示我的演示设备:Dell Precision 7920塔式工作站配备了两个Quadro RTX 5000显卡。至于SolidWorks Visualize应用程序,实际上,它不需要插入NVLINK桥来以相同的方式工作,这取决于应用程序的特性和具体的程序设计。
RTX 5000显卡本身的TDP功耗是230W。SolidWorks Visualize运行起来没有太大压力,每张卡150W左右。
注:本文仅代表作者个人观点,与任何机构无关。如有错误和不足,请在留言中评论指正。进一步交流可以加我QQ/微信:490834312。如果你想在这个微信官方账号分享你的技术干货,也请联系我:)
尊重知识,转载时请保留全文。感谢您的阅读和支持!
vray实时渲染参数
3dmax缩略图(渲染时测试V-Ray3.0参数设置):
1.V-Ray中的帧缓冲卷展栏需要勾选才能启动内置的帧缓冲,而小图则不需要勾选。设计师可以根据自己的实际情况选择是否使用,因为勾选的渲染比较慢,勾选和不勾选的颜色也不一样。
2.无法检查V-Ray中的“全局切换”卷展栏替换,覆盖深度设置为2。如果选中,则必须将其移除,并将次级光线偏移设置为0.01。
3.V-Ray中图像采样器(抗锯齿)的卷展栏是固定的。不要打开图像过滤器。
4.在V-Ray中,根据“环境”卷展栏的天光是否打开,通常不会打开。有时有必要设置环境光,如HDRI。
5.V-Ray的彩色贴图卷展栏中可能有人会选择先曝光,但是要区分线性曝光和指数曝光的区别。这里建议曝光方法的指数参数保持不变,检查亚像素映射和钳位输出。
6.在GI中,可以根据发光图像卷展栏的当前预设选择用户定义。最小速率为-4,最大速率为-4,细分设置为20,差分采样设置为20。细分和差分采样的参数越高,渲染效果越清晰,相应的渲染时间也会增加。需要检查和选择显示阶段。
7.在GI中,将“灯光缓存”卷展栏细分设置为200。
8.在设置中,系统卷展顺序从上到下选择,动态内存限制一般设置为8000MB。如果设计者选择内存较高的服务器,可以设置得高一些;取消选中显示消息日志窗口。
以上是小图的参数设置(测试)。设计师可以作为参考。以上参数不要照搬。你需要根据自己的实际情况进行适当的调整。
更多软件和教程,下载地址:www.enweike.com
恩维克教育官方微博:https://weibo.com/enweike
更多信息请关注微信公众平台:enweike
恩维克教育原创文章,转载注明出处。