硬件不升级 算力大进步 深北莫这项科研效果为自主研发装上“加快器”
跟着国产AI DeepSeek崛起,“精巧的东方力量”激发了科技圈的鼎新。而近日,一篇在《料想力学学报》上发表的最新盘考效果,将东谈主们的目力再次引向了中国。科研团队开发的一种基于图形处理器(GPU)并行的快速近场能源学算法,只需使用通常的家用GPU,即可已毕性能的大幅进步,为惩处传统料想力学算法的效率问题找到了新的标的。
该著作的第一完成单元是深圳北理莫斯科大学,作家为深圳北理莫斯科大学杨杨副熟悉、南边科技大学硕士盘考生苏梓鑫。1月31日,在接收深圳商报采访时,杨杨副熟悉暗示,这项效果的最大翻新在于无用更换GPU,即可将料想效用“最大化”,从而为工业软件的中枢工夫国产化保驾护航。
跨学科调和催生灵感
近场能源学是一种有用惩处断裂问题的步调。然则,其非局部表面使得料想历程较为耗时。并行料想是加快数值料想的有用路子,主要分为基于中央处理器(CPU)的并行料想和GPU的并行料想。其中,GPU并行料想更相宜处理逻辑肤浅但料想量大的场景。
现在,基于GPU的近场能源学并行盘考,大多围聚在将串行法子退换为并行法子。许多优化战术带来的加快效果主要依赖于GPU本人性能的进步,而针对GPU硬件结构的优化相对较少。此外,GPU并行料想仍存在一些问题,举例在处理大畛域问题时“心过剩力不及”、内存带宽虚耗、一些算法仅能处理均匀漫衍且未受损的蹧蹋结构……
针对这种情况,科研团队盘考盘算了一个资本效益高且性能优异的近场能源学模拟框架。该分析框架能够以高效的料想速度准确模拟键基和态基近场能源常识题。该算法弃取了粒子并行形态,拓荒了一个通用的邻域生成模块用以优化存储,并提倡了一种通用寄存器工夫,用于高速造访寄存器内存,减少全局内存造访。该工夫不仅排斥了对邻域点数目的戒指,还适用于材料点的非均匀漫衍,不错大大进步料想的效率。
“这项盘考咱们花了大约两年的时刻,之是以能取得冲突,是因为咱们是一个交叉学科的团队”,杨杨说。
料想效率进步800倍
“料想效率进步800倍!”这么的描摹相称“握眼球”,有东谈主致使说AI与之比较齐小巫见大巫。但杨杨严谨地强调:“不要将它与AI比较,两者不在一个架构下,不具备可比性。”
杨杨暗示,经过科学测试,智慧优配与现存基于串行法子和OpenMP并行的近场能源学算法法子比较,该算法诀别可已毕高达800倍和100倍的加快。在典型的百万级粒子模拟中,扩充4000次迭代在单精度下可在5分钟内完成,在双精度下可在20分钟内完成,这在低端GPU PC上即可已毕。这意味着,在处理复杂的材料盘算和毁伤模拟时,盘考东谈主员能够更快地得到收尾,从而加快科学盘考和工程应用的发展。
“咱们的上风是能够把英伟达显卡里的一些里面结构充分诈欺起来,通过对GPU里面寄存器显卡的读取,不需要更换更高档的显卡,即可已毕效率的升级。”杨杨说,该效果不错减少对更高水平料想机硬件的硬性需求,只需使用通常的家用GPU,就能够将底本需要数天身手完成的料想任务裁汰至几个小时,致使几分钟,但是“它跟AI惩处问题的标的是不相同的”。
杨杨暗示,在现存设备单卡的英伟达显卡下,“算力进步800倍”已是现存算法的上限,不外这不虞味着该项盘考不错画下句号。“咱们的盘考还有需要完善和迭代的地点,后续咱们也会不绝将盘考长远下去,力图让它做事于更多推行场景。”
新工夫将获凡俗应用
在科技界,有“得算力者得宇宙”的说法,这亦然深北莫该项盘考效果如斯令东谈主“心潮倾盆”的原因。
杨杨暗示,这项工夫的凡俗应用将有助于鞭策多个畛域的翻新,相称是在需要高性能料想扶直的行业中。通过诈欺浮滥级GPU的雄壮料想才略,盘考东谈主员能够更高效地惩处复杂的物理问题,从而鞭策科技特等和产业升级。
“现在,大部分企业应用的软件齐是海外的商用软件。更长久的将来,咱们但愿新算法不错匡助更多中国的企业研发我方的工业软件,从而相沿更多的开发场景。”杨杨暗示,据她所知,许多科研东谈主员和企业正在为工业软件的工夫自主而悉力,该算法有望助他们解囊相助,为工业软件的中枢工夫国产化孝顺力量。