高性能计算正成为材料基因研究的助推“发动机”
科技日报记者 陈杰
以大数据、人工智能为代表的信息技术正在改变着我们的生活,而在科研领域,这些技术也正在改变着科研人员对未知世界的探索方式。
自上个世纪八十年代起,技术的革新和经济的发展越来越依赖新材料的进步。当前,面对竞争激烈的制造业和快速的经济发展,材料科学家和工程师必须缩短新材料从发现到应用的研发周期,以应对需求上的巨大挑战。但传统材料科学研究主要依赖“试错”实验方法,一种新材料从研发到应用需要10至20年,这已无法满足工业快速发展对新材料的需求,急需通过变革研究方法推进材料科学的加速发展。因此,旨在缩短研发周期和研发成本的材料基因组计划,一经推出就得到广泛响应。此时,超级计算机的作用受到材料基因研究机构及科研人员的认同和推崇,通过计算模拟与设计,高性能计算成为打通材料理论与实验的桥梁。
日前,中科院物理所携手戴尔和英特尔搭建其怀柔材料基因组高性能计算平台引发科研和产业界的广泛关注。“当材料科学计算的方式方法已经非常深入人心了,越来越多科研组,包括实验组都在做类似的计算。我们希望做一个从计算到数据化的过程,就是在做计算的同时还要将计算数据保存下来,以便挖掘蕴含在这些数据当中的一些知识,所以我们携手戴尔和英特尔搭建了这个高性能计算平台。”中国科学院物理研究所刘淼接受记者采访时表示,有了这一高性能计算平台,中科院物理所材料基因组就可以通过高通量的材料实验,为材料模拟计算提供大量基础数据和实验验证,充实材料数据库,也可以针对具体应用需求,快速筛选目标材料。
刘淼表示,以前科研人员在算材料的时候一般只算几种材料,每种材料算个半年时间才能将其做得很仔细。现在高性能计算的算力可以在很短时间内就把一个材料的基本信息算得较为清楚了。“强大的算力可以让我们在短时间内,通过高通量的计算方式同时算几百上千的材料。当我们有了这样的材料数据作业流之后,我们可以产生很大的数据量,然后我们可以做一个数据的储备。在未来的时候,很多实验组或者是理论组的这些物理、化学、材料领域的科学工作者看到这些材料的计算问题的时候,完全可以不用自己再去算,只用通过对数据的查询和检索就可以看到这些材料的基本信息了。”
对于科研领域而言,如果有了一个特别多的材料基本信息库之后,科研人员完全可以做一些和数据科学交叉的相关领域,通过人工智能的方式,在没有计算的前提下,就可做一些很快速的材料性质的预测和材料筛选这样的工作,这无疑可以最大程度上节约节省上科研资源和科研工作者的时间以及精力。
当前,高性能计算正在成为重要的国家力量,更是高性能计算式科技进步与科学突破的“发动机”。在最新基础科学领域,高性能计算都扮演着越来越重要的角色。也正是基于此,不少由政府主导的大型超算中心也纷纷建成并投入运营。
“使用公共高性能计算平台肯定比自建平台成本低很多,但基于材料计算不仅要结果,计算过程中产生的大数据也是无比宝贵的财富,但因为网络传输的问题,会导致我们无法把这些数据通过现有的网络架构或者是技术方式给取回来。”刘淼表示,当一个用户要做一个材料计算,他只要把结构上传到我们的平台上,经过两三天就可以看到计算的结果。但如果说我们是用远程的数据中心来做,可能会面临不能及时把这些数据给显示、下载或者是传输的问题。因此,平台的耐用性与可靠性往往是这些超算中心的关切所在,成熟专业的技术支持与性能优化团队也成为了平台建设者们最为看重的价值。“总之,中科院物理所材料基因组不论是在选择自建平台,还是在供应商的选择上,遵循的都是业务需要原则。”