面对全球极端天气事件增多的挑战,美国宇航局(NASA)与 IBM 研究院合作开发了一款基于人工智能和开放科学原则的新型 AI 地理空间基础模型。
据 NASA 近日发布的消息,美国宇航局(NASA)与 IBM 研究院合作开发了一款基于人工智能和开放科学原则的新型 AI 地理空间基础模型,该模型使用 NASA Harmonized Landsat and Sentinel-2 数据(HLS)训练,不仅为科学研究提供更多的数据来源和支撑,还为极端气候的提前预测增加了可能。
NASA 首席科学数据官办公室(Office of the Chief Science Data Officer, OCSDO)的数据科学负责人 Manil Maskey 描述这个模型称,“基础模型能够了解数据中所呈现的事物,它就像瑞士军刀,可以用于各种不同情况和处理不同事情。”这种多功能性意味着,一旦创建了基础模型,它就可以在少量数据上进行训练,以执行特定的任务,从而实现强大而高效的解决方案。
到目前为止,联合实施和高级概念团队(Interagency Implementation and Advanced Concept Team, IMPACT)及其合作者已通过对这一地理空间基础模型的微调和应用,展示了其在多个领域的潜力,包括监测森林火灾、划定洪水区域,以及分类作物和其他土地使用类型。
由于创建初始基础模型需要海量的数据和强大的计算能力,NASA 和 IBM 之间的合作显得尤为关键。在这个项目中,NASA 提供了数据和科学知识,IBM 则提供了计算能力和 AI 算法优化的专业技术。这种合作不仅加速了模型的开发进程,也确保了研究成果能够通过开放科学的原则,让更多的研究人员受益。
Manil Maskey 指出,“要构建一个大规模基础模型,我们很早就意识到凭借某个机构单一的努力是不会成功的。这也是我们向公众开放基础模型,从预训练数据、代码、到实践、模型权重、微调训练数据和出版物,都保持透明,使研究人员可以追溯使用某些数据或模型架构的原因。”
在 NASA 和 IBM 研究院地理空间基础模型的成功基础上,双方持续合作,创建一个新的、用于天气和气候研究的类似模型。这一新项目的合作对象还包括橡树岭国家实验室(Oak Ridge National Laboratory, ORNL)、英伟达(NVIDIA)和几所大学。这次的主要数据集是 Modern-Era Retrospective analysis for Research and Applications, Version 2 (MERRA-2),一个从 1980 年到现在的庞大的大气重新分析数据集。与地理空间基础模型一样,这个新的天气和气候模型也将采用开放科学的方法开发,并将在不久的将来向公众提供。