复旦大学上线中国高校最大云上科研智算平台 CFFF,45 亿参数科学大模型一天训完

2023-06-28 09:38:06   来源:新浪科技   评论:0   [收藏]   [评论]
导读:昨日,国内高校最大的云上科研智算平台 CFFF(Computing for the Future at Fudan)在复旦大学正式上线。这台为发现和解决复杂科学问题而建的科研超级计算机由复旦大学与阿里云
  昨日,国内高校最大的云上科研智算平台 CFFF(Computing for the Future at Fudan)在复旦大学正式上线。这台为发现和解决复杂科学问题而建的科研“超级计算机”由复旦大学与阿里云等共同打造,以先进的公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练。这在国内高校中尚属首例,也领先于斯坦福大学等国际知名高校 。

  据介绍,CFFF 平台由面向多学科融合创新的 AI for Science 智能计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号两部分组成。

  复旦大学浩清教授、人工智能创新与产业研究院院长漆远介绍,基于百 G 高速数据传输网和阿里云全球领先的大规模异构算力融合调度技术、分级存储技术、AI 与大数据一体化技术,部署在复旦校内的“近思”一号和托管在 1500 公里外阿里云乌兰察布数据中心的“切问”一号连成了一台真正意义上的“超级计算机”,复旦四校区的所有实验设备都能高速接入,做到异构算力统一管理,计算任务统一调度,满足不同应用场景下的科学智能研究与应用需求。

  漆远表示,有赖于公共云模式,跑在 CFFF 平台上的项目可享受到超千卡并行的智能算力,千卡并行的有效算力达到行业领先的 92%,可拓展性达到万卡,万卡并行有效算力也可达 90%。

  同时,公共云更加低碳和绿色。阿里云绿色数据中心技术结合乌兰察布当地天然的气候优势,CFFF 平台可实现平台年平均 PUE 小于 1.2,每年可节省总电力超过 2000 千瓦,节省电费 500 万元,年均节碳量达 15 吨。

  目前,CFFF 平台上的第一个科研成果已经诞生。IT之家注意到,复旦大学人工智能创新与产业研究院李昊团队近期发布了 45 亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的 ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了 3 秒内。

  “基于 CFFF 平台的千卡并行智能计算,这样一个规模的大模型只用一天就完成了训练。传统的计算平台是很难做到的。”李昊说。

  复旦大学校长、中国科学院院士金力表示,在数据和智能技术驱动的“大科学时代”,如何在日新月异的科技创新环境中赢得主动,在关键领域取得创新突破,是时代给予高校的命题。以 CFFF 平台为代表的智算平台作为一种新兴的科研超算架构,将成为科研的重要支撑力量,极大提升科研效率、降低科研成本,加速科学原理发现和技术突破,有力推动科学大模型的落地。

分享到:
责任编辑:zsz

网友评论