近日,由中国科学院海洋研究所海洋大数据中心承担的中国科学院“十三五”信息化专项科研信息化应用工程-海洋科学“科技领域云”的建设与应用课题顺利通过技术验收。课题研发的海洋科学领域云平台通过建立“计算资源+数据资源+软件工具+分析平台+人工智能与大数据应用”全流程服务体系,面向海洋领域用户提供数据资源管理与共享、交互式数据分析、海洋大数据与人工智能应用、虚拟云主机、人工智能训练与推理等服务。目前,已上线船基调查数据集353套、定点观测数据集59套、卫星遥感数据6套及再分析数据产品、国际共享数据集10余套。此外,集成海洋与大气科学数据软件工具500余套,自主开发了多项海洋大数据与人工智能应用产品等。
海洋科学数据门户
http://portal.qdio.ac.cn
整合领域内数据资源提供数据共享服务;
集成数据处理、质控、格式标准化等数据处理流程;
实现元数据管理以及数据资源自动化更新、发布;
提供数据浏览、可视化检索、申请、下载。
图2 海洋科学数据门户及元数据管理系统
大规模数据交互式分析平台
https://datalab.iocasdata.com(所外用户需向海洋大数据中心申请VPN)
基于海洋大数据中心服务器集群,实现计算资源虚拟化统一管理调度;
集成JupyterLab编辑器和Python/R/Julia语言,提供基于Web浏览器的数据分析环境;
集成海洋与大气科学数据软件工具500+;
支持多计算节点并行处理分析超大规模数据集;
可用于数据分析、数值计算、统计建模、机器学习;
图3 数据在线交互式分析系统图4 集成软件包547个图5 海平面高度数据分析案例图6 NCBI数据查看(Julia语言)
图7 基因分析(R语言)
图8 三维地形展示(R语言)
图9 二维图表三维展示(R语言)
§ 人工智能训练与推理平台
基于海洋大数据中心构建的GPU服务器集群(22个Nvidia Tesla V100S 32G GPU显卡)建设了一体化人工智能开发服务平台,整合了训练数据资源、深度学习框架,实现了AI计算资源统一分配调度、训练数据集中管理并加速、AI 模型流程化开发训练以及模型推理部署。
图10 深度学习框架库
图11 创建开发环境界面
§ 海洋大数据与人工智能应用产品
· https://cloud.iocasdata.com/#/Applications
基于云平台环境以及平台集成的数据、软件工具、算法和模型等资源,自主开发了多项海洋大数据与人工智能应用产品。图12 海洋大数据与人工智能应用产品图13 全球海洋流场可视化图14 基于深度神经网络的三维温盐场重构
据了解,海洋科学领域云平台将海洋科学领域已有数据资源建设成科研业务在线云服务数据平台,将不断突破海洋数据提取、质量控制、格点化等共性关键技术,研发集成海洋科学数据管理和分析应用工具,开发具有普适性、综合性和示范性的数据产品,构建面向国家环境安全、政府决策和海洋科研需求的结构完善、功能先进的海洋人工智能与大数据服务业务化云平台,服务于海洋科技创新发展,推动海洋科学事业的发展。
原文链接:https://mp.weixin.qq.com/s/1-rlqiphdmGCnfKW8O5Low