高性能计算 (HPC)
高性能计算( High Performance Computing ),是用计算机来求解科学研究和工程技术中所遇到的大规模数学计算问题。广泛应用于数学、物理、天文、气象、化学、材料、生物等学科和工程仿真计算领域。如今,利用高性能计算已经逐步成为继实验、理论之后发展起来的能够创造、发现新的科学现象和科学概念的重要方法。 HPC 应用通常具有高网络吞吐、低延迟存储、大容量内存、 超高计算力的需求。通过紫光云,您可以将高性能计算任务部署在云端, 并根据需要对资源进行弹性扩展,从而提升高性能计算在具体应用场景的任务分析效率, 降低对资源部署的依赖。紫光云可按需提供资源, 包括灵活定制化的 CPU、GPU 和 FPGA云主机、高带宽低延时的互联网络、不同IO性能的存储介质等,无需巨额资金投入,从而帮助您降低成本。
方案优势
灵活弹性的高性能云主机
基于HPC多种应用场景,紫光云提供多种规格的云主机,满足计算密集型,I/O密集型,网络密集型等不同应用负载,匹配各种HPC应用对计算、内存、网络的差异性需求。
多规格可靠的弹性块存储服务
紫光云提供多种规格基于分布式可扩展的块存储服务,针对不同应用场景的云服务器,您可以灵活选择不同性能的云硬盘进行挂载,为其提供I/O存储服务。为确保数据可靠性,云盘块存储提供3副本的数据保护,确保数据安全可靠。基于HPC应用场景,云盘块存储服务即可满足高性能,I/O密集计算的需求,又可满足大容量灵活扩展的需要。
安全可靠的网络互联服务
紫光云网络为HPC用户在公有云下,构筑安全可靠的网络互连。无论您的HPC应用程序是需要将数千个核心用于一个紧密耦合的工作负载,或是需要将数十万个核心用于高度并行、高吞吐量计算 (HTC) 应用程序,紫光云网络均可提供相应的性能 (高带宽、低延迟) 和可扩展性。
海量的对象存储服务
基于对象的海量存储服务,紫光云为HPC应用提供存储空间,存储HPC应用的算例数据、结果数据,用户可通过对象存储服务灵活的上传、下载HPC计算数据。
应用场景
机器人语音交互
通过远场语音识别技术,解决人机间距离变化过程带来的识别率变化差异,使得人机互动更加高效准确。
智能家居
通过远场语音识别技术,在远距离完成对智能家居的唤醒及各项操作。
车载导航
通过减弱背景噪音和人声干扰,提高拾取信号质量,实现复杂环境下导航能准确提取目的信息。
设备维保
通过分析设备的运行数据,建立设备故障模型,从而可以预测设备发生故障的时间,协助用户更好的维护和管理设备,节约运维成本,甚至开启新的业务模式。
方案介绍
高性能计算应用相关的云服务如上图所示,涉及IaaS层的各种计算、网络、存储资源,以及PaaS层的集群能力提供如弹性HPC集群服务、批量计算服务。您可以根据自身应用场景、HPC应用、易用性与灵活性等各方面因素选择合适的服务。

应用场景
深度学习场景
应对深度学习高负荷特点, 提供高性能异构HPC计算集群,满足分布式模型训练环境下参数服务和梯度计算的非对称资源需求配比关系,搭配对象存储、云数据库服务以及大数据服务平台,方便训练数据的原生存取和复杂整合处理需要, 通过高带宽低延迟网络连接以支撑组件间频繁的数据传输交互;提供满足推理应用可扩展并行处理的高性能异构HPC计算集群,将批量并发推理应用请求均衡分发到GPU计算设备上并快速返回预测结果. 最终交付用户一个基于深度学习框架镜像随需定制的应对任何形式数据、任何类型模型、任何规模的弹性可伸缩深度学习训练和推理应用的一体化解决方案。
VR渲染场景
前VR效果依赖于双眼视差,天生需要双路输入;而为了得到更好的效果对分辨率、帧率也提出了很高的要求,因此制作VR内容涉及到大规模的渲染需求,传统的渲染方式无法提供如此庞大的渲染能力,VR内容制作耗时耗力。利用高性能计算解决方案,利用各种云服务可以提供超大规模的渲染集群,提供海量的渲染能力,助力VR内容制作,大幅度缩短VR渲染所需的时间,将原本耗时数月、数周的渲染任务在数天、数小时内完成,加速用户VR内容上线。
解决方案

首先将VR渲染数据上传至对象存储。
在批量计算服务控制台上定义渲染作业,包括:
资源规格要求:如使用的GPU云服务器规格,运行的GPU云服务器的数量。
使用的虚拟机镜像和执行的渲染命令。
各种配置参数和环境变量。
批量计算服务向IaaS服务要求创建所需的GPU云服务器集群。
GPU云服务器集群从对象存储中拉取数据,运行渲染任务。
渲染任务完成后,将最终结果保存于对象存储中。