协同计算加速架构

创新性引入GPU计算单元,突破了传统单一的计算单元,采用Intel最新Nehalem/Westmere处理器核心与NVIDIA Tesla加速计算技术的协同,让CPU和GPU各司其职,CPU主要承担更加擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职计算密集型、高度并行的计算工作,使得计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几百倍的增长。特别强调的是,协同计算加速架构不是对传统技术路线的否定,而是一种补充和辅助,更加淋漓尽致地发挥GPU的优势,最终帮助用户在某些特定应用领域中大大缩短解决问题的时间或提高解决问题规模。

大规模并行计算处理核心
相比较于仅能有很少线程同时工作的多核CPU而言,GPU的特性是可以同时执行数千个线程,这将令我们的系统能处理更多的信息流。例如在游戏、动漫渲染中,由于GPU的计算是一种特殊的计算任务,即所计算的每一个像素之间不需要(或者用方法使它不需要)考虑先后顺序,那么如果有了上百万个线程,就可以让所有的像素同时渲染,这样所有的像素就可以在一个像素的时间内计算完成。目前Tesla处理单元支持448个处理器核,峰值处理速度达每秒1万亿次浮点运算,通过协同可扩展架构,根据用户的需求可以增加GPU的数量,通常应用加速比都在1个到2个量级。

协调处理单元间高速IO交换技术
为了更好的发挥CPU和GPU的协同效应,九重天S8000桌面超级计算机采用了Intel 公司的QPI(Quick Path Interconnect)技术,可以实现高达6.4GT/s的传输速率,使通信更加迅捷。QPI总线实现了多核处理器内部的直接互联,在多处理器作业下,每颗处理器可以互相传送资料,并不需要经过芯片组,从而大幅提升整体系统性能。随着Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心的出现,QPI架构的优势将进一步发挥出来。

优秀的编程环境
CUDA(Compute Unified Device Architecture)通用并行计算架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。并且支持其它语言,包括FORTRAN以及C++。

  用于GPU并行应用开发的标准C语言
  快速傅里叶转换(FFT)以及基本线性代数子程序(BLAS)的标准数字库
  专用CUDA驱动器,用于GPU和CPU之间快速数据传输计算
  CUDA驱动程序与OpenGL和DirectX图形驱动程序可以实现互操作
  支持Linux 32/64位,Windows XP 32/64位以及Mac 操作系统
  目前数以千计的软件开发人员正在使用免费的CUDA软件开发工具来解决各种专业以及家用应用程序中的问题。这些应用程序从视频与音频处理和物理效果模拟到石油天然气勘探、产品设计、医学成像以及科学研究,涵盖了各个领域

操作系统

Windowslinux全系列

CPU处理器类型

- 支持双路 Intel® Xeon® E5-2600 系列, Socket R LGA2011 4/6/8 核心、15MB/20MB 缓存,最大功耗: 150W

芯片组

英特尔® C602

电源要求

2400W2+1)冗余 100-240V全球电压自适应,主动式功率因数校正

内存类型

DDR3 1333 MHz ECC Unbuffered or Registered DIMMs

内存

- 24 DDR3 DIMM slots ,高达 192GB
- 8
通道 DDR3/DDR3L 800/1066/1333/1600 MT/s
-
支持 RDIMM/UDIMM ECC/LR-DIMM/LV-DIMM

内置驱动器

23.5 英寸 SATA 6GB 硬盘或 4 2.5 英寸 SATA 硬盘,支持固态SSD(电子)硬盘

硬盘驱动器速度

7200 15000 rpm

存储控制器

- 2 AHCI (ODD)SATA 6G 端口, 包括 RAID 0/1
- 4
SCU0 (HSBP)SATA 6G 端口
-
可选 2x 4 端口 mini-SAS ,支持高达 6Gb/s SAS/SATA with both LSI & RSTe RAID 0/1/10/5 通过 Intel RAID C600 升级 Key

GPU处理器类型

- 高达8Nvidia Tesla M2090 GPU卡(每卡支持448颗计算核心、共计4,096颗核心)
-
单个机箱内,提供5.32 Teraflops 双精度浮点和10.65 Teraflops单精度浮点性能
- IEEE 754
/双精度浮点
-
高达48GB专用DDR5内存(每个GPU支持6.0GB

扩展槽

- 8x PCIe Gen3 x16 slot, FL, DW
- 3x PCIe Gen3 x8 slot, FL
- 1x PCIe Gen2 x4 electrical (in x8 slot), HL
*
支持高达8x16