<menu id="mqgc0"></menu>
  • <menu id="mqgc0"></menu><menu id="mqgc0"></menu><input id="mqgc0"><u id="mqgc0"></u></input>
    <input id="mqgc0"><u id="mqgc0"></u></input>
  • <optgroup id="mqgc0"></optgroup>
  • <input id="mqgc0"><tt id="mqgc0"></tt></input>
  • 终极:谁最强?处理器浮点计算能力PK

    电脑杂谈  发布时间:2020-11-14 02:00:42  来源:网络整理

    显卡浮点运算能力图_显卡浮点运算能力图

    随着AMD和NVIDIA陆续推出了浮点计算能力超过1TFlops的新产品,处理器的浮点计算能力最近已成为热门话题。浮点计算能力一直是处理器的非常重要的指标,科学计算的能力关键取决于处理器的浮点计算能力。

    前一段时间,AMD即将发布的新产品RV770官方信息文档出现在互联网上。该文件提到两个RV770产品的浮点计算能力超过1TFlops,而HD4850的单精度浮点计算能力达到1TFlops。 HD4870单精度浮点处理能力的高频版本高达1.2Tflops。

    显卡浮点运算能力图

    请注意HD4870简介文件的最后一行

    随后,AMD发布了新一代的流处理卡FireStream9250。由于该卡基于RV770内核,并具有800个流处理器的计算能力,因此该卡的浮点处理能力也非常高,超过了1TFlops。

    让我们来看看NVIDIA。本月16日,新的核心G200正式发布。流处理器的数量已达到240个。每个流处理器每单位时间可以处理3条指令,因此着色器频率为1400MHz。在这种情况下,浮点功能可能会超过1TFlops,但不幸的是最高端的GTX 280着色器频率仅1300MHz,浮点处理能力仅为933GFlops,不超过1TFlops。

    显卡浮点运算能力图

    ZOTAC推出了全球首款浮点功能超过1TFlops的GTX 280图形卡

    NVIDIA之所以没有突破GTX 280显卡的1TFlops浮点处理能力,主要是因为该显卡的热量和功耗已经难以控制,并且可以通过改进技术来实现。和将来的其他方法。但是,显卡制造商Zotac推出了GTX 280的超频版本,Shader频率设置为1400MHz,浮点处理能力自然超过1TFlops。

    显卡浮点运算能力图_显卡浮点运算能力图

    这里有个问题,为什么Zotac的GTX 280可以超过Shader的频率达到1400MHz,而NVIDIA无法。根据我的猜测,NVIDIA首先控制功耗和发热,因为对于重量级产品(例如G200),如果功耗和发热太大,媒体将使NVIDIA非常面目全非??。其次,众所周知,Zotac是世界最大的晶圆代工厂Boneng拥有自己的图形卡品牌。博能可能专门选择了一组体质更好的G200内核,并适当增加了它们的频率,从而可以极大地保证图形卡的稳定性。

    可以看出,G200的浮点处理能力仍然很强,只要稍微超频就可以突破1TFlops标记。这就是Zotac推出超频版GTX 280的意义。尽管公共版GTX 280并未突破1TFlops浮点计算能力,但NVIDIA推出的另一款科学计算产品Tesla L10做到了。

    显卡浮点运算能力图

    Tesla S1070

    Tesla S1070是一整套科学计算解决方案。简而言之,这是一个高性能工作站。 Tesla S1070具有4个G200 GPU,每个GPU的着色器频率达到1500MHz。根据“流处理器数量×每个流处理器同时执行的命令数量×流处理器频率=浮点处理能力”的公式进行计算,具有240个流处理器和每个流处理器的G200 GPU可以在以下位置执行3条指令:同一时间。当频率达到1500MHz时,单精度浮点功能可以达到1080GFlops,超过1TFlops,并且4个GPU同时运行。单精度浮点功能可以超过4TFlops。

    显卡浮点运算能力图

    它看起来就像一台1U服务器

    那么NVIDIA为什么不能在公开版本的GTX 280上突破1TFlops,却可以在Tesla S1070上实现?实际上,这很容易理解。 Tesla S1070是一整套科学计算解决方案。它具有单独的机箱。看起来像1U服务器。只要机箱中的空间允许,NVIDIA便可以随意使用它的散热设备,而且这类产品的价格当然也不低,即使使用全球顶级散热设备,NVIDIA也可以赚取可观的利润。因此,NVIDIA不惧怕这套设备的发热和功耗。

    显卡浮点运算能力图

    显卡浮点运算能力图_显卡浮点运算能力图

    Tesla C1060

    当然,NVIDIA还推出了另一款Tesla系列科学计算卡,型号为Tesla C1060。由于这是像GTX 280这样的独立卡的形式,因此情况与GTX 280非常相似。发热量,功耗和成本,着色器频率未超过1400MHz,浮点计算能力自然未超过1TFlops

    尽管NVIDIA和AMD都突破了1TFlops的浮点计算功能,但我们谈论的是单精度(FP32)计算功能。但是,就双精度浮点处理功能而言,相对较弱尽管Tesla S1070单GPU单精度浮点处理能力超过了1T,但双精度浮点能力只能达到大约100GFlops,大约是单精度浮点计算能力的1/10; AMD的FireStream 9250稍好一点,效率可以达到Tesla S1070的两倍,双精度浮点功能可以达到200GFlops。

    可以看出,GPU上双精度浮点运算的效率仍然很低。最近,Clearspeed发布了具有96GFlops双精度浮点计算功能的最新处理器。最令人惊讶的是,该处理器在工作时仅消耗12W的功率。 AMD的FireStream 9250可以达到200GFlops。功耗高达150W。 NVIDIA的性能甚至更差。 Tesla S1070单GPU具有仅100GFlops的双精度浮点运算能力,但功耗高达170W。

    显卡浮点运算能力图

    Clearspeed发行的该处理器的型号为CSX700,其代号为“ Callanish”(苏格兰巨石阵)。它采用90nm工艺生产,具有2×96处理内核,频率为250MHz,集成的256KB SRAM,纠错硬件模块,DDR2存储控制器和PCI-E接口。

    显卡浮点运算能力图

    CATS-700

    有两个带有CSX700处理器的加速卡,型号为Advance e710和Advance e720(单击型号可下载产品介绍PDF)。两种产品具有不同的形式以适应不同的用途,但规格相同。全部具有2GB的RAM,并且所有处理器均为CSX700。除了这两张加速卡之外,还有一个1U刀片服务器系统CATS-700(单击模型以下载产品介绍PDF),其中包含12个e710加速卡,24G存储系统以及总共两倍的。精度浮点性能高达1.152TFLops。

    显卡浮点运算能力图_显卡浮点运算能力图

    每年,都会发布世界500强超级计算机的最新统计数据。最近的统计是在去年9月。作者于去年9月获得了世界十大最快的超级计算机列表。下表:

    显卡浮点运算能力图

    点击放大视图

    从这台全球超级计算机Top10的最新统计数据中可以看出,蓝色巨人IBM占据了第一和第二位。美国能源部劳伦斯·利弗莫尔国家实验室(LLNL)安装的IBM Blue Gene / L系统已连续四年排名第一。但是,与以前的统计数据相比,该系统的计算能力已经改变。从以前的280TFlops到拥有212,992个处理器的478.2TFlops,它已经有了很大的改进。去年,IBM似乎已经对全球最佳超级计算机进行了重大升级;

    第二名也是IBM-Blue Gene / P System推出的产品。这是IBM去年制造的超级计算机,安装在德国的某个地方。作者不了解具体的地名!该系统有62536个处理器,浮点处理能力为167.3TFlops;

    第三名是由SGI推出的SGI Altix ICE 8200,它安装在新墨西哥计算应用中心(NMCAC)中,具有14,336个处理器和126.9TFlops浮点计算功能;

    第四名来自惠普。这台超级计算机安装在印度。它具有14,240个处理器和117.9Tflops的浮点处理能力;

    第五名也来自安装在瑞典的惠普公司,它具有13,728个处理器,浮点处理能力为102.8TFlops;

    第六名Red Storm Cray XT3来自Sandia / Cray,具有26,569个处理器,浮点处理能力为102.2TFlops;

    显卡浮点运算能力图_显卡浮点运算能力图

    在美国安装的第七个Cray系统具有23016个处理器,浮点处理能力为10 1.7TFlops;

    第八名也是IBM的产品。该系统安装在美国华盛顿。它具有40960个处理器,浮点能力高达9 1.3TFlops;

    第九名是Cray系统,具有19,320个处理器,浮点处理能力为85.4TFlops。这台超级计算机在美国;

    第十名是IBM Blue Gene系列的另一套产品,具有36864个处理器和82.2TFlops的浮点计算功能。

    实际上,在超级计算机市场上,行业巨头之间的竞争也非常激烈。该表每年都会发生很大变化。这是去年上半年全球十大超级计算机的清单。通过比较图片,您可能知道竞争的激烈程度(请参见下表):

    显卡浮点运算能力图

    此外,ISC08会议将于本月17日至20日在德国举行,这意味着它在过去几天中举行。最新的统计列表应公布。如果有新闻,作者将尽快向您提供报告。

    最新进度(19日15:00更新):

    我们宣布了刚刚被列入统计的世界前500名超级计算机。好消息是,该统计信息还使超级计算机进入了千万亿次时代,在IBM Roadrunner浮点运算中排名第一。容量已达到惊人的1.026PFlops,峰值性能为1.37578PFlops(注意:1PFlops = 1000TFlops)。

    [单击此处查看TOP10全球超级计算机] [单击此处查看TOP500全球超级计算机]

    此外,此统计中的全球前500名超级计算机还反映了HPC未来的发展趋势,例如多核,异构计算等。有兴趣的朋友可以单击下面的链接来了解:

    从TOP500超级计算机列表中看HPC的发展!


    本文来自电脑杂谈,转载请注明本文网址:
    http://www.pienmashup.com/a/shenmilingyu/article-333114-1.html

      发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

      热点图片
      拼命载入中...
      重庆彩票