我应该在带有ECC DIMM的Dell PowerEdge R710 Bios中使用bios“Advanced ECC”吗?

Modified on: Tue, 16 Apr 2019 13:00:03 +0800

我有一台配备双Intel Xeon E5503 CPU的Dell PowerEdge R710。它有96GB(12x8GB)的ECC DIMM。
在其BIOS中,内存配置为“高级ECC”。

我的问题是,如果我的DIMM已经是ECC,在BIOS中启用此“高级ECC”模式是否有意义,还是应该切换到“优化”?

戴尔将这些模式描述为:

  

高级ECC模式
  此模式使用两个MCH并将它们“绑定”在一起以模拟128位数据总线DIMM。这主要用于实现基于x8 DRAM技术的DIMM的单设备数据校正(SDDC)。在每种内存模式下,SDDC都支持基于x4的DIMM。一个妇幼保健院就是
  完全未使用,此通道中安装的任何内存都将在POST期间生成警告消息。

  
  

内存优化模式在此模式下,MCH彼此独立运行;例如,一个可以是空闲的,一个可以执行写操作,另一个可以准备读操作。内存可以安装在一个,两个或三个通道中。为了充分实现内存优化模式的性能优势,应该填充每个CPU的所有三个通道。这意味着某些“非典型”内存配置(如3GB,6GB或12GB)将产生最佳性能。除非需要特定的RAS功能,否则这是推荐模式。

Dell PowerEdge R710系统硬件用户手册(PDF)

作者:,Mxx

最佳答案

它确实有所作为,只有在x4或x8设备上需要RAS(可靠性,可用性和服务)功能并了解满足您需求的权衡时才有意义。有关详细信息,请参阅戴尔白皮书Dell™PowerEdge™服务器
2009年 - 记忆

此外,PowerEdge R710技术指南中提供了具有R710特定详细信息的配置和布局 - (Google这是因为我没有链接声誉)。

需要注意的重要问题是芯片上的ECC与戴尔用于单设备数据校正(SDDC)的BIOS提供的“高级ECC”之间的区别。您将对两者产生性能影响。 ECC将在写入芯片期间从错误中恢复。但是,SDDC更进一步,将组织这些位,以便整个芯片可以发生故障并仍然可以恢复。查看示例和详细信息SDDC E7500芯片组

问题在于您的性能和/或可靠性是否是您对机器特定用途的最大关注。如果芯片故障会导致此机器上的关键数据或使用丢失,并且在实现中它是非冗余的,则高级ECC可能是一个很好的方法。但是,您可能会对性能产生影响,这对您来说可能更重要。

我已在Dell PowerEdge服务器的现场实施了单个Microsoft SQL Server实施。如果我能提供更多帮助,请发表评论告诉我。

希望有所帮助。

编辑:覆盖差距/ ECC实施

是的,即使您同时实施两者,也存在覆盖差距。因为,您专门使用高可用性服务器群集,恕我直言,您应该使用高级ECC。与群集设备的优势相比,您的性能影响最小。根据Crucial,您只有ECC内存性能下降2%总的来说。

差距将更具体地针对发生的错误类型以及每个错误处理错误的方式。在您的具体情况下,它不应转化为数据丢失。由于这是一个企业DBMS,因此在软件级别管理错误,并发问题等,以防止数据丢失。详细记录了正确配置的DBMS中的更改,并且使用它的软件通常可以设置为在发生严重错误时使事务“回滚”。

ECC实施

ECC将尝试纠正内存读/写中的任何位错误。但是,如果错误更严重,那么即使ECC也无法恢复,导致潜在数据丢失。有关ECC的更多讨论以及ServerFault /什么是ECC ram,为什么它更好?

根据有关ECC_Memory的维基百科

  

ECC内存可以保持内存系统免受单位错误的影响...

SDDC 强>

如果您参考上面的E7500芯片组文档(注意来自英特尔的55xx / 56xx需要登录/合作伙伴关系,但这个想法类似于我最初没有链接的原因),它描述了SDDC以及它是如何实现的。基本上,它使用一种技术来组织写入存储器的字,确保所有字都以每个字只包含单个位错误的方式写入,即该字应该可以从单个位错误中恢复(如上)。 现在就是每个字,所以它可以通过对每个字进行纠错,从x4设备上的4位错误(每个字1个)和x8设备上的8位错误(每个字仍然是1个)中恢复。 强>

其他错误,更多位错误,总内存故障,通道故障,总线故障等仍然可能导致可怕的问题,但这就是您拥有集群和企业DBMS的原因。

简而言之,如果您已启用所有内容且错误纠正算法的位错误太多而无法纠正,则仍会出现错误,即错误覆盖率差距。这些可能非常罕见。


相关问答

添加新评论