直奔主题---服务器内存:
1、什么是服务器内存?它与普通PC机上的内存有什么区别?
答:服务器内存也是内存,它与我们平常在电脑城所见的普通PC机内存在外观和结构上没有什么明显实质性的区别,它主要是在内存上引入了一些新的技术,普通PC机上的内存在服务器上一般是不可用的,服务器认不到的,这就是说服务器内存不能随便为了贪便宜用普通PC机的内存来替代的原因了。有些人把具有某种技术的内存就称之为“服务器内存”,其实是不全面的,服务器的这些内存技术之所以在目前看来是服务器在专用,但不能保证永远只能是服务器专用。这些新技术之所以先在服务器上得以应用是因为服务器价格较贵,有条件得以应用,这些新技术由于价格的原因暂时在普通PC机上无法实现应用,但是会随着配件价格的下降逐步走向普通PC机,就行原来的奇偶校正内存一样原先也是最先应用在服务器上,现在不是很普遍了吗?所以服务器内存并不是一种特指,它是内存新技术在不同时间段上的应用。
2、什么是ECC内存?
答:目前是一谈到服务器内存,大家都一致强调要买ECC内存,认为ECC内存速度快,其实是一种错误地认识,ECC内存成功之处并不是因为它速度快(速度方面根本不关它事只与内存类型有关),而是因为它有特殊的纠错能力,使服务器保持稳定。ECC本身并不是一种内存型号,也不是一种内存专用技术,它是一种广泛应用于各种领域的计算机指令中,是一种指令纠错技术。它的英文全称是“Error Checking and Correcting”,对应的中文名称就叫做“错误检查和纠正”,从这个名称我们就可以看出它的主要功能就是“发现并纠正错误”,它比奇偶校正技术更先进的方面主要在于它不仅能发现错误,而且能纠正这些错误,这些错误纠正之后计算机才能正确执行下面的任务,确保服务器的正常运行。之所以说它并不是一种内存型号,那是因为并不是一种影响内存结构和存储速度的技术,它可以应用到不同的内存类型之中,就象我们在前面讲到的“奇偶校正”内存,它也不是一种内存,最开始应用这种技术的是EDO内存,现在的SD也有应用,而ECC内存主要是从SD内存开始得到广泛应用,而新的DDR、RDRAM也有相应的应用,目前主流的ECC内存其实是一种SD内存。
问:目前服务器内存的主要外频是多少:
答:由于服务器内存在各种技术上相对兼容机来说要严格得多,它强调的不公是内存的速度,而是它的内在纠错能力和稳定性。所以在外频上目前来说只能是紧跟兼容机或普通台式内存之后。目前台式机的外频一般来说已到了150MHz以上得时代,但是133外频仍是主流。而服务器由于受到整个配件外频和高稳定性的要求制约,主流外频还100MHz,但133MHz外频已逐步在各档次服务器中推选,在先购服务器时当然最好选择133外频的了!内存、其它配件也一样,要尽量同步进行,否则就会影响个服务器的性能。
3、目前主要些什么品牌的服务器内存?
由于服务器内存在技术难度和加工工艺上比普通PC机上的内存有较大提高,在服务内存品牌选择上没有象普通PC机内存一样那么杂,但目前服务器内存品牌也有逐步杂化的趋势,目前主要的服务器内存品牌主要有kingston、三星、IBM、NEC等,但主要以前面几种在市面上较为常见,而且质量也能得到较好保障。
4、选择服务器内存应该注意什么事项?
服务器内存的选择不能与普通兼容机一样随便选择,因为服务器一般要求24小时连续不间断工作,而且要求主速度较高,容量较大,目前的一般要求在PC133以上,所以在选择内存时一定要注意选择服务器专用内存,外频要在133MHZ以上,不能随便用一个PC的内存代替。内存的优化主要体现在内存访问缓冲时间的设置,在CMOS中有相应设置,一般应尽量设置为小一点的缓冲时间,这样速度会更快些。另外,服务器内存千万不要用兼容条或是贴了假原装标签的内存。一定要选择一个好的供应商,一个好的内存品牌,如Kingston。
目前WEB服务器所需的内存一般不专门采用ECC服务器内存。
服务器内存技术知识充电
看完了上面的文章后,我相信我们对服务器内存已经有了个大概的认识,或许你认为内存已经为服务器提供了很大的保险了,但面临着一些意外的内存错误,有另外一种技术比内存错误纠正技术有效得多。IBM的内存保护技术就是保护由于意外的内存错误而带来的损失,它使用的是标准的ECC 168内存。
它的工作方式有点像在Windows NT的NTFS文件系统下的在线备份磁盘扇区一样,当操作系统在磁盘上检测到坏的磁盘扇区时,它将在另外的扇区中写下这些数据放一边留作备用,我们可以认为内存保护就是提供在线备份数据位。这内存错误的纠正是通过内存控制器来完成的,所以不会增加操作系统的工作量,也不需要操作系统来提供支持,完全与操作系统无关。因为这是在标准的ECC 168线内存起作用的,无需为这种保护增加另外的开支。
内存保护(在其它系统中也有称“多余的数据位”)技术最初的发展是在IBM大型机上,而且在Z系列和I系列服务器上使用了许多年。在一个2路交叉存取的内存系统中,每2片168线ECC内存包含144位,但是只有140位是用于数据存取和校验的。余下的4位是没有用上的,标准的ECC内存可以检测出2位的数据错误,但它只能纠正一位错误。
如果在同时内存上有多位出错,那么这整个内存读取就失败了,此时唯有使系统临时挂起来,以尽量减少内存容量的需求,直到这个节点被更换。如果具有内存保护,那么就可以立即隔离这个失效的内存,重写数据在空余的数据位。通过这种方法可以在每4对(1个内存控制器,有的服务器不止包括一个内存控制器)168线内存中修复4个4位连续的内存错误。
当服务器下次重启就会重新检查内存的状态,如果是内存软错误(临时的),系统重启后内存的这些用于在线数据备份的数据位就重新释放了,恢复空的状态。如果是属于硬故障,这些在线备份数据位还会继续用来备份,直到更换为止。这种先进技术可以使减少停机机时间,使服务器持续保持高效的计算平台。这对于大型的数据库系统中尤其重要。
前面提到的在线内存备份是另一种更高级别的内存保护。需要注意的是由于系统使用了双路交叉(2-way Interleaving)访问技术,所以必须成对安装双列直插式内存模块(Dual In-line Memory Module,DIMM)的内存条。每个DIMM必须是同一型号的,而且容量相同,否则内存系统的性能会受到影响。
如果一共有三组内存条组,把C组作为在线备份内存,其内存容量总合要是A、B两组的容量总合之和。这种技术特别适用于没有足够的计算机系统维护后人员或者手头没有多余的内存可以方便替换的场所,像HP ProLiant服务器的ML 370、DL 380系列产品均采用在线备份模式。
另一种防止服务器因内存错误的发生而导致整个服务器不稳定性事件发生的措施就是内存镜像和内存热备份(Memory ProteXion)。在线备份内存模式只能对发生单比特错误的数据提供保护,像镜像内存方式还可以用来保护发生多比特错误的数据。正因为如此,内存镜像和内存热备份很适合于商业应用,因为它除了正常维护之外,不需要在内存检修上花费额外的时间。
这种技术的出现,是由于随着服务器系统总线提高,内存传输的数据陪增,会出现不知什么原因遇到了许多内存保护和Chipkill修复技术都不能完全修复的情况。内存镜像和内存热备都属于内存冗余技术,是内存热插拔不可缺少的技术成分,诸如其他还有热更换热添加、热插拔RAID内存,这些就相当好理解 ,不过需要注意的一点是,许多企业实际上实现的只是有限的内存热插拔,只能拔掉特定的内存条,而不能随意拔掉其他内存条。