传感器厂家
免费服务热线

Free service

hotline

010-00000000
传感器厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

板载故障记录原理解析

发布时间:2020-07-01 01:38:54 阅读: 来源:传感器厂家

OBFL基线记录的创建独立于任何电路板故障。OBFL系统应一直保持一个初始基线记录和至少一个近期基线记录。在完成对OBFL的系统现场配置、首次成功将电路板件投入使用之后,就会立即生成初始基线。首次创建近期基线记录的时候,将使用初始基线记录。创建近期基线记录的目的,是为了获取OBFL资源的近期值。随后每次成功的电路板复位都会创建后续的基线。OBFL还会要求提供存档的旧基线。任何稳定的基线都会被标注为“优良”基线,并在故障排查过程中用作参考基线。如果没有优良基线记录,初级基线记录将用作参考基线。 基线记录将获取特定的软硬件配置详情,并存储在非易失性存储器中。基线记录的硬件部分包括电路板配置数据详情,如机架编号、电路板件的插槽号、序列号、子卡标识详情、FPGA和ASIC修订号等。该部分还应该存储诸如SRAM/SDRAM/DDR这样的板载存储器类型、序列号和配置详细信息。BIOS版本、固件版本、OS详情和应用软件版本应存储在软件基线记录下。该记录在缩小由近期软硬件升级造成的电路板故障范围时非常有用。 基线记录的第三部分存储电路板环境变量值。任一存储的电路板环境变量都存放有近期的“N”个值,最大实际值和电路板环境变量的最低允许值。环境变量包括电路板电源部分参数,如电压、电流以及来自电路板上一个或者多个感应器的温度读数。 电路板环境变量的值定期采集、存储为近期值,并同最大允许值进行比较。如果采集的值大于最大允许值,将采用当前的时间戳更新环境错误事件(Environment Error Event)记录。此外,电路板一般有多个电压源和温度感应器。温度应定期记录(比如每隔30分钟),而电压数据可以不需这么频繁(比如每隔60分钟)。 事件记录 OBFL事件记录负责存储由板载存储器故障、系统复位、意外事件、中断错误或者电路板环境错误导致的硬件故障事件迹象(如电路板崩溃)。OBFL事件记录可以分为下列几类: 存储错误:通常,SDRAM或者DDR错误分为可纠正的错误和不可纠正的致命错误两种。可纠正错误可以通过存储器中的其他硬件逻辑来查找并纠正单比特ECC错误来加以纠正。虽然这种错误不具有致命性,但它会给系统性能造成一定影响,因此记录这种事件有助于排除系统性能错误。此外,记录可纠正错误还可以就将来可能出现的致命错误提出告警。对于属于不可纠正致命错误的多比特存储错误,在事件日志中应该登记错误地址位置、预计数据和其他存储详细信息。

linux操作系统文章专题:linux操作系统详解(linux不再难懂)

日照制做西服

长春定制西服

东营职业装订做