本发明涉及数据存储的,尤其涉及一种cxl扩展卡、故障日志收集的实现方法及系统。
背景技术:
1、cxl(compute express link)是一种高速串行协议,它允许在计算机系统内部的不同组件之间进行快速、可靠的数据传输。cxl还可以实现内存扩展和内存共享,并且可与计算加速器(如gpu、fpga)等外设通信,提供更快、更灵活的数据交换和处理方式。
2、现有技术中,服务器在运维过程中,时常碰到异常重启的情况,当遇到异常重启的情况时,大多无法判断系统的根因,原因在于服务器及cxl扩展卡在遇到系统重启时,重启之后的日志会覆盖原来的日志,因此无法根据日志判断重启根因,只能尝试复现故障根因,往往这种重启无法复现,导致根因问题无法解决,严重影响了应用cxl扩展卡的服务器的稳定性。
3、因此,现有应用cxl扩展卡的服务器存在稳定性差、可靠性低的问题。
技术实现思路
1、本发明实施例提供了一种cxl扩展卡、故障日志收集的实现方法及系统,旨在解决现有应用cxl扩展卡的服务器存在稳定性差、可靠性低的问题。
2、第一方面,本发明实施例公开了一种cxl扩展卡,所述cxl扩展卡包括输入模块、大电容模块、第一掉电检测模块、第二掉电检测模块、第一复位芯片、第二复位芯片、延迟电路、cpld模块、cxl主控模块、存储模块及电源芯片模块;所述存储模块包括日志存储模块及引导程序存储模块;
3、所述输入模块分别与大电容模块、第一掉电检测模块的第一端及第二掉电检测模块的第一端相连接;
4、所述第一掉电检测模块的第二端与所述第一复位芯片的第三引脚相连接;所述第一复位芯片的第一引脚与所述延迟电路的第一端相连接,所述第一复位芯片的第二引脚分别与所述延迟电路的第二端、所述cxl主控模块的第一端及所述cpld模块的第三端相连接;
5、所述cpld模块的第五端与所述cxl主控模块的第二端相连接,所述cpld模块的第五端与所述cxl主控模块的连接点与所述第一复位芯片的第四引脚相连接;所述第一复位芯片的第五引脚分别与所述cxl主控模块的第五端及所述cpld模块的第一端相连接;
6、所述cxl主控模块的第三端与所述日志存储模块的第一端相连接,所述cxl主控模块的第四端与所述引导程序存储模块的第三端相连接;
7、所述第二掉电检测模块的第二端与所述第二复位芯片的第七引脚相连接,所述第二复位芯片的第六引脚与所述cpld模块的第四端相连接,所述第二复位芯片的第八引脚与所述电源芯片模块相连接,所述第二复位芯片的第九引脚与所述cpld模块的第二端相连接。
8、进一步地,所述日志存储模块包括第一与门及与所述第一与门相连接的第一闪存;
9、所述第一与门的第一接收端作为所述日志存储模块的第一端,所述第一与门的输出端与所述第一闪存相连接。
10、进一步地,所述引导程序存储模块包括第二与门及与所述第二与门相连接的第二闪存;
11、所述第二与门的第一端作为所述引导程序存储模块的第三端,所述第一与门的第二端与所述第二与门的第二端相连接,其连接点与所述第二复位芯片的第九引脚相连接;
12、所述第二与门的输出端与所述第二闪存相连接。
13、进一步地,所述第一掉电检测模块包括第一电阻及第二电阻;
14、所述第一电阻的第一端作为所述第一掉电检测模块的第一端,所述第一电阻的第二端与所述第二电阻的第一端相连接,其连接点作为所述第一掉电检测模块的第二端;
15、所述第二电阻的第二端接地。
16、进一步地,所述第二掉电检测模块包括第三电阻及第四电阻;
17、所述第三电阻的第一端作为所述第二掉电检测模块的第一端,所述第三电阻的第二端与所述第四电阻的第一端相连接,其连接点作为所述第二掉电检测模块的第二端;
18、所述第四电阻的第二端接地。
19、第二方面,本发明实施例还公开了一种用于cxl扩展卡的故障日志收集的实现方法,应用于上述第一方面中的cxl扩展卡,所述方法包括:
20、若所述第一复位芯片检测到所述输入模块的电压低于预设的第一掉电门限,则向所述cxl主控模块发送日志存储指令;
21、若所述第一复位芯片检测到所述输入模块的电压低于预设的电压波动门限,则向所述延迟电路发送第一延迟指令;
22、若所述第二复位芯片检测到所述输入模块的电压低于预设的第二掉电门限,则向所述cpld模块发送第二延时指令,以使所述cpld模块根据接收到的第二延时指令延迟预设时长向所述第二复位芯片发送第一复位信号;
23、所述第二复位芯片根据接收到的第一复位信号向所述电源芯片模块发送第一复位指令,以使所述电源芯片模块根据接收到的第一复位指令执行下电操作。
24、第三方面,本发明实施例还提供了一种用于cxl扩展卡的故障日志收集的实现系统,所述系统包括配置于所述第一复位芯片的第一检测单元及电压波动检测单元:所述系统还包括配置于所述第二复位芯片的第二检测单元及复位单元;
25、所述第一检测单元,用于若所述第一复位芯片检测到所述输入模块的电压低于预设的第一掉电门限,则向所述日志存储模块发送日志存储指令;
26、所述电压波动检测单元,用于若所述第一复位芯片检测到所述输入模块的电压低于预设的电压波动门限,则向所述延迟电路发送第一延迟指令;
27、所述第二检测单元,用于若所述第二复位芯片检测到所述输入模块的电压低于预设的第二掉电门限,则向所述cpld模块发送第二延时指令,以使所述cpld模块根据接收到的第二延时指令延迟预设时长向所述第二复位芯片发送第一复位信号;
28、所述复位单元,用于所述第二复位芯片根据接收到的第一复位信号向所述电源芯片模块发送第一复位指令,以使所述电源芯片模块根据接收到的第一复位指令执行下电操作。
29、本发明实施例提供了一种cxl扩展卡、故障日志收集的实现方法及系统,所述cxl扩展卡包括输入模块、大电容模块、第一掉电检测模块、第二掉电检测模块、第一复位芯片、第二复位芯片、延迟电路、cpld模块、cxl主控模块、存储模块及电源芯片模块;所述存储模块包括日志存储模块及引导程序存储模块;所述输入模块分别与大电容模块、第一掉电检测模块的第一端及第二掉电检测模块的第一端相连接;所述第一掉电检测模块的第二端与所述第一复位芯片的第三引脚相连接;所述第一复位芯片的第一引脚与所述延迟电路的第一端相连接,所述第一复位芯片的第二引脚分别与所述延迟电路的第二端、所述cxl主控模块的第一端及所述cpld模块的第三端相连接;所述cpld模块的第五端与所述cxl主控模块的第二端相连接,所述cpld模块的第五端与所述cxl主控模块的连接点与所述第一复位芯片的第四引脚相连接;所述第一复位芯片的第五引脚分别与所述cxl主控模块的第五端及所述cpld模块的第一端相连接;所述cxl主控模块的第三端与所述日志存储模块的第一端相连接,所述cxl主控模块的第四端与所述引导程序存储模块的第三端相连接;所述第二掉电检测模块的第二端与所述第二复位芯片的第七引脚相连接,所述第二复位芯片的第六引脚与所述cpld模块的第四端相连接,所述第二复位芯片的第八引脚与所述电源芯片模块相连接,所述第二复位芯片的第九引脚与所述cpld模块的第二端相连接。本发明实施例可通过使用第一复位芯片、第二复位芯片及存储模块,实现对系统故障根因进行定位,能有效提高维护效率,从而提高应用cxl扩展卡的服务器的稳定性及可靠性。
1.一种cxl扩展卡,其特征在于,所述cxl扩展卡包括输入模块、大电容模块、第一掉电检测模块、第二掉电检测模块、第一复位芯片、第二复位芯片、延迟电路、cpld模块、cxl主控模块、存储模块及电源芯片模块;所述存储模块包括日志存储模块及引导程序存储模块;
2.根据权利要求1所述的cxl扩展卡,其特征在于,所述日志存储模块包括第一与门及与所述第一与门相连接的第一闪存;
3.根据权利要求2所述的cxl扩展卡,其特征在于,所述引导程序存储模块包括第二与门及与所述第二与门相连接的第二闪存;
4.根据权利要求1所述的cxl扩展卡,其特征在于,所述第一掉电检测模块包括第一电阻及第二电阻;
5.根据权利要求1所述的cxl扩展卡,其特征在于,所述第二掉电检测模块包括第三电阻及第四电阻;
6.一种用于cxl扩展卡的故障日志收集的实现方法,其特征在于,所述方法应用于权利要求1-5任一项中所述的cxl扩展卡,所述方法包括:
7.根据权利要求6所述的用于cxl扩展卡的故障日志收集的实现方法,其特征在于,所述向所述cxl主控模块发送日志存储指令,包括:
8.根据权利要求7所述的用于cxl扩展卡的故障日志收集的实现方法,其特征在于,所述第一复位芯片向所述延迟电路发送第三延迟指令之前,还包括:
9.根据权利要求6所述的用于cxl扩展卡的故障日志收集的实现方法,其特征在于,所述向所述延迟电路发送第一延迟指令之后,还包括:
10.一种用于cxl扩展卡的故障日志收集的实现系统,其特征在于,所述系统包括配置于所述第一复位芯片的第一检测单元及电压波动检测单元:所述系统还包括配置于所述第二复位芯片的第二检测单元及复位单元;
