Ce site contient essentiellement des notes de travail. Le contenu est en constante évolution, et loin d'être achevé. (+ d'infos)
La plupart des documentations informatiques sont orientées Debian / Ubuntu.

Informatique/Softwares/Netdata/IPMI : Différence entre versions

De Ordinoscope.net
Sauter à la navigation Sauter à la recherche
(ipmi.events - the number of events in the IPMI System Event Log (SEL))
(ipmi.events - the number of events in the IPMI System Event Log (SEL))
 
Ligne 13 : Ligne 13 :
 
  ipmi-sel
 
  ipmi-sel
  
  ipmi-sel clear
+
  ipmi-sel --clear
 
Certaines cartes inscrivent une entrée lorsque le journal est effacé - c'est à dire que le nombre d'entrées est au minimum de 1, et non pas 0 comme configuré pour netdata.
 
Certaines cartes inscrivent une entrée lorsque le journal est effacé - c'est à dire que le nombre d'entrées est au minimum de 1, et non pas 0 comme configuré pour netdata.
  

Version actuelle datée du 6 novembre 2019 à 14:56

ipmi.events - the number of events in the IPMI System Event Log (SEL)

Lorsque qu'un événement est logué, cette alerte s'affiche dans netdata. Elle ne disparaîtra pas tant que le journal n'a pas été effacé:

  • depuis l'interface web
  • avec ipmitool
ipmitool sel list
ipmitool sel clear
  • avec freeipmi-tools
ipmi-sel
ipmi-sel --clear

Certaines cartes inscrivent une entrée lorsque le journal est effacé - c'est à dire que le nombre d'entrées est au minimum de 1, et non pas 0 comme configuré pour netdata.

exemple:

ipmi-sel
ID  | Date        | Time     | Name             | Type                     | Event
1   | Oct-17-2019 | 09:11:39 | SEL              | Event Logging Disabled   | Log Area Reset/Cleared

workaround:

cd /etc/netdata
./edit-config healt.d/ipmi.conf

Changer la valeur de warn de $this > 0 à 1

  alarm: ipmi_events
     on: ipmi.events
   calc: $events
  units: events
  every: 10s
   warn: $this > 1
  delay: up 5m down 15m multiplier 1.5 max 1h
   info: the number of events in the IPMI System Event Log (SEL)
     to: sysadmin

ipmi.sensors_states - the number IPMI sensors in non-nominal state

Le plugin freeipmi se sert de ipmimonitoring. Voici comment trouver les capteurs dits critiques:

ipmimonitoring | grep critical
14  | Dedicated NIC    | Entity Presence          | Critical | N/A        | N/A   | 'Entity Absent'
45  | BP1 Presence     | Entity Presence          | Critical | N/A        | N/A   | 'Entity Absent'

Vous conviendrez que c'est absurde de déclencher des erreurs, alors que les capteurs/éléments sont absents.

Pour exclure ces IDs du contrôle [1]:

cd /etc/netdata
./edit-config netdata.conf
[plugin:freeipmi]
   command options = ignore 14,45

Références