Seltsame Watchdogeinträge

  • Hallo Leute,


    also wir haben die Anlage mit 170+ Usern jetzt seit Oktober letzten Jahres im Einsatz. So weit so gut, jetzt ist mir allerdings was interessantes Aufgefallen.
    Der Starface-eigene-watchdog scheint ein Problem zu haben, schaut euch mal bitte folgende Logeinträge an.


    Mon Mar 06 14:17:58 CET 2017 Asterisk AMI probe failed!
    Mon Mar 06 14:18:58 CET 2017 Asterisk AMI probe failed!
    Mon Mar 06 14:19:58 CET 2017 Asterisk AMI probe failed!
    Mon Mar 06 14:19:58 CET 2017 No response from Asterisk after 180000 ms
    Mon Mar 06 14:19:58 CET 2017 ===========================================


    Mon Mar 06 14:19:58 CET 2017 ===========================================


    Mon Mar 06 14:19:58 CET 2017 ===========================================


    Mon Mar 06 14:19:58 CET 2017 asterisk -rnx "core show sysinfo"
    Mon Mar 06 14:19:58 CET 2017


    Mon Mar 06 14:19:58 CET 2017 ===========================================


    Mon Mar 06 14:19:58 CET 2017 asterisk -rnx "core show locks"
    Mon Mar 06 14:19:58 CET 2017


    Mon Mar 06 14:19:58 CET 2017 ===========================================


    Mon Mar 06 14:19:58 CET 2017 asterisk -rnx "core show threads"
    Mon Mar 06 14:19:58 CET 2017


    Mon Mar 06 14:19:58 CET 2017 ===========================================


    Mon Mar 06 14:19:58 CET 2017 Restarting asterisk



    Diese verhalten tritt quasi täglich in unregelmäßigen Abständen auf.


    Ich habe es eigentlich gar nicht gemerkt. Allerdings wurde von einem User gemeldet dass sein Gespräch auf einmal weg war. Und da habe ich dann angefangen zu recherchieren.
    Hat jemand schon mal etwas ähnliches beobachten können?


    Gruß Talos

  • Es handelt sich hierbei um eine VM-Edition mit 8GB Ram und einer CPU mit 4Kernen.


    - Hm aber so unregelmäßig?

  • Da wir physikalische Hardware (in Form der Appliance) als Ursache ausschließen können, kommt maximal die Virtualisierungshardware oder ein Problem der virtualisierten Umgebung in Betracht.
    Ich würde empfehlen, Integrationsdienste testweise auszuschalten, insbesondere: Zeitsynchronisation, Datenaustausch und Volumenprüfpunkte.
    Dann würde ich es ein paar Tage beobachten. Wenn es aktuell täglich auftritt, sollte man ziemlich schnell sehen, ob es Veränderungen gibt.


    Ich nehme an, der physikalische Server bzw. andere VMs laufen problemlos?

  • Also der Server und alle darauf laufenden VMs laufen problemlos.


    Kann es sein dass der Watchdog vielleicht ein Problem hat, die Asterisk AMI aufzurufen? Ich denke nämlich dass der Dienst läuft, aber der watchdog es nicht mitbekommt und dann einfach neustartet? Denn wir können telefonieren, eben bis zu dem Punkt an dem der Watchdog asterisk killt und neustartet.

  • Ja das ist die Frage. Ich schau dass ich irgendwas herausfinden kann. Falls jemand von Starface das hier liest, und eine Idee hat? Kann dann auch details zur Konfig geben etc.

  • Hallo Talos


    Ich würde dir doch schnell Folgendes Vorschlagen.


    Komplettes Backup der SF ziehen, eine neue VM hochfahren, SF Installieren, Backup Importieren und schauen, ob dort das Problem auch wieder auftritt.


    Neuinstallation wirkt manchmal echt wunder ;)


    MfG


    Fabian

  • Also eine neuinstallation? Ich setze meine Server auch nicht neu auf, wenn ein Modul hakt ;)


    Die Last ist lächerlich gering. 0.5 - max 0.30 das System langweilt sich eher.

  • Also eine neuinstallation? Ich setze meine Server auch nicht neu auf, wenn ein Modul hakt ;)


    Die Last ist lächerlich gering. 0.5 - max 0.30 das System langweilt sich eher.


    Wieviele Ressourcen stehen der VM denn zur Verfügung (also Anzahl Kerne, CPU Takt, Menge RAM, freier Festplattenplatz usw)?

    Quality Assurance


    STARFACE GmbH | Adlerstraße 61 | 76137 Karlsruhe | www.starface.com

  • Wieviele Ressourcen stehen der VM denn zur Verfügung (also Anzahl Kerne, CPU Takt, Menge RAM, freier Festplattenplatz usw)?


    4 Kerne, 1 Cpu, mit 2,5 Ghz, 8 GB Ram - davon genutzt 2 GB , Festplattenkapazität 60 GB - davon belegt 5,3 GB

  • Hallo Talos,


    wir haben/hatten selbiges Problem mit unserer Starface Platinum Appliance. Zu unterschiedlichen Zeiten und in mehr oder weniger regelmäßigen Abständen. Sowohl in der Version 6.2.11, als auch mit der aktuellen 6.4.1.11. Die Ursache konnte bis heute nicht von Starface geklärt werden. Allerdings hat die Installation des "Debug-Asterisk" für Abhilfe gesorgt. Seither haben wir diesen Fehlerfall nicht mehr beobachten können und der Asterisk-Service läuft stabil. Es ist schön zu hören, dass wir nicht der einzige Kunde sind, der von diesem ominösen und nicht reproduzierbaren Fehlverhalten betroffen ist...


    Schreib mir gerne eine PN. Dann erläutere ich dir die Schritte zur Installation!


    Gruß,


    Markus

  • Ich würde das ja trotzdem weiter suchen, vielleicht liegt auch ein Hardware Problem vor.
    Mit vollem Debug ist auch nichts zu sehen?
    dmesg zu diesem Zeitpunkt?

  • Ich habe in dem Zusammenhang auch etwas nicht so schönes in DMESG gefunden. -> segfault at 7fe8b73e1c20 ip 000000000049259a sp 00007fe85dd8c300 error 4 in asterisk[400000+214000] ... jetzt heißt es wohl debuggen bis der arzt kommt.


    Kann hier vielleicht einer von Starface-Crew noch etwas beisteuern? ;) - ich kann auch anrufen und das Bezahlen, ich muss nur sicherstellen dass es besser wird. Bisher war es ja nur ein Neustart, der wahrgenommen wurde.


    Grüße

  • Also doch ein Absturz des Asterisk ;)


    Man könnte an dieser Stelle Stacktraces einschalten um diese durch den Support näher untersuchen zu lassen.
    Wie das geht, möchte ich hier jetzt nicht posten, sondern auf den Support verweisen.

  • Ich habe in dem Zusammenhang auch etwas nicht so schönes in DMESG gefunden. -> segfault at 7fe8b73e1c20 ip 000000000049259a sp 00007fe85dd8c300 error 4 in asterisk[400000+214000] ... jetzt heißt es wohl debuggen bis der arzt kommt.


    Kann hier vielleicht einer von Starface-Crew noch etwas beisteuern? ;) - ich kann auch anrufen und das Bezahlen, ich muss nur sicherstellen dass es besser wird. Bisher war es ja nur ein Neustart, der wahrgenommen wurde.


    Grüße


    Wenn das deaktivieren der Zeitsynchronisation nicht hilft, kannst du folgendes probieren (keine Erfolgsgarantie)


    In die Datenbank schreiben ( aus dem Terminal 'psql asterisk' :(
    INSERT INTO setup (key, value) VALUES ('asterisk_timing', 'res_timing_timerfd.so');


    Datenbank-CLI mit ' \q ' verlassen
    Danach Tomcat neustarten (service tomcat6 restart)


    Mehr kann ich im Forum ohne Logs zu sehen nicht sagen. Dazu müsstest du ein Support Case bei uns aufmachen.

    Quality Assurance


    STARFACE GmbH | Adlerstraße 61 | 76137 Karlsruhe | www.starface.com

  • Das Timing-Interface res_timing_timerfd würde ich bei Installationen ohne ISDN-Karte immer empfehlen.


    @STARFACE: Vielleicht wäre das ein sinniges Default, für VM-Editionen und wenn keine ISDN-Karten erkannt werden ;)


    Hallo Fabian,


    ich trags mal weiter :)


    Viele Grüße,


    Tom

    Quality Assurance


    STARFACE GmbH | Adlerstraße 61 | 76137 Karlsruhe | www.starface.com

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!