Anlagenverbund kommt nach Zwangstrennung nicht mehr zustande - InactivityIOException

  • Hallo,


    sporadisch kommt unser Anlagenverbund immer wieder nicht zustande, um diese Uhrzeit findet die PPPoE Zwangstrennung statt womit auch das OpenVPN abreist.

    Code
    [2014-02-23 02:05:49,153] INFO  org.apache.activemq.network.NetworkConnector Network Connector tcp://192.168.1.11:3090 Started 
    [2014-02-23 02:05:49,216] INFO  org.apache.activemq.network.DemandForwardingBridge Network connection between vm://localbroker#244 and tcp:///192.168.1.11:3090(localbroker) has been established. 
    [2014-02-23 02:05:53,059] INFO  de.vertico.starface.federation.site.SiteInfoExchanger xxxx-xxxx-xxxx goes online 
    [2014-02-23 02:05:53,129] INFO  de.vertico.starface.federation.routing.InterconnRoutingManager Received Message of type PullConfigEvent 
    [2014-02-23 02:05:53,143] INFO  de.vertico.starface.federation.routing.InterconnRoutingManager Received Message of type PushConfigEvent 
    [2014-02-23 02:05:53,359] INFO  de.vertico.starface.federation.site.SiteInfoExchanger Initial data received from EXAMPLEGMBH@192.168.1.11 uuid:xxxx-xxxx-xxxx 
    [2014-02-24 02:04:50,963] INFO  de.vertico.starface.federation.site.SiteInfoExchanger 'EXAMPLEGMBH' goes offline 
    [2014-02-24 02:04:59,197] INFO  org.apache.activemq.network.DemandForwardingBridge Network connection between vm://localbroker#244 and tcp:///192.168.1.11:3090 shutdown due to a local error: org.apache.activemq.transport.InactivityIOException: Channel was inactive for too long: /192.168.1.11:3090 
    [2014-02-24 02:04:59,199] INFO  org.apache.activemq.network.DemandForwardingBridge localhost bridge to localbroker stopped 
    [2014-02-24 02:04:59,199] INFO  org.apache.activemq.network.NetworkConnector Network Connector tcp://192.168.1.11:3090 Stopped


    Wie kann ich das Problem lösen, mir gefällt vor allem das "Stopped" nicht.
    Starface 5.7.0.7

  • Ich würde bei Problemen mit der Zwangstrennung den Provider kontaktieren ;) Spaß beiseite,... wie wäre es mit einem automatisierten Diensteneustart? Aus dem Modulsystem sollten sich das Tomcat init-Skript aufrufen lassen. Man sollte vielleicht nur aufpassen, dass man mit dem Aufruf nicht den eigenen Elternprozess abschießt.

  • Lässt sich das nicht schöner lösen?
    Leider weis ich nicht mehr genau wann das Problem anfing, evtl. mit der 5.5er Version, davor lief der Anlagenverbund ohne Probleme.


    Es wäre unschön den ganzen Tomcat dawegen durchzustarten.


    Edit:
    Man kann das Problem von Hand lösen wenn man den Anlagenverbund trennt und ihn wieder verbindet, leider muss ich das immer machen, ist also keine Lösung.

  • Ach,... Du testest einfach besser als andere. Wenn Du nichts mehr findest, ist die Version releasefähig ;)


    Ohne dass ich mir die Konfiguration von ActiveMQ oder den Quellcode angeschaut hätte, könntest Du versuchen, ob Du an den Einstellungen des NetworkConnector etwas drehen könntest, damit dieser sich schneller wieder verbindet oder später die Verbindung abbaut: http://activemq.apache.org/networks-of-brokers.html

  • Wäre hier nicht ein offizielles Fix angebracht?
    Ich weis leider nicht mehr genau seit wann das Problem besteht, aber frühere Starface Versionen kamen damit zurecht bzw. wir hatten das Problem nicht.

  • Das Verhalten ist uns schon seit der Einführung des Anlagenverbunds in Version 4.0 bekannt, bis zur Version 5.0 könnte das der nächtliche Dienste-Neustart tatsächlich kaschiert haben. Wir sind dem Thema bislang noch nicht weiter nachgegangen, da die - zugebener maßen extrem hohen - Anforderungen an das Netzwerksetup für den Anlagenverbund Dialup-Leitungen in der Praxis ausgeschlossen haben.


    Der Anlagenverbund - genauer gesagt das darunter liegende JMS-Framework - kommt sporadisch "aus dem Tritt", wenn Anlagen Netzwerkseitig "einfach weg" (Routen temporär nicht funktionieren) sind. Ist der Kontakt "ungünstig" unterbrochen schafft es der Verbund gelegentlich nicht, sich selbstständig zu erholen. Dann bleibt nur das "Disconnect" und "Connect" in der Admin-Oberfläche, nachdem es "Netzwerkprobleme" im Verbund gab.


    Leider ist das kein banaler fix, sondern erfordert grundlegende Änderungen in der Arbeitsweise des Anlagenverbunds. Die Anforderungen an den Anlagenverbund zu reduzieren steht definitiv auf unserem Fahrplan. Aber das wird wohl erst passieren, wenn wir die laufenden, grundlegenden Änderungen an der STARFACE abgeschlossen haben.

    mfg
    may

  • Nachdem Ärger den ich dawegen bekommen habe kann ich mit dieser Antwort nicht leben :(


    Lässt sich da was mit einem cronjob machen?
    Starface Modul das den Anlagenverbund trennt und wieder herstellt?

  • Ist eine Option, wie kann ich auf der Konsole "greppen" ob es dem Anlagenverbund gut geht?
    Evtl. den Status eines Users aus dem anderen Standort abfragen?

  • Ich würde per grep im Log nach "org.apache.activemq.transport.InactivityIOException" suchen. Wenn diese Meldung innerhalb der letzten Minute auftaucht (zumindest wenn der Cronjob minütlich ausgeführt wird), könnte man den Tomcat neustarten.

  • Ich würde per grep im Log nach "org.apache.activemq.transport.InactivityIOException" suchen.


    So ist mir das viel sympatischer, gutes altes Terminal! ;)


    Die Logdatei ist übrigens: /var/log/starface/federation.log

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!