Probleme mit Starface Cloud

  • Hallo zusammen,


    hatte heute noch jemand gegen 14 Uhr Probleme mit der Erreichbarkeit der Cloud-Anlagen?


    Ja, positiv. Zeitfenster zwischen 13:56 und 14:04. Jeweils aber nur für 1-2 Min von betroffen.

    Philipp Sander


    3NET GmbH

    Microsoft Solutions Partner | DATEV Solution Partner

    Tel: +49 40 254045-25

    www.3net.de

    STARFACE Excellence Partner

  • Hallo,


    wir hatten gestern gegen 17:20 Probleme mit ein paar Cloudsystemen - Komplettausfall und sind dann wiedewr hochgefahren. Ebenfalls Leitungsunterbrechungen zum Povider gegen 9:55 - 10:00.

  • Guten Morgen,


    ich bitte Euch darum, Support-Tickets aufzumachen und dort die betroffenen Clouds, Uhrzeiten und Symptome zu nennen. Dann können wir da genauer nachschauen. Pauschale Aussagen helfen keinem weiter und unsere Überwachungssysteme zeigen keine Auffälligkeiten.

    Product Management


    STARFACE GmbH | Adlerstraße 61 | 76137 Karlsruhe | www.starface.com

  • Habe ich breits gemacht ... allerdings wieder nur die pauschale Antwort erhalten Logfiles, TCP-Dumps etc. zu liefern. Wie soll das gehen bei so einem Fehler ? Und warum muss ich/wir als "Mieter" der Anlage die Fehler analysieren ? Die Anlage ist von euch gemietet - das Monitoring dafür kann nicht der Händler übernehmen. Bin etwas angesäuert und äußere mich jetzt erst einmal nicht länger zu dem Thema.


    Viele Grüße,
    Torsten

    Einmal editiert, zuletzt von t.meyer ()

  • Und warum muss ich/wir als "Mieter" der Anlage die Fehler analysieren ? Die Anlage ist von euch gemietet - das Monitoring dafür kann nicht der Händler übernehmen.


    Hallo Torsten,


    vielen Dank für die Ticketeröffnung und die Zusendung der Logfiles für die von Dir gemeldeten Cloud.
    Unser Support benötigt die Logfiles von Dir, da unsere Systeme keinerlei Ausfall zu dem von Dir genanntemZeitpunkt gemeldet haben und uns auch keine weitere Meldung eines Kunden vorliegt. Aus diesem Grund könnte die Ursache eventuell eine Einstellung in der Anlage selbst sein.
    Ihr als Partner seid selbst für die Konfiguration der Anlage verantwortlich und wir haben u.a aus datenschutztechnischen Gründen keinen Zugriff auf diese.


    Nach der Analyse der von Dir übersendenden Logdateien konnten wir keine Auffälligkeiten finden. Jedoch konnten wir auch den von Dir beschriebene Neustart der Anlage in diesen nicht finden.
    Da Du von mehreren betroffenen Clouds gesprochen hast, würde ich Dich bitten, uns im Ticket diese zu nennen und auch für diese die Logs zukommen zu lassen um eine evtl. Gemeinsamkeit der Nichterreichbarkeit zu finden.


    Die weitere Kommunikation sollten wir dann im Ticket führen.


    Viele Grüße, Christoph

    Product Management


    STARFACE GmbH | Adlerstraße 61 | 76137 Karlsruhe | www.starface.com

  • Bitte trotzdem irgendwann das Ergebnis hier posten! Danke!


    Ich habe auch sehr viele Kunden, die sich beim ersten gescheiterten Anruf sofort bei mir melden...

    Viele Grüße


    d i r k


  • Hallo Christoph,


    natürlich sind wir für die Konfiguration der Anlage zuständig - aber nicht für Probleme mit der darunterliegenden Hardware oder der Netzwerkanbindung bei euch. Die Logdateien habe ich aus den betroffenen Anlagen mit der jeweiligen Ticket-ID verschickt. Und das bei zwei Kunden von uns zur gleichen Zeit die Cloud nicht geht halte ich nicht für einen Zufall.


    Viele Grüße,
    Torsten

  • Ich fass mal zusammen, was ich aus der Analyse der Kollegen verstanden habe:
    1. Bei den beiden genannten Clouds wurde die Verbindung zu den Telefonen für ca. 20 Sekunden verloren. Bei der einen Cloud war das gegen 17:17 Uhr und bei der anderen gegen 17:19 Uhr. Die Telefone haben sich anschließend automatisch wieder registriert.
    2. Während dieses Zeitpunkts liefen aktive Telefonate weiter.
    3. Es gab in keinem anderen Log ein Anzeichen, dass die Cloud nicht erreichbar gewesen wäre.
    4. Es liegen uns keine Meldungen von anderen Cloud-Systemen in dem Zeitraum vor.


    Warum die Telefone zu den unterschiedlichen Zeiten die Verbindung verloren haben, ist nicht zu erkennen. Eine zentrale Störung der STARFACE Clouds oder in unserem RZ kann aus diesem Fehlerbild nicht abgeleitet werden.


    Torsten: Kannst Du das so bestätigen?

    Product Management


    STARFACE GmbH | Adlerstraße 61 | 76137 Karlsruhe | www.starface.com


  • Da ich ja nur einen Teil des Log einsehen konnte (der PBX-Log ist am nächsten Tag ja immer zurückgesetzt) stellt sich das so dar. Allerdings ist in beiden Fällen ein Netzwerkfehler auf Kundenseite auszischließen da auch Telefone betroffen sind, die im Homeoffice der Mitarbeiter stehen. Es muss also an der Cloud gelegen haben.


    Viele Grüße,
    Torsten

  • Da ich ja nur einen Teil des Log einsehen konnte (der PBX-Log ist am nächsten Tag ja immer zurückgesetzt) stellt sich das so dar. Allerdings ist in beiden Fällen ein Netzwerkfehler auf Kundenseite auszischließen da auch Telefone betroffen sind, die im Homeoffice der Mitarbeiter stehen. Es muss also an der Cloud gelegen haben.


    Diese Schlussfolgerung teile ich so nicht.
    Zwischen Cloud-Instanz und Telefonen gibt es mit Kundenprovider, Peeringpartnern/weiteren Carriern noch weitere mögliche Ursachen für einen kurzzeitigen Ausfall.
    Erst wenn diese Ursachen ausgeschlossen wurden, könnte man mit hoher Wahrscheinlichkeit von einem Problem der Cloud-Instanz oder des Cloud-RZ ausgehen.

  • Diese Schlussfolgerung teile ich so nicht.
    Zwischen Cloud-Instanz und Telefonen gibt es mit Kundenprovider, Peeringpartnern/weiteren Carriern noch weitere mögliche Ursachen für einen kurzzeitigen Ausfall.
    Erst wenn diese Ursachen ausgeschlossen wurden, könnte man mit hoher Wahrscheinlichkeit von einem Problem der Cloud-Instanz oder des Cloud-RZ ausgehen.


    O.K. - dann hatten also ca. 4-5 Internetanbieter in Norddeutschland verteilt genau im exakt gleichen Moment ein Problem mit der Verbindung zu den beiden betroffenen Cloud-Systemen. Und nur zu diesen. Dann glaube ich eher das es daran gelegen hat: https://www.heise.de/news/Erst…iostoerungen-6129718.html

  • O.K. - dann hatten also ca. 4-5 Internetanbieter in Norddeutschland verteilt genau im exakt gleichen Moment ein Problem mit der Verbindung zu den beiden betroffenen Cloud-Systemen. Und nur zu diesen.


    Soll das ein Argument werden?


    Eine kurze Prüfung verschiedener Störungs-Tracker zeigt, dass zum Beispiel
    * Vodafone Kabel am 06.07. ab 03:00 Uhr im Vorwahlbereich 0221 eine Störung hatte
    * Vodafone Kabel am 06.07. ab 14:45 Uhr im Vorwahlbereich 0228 eine Störung hatte
    * Vodafone Kabel am 06.07. ab 17:15 Uhr im Vorwahlbereich 0871 eine Störung hatte
    * Seacom einen Schaden an einem Seekabel in Richtung Afrika hat.
    * Core-Backbone am 06.07. zwischen 8:48 und 11:45 Uhr eine Störung auf den Links Madrid-Paris hatte


    Ist die Erwartung, dass es im Internet nie zu Paketverlusten, Ausfällen oder Störungen kommen kann?


    Dann glaube ich eher das es daran gelegen hat: https://www.heise.de/news/Erst…iostoerungen-6129718.html


    Oh! Hoppla! Das erklärt, warum das Navi bei mir im Auto mich konstant einen halben Kilometer neben der eigentlichen Fahrstrecke verortet hat und mich penetrant umkehren lassen wollte. Danke für die Info. Hatte schon Angst, das System wäre defekt.

  • Läuft stabil.


    Mal eventuell eine andere Frage....gehört hier so ein bisschen ;) auch in den Cloud Bereich.


    Kunden sind bei Plusnet und haben dementsprechend einen SIP Trunk den wir in die SF Cloud einbinden.
    Wir nutzen das Modul https://shop.rba-net.com/de/modul-checksip-advanced.html und erhalten für meinen empfinden viel zu oft Mails, dass der SIP Trunk Dienst neu gestartet wurde durch nicht Erreichbarkeit.


    Dieses Modul haben wir mittlerweile als Standard mit drin, weil es zu oft vorkam dass der Kunde per Handy anruft und sagt sie sind nicht mehr erreichbar.
    Daraufhin schaut man in die Cloud und prüft ob der SIP Trunk registriert ist.... Sah IMMER alles gut aus. Versucht man anzurufen kommt nichts an in der Cloud. Nichts in den LOGS. Daraufhin bei Plusnet angerufen... keine Störungen bekannt und die tracen das Thema. Dabei kommt dann folgendes bei raus:


    Wir haben aufgrund der Störmeldung den Anschluss überprüft. Momentan konnte keine Beeinträchtigung festgestellt werden. Die Nummer ........NUMMER......war bei einem Testanruf erreichbar. Es ertönte eine Bandansage, dass man außerhalb der Geschäftszeit anruft.


    Bei dem Testanruf um 16:06 Uhr jedoch war die Nummer nicht erreichbar. Hier kam als Rückmeldung, dass die Anlage die Nummer nicht gefunden hat, und hat den Fehler 404, not found, zurückgemeldet.


    Im Folgenden sind Auszüge der SIP Trace der beiden Anrufe zu sehen. Zuerst der, der gerade geklappt hat, danach der fehlgeschlagene Anruf:


    SIP/2.0 200 OK
    Via: SIP/2.0/UDP 62.206.200.34:5060;branch=z9hG4bKqmmmkp10d0ntgn1dr630.1;received=62.206.200.34
    From: "........NUMMER......" <sip:........NUMMER......@ipfonie.de;user=phone>;tag=SD81p3501-hn010sl2-CC-35
    To: <sip:........NUMMER......@ipfonie.de;user=phone>;tag=as0f62b190
    Call-ID: SD81p3501-a57671c4e2c2511c61da49ab8eb72429-u94p010
    CSeq: 1 INVITE
    Server: STARFACE PBX
    Allow: INVITE, ACK, CANCEL, OPTIONS, BYE, REFER, SUBSCRIBE, NOTIFY, INFO, PUBLISH, MESSAGE
    Supported: replaces, timer
    Contact: <sip:........NUMMER......@10.0.9.151:5060>
    Content-Type: application/sdp
    Content-Length: 269


    ###


    SIP/2.0 404 Not Found
    Via: SIP/2.0/UDP 62.206.200.34:5060;branch=z9hG4bKbh9d23008o9v4a1tcm50.1;received=62.206.200.34;rport=5060
    From: "........NUMMER......" <sip:+........NUMMER......@ipfonie.de;user=phone>;tag=SDn0mod01-0UUHS0000030000E1D0F0E1u0253NLP11T4TUC
    To: <sip:........NUMMER......@ipfonie.de;user=phone>;tag=as34437e4b
    Call-ID: SDn0mod01-8dd45d4c42042a6d19727858b7ff3a9f-u94p010
    CSeq: 42634 INVITE
    Server: STARFACE PBX
    Allow: INVITE, ACK, CANCEL, OPTIONS, BYE, REFER, SUBSCRIBE, NOTIFY, INFO, PUBLISH, MESSAGE
    Supported: replaces, timer
    Content-Length: 0



    Warum das so war, können wir nicht sagen. Vielleicht gibt das Log der Telefonanlage Auskunft.


    Warum das erst nicht geklappt hat und dann doch, lag daran das ich händisch den SIP Trunk neu registriert habe zwischendurch.
    Deswegen nutzen wir das Modul. Normal finde ich das aber definitiv nicht. Eingestellt ist, dass das Modul nach 5 Minuten (weniger geht nicht) nicht Erreichbarkeit, den SIP Trunk den er prüft, neu startet. Wir bekommen teilweise an einem Tag zu einer Cloud 2-3 Mails, dass der Dienst neu gestartet wurde.


    Bevor jetzt wieder das Thema SF Support kommt. Ticket gibt es für eine Cloud.: Call#6988540 Wurde mal zwischenzeitlich abgeschlossen, dann wieder versucht per Telefon aufzumachen. Nach 10 Minuten wird man abgeworfen und dann versucht online das Ticket wieder aufzumachen, aber dazu vermisse ich bis jetzt ein Feedback, ob das Ticket jetzt erfolgreich wieder auf ist oder ob das überhaupt geklappt hat.

    Philipp Sander


    3NET GmbH

    Microsoft Solutions Partner | DATEV Solution Partner

    Tel: +49 40 254045-25

    www.3net.de

    STARFACE Excellence Partner

  • @Sander/3NET: Wurde eigentlich schon mal versucht, den plusnet-Account auf einer anderen Starface (lokal oder anderes Rechenzentrum) zu installieren?


    Normalerweise sollten die benannten Unterbrüche tatsächlich nicht so häufig vorkommen - insbesondere der angesprochene, nötige Diensteneustart ist eigentlich die wirklich allerletzte, sehr harte Keule - es sollte normalerweise auch ohne diese Maßnahme gehen. Dass man nicht unter 5 Minuten Neustarts setzen kann, hat natürlich einen Grund - kleinere Zeiten könnten im Störungsfall dazu führen, dass man sich von der SF aussperrt, da die schneller neustartet, als man das Modul im Zweifelsfall stoppen kann (das nur am Rande).


    Um das Verhalten einzugrenzen würde ich empfehlen, mal benannten SIP-Account auf einer anderen SF zu testen und dort das Verhalten zu verifizieren. Insofern das bei mehreren plusnet-Accounts so ist, lässt sich sicher mal ein Testaccount bei plusnet einrichten lassen (...). Eine Testinstallation im RZ könnten wir bereitstellen und das Verhalten gemeinsam beobachten.

  • @Sander/3NET: Wurde eigentlich schon mal versucht, den plusnet-Account auf einer anderen Starface (lokal oder anderes Rechenzentrum) zu installieren?


    Wir selbst haben in unserem RZ eine VM laufen. Wir sind ebenso bei Plusnet. Solch Themen die wir bei SF Cloud haben sind bei uns noch nicht aufgetreten bzw. aufgefallen (und da bin ich mir relativ sicher, dass das schnell aufgefallen wäre). Ich habe heute das Modul auch bei uns nochmal intergriert. Das Modul ist in dem Fall nicht nur ein kleines Backup sondern dokumentiert mit den entsprechenden Mails.


    Normalerweise sollten die benannten Unterbrüche tatsächlich nicht so häufig vorkommen - insbesondere der angesprochene, nötige Diensteneustart ist eigentlich die wirklich allerletzte, sehr harte Keule - es sollte normalerweise auch ohne diese Maßnahme gehen. Dass man nicht unter 5 Minuten Neustarts setzen kann, hat natürlich einen Grund - kleinere Zeiten könnten im Störungsfall dazu führen, dass man sich von der SF aussperrt, da die schneller neustartet, als man das Modul im Zweifelsfall stoppen kann (das nur am Rande).


    Ja, nachvollziehbar. War auch kein Vorwurf :)


    Um das Verhalten einzugrenzen würde ich empfehlen, mal benannten SIP-Account auf einer anderen SF zu testen und dort das Verhalten zu verifizieren. Insofern das bei mehreren plusnet-Accounts so ist, lässt sich sicher mal ein Testaccount bei plusnet einrichten lassen (...). Eine Testinstallation im RZ könnten wir bereitstellen und das Verhalten gemeinsam beobachten.


    Ich würde mich nochmal melden, sollte es bei unserer SF VM eine Regelmäßigkeit geben die uns dann leider nicht aufgefallen ist.


    Um mal eine Zahl zu sagen wie oft das vorkommt:


    von Fr. 16.07.2021-20.07.2021 gab es 38 Mails von dem Modul bei 25 Clouds die die Kombi SF Cloud und Plusnet haben. Einige Clouds waren wohl mehrmals betroffen und einige gar nicht. Auffällige Zeitfenster gibt es nicht.

    Philipp Sander


    3NET GmbH

    Microsoft Solutions Partner | DATEV Solution Partner

    Tel: +49 40 254045-25

    www.3net.de

    STARFACE Excellence Partner

    Einmal editiert, zuletzt von Sander ()

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!