x

[solved] toll, Server down :(


  1. [solved] toll, Server down :( · wambacher (Gast) · 24.12.2017 17:51 · [flux]

    Gutes Timing, gerade gemerkt, dass mein Server (wambachers-osm.webserver) down ist.

    Mal sehen, ob und wann es weitergeht. Kann dauern.

    Gruss
    walter


    • Re: [solved] toll, Server down :( · Rogehm (Gast) · 24.12.2017 21:34 · [flux]

      Mach mal Pause über die Feiertage und keinen Stress. Hast du dir verdient. 😉
      Schöne Weihnachten!


    • Re: [solved] toll, Server down :( · wambacher (Gast) · 24.12.2017 22:01 · [flux]

      Rogehm wrote:

      Mach mal Pause über die Feiertage und keinen Stress. Hast du dir verdient. 😉
      Schöne Weihnachten!

      Danke und ebenso.

      Scheint eine der drei SSDs zu sein, auf denen die Datenbank liegt. Mal sehen, ob ich die morgen hinkriege (Kiste ist jetzt aus). Wenn es ganz schlimm kommt, neue SSD rein (hab noch eine 1TB rumliegen;)) und DB neu aufbauen.

      Schaun mer mal, aber net heute. Heute wird Elex gezockt.

      Gruss
      walter


    • Re: [solved] toll, Server down :( · !i! (Gast) · 25.12.2017 11:05 · [flux]

      Eben, kein Stress über die Feiertage :-) #wirdschon


    • Re: [solved] toll, Server down :( · wambacher (Gast) · 07.01.2018 20:02 · [flux]

      Hi,

      hab vorhin die neue 1TB SSD eingebaut (die, die ich in Reserve hatte, wollte net. Musste erst Ersatz beschaffen)
      Da ich aber das System, die Daten und die DB erst jeweils auf ein RAID schieben will, wird es noch dauern.

      Geplant ist: System auf Raid2 mit 2x 100GB SSD, Data auf Raid5 3x 2TB HD und DB auf Raid5 3x 1TB SSD.

      Status:
      - Alle neuen Platten sind drin.
      - Raid5 für Data wird aufgebaut.


    • Re: [solved] toll, Server down :( · Andreas Binder (Gast) · 07.01.2018 20:10 · [flux]

      wambacher wrote:

      ...System auf Raid2 mit 2x 100GB SSD...

      Hi Walter,
      meinst Du wirklich Raid2 und nicht Raid1?
      Grüße
      Andreas


    • Re: [solved] toll, Server down :( · wambacher (Gast) · 08.01.2018 01:11 · [flux]

      Andreas Binder wrote:

      wambacher wrote:

      ...System auf Raid2 mit 2x 100GB SSD...

      Hi Walter,
      meinst Du wirklich Raid2 und nicht Raid1?

      Klaro: Raid1 - einfacher Mirror.

      Gruss
      walter


    • Re: [solved] toll, Server down :( · seichter (Gast) · 08.01.2018 11:25 · [flux]

      wambacher wrote:

      Andreas Binder wrote:

      wambacher wrote:

      ...System auf Raid2 mit 2x 100GB SSD...

      Hi Walter,
      meinst Du wirklich Raid2 und nicht Raid1?

      Klaro: Raid1 - einfacher Mirror.

      Zur Info für die, die das mitlesen und RAID vielleicht nicht genau kennen:
      Bei RAID1 (mirror) hat man höhere Verfügbarkeit, da das System weiterlaufen kann, wenn ein Laufwerk ausfällt.
      Man hat aber keine höhere Sicherheit (Backup), weil jeder Fehler, jede Fehlbedienung sofort auf beiden Laufwerken landet.


    • Re: [solved] toll, Server down :( · wambacher (Gast) · 22.01.2018 12:32 · [flux]

      Moin,

      hier mal der aktuelle Stand (meine Mail an User, die nachfragen):

      wambacher wrote:

      Hi xxx,

      i finaly added an error message to API/CLI users.

      Error: database SSD broken on 2017/12/24 (yes, on holy night 🙁)

      Many tries to get server back.

      done: got 2 new SSD (2x270 €)
      database moved to Raid 5 (3 x 960 GB)
      created Raid 5 for other data (3 x 2 TB HDD)

      current: creating indexes of database tables (tables usually 30-200 GB, indices 5-100 GB.
      job running for more than one day and still not completed.

      next: testing
      import OSM data for january
      testing
      releasing
      crossing my fingers

      todo:
      create Raid 1 for system disk and swap (2x 120 GB SSD)
      add 960 GB SSD as hot spare in database raid5 (270 €)

      that is really big stuff.

      Regards
      walter

      btw: Donations via Paypal to wnordmann@gmx.de are welcome.

      Gruss
      walter


    • Re: [solved] toll, Server down :( · wambacher (Gast) · 23.01.2018 17:34 · [flux]

      Moin,

      so langsam kommt Leben in die Bude.

      - beide Raid5 laufen
      - Datenbank ist recovered (Stand 24.12.17)
      - Datensicherung ist gemacht
      - Reboot funzt
      - Einspielen der Diffs bis heute läuft. (*)

      Demnächst kann ich die Boundaries Map freigeben. Die anderen Anwendungen (Fools, Emergency Map u. A.) sollten laufen, allerdings mit alten Daten. Immer auf den Lag achten.

      Gruss
      walter

      • ) genau dabei ist mir letzte Woche die Kiste erneut abgeschmiert.

    • Re: [solved] toll, Server down :( · wambacher (Gast) · 30.01.2018 11:22 · [flux]

      Moin,

      es hat ein wenig gedauert aber nun ist meine Database wieder im "Live"-Modus.
      D.h alle meine online-Karten sind top aktuell bzw die üblichen Auswertungen bringen zeitnahe Ergebnisse.

      Fools läuft ja schon und heute Abend lass ich dann wieder die Boundaries-Auswertungen laufen. Wenn alles gut geht, stehen morgen früh die Missing Boundaries und aktuelle Boundaries zur Verfügung.

      Ich hab mir etwas Zeit gelassen, damit manche andere Kleinigkeiten endlich mal bereinigt wurden.

      Was steht noch an?

      - Upgrade der beiden an und für sich schon recht stabilen Raid5 auf Raid6. Damit ist ein gleichzeitiger Ausfall zweier Platten im Raid abgesichert. (*) Dafür muss noch eine weitere 1TB SSD angeschafft werden (270 €)
      - Umwandlung der Systemplatte, die derzeit noch singulär ist, in ein Raid0 (**)
      - Upgrade der Boundaries Map auf die Release 4.3
      - Urlaub 😉

      Gruss
      walter

      • ) es soll schon vorgekommen sein, dass beim Ausfall einer Raid5-Disk (ist ja an und für sich unkritisch) eine zweite Disk ausgefallen ist. Dann war "Hängen im Schacht"
        • ) Ist nicht trivial, da von diesem Raid0 gebootet werden muss.

    • Re: [solved] toll, Server down :( · glglgl (Gast) · 30.01.2018 11:28 · [flux]

      Super! Vielen Dank für deinen Einsatz und für das betreiben des Servers!


    • Re: [solved] toll, Server down :( · seichter (Gast) · 30.01.2018 12:13 · [flux]

      wambacher wrote:

      • ) es soll schon vorgekommen sein, dass beim Ausfall einer Raid5-Disk (ist ja an und für sich unkritisch) eine zweite Disk ausgefallen ist. Dann war "Hängen im Schacht"

      So außergewöhnlich ist das nicht, da dann die Ausfallkompensation erstmals anspringen muss und wer traut sich schon, das im laufenden Betrieb zu testen.
      Außerdem nimmt die Last auf die verbleibenden Disks sprunghaft zu.

      Und Danke für die Arbeit - u.a. sind die Fools ja inzwischen in der Gegenwart angekommen 🙂.


    • Re: [solved] toll, Server down :( · glglgl (Gast) · 01.02.2018 10:41 · [flux]

      wambacher wrote:

      Donations via Paypal to wnordmann@gmx.de are welcome.

      Done.


    • Re: [solved] toll, Server down :( · Chrysopras (Gast) · 01.02.2018 11:09 · [flux]

      glglgl wrote:

      Super! Vielen Dank für deinen Einsatz und für das betreiben des Servers!

      Da kann ich mich nur anschließen. Vielen (verspäteten 🙁) Dank! 🙂


    • Re: [solved] toll, Server down :( · Harald Hartmann (Gast) · 02.02.2018 18:38 · [flux]

      @wambacher: ich hoffe du startest gerade eben nur mal kurz durch?


    • Re: [solved] toll, Server down :( · wambacher (Gast) · 02.02.2018 18:57 · [flux]

      Harald Hartmann wrote:

      @wambacher: ich hoffe du startest gerade eben nur mal kurz durch?

      Nö, nicht ganz.

      Mein Provider hat heute andauernd an der Leitung rumgefummelt und da hab ich mir gedacht: Wenn der Anschluss eh wackelig ist, kann ich ja "mal eben" die Netzwerkhardware (2 Fritzen, ein Hub und Stomversorgung) dahin stellen, wo sie schon lange hin soll. Nun, schnell die Verkabelung ausseinandergerissen, Boxen an den neuen Platz verschoben und dann .... verdammt, das Kabel zur I-Net-Dose ist 20 cm zu kurz.

      wat nu? alles zurück? nee, neues Kabel kaufen.

      Dann noch einen Pin im Stecker verbogen aber nu tut es wohl wieder.

      Golden rule: Never change a winning team - never change a running system.

      Sorry und Gruss
      walter

      ps: bin mal wieder viel zu ehrlich. Ein einfaches "Stromausfall" hätte es auch erklärt. 😉


    • Re: [solved] toll, Server down :( · seichter (Gast) · 02.02.2018 22:28 · [flux]

      wambacher wrote:

      ps: bin mal wieder viel zu ehrlich. Ein einfaches "Stromausfall" hätte es auch erklärt. wink

      Keine Ursache - es gilt ja die eherne Regel der Informatik:
      Es dauert immer mindestens doppelt so lange wie vorgesehen.