UTHPC - Network issue causing timeouts in HPC and Cloud – Intsidentide üksikasjad

Kõik teenused on töökorras!

Network issue causing timeouts in HPC and Cloud

Lahendatud
Osaline katkestus
Algas rohkem kui ühe aasta eestKestis umbes 2 tundi

Mõjutatud

rocket.hpc.ut.ee

Osaline katkestus alates 2:55 PM kuni 3:38 PM, Töökorras alates 3:38 PM kuni 5:20 PM

UT HPC webservices

Osaline katkestus alates 2:55 PM kuni 3:38 PM, Töökorras alates 3:38 PM kuni 5:20 PM

support.hpc.ut.ee

Osaline katkestus alates 2:55 PM kuni 3:38 PM, Töökorras alates 3:38 PM kuni 5:20 PM

Services

Osaline katkestus alates 2:55 PM kuni 3:38 PM, Töökorras alates 3:38 PM kuni 5:20 PM

Galaxy

Osaline katkestus alates 2:55 PM kuni 3:38 PM, Töökorras alates 3:38 PM kuni 5:20 PM

RStudio

Osaline katkestus alates 2:55 PM kuni 3:38 PM, Töökorras alates 3:38 PM kuni 5:20 PM

Värskendused
  • Lahendatud
    Lahendatud

    Marking this incident as resolved.

  • Tuvastatud
    Tuvastatud
    A hardware issue has been found with one of the infiniband switches, systems seem to be returning to normal now. There might be some slowness due to previous timeouts playing themselves out. We will continue to monitor the situation.
  • Uurimisel
    Uurimisel
    There's an infiniband network issue causing distributed filesystem operations to wait, which is causing cloud VMs and HPC not to answer properly.