Zum Inhalt springen

Operation · Managed Cloud & Kubernetes

Ihr System läuft. immer.

Stabiler Betrieb für geschäftskritische Plattformen. Nach SRE-Prinzipien.

Produktive Systeme verzeihen keine Fehler. Deshalb übernehmen wir vollständige Betriebsverantwortung: vertraglich definierte SLAs, proaktives Monitoring und ein Team, das Probleme erkennt, bevor sie zum Incident werden.

100% Verfügbarkeit ist unsere Mission

99,9xxx%

Verfügbarkeit · Vertraglich · Messbar · Transparent

< 15 Min

Reaktionszeit bei P1-Incident

24/7

Wir sind 24/7 für Sie erreichbar

Verantwortung übernehmen.

Wir betreiben keine generischen Umgebungen. Wir übernehmen Verantwortung für komplexe, geschäftskritische Plattformen, mit dem Wissen, das dafür nötig ist.

Für IT-Management und Einkauf

Verantwortung übernehmen.

Linux & Open Source

  • Enterprise · Langzeitstabil · Compliant
  • RHEL, Ubuntu, Debian-Ökosysteme auf Enterprise-Niveau. Patch-Management, Security-Updates, Lifecycle-Kontrolle, kontinuierlich und dokumentiert.

Kubernetes / Cloud Native

  • On-Premise · Hybrid · Multi-Cloud
  • Kubernetes-Cluster in jeder Ausprägung: on-premise, hybrid oder multi-cloud. Betrieb, Monitoring, Skalierung und Incident-Response aus einer Hand.

AI & ML Workloads

  • GPU-Cluster · Inference · Training
  • GPU-Cluster und Inference-Infrastruktur für produktive KI-Workloads. Hohe Anforderungen an Verfügbarkeit und Performance, zuverlässig betrieben.

Daten- & Middleware

  • Datenplattformen · Integration · Messaging
  • Daten- und Middleware-Plattformen als kritisches Rückgrat moderner Architekturen: zuverlässig betrieben, proaktiv überwacht, langfristig stabil.

Nicht reaktiv. Nicht klassisch SRE.

Wir sind keine klassische Managed-Services-Bude. Wir sind Cloud-Enabler mit einem hohen Verfügbarkeits Versprechen.

Vollständig. Klar definiert.

Dokumentation

Immer aktuell

Lebende Betriebsdokumentation – Architektur, Assets & Runbooks immer aktuell.

Patchmanagement

Automatisiert

Automatisierte, getestete Patches – kritische Updates innerhalb 24 Stunden.

Backup

EU-konform

Verschlüsselte 3-2-1-Backups in der EU – RPO ≤ 24 h, RTO ≤ 4 h, regelmäßige Restore-Tests.

Support

Erreichbar · Mehrsprachig

Ein Team, drei Kanäle: Ticket-Portal, Slack & Hotline – auf Deutsch und Englisch.

24/7 Management

Immer erreichbar

Rund um die Uhr betreut von zertifizierten Cloud-Engineers

Monitoring & Alerting

Proaktiv

Proaktive Überwachung mit korrelierten Alerts – Probleme erkannt, bevor Sie sie merken.

Incident-Management

ITIL-konform

ITIL-konformes Incident- & Eskalationsmanagement inkl. Post-Mortem in 5 Werktagen.

Service-Reporting

Monatlich

Monatlicher Report mit KPIs, Trends und Empfehlungen für Ihre Cloud-Optimierung.

Messbar · Strukturiert · Für alle Zielgruppen

Prinzipien statt Versprechen.

01

Iteratives Vorgehen

Messbare Ziele, keine weichen Zusagen

Messbare Ziele, keine weichen Zusagen. Jedes System hat definierte SLOs: transparent einsehbar, vertraglich verankert, monatlich reportet. Keine Interpretationsspielräume.

02

Error Budgets

Struktur für den Trade-off

Struktur für den Trade-off zwischen Stabilität und Innovationstempo. Error Budgets machen diesen Zielkonflikt sichtbar und managebar, statt ihn zu ignorieren

03

Toil-Reduktion

Systematisch automatisiert

Manuelle, repetitive Arbeit (Toil) wird systematisch identifiziert und automatisiert. Nicht als Einmalprojekt, sondern als kontinuierliche Aufgabe jedes Team-Mitglieds.

04

Blameless Culture

Vorfälle sind Lernmöglichkeiten

Vorfälle sind Lernmöglichkeiten, keine Schuldfragen. Blameless Post-mortems führen zu echten Verbesserungen, nicht zu Angst, Vertuschung und Wiederholung.

Messbar. Vertraglich.

99,9xxx%

Verfügbarkeit · Ziel · Messbar · Transparent

< 15 Min

Reaktionszeit bei P1-Incident

24/7

Erreichbarkeit · Immer erreichbar

Zertifizierungen & Standards

Zertifizierungen & Standards

  • BSI Grundschutz
  • ISO 27001 kompatibel
  • DSGVO-konform
  • NIS2
  • SOC 2 vorbereitet

Häufige Fragen · Managed Betrieb

Managed Cloud & Kubernetes: kurz erklärt.

Was umfasst Managed Kubernetes bei ONEHUNDRED?

Betrieb, Updates, Monitoring, Security-Patching und Incident-Management Ihres Clusters nach SRE-Prinzipien. Die Basis bildet souveräne Infrastruktur, kein proprietärer Hyperscaler-Service.

Was sind Managed Cloud Services?

Die vollständige Betriebsverantwortung für Ihre Cloud- oder Hybrid-Plattform mit vertraglichen SLAs (Verfügbarkeit, Reaktionszeit), proaktivem Monitoring und EU-konformem Backup.

Wo werden Daten und Backups gespeichert?

Verschlüsselte 3-2-1-Backups in der EU (RPO ≤ 24 h, RTO ≤ 4 h). Das ist DSGVO-konform und liegt ausserhalb der Zugriffsmöglichkeiten über den US-Cloud-Act.

Kein Risiko. Klare SLAs.

Bereit, Verantwortung abzugeben?

Den Betrieb eines Systems abzugeben ist eine der wichtigsten Entscheidungen überhaupt. Wir nehmen diese Verantwortung ernst und gehen sie mit Ihnen Schritt für Schritt durch.

Primärer Einstieg

Betrieb anfragen

Erstgespräch vereinbaren: Wir verstehen Ihre Systemlandschaft, Ihre SLA-Anforderungen und zeigen, wie eine strukturierte Betriebsübernahme aussieht.

Mehr erfahren

Unser SRE-Ansatz im Detail

Wie wir SRE-Prinzipien in der Praxis umsetzen, welche Tools wir einsetzen und warum unsere Blameless Culture kein Buzzword ist.