Recherche : [SRE] - Les liens de Raphaël

(mcorbin.fr): Ne pas se limiter à une spécialité dans sa carrière

L'auteur partage son expérience et ses réflexions sur l'importance de diversifier ses compétences au cours de sa carrière, plutôt que de se cantonner à une seule spécialité. Il suggère de viser un profil en "N" ou en "M", c'est-à-dire d'acquérir des compétences dans plusieurs domaines. Par exemple, un SRE (Site Reliability Engineer) ayant également une expérience en développement sera plus à même de comprendre les besoins des développeurs et de travailler efficacement avec eux. De plus, cette diversité de compétences permet de mieux détecter les problèmes et de participer activement à la résolution des incidents. L'auteur encourage à changer de poste pour acquérir de nouvelles expériences et compétences, ce qui est enrichissant et valorisant.

carrière · développement · SRE

January 20, 2026 at 6:19:19 AM GMT+1 · permalien

·

https://mcorbin.fr/posts/2026-01-18-carriere-dev-sre/

·

SLO, SLI, Error Budget et Critical User Journey expliqués simplement (et pourquoi ce ne sont pas des SLA !) (en plusieurs prompts)

L'article explique les concepts clés du Site Reliability Engineering (SRE) tels que les SLO (Service Level Objectives), SLI (Service Level Indicators), et Error Budget, introduits par Google. Il souligne l'importance de distinguer les SLA (Service Level Agreements), qui sont des contrats avec des pénalités financières, des SLO, qui sont des objectifs internes pour la fiabilité des services. L'article met l'accent sur l'identification des Critical User Journeys (CUJ), qui sont les parcours utilisateurs critiques pour le succès d'un service. Les SLI sont utilisés pour mesurer la performance de ces parcours, tandis que les SLO définissent des objectifs réalistes pour ces mesures. Enfin, l'Error Budget est présenté comme un outil pour gérer la fiabilité des services, permettant aux équipes de prendre des risques calculés tant que les objectifs de fiabilité sont respectés.

SRE · SLO · SLI · Error-Budget · SLA · CUJ · performance · définition

June 17, 2025 at 9:29:23 PM GMT+2 * · permalien

·

https://blog.zwindler.fr/2025/06/17/slo-sli-error-budget-critical-user-journey-expliques-simplement/

·

Lessons learned from two decades of Site Reliability Engineering

Tout est dans le titre

SRE · bonnes-pratiques · recovery · failure

December 20, 2023 at 6:21:14 AM GMT+1 * · permalien

·

https://sre.google/resources/practices-and-processes/twenty-years-of-sre-lessons-learned/

·

L'Ingénieur de Fiabilité des Sites | Stéphane ROBERT

Tout est dans le titre

SRE · guide

November 28, 2023 at 6:25:53 AM GMT+1 * · permalien

·

https://blog.stephane-robert.info/docs/devops/postes/sre/

·

Incident en production : intervenir avec efficacité | Padok

Tout est dans le titre

SRE · production · administration-système · bonnes-pratiques

November 16, 2023 at 6:17:15 AM GMT+1 * · permalien

·

https://www.padok.fr/blog/incident-production

·

Retour d’expérience sur une implémentation réussie de la méthodologie DevOps SRE

Tout est dans le titre

devops · SRE

October 13, 2023 at 6:44:55 AM GMT+2 * · permalien

·

https://scribe.rip//m/global-identity-2?redirectUrl=https%3A%2F%2Fblog.positivethinking.tech%2Frex-implementation-methodologie-devops-sre-71c0e3991cb5

·

CR Duck Conf 2023 : La vie d’Ops au cœur d’un SI en évolution

Tout est dans le titre

ops · organisation · SRE

April 19, 2023 at 10:03:20 PM GMT+2 · permalien

·

https://blog.octo.com/compte-rendu-de-la-duck-conf-2023-la-vie-dops-au-coeur-dun-si-en-evolution/

·

The Calculus of Service Availability - ACM Queue

Je cite l'auteur "You're only as available as the sum of your dependencies." il s'agit d'un article détaillé sur les pratiques SRE en usage chez Google (à l'époque au moins, soit 2017)

SRE · high-availability

June 15, 2022 at 6:34:18 AM GMT+2 * · permalien

·

https://queue.acm.org/detail.cfm?id=3096459&__s=dnkxuaws9pogqdnxmx8i

·

Conférences

Les slides des conférences données par Zwindler :

1- SREs ! SREs partout !
2- Du code Terraform vraiment factorisé avec Terragrunt
3- Ciel ! Mon Kubernetes mine des Bitcoins
4- 101 ways to break your RabbitMQ cluster
5- Le (logiciel) libre a-t-il de beaux jours devant lui ?
6- Besoin de métriques Prometheus à long terme ? Thanos fera des Marvels !
7- Dans ton Kube : retour sur 2 ans d’incidents en production
8- Ami développeur, deviens un Ops sans effort avec Ansible