Recherche : [database] - Les liens de Raphaël

Database Backup Strategies - automated dumps, point-in-time recovery | Akash Rajpurohit

Ce billet explique comment mettre en place des stratégies de sauvegarde de bases de données, en insistant sur l'importance cruciale des backups pour éviter la perte définitive de données en cas de panne, d'erreur humaine, de ransomware ou de corruption. L'article détaille trois niveaux de sauvegarde :

Niveau 1 : Sauvegardes automatiques basiques avec des scripts shell et pg_dump pour PostgreSQL, idéales pour les petites bases de données où une récupération quotidienne est acceptable. Il montre comment planifier ces sauvegardes via cron et gérer la rétention des fichiers.

Niveau 2 : Archivage WAL (Write-Ahead Logging) pour une récupération à un instant précis (PITR), en configurant PostgreSQL pour archiver les WAL et créer des sauvegardes de base. La procédure de récupération permet de restaurer la base à un moment spécifique, utile pour les bases critiques.

Niveau 3 : Sauvegardes continues avec pgBackRest, une solution robuste pour les environnements de production, permettant des sauvegardes complètes, différentielles et incrémentales, avec gestion automatisée des politiques de rétention.

L'article aborde aussi l'intégration avec des solutions cloud (S3, Hetzner Storage Box) via rclone, la surveillance des sauvegardes avec des alertes en cas d'échec, et l'importance de tester régulièrement les procédures de récupération. Enfin, il souligne les pièges courants (permissions, espace disque, WAL manquants) et propose des solutions pour les éviter. Une lecture essentielle pour sécuriser ses données et dormir sur ses deux oreilles.

backup · database · Postgresql · guide

November 9, 2025 at 1:19:35 PM GMT+1 * · permalien

·

https://akashrajpurohit.com/blog/database-backup-strategies-automated-dumps-point-in-time-recovery/

·

How We Migrated 1 Billion Records from DB1 to DB2 Without Downtime | by Himanshu Singour | Sep, 2025 | Medium

L’auteur raconte comment son équipe a migré plus d’un milliard d’enregistrements d’une base de données critique (contenant des données financières) vers une nouvelle, sans aucune interruption de service. Voici les étapes clés et les leçons apprises :

Migration par lots des données historiques : Les données ont été divisées en chunks par plages d’ID, chargées en parallèle avec les index et contraintes désactivés pour accélérer le processus, puis vérifiées par des checksums pour garantir l’intégrité.
Écritures doubles (dual writes) : Pendant la migration, chaque nouvelle écriture était dupliquée vers l’ancienne et la nouvelle base. Les échecs étaient gérés via une file Kafka de réessai, avec des écritures idempotentes pour éviter les doublons.
Lectures fantômes (shadow reads) : Les requêtes étaient exécutées en silence sur la nouvelle base et comparées à l’ancienne pour détecter des incohérences (fuseaux horaires, collations, valeurs NULL), permettant de corriger les problèmes avant de basculer les utilisateurs.
Bascule progressive (cutover) : La nouvelle base a été préchauffée (cache et index), et le basculement a eu lieu à 4h30, heure de faible trafic, avec un mécanisme de retour arrière (rollback) prêt. Les métriques business et techniques ont été surveillées en temps réel.
Observabilité totale : Des tableaux de bord ont suivi la latence, le lag de réplication, les deadlocks, et les KPI métiers pour détecter instantanément tout problème.

Leçons clés :

Les migrations à grande échelle se font par lots parallèles, avec des mécanismes de reprise et de vérification.
Les dual writes et les shadow reads sont essentiels pour capturer les données en temps réel et valider la nouvelle base.
La bascule doit être préparée comme une opération critique : cache préchauffé, monitoring obsessionnel, et plan de rollback.
Une migration réussie repose sur la conception distribuée (idempotence, files de réessai) et une observabilité fine (WAL, cache, deadlocks).

En traitant la migration comme un problème de system design plutôt que technique, l’équipe a pu garantir une transition sans temps d’arrêt, malgré la pression et les risques financiers.

migration · database · bonnes-pratiques · chunl · dual-write · shadow-read · cutover · observability

October 5, 2025 at 9:04:50 AM GMT+2 * · permalien

·

https://medium.com/@himanshusingour7/how-we-migrated-db-1-to-db-2-1-billion-records-without-downtime-c034ce85d889

·

Database Indexing in Theory

Comment fonctionnent les index dans les bases de données

database · index · guide

May 29, 2024 at 8:39:33 AM GMT+2 * · permalien

·

https://martinjoo.dev/database-indexing-in-theory

·

Database referential integrity with Doctrine - DEV Community

Tout est dans le titre

database · integrity · doctrine

May 12, 2024 at 9:50:24 PM GMT+2 * · permalien

·

https://dev.to/altesack/database-referential-integrity-with-doctrine-1539

·

Découvrez le DbToolsBundle | Makina Corpus

Tout est dans le titre

Symfony · database · tool

February 6, 2024 at 12:55:33 PM GMT+1 * · permalien

·

https://makina-corpus.com/symfony/symfony-dbtoolsbundle-sauvegarder-restaurer-anonymiser-base-donn%C3%A9es

·

Multi database doctrine-symfony based project | by Carlos Compains | Dec, 2023 | Medium

Tout est dans le titre

database · multiple-database · Symfony · doctrine2

December 24, 2023 at 5:39:42 PM GMT+1 · permalien

·

https://carlos-compains.medium.com/multi-database-doctrine-symfony-based-project-0c1e175b64bf

·

Navigating Data Management: Warehouses, Lakes and Lakehouses — SitePoint

L'auteur fait le point sur les différents systèmes de gestion de données : des SGBD jusqu'au concept de maillage de données (Data Mesh)

data · database · relational-database · NoSQL · data-warehouse · data-lake · data-lakehouse · data-mesh

November 24, 2023 at 6:11:41 AM GMT+1 * · permalien

·

https://www.sitepoint.com/navigating-data-management-warehouses-lakes-lakehouses/

·

Setting up a testing database in Symfony

Tout est dans le titre

Symfony · test · database · bundle

July 10, 2023 at 6:32:35 AM GMT+2 * · permalien

·

https://scribe.rip//@soufiyane.aitmoulay/setting-up-a-testing-database-in-symfony-54c5ff5a85dd

·

Symfony/Doctrine migrations for multiple databases - DEV Community

L'astuce concerne surtout l'idée d'une base par environnement (dev, test)

database · doctrine · Symfony · environnement · tip

May 8, 2023 at 9:05:27 PM GMT+2 * · permalien

·

https://dev.to/rafaelberaldo/symfony-doctrine-migrations-for-multiple-databases-drivers-1a07

·

Why You Should Consider Graphs For Your Next GraphQL Project

Une introduction aux bases de données orientées graphes

Neo4J · graph · database

March 8, 2023 at 7:20:49 AM GMT+1 · permalien

·

https://www.smashingmagazine.com/2023/03/consider-graphs-graphql-project/

·

Database Cryptography Fur the Rest of Us - Dhole Moments

Un excellent et long article sur le chiffrement des bases de données, relationnelles ou pas...

chiffrement · database · guide

March 3, 2023 at 7:38:22 AM GMT+1 · permalien

·

https://soatok.blog/2023/03/01/database-cryptography-fur-the-rest-of-us/

·

Des solutions pour les conflits au niveau de la base de données pour les tests exécutés en parallèle | Charles Desneuf

Tout est dans le titre

test · conflict · tip · database

October 31, 2022 at 9:08:19 AM GMT+1 * · permalien

·

https://blog.charlesdesneuf.com/articles/tests-en-parallele-et-base-de-donnees/

·

Things You Should Know About Databases

Tout est dans le titre

database · guide · index · b-tree

August 15, 2022 at 1:14:24 PM GMT+2 * · permalien

·

https://architecturenotes.co/things-you-should-know-about-databases/

·

Et si on testait le Clever Operator pour Kubernetes ?

Tout est dans le titre

Kubernetes · Clever-Cloud · Clever-Operator · database

June 19, 2022 at 10:04:57 AM GMT+2 * · permalien

·

https://blog.zwindler.fr/2022/05/17/et-si-on-testait-clever-kubernetes-operator/

·

Database triggers to clean text inputs | Derek Sivers

Tout est dans le titre

database · trigger · function · sanitize · Postgresql

March 1, 2022 at 8:17:34 PM GMT+1 * · permalien

·

https://sive.rs/clean1

·

Generate unique random values directly in the database | Derek Sivers

Tout est dans le titre

random · database · function · Postgresql

March 1, 2022 at 8:16:05 PM GMT+1 * · permalien

·

https://sive.rs/rand1

·

Database functions to wrap logic and SQL queries | Derek Sivers

Tout est dans le titre

database · function · trigger · Postgresql

March 1, 2022 at 8:14:45 PM GMT+1 * · permalien

·

https://sive.rs/api01

·

Database trigger recalculates totals, for data integrity | Derek Sivers

L'idée défendue par l'auteur est de mettre la logique de données (!= logique métier) dans la base de données. L'exemple qu'il prend est celui des tables "facture" et "ligne_facture". Le champ "total" de "facture" est recalculé dès l'insertion / modification / suppression dans "ligne_facture"

trigger · database · Postgresql

March 1, 2022 at 8:12:01 PM GMT+1 * · permalien

·

https://sive.rs/recalc

·

https://sudhir.io/uuids-ulids Understanding UUIDs, ULIDs and String Representations

Tout est dans le titre, sauf que les ULID permettent de résoudre un pb spécifique aux UUID : la capacité de les trier par ordre croissant / décroissant. L'idée est simple : utiliser un timestamp sur les 48 premiers bits, puis le reste des 80 bits aléatoirement. La probabilité de collision restera très très faible tout en donnant la possibilité de classer les ULID.

UUID · ULID · timestamp · database · optimisation · tri

January 9, 2022 at 8:53:13 PM GMT+1 * · permalien

·

https://sudhir.io/uuids-ulids

·

Tips for testing the database in Symfony application - DEV Community

Tout est dans le titre

test · database · symfony

July 23, 2021 at 5:10:07 PM GMT+2 * · permalien

·

https://dev.to/vikbert/tips-for-testing-the-database-in-symfony-application-1pd5

·