Cette page introduit les bases de données orientées colonnes, comme ClickHouse, conçues pour analyser des flux d'événements horodatés (timeseries) à grande échelle, que ce soit pour des analyses historiques ou en temps réel. Leur principal avantage réside dans une compression et un traitement optimisés grâce à la structure en colonnes, contrairement aux bases relationnelles classiques (OLTP) qui privilégient les transactions et la cohérence. Les colonnes permettent des lectures séquentielles efficaces, une meilleure parallélisation et une compression adaptée aux gros volumes de données.
L'auteur compare ce modèle aux bases OLTP, soulignant que les bases orientées colonnes (comme celles utilisées pour la télémétrie ou l'observabilité) excelling en débit d'écriture et en scalabilité, mais au prix de transactions moins atomiques et de modifications plus lourdes. Contrairement aux systèmes comme Prometheus, qui gèrent mal la diversité des labels, les solutions modernes s'appuient sur des technologies éprouvées pour se concentrer sur la couche applicative. Le texte annonce ClickHouse comme solution dans un prochain article.