Retour sur la PG Conf Europe 2024

2025-02-24

1146 mots, 6 minutes de lecture

Retour sur la PG Conf Europe 2024

Cette année, la PostgreSQL Conference Europe 2024 s’est déroulée à Athènes, en Grèce, à quelques hectomètres de l’acropole. À nouveau, un record d’affluence est battu cette année avec 779 participants, ce qui en fait l’évènement PostgreSQL le plus important au monde.

La chouette d’Athéna

La liste des conférences est disponible sur le site de l’évènement : https://2024.pgconf.eu/. Les supports de présentations, ainsi que les enregistrements vidéos sont également mis à disposition.

La conférence d’ouverture est donnée par Stacey Haysler. Le sujet abordé est celui du coût de la licence PostgreSQL. Cette dernière étant gratuite, elle demande une implication des différents acteurs pour que le projet puisse fonctionner et demeurer robuste et pérenne.

Les conférences sont ensuite réparties dans différentes salles, avec 4 conférences simultanées, dont une réservée aux sponsors. Nous résumons ici nos notes à propos des présentations auxquelles nous avons assisté.

Performance

NUMA vs PostgreSQL

Andres Freund nous explique les particularités de NUMA, qui est une architecture d’accès à la mémoire, ce qui a des conséquences pour les processeurs, et donc les logiciels qui s’en servent. Quels sont les problèmes rencontrés dans le contexte de l’utilisation de PostgreSQL ? Cette présentation est complexe, mais détaillée et permet à l’auditoire de mieux comprendre le comportement global des systèmes, tout en ouvrant vers des optimisations possibles de PostgreSQL.

Streaming I/O and vectored I/O

Les orateurs Thomas Munro & Nazir Bilal Yavuz détaillent un point important concernant les performances des lectures et écritures de données (I/O) : après un historique des solutions, ils expliquent ce que sont les solutions modernes telles que les Streaming I/O et que peut apporter le patch AIO qui est en cours de développement.

Debugging active queries with mid-flight instrumented explain plans

Rafael Thofehrn Castro nous présente des extensions et patchs pour suivre les plans d’exécutions à la volée dans une instance PostgreSQL. C’est bluffant, malheureusement rien n’est disponible publiquement.

A Deep Dive into Postgres Statistics

Louise Leinweber détaille de façon claire et précise ce que sont les statistiques sur les données dans PostgreSQL, comment elles sont utilisées dans PostgreSQL et quels leviers nous avons pour agir.

Porting on-prem performance troubleshooting skills to the cloud

Denzil Ribeiro évoque l’outillage nécessaire à la supervision d’une instance PostgreSQL dans le cloud, en particulier tout ce qui est spécifique aux environnements clouds, très utile lorsqu’on vient d’environnements dits “on-premise”.

PostgreSQL Observed—and Explained

Stacey Haysler et Karen Jex utilisent quelques points emblématiques des problèmes souvent rencontrés par les utilisateurs de PostgreSQL pour évoquer les bonnes ou mauvaises pratiques et certains anti-patterns connus.

Vacuuming Large Tables: How Recent Postgres Changes Further Enable Mission Critical Workloads

Robert Treat évoque avec humour ses mésaventures avec les vacuums et les ID de transactions, et les améliorations apportées depuis dans PostgreSQL 17.

Mastering PostgreSQL Partitioning: Supercharge Performance and Simplify Maintenance

Ryan Booz évoque un outil très utile en ce qui concerne la gestion de la performance : le partitionnement des tables, ses différentes possibilités et cas d’usage, jusqu’aux extensions que sont TimescaleDB et Citus.

High availibility

Sparta’s Dual Kingship and PostgreSQL Active-Active

Boriss Mejías détaille le fonctionnement d’une réplication active-active, avec toutes les notions, plus ou moins complexes, qui permettent de bien comprendre les contraintes qu’imposent ce type de réplication.

Patroni Deployment Patterns

Michael Banck expose de façon pratique et claire le fonctionnement de Patroni, avec quelques éléments pertinents à retenir, correspondant à son expérience.

Comparing Connection Poolers for PostgreSQL

Julian Markwort compare les différents gestionnaires de connexions entre eux. Quelles sont les différentes questions qui se posent pour adopter un tel outil, et pourquoi faut-il choisir pgBouncer ?

Speeding up logical replication setup

Euler Taveira présente le développement qu’il a mené dans PostgreSQL pour intégré l’outil pg_createsubscriber qui permet de convertir une réplication physique en réplication logique, accélérant ainsi la création d’un réplica logique.

Kubernetes

Crunchy Postgres for Kubernetes: Your virtual DBA

Karen Jex explique le fonctionnement de Kubernetes et l’utilisation de l’opérateur Crunchy Postgres, et comment son fonctionnement s’articule avec le rôle et les responsabilités d’un administrateur de bases de données.

Demystifying Kubernetes for Postgres DBAs: A Guide to Operators

Adam Wright évoque le lien entre Kubernetes et PostgreSQL : les opérateurs ! Différents opérateurs pour PostgreSQL existent et ne sont pas strictement équivalents, ce qui nécessite une compréhension de chacun d’entre eux de la part de l’administrateur de bases de données pour les adopter : sécurité, réseau, sauvegarde, stockage, extension.

From VMs to Cloud-Native PostgreSQL in Kubernetes: A Case Study of Migrating a Medium-Sized Application

David Pech fait le retour d’expérience d’une migration d’instance PostgreSQL depuis des machines virtuelles vers un cluster Kubernetes. Le choix de l’opérateur Kubernetes est un point important de la démarche. Après avoir fait tomber quelques mythes autour de Kubernetes, l’orateur détaille de plan de travail pour adopter la solution.

Fun with Postgres High Availability Poker

Dave Pitts et Derk Van Veen introduisent les concepts de haute disponibilité de PostgreSQL par le jeu, ce qui est toujours une bonne manière d’apprendre.

Intelligence artificielle

Dissimilarity search: implementing in-memory vector search algorithms to PostgreSQL

Jonathan Katz parle de l’extension pgvector, qui est une possibilité offerte aux utilisateurs de PostgreSQL de vectoriser des données et de faire des recherches par approximation.

Leveraging AI as a PostgreSQL DBA, Grant Fritchey

Grant Fritchey se demande si les prompts d’IA sont de bons outils pour les DBA ? Quelles sont les différentes tâches du DBA qui pourraient bénéficier de l’aide d’un assistant conversationnel ?

Sécurité

Untangling the Web of PostgreSQL Permissions

Lætitia Avrot évoque l’ensemble des fonctionnalités liées aux permissions dans PostgreSQL : rôle, groupe, privilèges, Row Level Security, privilèges par défaut.

PostgreSQL security: defending against external Attacks

Taras Kloba détaille un sujet très important, quoique parfois trop négligé : comment protéger PostgreSQL contre les attaques. Des mises à jour de sécurité à la gestion de l’authentification en passant par la protection des données, cette présentation fait la liste des points à retenir en termes de sécurité.

Column encryption (solutions and ideas)

Peter Eisentraut fait le tour des besoins et solutions de chiffrement de données disponibles avec PostgreSQL.

Autres

High-concurrency distributed snapshots, Ants Aasma :

Le modèle actuel de snapshot, qui autorise la visibilité des enregistrements, est maintenant vieux de plus de vingt ans : quel modèle peut-il le remplacer, en prenant en compte la croissance de la concurrence d’accès. L’orateur évoque alors les notions de Commit Sequence Number ou d’un modèle hybride.

UNDELETE data FROM table;

Christoph Berg explique en détail le fonctionnement de PostgreSQL lorsqu’on lui demande de supprimer un enregistrement, et ce qu’il est possible de faire pour retrouver cet enregistrement avec l’extension pg_dirtyread ou la commande pg_waldump. Dans tous les cas, faites des sauvegardes !

pg_ivm : extension for rapid incremental view

Yugo Nagata présente l’extension pg_ivm qui permet de créer des vues matérialisées incrémentales, qui sont donc mises à jour rapidement, contrairement aux vues matérialisées existantes dans PostgreSQL qui nécessitent une régénération entière.

LOXODATA

Retour sur la PG Conf Europe 2024

Retour sur la PG Conf Europe 2024

Performance

High availibility

Kubernetes

Intelligence artificielle

Sécurité

Autres