Unicode et UTF-8 sont deux standards complémentaires mais distincts : Unicode est une base de données universelle qui associe un numéro unique (point de code) à chaque caractère, symbole ou emoji, couvrant toutes les langues et bien plus. UTF-8, quant à lui, est un encodage qui permet de représenter ces points de code en binaire, de manière rétrocompatible avec l’ASCII et optimisée en espace (1 à 4 octets par caractère). L’article explique pourquoi l’ASCII, limité à 128 caractères, a cédé la place à Unicode pour gérer la diversité linguistique, et comment UTF-8 s’impose comme le format dominant grâce à son efficacité et sa compatibilité. Il aborde aussi les subtilités comme les graphèmes (combinaisons de points de code) et la normalisation, rappelant que la notion de "caractère" est plus complexe qu’il n’y paraît.
Tout est dans le titre
Tout est dans le titre
Tout est dans le titre
Tout est dans le titre
Plein de notions CSS sont abordées dans cet article : sélecteurs, contenu généré, utf8, flexbox, etc.
Tout est dans le titre
À retenir (via sebsauvage)
"�" : encodé en ISO, affiché en UTF-8.
"é" : encodé en UTF-8, affiché en ISO.
"" : encodé en WINDOWS-1252, affiché en UTF-8 (généralement).
Pour résumer l'article :
- Utilisez Unicode;
- Forcez le charset de vos connexions MySQL ;
- Utilisez utf8mb4 au lieu de utf8 ;
- Normalisez les contenus importants ;
- Forcez l’encodage pour tous vos développeurs ;
- N’utilisez pas utf8_decode et utf8_encode !
Piqué au warrior du dimanche : Bon à savoir ça: pour filtrer les caractères non alphabétiques en conservant les accents, il suffit d'ajouter la directive «u» à la fin de la regex.
(en ayant précisé la locale voulue...quand même.)
$str = 'perché';
setlocale(LC_ALL, 'fr_FR@euro');
echo preg_match('#^\w+$#u', $str);
sinon, on peut aussi utiliser les Unicode character properties
\p{L}
Mémo pour configurer correctement l'utf-8 dans le Dockerfile.
Une conférence sur l'encodage (via https://blog.stephaniewalter.fr/la-semaine-en-pixels-24-juin-2018/ )
Tout est dans le titre
Tout est dans le titre... et c'est bon à savoir :)
Intéressant
Tout est dans le titre
Tout est dans le titre
Une bonne solution à ce problème...
Encore du tout bon : de l'intégration continue, de l'asynchrone, de l'UTF-8 en PHP