notes·de·pit

Parfois j'apprends à pêcher à des gens qui n'aiment pas le poisson

Dans ton charset

Lorsque l’on rédige un document en html, la question du charset que l’on veut utiliser se pose parfois.

stop-348368964_c2d9519644_b.jpg

Un document html5 a la structure suivante

<!doctype html>
<html lang="fr">
<head>
  <meta charset="utf-8">
  <title>Titre de la page</title>
  <link rel="stylesheet" href="style.css">
  <script src="script.js"></script>
</head>
<body>

  <!-- Le reste du contenu -->

</body>
</html>

En html4 la balise en question avait la forme suivante

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Évidemment (ce n’est sans doute pas évident pour tout le monde1, il faut que le document soit encodé dans le charset annoncé pour que ça fonctionne bien.

Lorsque j’édite un fichier texte (un fichier html est un fichier texte), l’éditeur que j’utilise choisit une manière d’encoder les caractères. Même si aujourd’hui c’est souvent l’utf-8 qui est choisi, ce n’est pas une obligation.

Sous linux, la commande file permet d’obtenir cette information

~$ file example.html
example.html: HTML document, ISO-8859 text

~$ file example2.html
example2.html: HTML document, UTF-8 Unicode text

C’était le petit rappel pour les webmasters débutants.


Alsacreations – Structure globale d’un document html5
Alsacreations — Quel charset choisir
Openweb, Introduction aux jeux de caractères
Linuxfr, mise en demeure
Korben - L’affaire Linkeo
Ploum et son rat mort
Crédit photo, QFamily

À lire aussi

Unicode, UTF8, UTF16, UTF32… et tutti quanti


  1. Et c’est là que je fais le lien (discret) avec l’affaire Linkeo qui aura marqué les esprits en ce début juin 2013.