Assiste.com
cr 01.04.2012 r+ 22.10.2024 r- 22.10.2024 Pierre Pinard. (Alertes et avis de sécurité au jour le jour)
Sommaire (montrer / masquer) |
---|
Ce formulaire vous permet d'encoder un texte en échappement% ou, inversement, de décoder un texte en échappement%.
Utilisation :
Escape Code (Échappement %) - De quoi s'agit-il ?
Vous avez déjà vu des URLs avec cette tête ?
L'URL utilise un codage légitime, mais inhabituel, utilisant des "séquences d'escapes" et appelé "échappement %".
Avec de tels liens, vous ne savez pas où vous allez atterrir et, comme l'usage d'un tel encodage est complètement inhabituel, on est persuadé qu'il y a quelque chose de caché, à commencer par le nom de domaine contenu dans l'URL et tout le contenu de l'URL. Cette méthode est utilisée par les sites crapuleux, les sites bénéficiaires de spam commerciaux etc. ... Le formulaire suivant permet de décoder ces URLs. En fait, il permet de décoder n'importe quelle chaîne de caractères codée avec des séquences d'escape.
Le codage des URLs (des liens hypertexte) répond à une syntaxe qui a été voulue, dès le départ, ouverte aux futurs protocoles possibles et imaginables et être utilisable par tous les systèmes déjà existants.
C'est donc l'usage de la bonne vieille table de caractères normalisée, la table ASCII (American Standard Code for Information Interchange) qui a été retenu. Cette table est constituée de tous les caractères imprimables (que l'on voit et trouve donc sur un clavier) mais aussi de certains autres, non imprimables et non visibles sur un clavier. Ils sont, traditionnellement, utilisés, par exemple pour donner des ordres de format aux imprimantes "caractère" (sauts de page, sauts de ligne, tabulation etc. ...). Leur utilisation est nécessaire car certains services utilisent ces caractères spéciaux comme éléments du protocole (gopher, par exemple, utilise le caractère Tab (%09) comme séparateur de champ).
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | TAB | LF | VT | FF | CR | SO | SI |
1 | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2 | espace | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7 | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8 | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | Š | ‹ | Œ | Ž | |||
9 | ‘ | ’ | “ | ” | • | | | ˜ | | š | › | œ | ž | Ÿ | ||
A | ¡ | ¢ | £ | ¥ | | | § | ¨ | © | ª | « | ¬ | ¯ | ® | ¯ | ||
B | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
C | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß | |
E | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Le même tableau pour les paresseux :
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | TAB | LF | VT | FF | CR | SO | SI |
1 | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2 | espace %20 | ! %21 | " %22 | # %23 | $ %24 | % %25 | & %26 | ' %27 | ( %28 | ) %29 | * %2A | + %2B | , %2C | - %2D | . %2E | / %2F |
3 | 0 %30 | 1 %31 | 2 %32 | 3 %33 | 4 %34 | 5 %35 | 6 %36 | 7 %37 | 8 %38 | 9 %39 | : %3A | ; %3B | < %3C | = %3D | > %3E | ? %3F |
4 | @ %40 | A %41 | B %42 | C %43 | D %44 | E %45 | F %46 | G %47 | H %48 | I %49 | J %4A | K %4B | L %4C | M %4D | N %4E | O %4F |
5 | P %50 | Q %51 | R %52 | S %53 | T %54 | U %55 | V %56 | W %57 | X %58 | Y %59 | Z %5A | [ %5B | \ %5C | ] %5D | ^ %5E | _ %5F |
6 | ` %60 | a %61 | b %62 | c %63 | d %64 | e %65 | f %66 | g %67 | h %68 | i %69 | j %6A | k %6B | l %6C | m %6D | n %6E | o %6F |
7 | p %70 | q %71 | r %72 | s %73 | t %74 | u %75 | v %76 | w %77 | x %78 | y %79 | z %7A | { %7B | | %7C | } %7D | ~ %7E | %7F |
8 | € %80 | %81 | ‚ %82 | ƒ %83 | „ %84 | … %85 | † %86 | ‡ %87 | ˆ %88 | ‰ %89 | Š %8A | ‹ %8B | Œ %8C | %8D | Ž %8E | %8F |
9 | %90 | ‘ %91 | ’ %92 | “ %93 | ” %94 | • %95 | %96 | %97 | ˜ %98 | %99 | š %9A | › %9B | œ %9C | %9D | ž %9E | Ÿ %9F |
A | %A0 | ¡ %A1 | ¢ %A2 | £ %A3 | %A4 | ¥ %A5 | | %A6 | § %A7 | ¨ %A8 | © %A9 | ª %AA | « %AB | ¬ %AC | ¯ %AD | ® %AE | ¯ %AF |
B | ° %B0 | ± %B1 | ² %B2 | ³ %B3 | ´ %B4 | µ %B5 | ¶ %B6 | · %B7 | ¸ %B8 | ¹ %B9 | º %BA | » %BB | ¼ %BC | ½ %BD | ¾ %BE | ¿ %BF |
C | À %C0 | Á %C1 | Â %C2 | Ã %C3 | Ä %C4 | Å %C5 | Æ %C6 | Ç %C7 | È %C8 | É %C9 | Ê %CA | Ë %CB | Ì %CC | Í %CD | Î %CE | Ï %CF |
D | Ð %D0 | Ñ %D1 | Ò %D2 | Ó %D3 | Ô %D4 | Õ %D5 | Ö %D6 | %D7 | Ø %D8 | Ù %D9 | Ú %DA | Û %DB | Ü %DC | Ý %DD | Þ %DE | ß %DF |
E | à %E0 | á %E1 | â %E2 | ã %E3 | ä %E4 | å %E5 | æ %E6 | ç %E7 | è %E8 | é %E9 | ê %EA | ë %EB | ì %EC | í %ED | î %EE | ï %EF |
F | ð %F0 | ñ %F1 | ò %F2 | ó %F3 | ô %F4 | õ %F5 | ö %F6 | ÷ %F7 | ø %F8 | ù %F9 | ú %FA | û %FB | ü %FC | ý %FD | þ %FE | ÿ %FF |
Le caractère "TAB", par exemple, est, dans cette table, à l'intersection de la ligne 0 et de la colonne 9. Son code ASCII est donc 09.
Ceci est, bien entendu, fonctionnel sur toute la table ASCII. Par exemple "Papa" pourrait donc s'écrire "50 61 70 61", mais il manque quelque chose :
Pour distinguer 50 61 70 61 d'un bête nombre, il a été convenu d'un code dit d'"échappement" qui a été choisi pour être le caractère "%" d'où le nom d'"échappement %". Lorsque ce code est rencontré, les 2 caractères qui le suivent sont le code ASCII d'un caractère. (Conséquence syntaxique : le caractère % est "interdit" en écriture directe et ne peut s'écrire que %25).
Papa pourrait donc s'écrire %50 %61 %70 %61, mais il manque encore quelque chose que la règle syntaxique impose :
Le caractère "espace" n'est pas admis. Il doit être remplacé, lorsqu'il est requis, par %20 (le caractère "espace" dans la case ligne 2 colonne 0). S'il n'est pas requis, il ne doit pas y en avoir.
Donc, finalement, Papa s'écrit %50%61%70%61. Cette manière d'écrire les URLs est donc parfaitement légitime bien que totalement "exotique" et consiste à remplacer chaque caractère (d'une URL, d'une chaîne de caractères quelconque...) par son équivalent dans un autre alphabet appelé "échappement %". Les sites crapuleux et les spammeurs sont les grands utilisateurs de cette méthode de camouflage. Nous pouvons d'ailleurs leur rendre la monnaie de leur pièce et crypter nos adresses e-mail pour éviter leurs robots en utilisant les mêmes outils qu'eux !
Windows, Internet et le codage de certains caractères
Le partage d'informations, sous forme de documents numériques, pose un problème né de la mondialisation des échanges grace (ou à cause) de l'émergence de l'Internet. Il faut faire en sorte que le contenu d'un document numérique puisse être reconnu de manière identique par les systèmes d'exploitation et les applications utilisant des alphabets (des jeux de caractères) totalement différents (oriental, occidental etc. ...).
Des codes ont été mis au point pour s'assurer qu'un symbole, dans un système, s'affiche et s'imprime identiquement dans un autre système. Ces codes se sont compléxifiés et étendus avec le temps afin de reconnaître de plus en plus de caractères spéciaux propres à des langues de plus en plus nombreuses. Ces codes normalisés ont commencés avec ASCII, EBCDIC, ISO-2022... pour aboutir à Unicode). Evidemment Microsoft a tenté d'imposer un code exotique qui est invalide et ne sera jamais normalisé.
Principaux codes utilisés sur l'Internet.
codages invalides utilisés par Windows | Entités « caractère » normalisées Pas reconnues par Netscape 4 | Références numériques normalisées | Résultat affiché | Commentaire |
---|---|---|---|---|
€ | € | € | € | Symbole monétaire de l'Euro (1) |
 | ||||
‚ | ‚ | ‚ | ‚ | Apostrophe anglaise basse (1) (2) (3) |
ƒ | ƒ | ƒ | ƒ | Florin, forte musical (1) (2) |
„ | „ | „ | „ | Guillemet anglais bas (1) (2) |
… | … | … | … | Points de suspension (n'est pas une suite de 3 points mais un symbole unique) (1) |
† | † | † | † | Obèle, dague, croix (appel de notes de bas de page) (1) |
‡ | ‡ | ‡ | ‡ | Double obèle, double croix (1) |
ˆ | ˆ | ˆ | ˆ | Accent circonflexe (1) |
‰ | ‰ | ‰ | ‰ | Pour mille (1) |
Š | Š | Š | Š | S majuscule avec hatchek (háček, caron, antiflexe - accent circonflexe inversé) - langue tchèque (1) (ISO-8859-2 Unicode) |
‹ | ‹ | ‹ | ‹ | Guillemet simple allemand et suisse, parenthèse angulaire ouvrante (1) (2) (3) |
Œ | Œ | Œ | Œ | Ligature o-e majuscule (1) (2) (ignorée des normes ISO Latin-1 (ISO 8859-1) et Unicode (ISO 10646)) |
 | ||||
Ž | Ž | Ž | Z majuscule avec hatchek (háček, caron, antiflexe - accent circonflexe inversé) - langue tchèque (1) (ISO-8859-2 Unicode) | |
 | ||||
 | ||||
‘ | ‘ | ‘ | ‘ | Guillemet anglais simple ouvrant (1) (2) (3) |
’ | ’ | ’ | ’ | Guillemet anglais simple fermant (1) (2) (3) |
“ | “ | “ | “ | Guillemets anglais doubles ouvrants (1) (2) (3) |
” | ” | ” | ” | Guillemets anglais doubles fermants (1) (2) (3) |
• | • | • | • | Boulet (type "listes à puces") (1) (2) |
– | – | – | | Tiret demi-cadratin ou tiret moyen « » (caractère Unicode U+2013, LaTeX --, clavier Mac : Alt + Maj + -) (Espaces typographiques). Voir The Trouble With EM 'n EN |
— | — | — | | Tiret cadratin ou tiret long « » (caractère Unicode U+2014, LaTeX ---, clavier Mac : Alt + -) (Espaces typographiques). Voir The Trouble With EM 'n EN |
˜ | ˜ | ˜ | ˜ | Tilde : signe diacritique utilisé en Castillan (ñ), en Portugais (ã, õ), en Guarani (ã, ñ, õ) et en Breton (añ). (1) |
™ | ™ | ™ | | TM - Trade Mark (Marque Dépossée) |
š | š | š | š | s minuscule avec hatchek (háček, caron, antiflexe - accent circonflexe inversé) - langue tchèque (1) (ISO-8859-2 Unicode) |
› | › | › | › | guillemet simple allemand et suisse, parenthhse angulaire fermante (1) (2) (3) |
œ | œ | œ | œ | Ligature o-e minscule (1) (2) (ignorée des normes ISO Latin-1 (ISO 8859-1) et Unicode (ISO 10646)) |
 | ||||
ž | ž | ž | z minuscule avec hatchek (háček, caron, antiflexe - accent circonflexe inversé) - langue tchèque (1) (ISO-8859-2 Unicode) | |
Ÿ | Ÿ | Ÿ | Ÿ | Y majuscule avec trema (dans quelques noms propres. (Ignorée des normes ISO Latin-1 (ISO 8859-1) et Unicode (ISO 10646)) |
|
Les encyclopédies |
---|