Меню

Главная
Случайная статья
Настройки
ISO 8859-1
Материал из https://ru.wikipedia.org

ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1) — кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220. Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859.

ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых используется весьма редко). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML, однако, кодировкой по умолчанию является UTF-8).

IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987, ISO_8859-1, ISO-8859-1, iso-ir-100, sISOLatin1, latin1, l1, IBM819, CP819.

В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.

В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252, которая отличается от ISO-8859-1 тем, что позиции 128—159 (0x80—0x9F) здесь заняты разными полезными типографскими символами. Большинство браузеров не различает ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.

Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows-1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например, тире (—) обозначалось — вместо правильного —, многоточие обозначалось … вместо правильного … и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например, — как тире, хотя на самом деле — — это управляющий символ «end of guarded area», применение которого в HTML бессмысленно.

В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.[1]

Содержание

Таблицы

Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

ISO-8859-1
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. PAD
0080
HOP
0081
BPH
0082
NBH
0083
IND
0084
NEL
0085
SSA
0086
ESA
0087
HTS
0088
HTJ
0089
VTS
008A
PLD
008B
PLU
008C
RI
008D
SS2
008E
SS3
008F
9. DCS
0090
PU1
0091
PU2
0092
STS
0093
CCH
0094
MW
0095
SPA
0096
EPA
0097
SOS
0098
SGCI
0099
SCI
009A
CSI
009B
ST
009C
OSC
009D
PM
009E
APC
009F
A.  
00A0

00A1

00A2

00A3
¤
00A4

00A5
¦
00A6
§
00A7

00A8
©
00A9

00AA
«
00AB
¬
00AC
­
00AD
®
00AE

00AF
B. °
00B0
±
00B1

00B2

00B3

00B4
µ
00B5

00B6
·
00B7

00B8

00B9

00BA
»
00BB

00BC

00BD

00BE

00BF
C.
00C0

00C1

00C2

00C3

00C4

00C5

00C6

00C7

00C8

00C9

00CA

00CB

00CC

00CD

00CE

00CF
D.
00D0

00D1

00D2

00D3

00D4

00D5

00D6

00D7

00D8

00D9

00DA

00DB

00DC

00DD

00DE

00DF
E.
00E0

00E1

00E2

00E3

00E4

00E5

00E6

00E7

00E8

00E9

00EA

00EB

00EC

00ED

00EE

00EF
F.
00F0

00F1

00F2

00F3

00F4

00F5

00F6

00F7

00F8

00F9

00FA

00FB

00FC

00FD

00FE

00FF


Интересно расположение символов и посреди букв: первоначально там планировалось разместить лигатуру , но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.[2]

Windows-1252

В первоначальной версии этой кодировки отсутствовали символы (0x80), (0x88), (0x98), (0x8E), (0x9E).
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
20AC

201A

0192

201E

2026

2020

2021

02C6

2030

0160

2039

0152

017D
9.
2018

2019

201C

201D

2022

2013

2014

02DC

2122

0161

203A

0153

017E

0178
A.  
00A0

00A1

00A2

00A3
¤
00A4

00A5
¦
00A6
§
00A7

00A8
©
00A9

00AA
«
00AB
¬
00AC
­
00AD
®
00AE

00AF
B. °
00B0
±
00B1

00B2

00B3

00B4
µ
00B5

00B6
·
00B7

00B8

00B9

00BA
»
00BB

00BC

00BD

00BE

00BF
C.
00C0

00C1

00C2

00C3

00C4

00C5

00C6

00C7

00C8

00C9

00CA

00CB

00CC

00CD

00CE

00CF
D.
00D0

00D1

00D2

00D3

00D4

00D5

00D6

00D7

00D8

00D9

00DA

00DB

00DC

00DD

00DE

00DF
E.
00E0

00E1

00E2

00E3

00E4

00E5

00E6

00E7

00E8

00E9

00EA

00EB

00EC

00ED

00EE

00EF
F.
00F0

00F1

00F2

00F3

00F4

00F5

00F6

00F7

00F8

00F9

00FA

00FB

00FC

00FD

00FE

00FF


Примечания
  1. Проект стандарта на сайте www.w3.org. Дата обращения: 15 января 2010. Архивировано 6 января 2010 года.
  2. Disposition of comments on ballot results SC2 N 3005 — ISO/IEC 8859 Part 15. Дата обращения: 25 июня 2010. Архивировано 19 июня 2010 года.


Ссылки
Downgrade Counter