Меню
Главная
Случайная статья
Настройки
|
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для русских версий Microsoft Windows до 10-й версии. В прошлом пользовалась довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990—1991 годах совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft. Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»). Но, однако был вариативным и представленным в 6 формах применения.
В современных приложениях отдается предпочтение Юникоду (UTF-8). На 1 апреля 2019 года лишь на 1 % всех веб-страниц используется Windows-1251.[1]
Содержание
Особенности
Windows-1251 выгодно отличается от других 8битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только значок ударения); она также содержит все символы для других славянских языков: украинского, белорусского, сербского, македонского и болгарского.
Windows-1251 имеет два недостатка:
- строчная буква я имеет код (25510). Она является «виновницей» ряда неожиданных проблем в программах без поддержки чистого 8-го бита[англ.], а также (гораздо более частый случай) использующих этот код как служебный (в CP437 и CP866 ему соответствует неразрывный пробел, в Windows-1252 — буква , оба варианта практически не используются; число же
-1 , в дополнительном коде длиной 8 бит совпадающее с беззнаковым целым 255 , часто используется в программировании как специальное значение). Тот же недостаток имеет и KOI8-R, но в ней коду
- отсутствуют символы псевдографики, имеющиеся в CP866 и KOI8-R (хотя в графическом окружении, для которого предназначена Windows-1251, в них не было нужды, это делало заметнее несовместимость кодировок, использовавшихся в текстовом и графическом окружениях Windows).
Также как недостаток может рассматриваться отдельное расположение буквы Ё, тогда как остальные символы расположены строго в алфавитном порядке. Это усложняет программы лексикографического упорядочения.
Синонимы: CP1251; ANSI (только в русскоязычной ОС Windows).
Таблицы
Первая половина таблицы кодировки (коды
Кодировка Windows-1251
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
Ђ 0402
|
Ѓ 0403
|
‚ 201A
|
ѓ 0453
|
„ 201E
|
… 2026
|
† 2020
|
‡ 2021
|
€ 20AC
|
‰ 2030
|
Љ 0409
|
‹ 2039
|
Њ 040A
|
Ќ 040C
|
Ћ 040B
|
Џ 040F
|
9.
|
ђ 0452
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
|
™ 2122
|
љ 0459
|
› 203A
|
њ 045A
|
ќ 045C
|
ћ 045B
|
џ 045F
|
A.
|
00A0
|
Ў 040E
|
ў 045E
|
Ј 0408
|
¤ 00A4
|
Ґ 0490
|
¦ 00A6
|
§ 00A7
|
Ё 0401
|
© 00A9
|
Є 0404
|
« 00AB
|
¬ 00AC
|
00AD
|
® 00AE
|
Ї 0407
|
B.
|
° 00B0
|
± 00B1
|
І 0406
|
і 0456
|
ґ 0491
|
µ 00B5
|
¶ 00B6
|
· 00B7
|
ё 0451
|
№ 2116
|
є 0454
|
» 00BB
|
ј 0458
|
Ѕ 0405
|
ѕ 0455
|
ї 0457
|
C.
|
А 0410
|
Б 0411
|
В 0412
|
Г 0413
|
Д 0414
|
Е 0415
|
Ж 0416
|
З 0417
|
И 0418
|
Й 0419
|
К 041A
|
Л 041B
|
М 041C
|
Н 041D
|
О 041E
|
П 041F
|
D.
|
Р 0420
|
С 0421
|
Т 0422
|
У 0423
|
Ф 0424
|
Х 0425
|
Ц 0426
|
Ч 0427
|
Ш 0428
|
Щ 0429
|
Ъ 042A
|
Ы 042B
|
Ь 042C
|
Э 042D
|
Ю 042E
|
Я 042F
|
E.
|
а 0430
|
б 0431
|
в 0432
|
г 0433
|
д 0434
|
е 0435
|
ж 0436
|
з 0437
|
и 0438
|
й 0439
|
к 043A
|
л 043B
|
м 043C
|
н 043D
|
о 043E
|
п 043F
|
F.
|
р 0440
|
с 0441
|
т 0442
|
у 0443
|
ф 0444
|
х 0445
|
ц 0446
|
ч 0447
|
ш 0448
|
щ 0449
|
ъ 044A
|
ы 044B
|
ь 044C
|
э 044D
|
ю 044E
|
я 044F
|
Другие варианты
(Показаны только отличающиеся строки, поскольку всё остальное совпадает)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A.
|
00A0
|
00A1
|
00A2
|
00A3
|
€ 20AC
|
00A5
|
¦ 00A6
|
§ 00A7
|
Ё 0401
|
© 00A9
|
№ 2116
|
« 00AB
|
¬ 00AC
|
00AD
|
® 00AE
|
00AF
|
B.
|
° 00B0
|
± 00B1
|
00B2
|
00B3
|
00B4
|
µ 00B5
|
¶ 00B6
|
· 00B7
|
ё 0451
|
00B9
|
00BA
|
» 00BB
|
00BC
|
00BD
|
00BE
|
00BF
|
Данная кодировка утверждена стандартом СТ РК 1048—2002 и зарегистрирована в IANA как KZ-1048 [1].
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
Ђ 0402
|
Ѓ 0403
|
‚ 201A
|
ѓ 0453
|
„ 201E
|
… 2026
|
† 2020
|
‡ 2021
|
€ 20AC
|
‰ 2030
|
Љ 0409
|
‹ 2039
|
Њ 040A
|
049A
|
04BA
|
Џ 040F
|
9.
|
ђ 0452
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
|
™ 2122
|
љ 0459
|
› 203A
|
њ 045A
|
049B
|
04BB
|
џ 045F
|
A.
|
00A0
|
04B0
|
04B1
|
04D8
|
¤ 00A4
|
04E8
|
¦ 00A6
|
§ 00A7
|
Ё 0401
|
© 00A9
|
0492
|
« 00AB
|
¬ 00AC
|
00AD
|
® 00AE
|
04AE
|
B.
|
° 00B0
|
± 00B1
|
І 0406
|
і 0456
|
04E9
|
µ 00B5
|
¶ 00B6
|
· 00B7
|
ё 0451
|
№ 2116
|
0493
|
» 00BB
|
04D9
|
04A2
|
04A3
|
04AF
|
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
Ђ 0402
|
Ѓ 0403
|
‚ 201A
|
ѓ 0453
|
„ 201E
|
… 2026
|
† 2020
|
‡ 2021
|
€ 20AC
|
‰ 2030
|
Љ 0409
|
‹ 2039
|
04D0
|
04D6
|
04AA
|
04F2
|
9.
|
ђ 0452
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
|
™ 2122
|
љ 0459
|
› 203A
|
04D1
|
04D7
|
04AB
|
04F3
|
Эта кодировка была официально принята в Татарстане в 1996 году.
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
04D8
|
Ѓ 0403
|
‚ 201A
|
ѓ 0453
|
„ 201E
|
… 2026
|
† 2020
|
‡ 2021
|
€ 20AC
|
‰ 2030
|
04E8
|
‹ 2039
|
04AE
|
0496
|
04A2
|
04BA
|
9.
|
04D9
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
|
™ 2122
|
04E9
|
› 203A
|
04AF
|
0497
|
04A3
|
04BB
|
Примечания
- Historical trends in the usage of character encodings, April 2019 (неопр.). Дата обращения: 11 февраля 2016. Архивировано 3 марта 2021 года.
Ссылки
|
|