Windows-1251
MIME / IANA | windows-1251 |
---|---|
Језици | руски, украјински, белоруски, бугарски, српски, македонски, босански, русински, енглсики |
Стандард | WHATWG |
Windows-1251 је 8-битно енкодирање знакова, дизајнирано да покрије језике који користе ћирилично писмо као што су руски, украјински, белоруски, бугарски, српска ћирилица, македонски и др.
На вебу је то друго најчешће коришћено једнобајтно кодирање знакова (или треће најчешће коришћено кодирање знакова у целини) и најчешће коришћено једнобајтно кодирање које подржава ћирилицу. Ажурирано: јануар 2024.[ажурирање] 0,3% свих веб локација користи Windows 1251. [1] [2] Далеко се углавном користи за руски језик, док га користи мала мањина руских веб-сајтова, са 94,6% руских веб локација које користе UTF-8, [3] [4] [5] а застарело 8-битно кодирање је удаљено друго. У Linux-у, кодирање је познато као cp1251. [6] IBM користи кодну страницу 1251 (CCSID 1251 и проширени CCSID 5347 знака евра) за Windows 1251. [7] [8] [9] [10] [11] [12] [13]
Windows 1251 и KOI8-R (или његова украјинска варијанта KOI8-U) се много чешће користе од ISO 8859-5 (који користи мање од 0,0004% веб локација). [14] За разлику од Windows-1252 и ISO 8859-1, Windows 1251 није блиско повезан са ISO 8859-5.
Unicode (нпр. UTF-8) је пожељнији од Windows 1251 или других ћириличких кодирања у савременим апликацијама, посебно на Интернету, што УТФ-8 чини доминантним кодирањем за веб странице.
Скуп знакова
[уреди | уреди извор]Следећа табела приказује Windows 1251. Сваки знак је приказан са својим Unicode еквивалентом и његовим Alt кодом.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
8x | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Ќ | Ћ | Џ |
9x | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | ќ | ћ | џ | |
Ax | NBSP | Ў | ў | Ј | ¤ | Ґ | ¦ | § | Ё | © | Є | « | ¬ | SHY | ® | Ї |
Bx | ° | ± | І | і | ґ | µ | ¶ | · | ё | № | є | » | ј | Ѕ | ѕ | ї |
Cx | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
Dx | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Ex | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Fx | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Казахстанске варијанте
[уреди | уреди извор]KZ-1048
[уреди | уреди извор]Измењена верзија Windows 1251 је стандардизована у Казахстану као казахстански стандард STRK1048, и позната је под ознаком KZ-1048
. Разликује се у редовима приказаним испод:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8x | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Қ | Һ | Џ |
9x | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | қ | һ | џ | |
Ax | NBSP | Ұ | ұ | Ә | ¤ | Ө | ¦ | § | Ё | © | Ғ | « | ¬ | SHY | ® | Ү |
Bx | ° | ± | І | і | ө | µ | ¶ | · | ё | № | ғ | » | ә | Ң | ң | ү |
Кодна страница 1174
[уреди | уреди извор]Кодна страница 1174 је још једна варијанта креирана за казахстански језик, која одговара Windows 1251 за руски подскуп ћириличких слова. Од KZ-1048 се разликује по померању ћириличног слова Һ са 8Е/9Е на 8А/9А.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8x | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Һ | ‹ | Њ | Қ | Ћ | Џ |
9x | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | һ | › | њ | қ | ћ | џ | |
Ax | NBSP | Ұ | ұ | Ә | ¤ | Ө | ¦ | § | Ё | © | Ғ | « | ¬ | SHY | ® | Ү |
Bx | ° | ± | І | і | ө | µ | ¶ | · | ё | № | ғ | » | ә | Ң | ң | ү |
Летонска варијанта
[уреди | уреди извор]Windows летонски + руски је модификација Windows 1251 за подршку летонског језика.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8x | Ū | Ģ | ‚ | ō | „ | … | † | ‡ | Ž | ‰ | Š | ‹ | Ē | Ķ | Č | ģ |
9x | ū | ‘ | ’ | “ | ” | • | – | — | ž | ™ | š | › | ē | ķ | č | Ō |
Ax | Шаблон:Control code link | Ā | ā | Ļ | ¤ | ļ | ¦ | § | Ё | © | Ņ | « | ¬ | Шаблон:Control code link | ® | ¯ |
Bx | ° | ± | Ī | ī | ´ | µ | ¶ | · | ё | № | ņ | » | ¼ | ½ | ¾ | × |
Amiga варијанта
[уреди | уреди извор]Руске верзије Amiga OS-а су користиле верзију кодне странице 1251 која одговара Windows 1251 за руски подскуп ћириличких слова, али иначе углавном прати ISO-8859-1. Ова верзија је позната као Amiga-1251, под којим именом је регистрована у IANA-и. [18]
- ^ Matching ISO-8859-15; at a different location than in Windows-1251
- ^ Present in Windows-1251, but in a different location (absent from ISO-8859-1/15)
Види још
[уреди | уреди извор]Референце
[уреди | уреди извор]- ^ „Historical trends in the usage of character encodings, January 2024”. Приступљено 2024-01-01.
- ^ „Frequently Asked Questions”.
- ^ „Distribution of Character Encodings among websites that use .ru”. w3techs.com. Приступљено 2024-01-01.
- ^ „Distribution of Character Encodings among websites that use Russian”. w3techs.com. Приступљено 2023-01-16.
- ^ „Distribution of Character Encodings among websites that use Russian Federation”. w3techs.com. Приступљено 2021-11-05.
- ^ „cp1251(7) - Linux manual page”. man7.org. Приступљено 2018-07-01.
- ^ „Code page 1251 information document”. Архивирано из оригинала 2016-03-03. г.
- ^ „CCSID 1251 information document”. Архивирано из оригинала 2014-11-29. г.
- ^ „CCSID 5347 information document”. Архивирано из оригинала 2014-11-29. г.
- ^ Code Page CPGID 01251 (pdf) (PDF), IBM
- ^ Code Page CPGID 01251 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03
- ^ International Components for Unicode (ICU), ibm-5347_P100-1998.ucm, 2002-12-03
- ^ „Usage Statistics of Character Encodings for Websites”. w3techs.com (на језику: енглески). Архивирано из оригинала 2012-05-30. г.
- ^ Steele, Shawn (1998). CP1251 to Unicode table. Unicode Consortium. CP1251.TXT.
- ^ Whistler, Ken (2007). KZ-1048 to Unicode. Unicode Consortium. KZ1048.TXT.
- ^ ibm-1174_X100-2007.ucm, IBM
- ^ „Character Sets”. IANA.
- ^ Malyshev, Michael (2003). „Amiga-1251 to Unicode table”. Registration of new charset [Amiga-1251]. IANA.
Литература
[уреди | уреди извор]- Kornai, Andras (1993-03-13). „CYRILLIC ENCODING FAQ Version 1.3”. Приступљено 2020-06-24.
Спољашње везе
[уреди | уреди извор]- Референтни графикон за Windows 1251
- Регистрација имена IANA скупа знакова
- Unicode мапирања за Windows 1251 са "најбољим уклапањем"
- Универзални ћирилични декодер, онлајн програм који може помоћи у опоравку нечитљивих ћириличних текстова са поквареним Windows 1251 или другим кодовима знакова.