Пређи на садржај

Windows-1251

С Википедије, слободне енциклопедије
Windows-1251
MIME / IANAwindows-1251
Језицируски, украјински, белоруски, бугарски, српски, македонски, босански, русински, енглсики
СтандардWHATWG

Windows-1251 је 8-битно енкодирање знакова, дизајнирано да покрије језике који користе ћирилично писмо као што су руски, украјински, белоруски, бугарски, српска ћирилица, македонски и др.

На вебу је то друго најчешће коришћено једнобајтно кодирање знакова (или треће најчешће коришћено кодирање знакова у целини) и најчешће коришћено једнобајтно кодирање које подржава ћирилицу. Ажурирано: јануар 2024. 0,3% свих веб локација користи Windows 1251. [1] [2] Далеко се углавном користи за руски језик, док га користи мала мањина руских веб-сајтова, са 94,6% руских веб локација које користе UTF-8, [3] [4] [5] а застарело 8-битно кодирање је удаљено друго. У Linux-у, кодирање је познато као cp1251. [6] IBM користи кодну страницу 1251 (CCSID 1251 и проширени CCSID 5347 знака евра) за Windows 1251. [7] [8] [9] [10] [11] [12] [13]

Windows 1251 и KOI8-R (или његова украјинска варијанта KOI8-U) се много чешће користе од ISO 8859-5 (који користи мање од 0,0004% веб локација). [14] За разлику од Windows-1252 и ISO 8859-1, Windows 1251 није блиско повезан са ISO 8859-5.

Unicode (нпр. UTF-8) је пожељнији од Windows 1251 или других ћириличких кодирања у савременим апликацијама, посебно на Интернету, што УТФ-8 чини доминантним кодирањем за веб странице.

Скуп знакова

[уреди | уреди извор]

Следећа табела приказује Windows 1251. Сваки знак је приказан са својим Unicode еквивалентом и његовим Alt кодом.

Windows-1251[15]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2x  SP  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ DEL
8x Ђ Ѓ ѓ Љ Њ Ќ Ћ Џ
9x ђ љ њ ќ ћ џ
Ax NBSP Ў ў Ј ¤ Ґ ¦ § Ё © Є « ¬ SHY ® Ї
Bx ° ± І і ґ µ · ё є » ј Ѕ ѕ ї
Cx А Б В Г Д Е Ж З И Й К Л М Н О П
Dx Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
Ex а б в г д е ж з и й к л м н о п
Fx р с т у ф х ц ч ш щ ъ ы ь э ю я
  Differences from Windows-1252

Казахстанске варијанте

[уреди | уреди извор]

Измењена верзија Windows 1251 је стандардизована у Казахстану као казахстански стандард STRK1048, и позната је под ознаком KZ-1048. Разликује се у редовима приказаним испод:

KZ-1048 (STRK1048-2002)[16]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8x Ђ Ѓ ѓ Љ Њ Қ Һ Џ
9x ђ љ њ қ һ џ
Ax NBSP Ұ ұ Ә ¤ Ө ¦ § Ё © Ғ « ¬ SHY ® Ү
Bx ° ± І і ө µ · ё ғ » ә Ң ң ү
  Differences from Windows-1251

Кодна страница 1174

[уреди | уреди извор]

Кодна страница 1174 је још једна варијанта креирана за казахстански језик, која одговара Windows 1251 за руски подскуп ћириличких слова. Од KZ-1048 се разликује по померању ћириличног слова Һ са 8Е/9Е на 8А/9А.

Кодна страница 1174[17]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8x Ђ Ѓ ѓ Һ Њ Қ Ћ Џ
9x ђ һ њ қ ћ џ
Ax NBSP Ұ ұ Ә ¤ Ө ¦ § Ё © Ғ « ¬ SHY ® Ү
Bx ° ± І і ө µ · ё ғ » ә Ң ң ү
  Different from Windows-1251

Летонска варијанта

[уреди | уреди извор]

Windows летонски + руски је модификација Windows 1251 за подршку летонског језика.

Windows Latvian + Russian
0 1 2 3 4 5 6 7 8 9 A B C D E F
8x Ū Ģ ō Ž Š Ē Ķ Č ģ
9x ū ž š ē ķ č Ō
Ax Шаблон:Control code link Ā ā Ļ ¤ ļ ¦ § Ё © Ņ « ¬ Шаблон:Control code link ® ¯
Bx ° ± Ī ī ´ µ · ё ņ » ¼ ½ ¾ ×
  Differences from Windows-1251

Amiga варијанта

[уреди | уреди извор]

Руске верзије Amiga OS-а су користиле верзију кодне странице 1251 која одговара Windows 1251 за руски подскуп ћириличких слова, али иначе углавном прати ISO-8859-1. Ова верзија је позната као Amiga-1251, под којим именом је регистрована у IANA-и. [18]

Amiga-1251[19]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8x Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link
9x Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link Шаблон:Control code link
Ax NBSP ¡ ¢ £ [а] ¥ ¦ § Ё © [б] « ¬ SHY ® ¯
Bx ° ± ² ³ ´ µ · ё ¹ º » ¼ ½ ¾ ¿
  Different from Windows-1251 to match ISO-8859-1
  Different from both Windows-1251 and ISO-8859-1
  1. ^ Matching ISO-8859-15; at a different location than in Windows-1251
  2. ^ Present in Windows-1251, but in a different location (absent from ISO-8859-1/15)

Референце

[уреди | уреди извор]
  1. ^ „Historical trends in the usage of character encodings, January 2024”. Приступљено 2024-01-01. 
  2. ^ „Frequently Asked Questions”. 
  3. ^ „Distribution of Character Encodings among websites that use .ru”. w3techs.com. Приступљено 2024-01-01. 
  4. ^ „Distribution of Character Encodings among websites that use Russian”. w3techs.com. Приступљено 2023-01-16. 
  5. ^ „Distribution of Character Encodings among websites that use Russian Federation”. w3techs.com. Приступљено 2021-11-05. 
  6. ^ „cp1251(7) - Linux manual page”. man7.org. Приступљено 2018-07-01. 
  7. ^ „Code page 1251 information document”. Архивирано из оригинала 2016-03-03. г. 
  8. ^ „CCSID 1251 information document”. Архивирано из оригинала 2014-11-29. г. 
  9. ^ „CCSID 5347 information document”. Архивирано из оригинала 2014-11-29. г. 
  10. ^ Code Page CPGID 01251 (pdf) (PDF), IBM 
  11. ^ Code Page CPGID 01251 (txt), IBM 
  12. ^ International Components for Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03 
  13. ^ International Components for Unicode (ICU), ibm-5347_P100-1998.ucm, 2002-12-03 
  14. ^ „Usage Statistics of Character Encodings for Websites”. w3techs.com (на језику: енглески). Архивирано из оригинала 2012-05-30. г. 
  15. ^ Steele, Shawn (1998). CP1251 to Unicode table. Unicode Consortium. CP1251.TXT. 
  16. ^ Whistler, Ken (2007). KZ-1048 to Unicode. Unicode Consortium. KZ1048.TXT. 
  17. ^ ibm-1174_X100-2007.ucm, IBM 
  18. ^ „Character Sets”. IANA. 
  19. ^ Malyshev, Michael (2003). „Amiga-1251 to Unicode table”. Registration of new charset [Amiga-1251]. IANA. 

Литература

[уреди | уреди извор]

Спољашње везе

[уреди | уреди извор]