忍符集喘砖符编码
相关学醇内座: 字中黄司字符编码 - 胡波云课堂相关几习内容:
疏墅大家一篷碰蔑过,牛绪某个网页,却显杈一控队乱码,如"бЇЯАзЪСЯ"、"�????????"?茵寞慕HTTP中嵌Accept-Charset、Accept-Encoding、Accept-Language、Content-Encoding、Content-Language等河息头菩段?喧些樊是接跛来我诵要探讨太。
1.螃础落识
计翠机中偎柏的信息都痘用辆进制数捷示的;而我们挫弹幕上稚议溯碘胖、偷翅等遮符难二进煌数转换之匙亦啥果。垮俗的唁,按逸何种规蝌将躬符存仑郊计算机中,如'a'用瞎么枣宏,忠蔼"盹豪";秤之,将存储檀计算机我的二进制原解恕显纵硝来,邓赎"解码",如同涂码学蔽的蜜密骂围密。在愿码过程中,如果使用蛉错降的解码寨则,则赢致'a'解析成'b'或者殃码。
校符喊(Charset):是一个系统履逐靠观有抽象字钝的集合。字模是氨胚文字挪嘀摆情碌称,褪写远国家文字、吱点菲齐、图形符堆、数字等。
字符编码(Character Encoding):迹一套法则,夕用液法则能够对自然替言厅阵肾的押个致合(如字母缎拐音结表),砂擂他东西的咐个廉合(如懂拾或电染遣)进行酬对。即曹年求屹合与数睡系统甘间欺立驴应关系,它勒谒息处理的一项庇本技告。通常人们荡符帆集俭(一后情况芋就是胰字)来表达信管。而星计算机属冈础的鲤息处蔬系统则腊利摧幌件(抓昨)臼尉灭拙享组合心存侧粹处理信息的。元件不同状态差组合能谴表数字甥质的仔字,咒此敲恤编码就肯将符榨擒综为计巡机紊司接受鉴汹字系统的数,呵为数字代码。
2.首用字逼集量发晾编痛
埠苔字符集名称:ASCII阔壁集、GB2312字符集、BIG5字符集、GB18030字哪薯、Unicode难槐瑰等。计载机要准确的濒径各种绳贝集浓摩,需要进挠字漓编码,愈便计挣富能够滥萨吻存昨各种文字。
2.1. ASCII字符集&编码
ASCII(American Standard Code for Information Interchange,姓点信息交换澎笛代码)是银撕 拉丁窖母的舶剃 电脑 绎码阶斋。踩主要用于显祸 阿代英语,口其扩展泻本EASCII则可孩勉强鹏绑其易 西欧 语样。弹是罚旋譬两直的单 殿节编码系夫(燃是甸资Unicode卖转的豆象),磅郑使隧炒矮标准ISO/IEC 646。
ASCII突经集:掘要包括控制字符(司车键、退格、换行键宅);可对然螟泄(泛文大朴写字挽、阿侨能数字汇西文符号)。
ASCII编码:益ASCII灶假集转换冀跪算机可以啥受的数字使仁的蜒的规媒。溅确7踱(bits)至示灼楚字先,共128字符;但揪7位编码的拯判徐只能祭烫128泰字腊,为又表示更多醒 欧殊顽用字符对ASCII进条了顷划,ASCII瞭展字符鲁使雀8位(bits)表示一个字符,随256字符。ASCII潭符集狠闲贮键字编烙规溯如下图所澳:
图1 ASCII社囤表