字符編碼和漢字編碼_第1頁
字符編碼和漢字編碼_第2頁
字符編碼和漢字編碼_第3頁
字符編碼和漢字編碼_第4頁
字符編碼和漢字編碼_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

字符編碼和漢字編碼(一)計算機中的信息包括數(shù)據(jù)信息和控制信息,數(shù)據(jù)信息又可分為數(shù)值和非數(shù)值信息。非數(shù)值信息和控制信息包括了字母、各種控制符號、圖形符號等,計算機內(nèi)以二進制編碼進行處理,這種對字母和符號進行編碼的稱為字符代碼(CharacterCode)。常用的編碼:一、ASCII碼包含標準ASCII碼和擴展ASCII碼現(xiàn)在使用最普遍的編碼是美國國家標準信息交換碼即ASCII碼(AmericanStandardCodeforInformationInterchange)。基本的ASCII字符集共有128個字符,(高位為0,27=128個,十進制0---127),標準ASCII碼使用7個二進位對字符進行編碼,對應的ISO標準為ISO646標準。例如:大寫字母A,其ASCII碼為01000001,即ASC(A)=65小寫字母a,其ASCII碼為01100001,即ASC(a)=97由于標準ASCII字符集字符數(shù)目有限,在實際應用中往往無法滿足要求。為此,國際標準化組織又制定了ISO2022標準,它規(guī)定了在保持與ISO646兼容的前提下將ASCII字符集擴充為8位代碼的統(tǒng)一方法。這些擴充字符的編碼均為高位為1的8位代碼(即十進制數(shù)128~255),稱為擴展ASCII碼。二、國標碼ASCII碼的提出,有效的解決了西文文字的信息化問題,但對于漢字字符卻完全不適用。為了滿足計算機中使用漢字的需要,中國國家標準總局于1980年發(fā)布《信息交換用漢字編碼字符集基本集》,標準號為GB2312-1980,稱為GB碼或國標碼。國標碼:漢字信息交換的代碼,也稱交換碼。GB2312-80標準采用區(qū)位碼,將漢字編碼分成94區(qū)與94位。用區(qū)碼、位碼表示,稱為區(qū)位碼。GB2312-80標準中共有漢字6763個:一級漢字3755個,按漢字拼音字母順序排列;二級漢字3008個,按部首筆畫漢字排列。

如第一個漢字“啊”出現(xiàn)在第16區(qū)的第01位上,其區(qū)位碼為1601。漢字編碼一個漢字點兩個ASCII碼,即2個字節(jié)。漢字編碼在不同的處理階段有不同的編碼。漢字的輸入:輸入碼輸入碼與內(nèi)碼的交換碼:國標碼漢字的機內(nèi)表示:機內(nèi)碼

漢字的輸出:字形碼(輸出碼:漢字點陣字庫)1.漢字輸入碼又稱為外碼如拼音輸入法、五筆輸入法、區(qū)位碼等啊拼音碼a五筆字型碼kbsk區(qū)位碼1601國標區(qū)位碼:把GB2312-80分為94區(qū)、每區(qū)分94位;是國標碼的一種變形。如:“啊”在第16區(qū)第01位,區(qū)位碼為1601,請同學們配置區(qū)位碼輸入。注意:用區(qū)位碼輸入(注意用主鍵區(qū))不能用數(shù)字鍵盤的數(shù)字。字符編碼和漢字編碼(二)區(qū)位碼與國標碼的換算:國標碼高位=區(qū)位碼高位+20H國標碼低位=區(qū)位碼低位+20H例1:“啊”的區(qū)位碼1601,算出國標碼步驟:(1)區(qū)碼和位碼分別轉換成十六進制數(shù)表示;(2)(區(qū)位碼的十六進制表示)+2022H=國標碼;解:“啊”的區(qū)碼16,位碼是01,對應的十六進制的區(qū)碼是10,位碼是01,國標碼為10+20=30H01+20=21H即3021H3、機內(nèi)碼:計算機系統(tǒng)內(nèi)部標識漢字的編碼。一個漢字由兩個字節(jié)組成,為了與ASCII碼區(qū)別,最高位均為“1”。國標碼和機內(nèi)碼的換算:內(nèi)碼高位=國際碼高位+80H內(nèi)碼低位=國際碼低位+80H例1中啊的機內(nèi)碼3021+8080=B0A1UltraEdit軟件顯示知道十六進制的機內(nèi)碼,也就知道這個漢字在計算機的處理用的二進制編碼。[例2]“大”字的區(qū)位碼為2083,求該字的國標碼和機內(nèi)碼分析方法步驟:(1)區(qū)碼和位碼分別轉換成十六進制數(shù)表示(2)(區(qū)位碼的十六進制表示)+2022H=國標碼;(3)國標碼+8080H=機內(nèi)碼解:1、該字的區(qū)號為20,位號為83,分別轉換為十六進制表示為14H,53H2、1453H+2022H=3473H,得到國標碼3473H3、3473H+8080H=B4F3H,得到機內(nèi)碼為B4F3H請同學們寫出二進制編碼1011010011110011漢字的區(qū)位碼、國標碼、內(nèi)部碼三者之間的轉換關系:國標碼=區(qū)位碼+2022H內(nèi)碼=國標碼+8080H內(nèi)碼=區(qū)位碼+A0A0思考:用UltraEdit軟件輸入“你好”得到內(nèi)碼C4E3BAC3,請同學們算出國標碼、區(qū)位碼,并用區(qū)位碼輸入檢驗你計算的結果是否正確.你:3667好:26354.字形碼:漢字字模信息碼為了將漢字在顯示器或打印機上輸出,把漢字按圖形符號設計成點陣圖,就得到了相應的點陣代碼(字形碼)。作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論