⑴ 在計算機中,漢字採用什麼碼存放。
機內碼。計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。 漢字交換碼(國標碼)主要用於漢字信息交換,《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元進行了編碼。
國標碼是漢字信息交換的標准編碼,但因其前後位元組的最高位為0,與ASCII碼發生沖突,國標碼是不可能在計算機內部直接採用的,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變。
(1)交換碼用於存儲擴展閱讀
漢字用兩個位元組表示,原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。
這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。
⑵ 什麼是漢字的內碼、外碼、交換碼、字形碼
1、內碼是指計算機漢字系統中使用的二進制字元編碼,是溝通輸入、輸出與系統平台之間的交換碼,通過內碼可以達到通用和高效率傳輸文本的目的。如ASCII。
2、外碼是相對於內碼而言的辭匯。在計算機科學及相關領域中,外碼指的是「外在的『經過學習之後,可直接了解的編碼形式(例如:文字或語音符號)』」。
中文輸入法對漢字的編碼即屬外碼。常見的中文外碼有倉頡碼、行列碼、大易碼、嘸蝦米碼、注音碼、拼音碼。
3、交換碼是指用於交換文件所使用的編碼。對於計算機而言,不同的系統有可能使用不同的內碼。但如果不同系統間要基冊交換文件,則會發生亂碼現象。解決方法則為,在交換文件前,文件提供者先將由內碼形式儲存的文件轉換成交換碼形式再做交換。在接收文件後,文件接收者再由交物鋒手換碼轉成內碼。
4、字形碼,點陣代碼的一種。為了將漢字在顯示器或列印機上輸出,把漢字按圖形符號設計成點陣圖,就得到了相應的點陣代碼(字形碼)。用於顯示的字型檔叫顯示字型檔。顯示一個漢字一般採用16×16點陣或24×24點陣或48×48點陣。已知漢字點陣的大小,可以計算出存儲一個漢字所需佔用的位元組空間。
5、漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算罩嫌機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。