當前位置:首頁 » 服務存儲 » 國標碼和機內碼都是存儲碼嗎
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

國標碼和機內碼都是存儲碼嗎

發布時間: 2022-10-25 22:03:39

1. 機內碼和國標碼什麼意思,怎麼轉換

機內碼是漢字在計算機內部使用的編碼,國標碼是在中國大陸使用最廣泛的漢字編碼字元集。其轉換規則是:機內碼是將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1。

在漢字計算機編碼標准中,最大的漢字編碼是台灣的標准CNS11643,(4.0)共收錄可考證之繁簡、日、韓語漢字共76,067個,但並不普及,只有在戶政系統等少數環境使用。台港民間通用的大五碼收錄繁體漢字13053個。

GB18030是中華人民共和國現時最新的內碼字集,GBK收錄簡體、繁體及日語、韓語漢字20912個,而早期的GB2312收錄簡體漢字6763個。而Unicode的中日韓統一表意文字基本字集則收錄漢字20902個,另有兩個擴展區,總數亦高達七萬多字。

(1)國標碼和機內碼都是存儲碼嗎擴展閱讀:

國標碼(「國標」是中華人民共和國國家標準的簡稱)在中國大陸使用。GB2312收錄6763個漢字,GBK收錄20912個漢字,最新的GB18030收錄27533個漢字。BIG5碼。收錄13053個漢字。在台灣和香港使用的一位元組或兩位元組編碼。

Unicode並不被中國政府很好的接受。中國政府要求在中國大陸出售的軟體必須支持GB18030編碼。在國際通信化和軟體設計領域,CJK編碼收集了漢語、日語、韓語中的漢字集。

2. 什麼是區內碼,機內碼,國標碼

一個字在電腦中存儲的時候有水平坐標和垂直坐標,這就相當於區位碼,不是區內碼。
機內碼是所有漢字存儲時使用的碼。
英文字母存儲和漢字存儲不一樣,外國使用的是國標碼。

3. 什麼是區位碼,國標碼,機內碼,存儲碼,字形碼。要定義,可能的話加上它們間的關系!

網路搜搜,答案就有了。
區位碼 1980年,為了使每一個漢字有一個全國統一的代碼,我國頒布了第一個漢字編碼 的國家標准: GB2312-80《信息交換用漢字編碼字元集》基本集,這個字元集是我國中文信息處理技術的發展基礎,也是目前國內所有漢字系統的統一標准。
國標碼是一個四位十六進制數,區位碼是一個四位的十進制數,每個國標碼或區位碼都對應著一個唯一的漢字或符號,但因為十六進制數我們很少用到,所以大家常用的是區位碼,它的前兩位叫做區碼,後兩位叫做位碼。
。。。。。。

4. 什麼是國標碼機內碼/機外碼字型碼

計算機中漢字的表示也是用二進制編碼,同樣是人為編碼的。根據應用目的的不

同,漢字編碼分為外碼、交換碼、機內碼和字形碼。1.外碼(輸入碼)�

外碼也叫輸入碼,是用來將漢字輸入到計算機中的一組鍵盤符號。英文字母只有26個,可以把所有的字元都放到鍵盤上,而使用這種辦法把所有的漢字都放到鍵盤上,是不可能的。所以漢字系統需要有自己的輸入碼體系,使漢字與鍵盤能建立對應關系。目前常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認知碼、區位碼和電報碼等,一種好的編碼應有編碼規則簡單、易學好記、操作方便、重碼率低、輸入速度快等優點,每個人可根據自己的需要進行選擇。在後面的章節中,重點介紹智能全拼輸入法和五筆字型輸入法。�

2.交換碼�

計算機內部處理的信息,都是用二進制代碼表示的,漢字也不例外。而二進制代碼使用起來是不方便的,於是需要採用信息交換碼。我國標准總局1981年制定了中華人民共和國國家標准GB2312--80《信息交換用漢字編碼字元集--基本集》,即國標碼。國標碼字元集中收集了常用漢字和圖形符號7445個,其中圖形符號682個,漢字6763個,按照漢字的使用頻度分為兩級,第一級為常用漢字3755個,第二級為次常用漢字3008個。為了避開ASCII字元中的不可列印字元0100001--1111110(十六進制為21-7E),國標碼表示漢字的范圍為2121--7E7E(十六進制)。�

區位碼是國標碼的另一種表現形式,把國標GB2312--80中的漢字、圖形符號組成一個94×94的方陣,分為94個「區」,每區包含94個「位」,其中「區」的序號由01至94,「位」的序號也是從01至94。94個區中位置總數=94×94=8836個,其中7445個漢字和圖形字元中的每一個佔一個位置後,還剩下1391個空位,這1391個位置空下來保留備用。所以給定「區」值和「位」值,用四位數字就可以確定一個漢字或圖形符號,其中前兩位是「區」號。後兩位是「位」號,如「普」字的區位碼是「3853」,「通」字的區位碼是「4508」。區位碼編碼的最大優點是沒有重碼,但由於編碼缺少規律,很難記憶。使用區位碼的主要目的是為了輸入一些中文符號或無法用其它輸入法輸入的漢字、製表符以及日語字母、俄語字母、希臘字母等。94個區可以分為五組:�

01--15區:是各種圖形符號、製表符和一些主要國家的語言字母,其中01--09區為標准符號區,共有682個常用符號。�

10--15區:為自定義符號區,可留作用戶自己定義。�

16--55區:是一級漢字區,共有3755個常用漢字,以拼音為序排列。�

56--87區:是二級漢字區,共有3008個次常用漢字,以部首為序排列。�

88--94區:自定義漢字區,可留作用戶自己定義。�

3.機內碼�

根據國標碼的規定,每一個漢字都有了確定的二進制代碼,但是這個代碼在計算機內部處理時會與ASCII碼發生沖突,為解決這個問題,把國標碼的每一個位元組的首位上加1。由於ASCII碼只用7位,所以,這個首位上的「1」就可以作為識別漢字代碼的標志,計算機在處理到首位是「1」的代碼時把它理解為是漢字的信息,在處理到首位是「0」的代碼時把它理解為是ASCII碼。經過這樣處理後的國標碼就是機內碼。�

漢字的機內碼、國際碼和區位碼之間的關系是:�

(漢字機內碼前兩位)16=(國標碼前兩位)16+80H=(區碼)16+A0H�

(漢字機內碼後兩位)16=(國標碼後兩位)16+80H=(區碼)16+A0H�

把用十六進製表示的機內碼的前兩位和機內碼的後兩位連起來,就得到完整的用十六進製表示的機內碼。在微機內部漢字代碼都用機內碼,在磁碟上記錄漢字代碼也使用機內碼。�

4.漢字的字形碼�

字形碼是漢字的輸出碼,輸出漢字時都採用圖形方式,無論漢字的筆畫多少,每個漢字都可以寫在同樣大小的方塊中。為了能准確地表達漢字的字形,對於每一個漢字都有相應的字形碼,目前大多數漢字系統中都是以點陣的方式來存儲和輸出漢字的字形。所謂點陣就是將字元(包括漢字圖形)看成一個矩形框內一些橫豎排列的點的集合,有筆畫的位置用黑點表示,沒筆畫的位置用白點表示。在計算機中用一組二進制數表示點陣,用0表示白點,用1表示黑點。一般的漢字系統中漢字字形點陣有16×16、24×24、48×48幾種,點陣越大對每個漢字的修飾作用就越強,列印質量也就越高。通常用16×16點陣來顯示漢字,每一行上的16個點需用兩個位元組表示,一個16×16點陣的漢字字形碼需要2×16=32個位元組表示,這32個位元組中的信息是漢字的數字化信息,即漢字字模。下面以「口」為例看看16×16點陣字形是怎樣存放的(如圖3--1)。�

如果我們把這個「口」字圖形的「.」處用「0」代替,就可以很形象地得到「口」的字形碼:0000H 0004H 3FFAH 2004H 2004H 2004H 2004H 2004H 2004H 2004H 2004H 2004H 3FFAH 2004H 0000H 0000H。計算機要輸出「口」時,先找到顯示字型檔的首址,根據「口」的機內碼經過計算,再去找到「口」的字形碼,然後根據字形碼(要用二進制)通過字元發生器的控制在屏幕上進行依次掃描,其中二進制代碼中是「0」的地方空掃,是「1」的地方掃出亮點,於是就可以得到「口」的字元圖形。�

字模按構成字模的字體和點陣可分為宋體字模、楷體字模等等,這些是基本字模。基本字模經過放大、縮小、反向、旋轉等交換可以得到美術字體,如長體、扁體、粗體、細體等等。漢字還可以分為簡體和繁體兩種,ASCII字元也可分為半形字元和全形字元。漢字字模按國標碼的順序排列,以二進制文件形式存放在存儲器中,構成漢字字模字型檔,亦稱為漢字字形庫,稱漢字型檔。����

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7

0 . . . . . . . . . . . . . . . .

1 . . . . . . . . . . . . . 1 . .

2 . . 1 1 1 1 1 1 1 1 1 1 1 1 . .

3 . . 1 . . . . . . . . . . 1 . .

4 . . 1 . . . . . . . . . . 1 . .

5 . . 1 . . . . . . . . . . 1 . .

6 . . 1 . . . . . . . . . . 1 . .

7 . . 1 . . . . . . . . . . 1 . .

0 . . 1 . . . . . . . . . . 1 . .

1 . . 1 . . . . . . . . . . 1 . .

2 . . 1 . . . . . . . . . . 1 . .

3 . . 1 . . . . . . . . . . 1 . .

4 . . 1 1 1 1 1 1 1 1 1 1 1 1 . .

5 . . 1 . . . . . . . . . . 1 . .

6 . . . . . . . . . . . . . . . .

7 . . . . . . . . . . . . . . . .

圖1-6 「口」字的16×16點陣字形圖
參考資料: http://www.sxftc.e.cn/course/school/pc_basic/jiaoan/1.4.htm

5. 區位碼1551.求國標碼和機內碼

它的內碼就是1551。
內碼是漢字在計算機內部存儲,處理和傳輸用的信息編碼。它必須與ASCII碼兼容但又不能沖突。

所以把國標碼兩個位元組的最高位置'1',以區別於西文,這就是內碼。漢字的輸入碼稱為"外碼"。輸入碼即指我們輸入漢字時使用的編碼。常見的外碼分為數字編碼(如區位碼),拼音編碼和字形編碼(如五筆)。

再說區位碼,"啊"的區位碼是1601,寫成16進制是0x10,0x01。這和計算機廣泛使用的ASCII編碼沖突。為了兼容00-7f的 ASCII編碼,我們在區位碼的高、低位元組上分別加上A0。這樣"啊"的編碼就成為B0A1。我們將加過兩個A0的編碼也稱為GB2312編碼,雖然 GB2312的原文根本沒提到這一點。
內碼是指操作系統內部的字元編碼。早期操作系統的內碼是與語言相關的.現在的Windows在內部統一使用Unicode,然後用代碼頁適應各種語言,"內碼"的概念就比較模糊了。我們一般將預設代碼頁指定的編碼說成是內碼。