當前位置:首頁 » 服務存儲 » 漢字存儲編碼大全
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

漢字存儲編碼大全

發布時間: 2022-11-20 19:30:16

A. 關於計算機漢字的編碼,計算機中的漢字型檔中大概有多少個

電腦漢字的編碼,電腦漢字型檔中的漢字數量由字元集決定的,GB2312的字元集約6000多,GBK約1-2萬,GB18030約6萬。
電腦內部漢字信息的存儲運算的代碼有四種:輸入碼、國標碼、內碼和字型碼。
輸入碼:包括拼音編碼和字型編碼。微軟拼音ABC就是拼音編碼,五筆字型輸入法就是字型編碼。
國標碼:又稱為漢字交換碼,在計算機之間交換信息用。用兩個位元組來表示,每個位元組的最高位均為0,因此可以表示的漢字數為2的14次冪,就是16384個。將漢字區位碼的高位位元組、低位位元組各加十進制數32(即十六進制數的20),便得到國標碼。例如「中」字的國標碼為8680(十進制)或7468(十六進制)。
內碼:漢字內碼是在設備和信息處理系統內部存儲、處理、傳輸漢字用的代碼。無論使用何種輸入碼,進入計算機後就立即被轉換為機內碼。規則是將國標碼的高位位元組、低位位元組各自加上128(十進制)或80(十六進制)。例如,「中」字的內碼以十六進製表示時應為F4E8。這樣做的目的是使漢字內碼區別於西文的ASCII,因為每個西文字母的ASCII的高位均為0,而漢字內碼的每個位元組的高位均為1。
字型碼:表示漢字字形的字模數據,因此也稱為字模碼,是漢字的輸出形式。通常用點陣、矢量函數等表示。用點陣表示時,字形碼指的就是這個漢字字形點陣的代碼。根據輸出漢字的要求不同,點陣的多少也不同。簡易型漢字為16′16點陣、提高型漢字為24′24點陣、48′48點陣等。如果是24′24點陣,每行24個點就是24個二進制位,存儲一行代碼需要3個位元組。那麼,24行共佔用3′24=72個位元組。計算公式:每行點數/8′行數。依此,對於48′48的點陣,一個漢字字形需要佔用的存儲空間為48/8′48=6′48=288個位元組。

B. 漢字編碼按編碼方法不同,可分為哪四大類

漢字編碼主要分為四大類:漢字輸入碼、漢字交換碼、漢字內碼和漢字字形碼。
(1)漢字的外部碼
漢字的外部碼簡稱外碼,又叫輸人碼,是輸人漢字的一組鍵盤符號。使用不同的輸入方法,同一漢字的外部碼不同。用戶應選用易記憶、操作簡單、位碼少、重碼少和輸人速度快的外碼。
(2)漢字的內部碼
漢字的內部碼又稱漢字內碼或漢字機內碼。機器接收到外碼後,要轉換成內碼進行存儲、運算和傳送。用二個位元組表示漢字的內碼。為了和西文符號區分,內碼的最高位設為「1」。內碼通常用漢字在車庫中的物理位置表示,可以是漢字在字型檔中的序號,也可以是字型檔中的存儲位置。
(3)漢字交換碼
在計算機之間交換信息時,要求傳送的漢字代碼符合國家規定的交換碼標准,即符合GB2312-80信息交換用漢字編碼集,又稱為國標碼。國標碼收集了7445個圖形字元,其中有6763個漢字和各種符號709個。
國標碼規定,每個漢字用兩個位元組表示,每個位元組僅用低7位,最高位為0。漢字的國標碼和內碼有—一對應關系,即將高位加l,國標碼就變為內碼。
(4)漢字字形碼
在顯示或列印漢字時,還涉及到字形碼,又稱輸出碼。漢字字形是指原來鉛字排版漢字的大小和形狀,在計算機中指組成漢字的點陣。盡管漢字字形有多種變化,筆畫繁簡不一,但都是方塊字且大小相同,都可以寫在同樣的方塊中。把一個方塊看成m行n列矩陣,共有m×n個點,稱為漢字點陣。如16×16點陣的漢字,共有256個點
漢字點陣和字形的對應關系是,有筆畫處的點為1,無筆畫處的點為0。這樣,漢字的點陣可以對應若干位元組長的字形碼。這種表示漢字點陣的方法稱為漢字字形的數字化表示法。

C. 什麼編碼用於漢字的存取、處理和傳輸

漢字機內碼用於漢字的存取、處理和傳輸。

漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。

機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。

(3)漢字存儲編碼大全擴展閱讀:

內碼是指計算機漢字系統中使用的二進制字元編碼,是溝通輸入、輸出與系統平台之間的交換碼,通過內碼可以達到通用和高效率傳輸文本的目的。

英文ASCII字元採用一個位元組的內碼表示,中文字元如國標字元集中,GB2312、GB12345、GB13000皆用雙位元組內碼。

GB18030(27,533漢字)雙位元組內碼漢字為20,902個,其餘6,631個漢字用四位元組內碼。

D. 漢字在計算機內有幾種編碼試簡述每種編碼的意義。

漢字在計算機上的編碼主要有三種:輸入碼、機,內碼和輸出碼,1.用於輸入的漢字的編碼——輸入碼(外碼)
計算機上輸入漢字的方法很多,如鍵盤編碼輸入、語音輸入、手寫輸入、掃描輸入等,其中鍵盤編碼輸入是最容易實現和最常用的一種漢字輸入方法。英文等可以用鍵盤上的每個字母鍵來輸入,而輸入漢字則不同,不可能用有限的按鍵來對應每一個漢字,為了讓用戶能直接使用英文鍵盤輸入漢字,於是就有了輸入漢字時使用的漢字輸入碼,它一般由鍵盤上的字母或數字組成,代表某個漢字或某些漢字、片語或句子。當前用於漢字輸入的編碼方案很多,如區位碼、拼音碼、王碼(五筆字型)、自然碼等。2.用於儲存漢字的編碼——機內碼(內碼)
由於漢字輸入碼的編碼方案多種多樣,同一個漢字如果採用的編碼方案不一樣,其輸入碼就有可能不一樣。如果計算機內部存放的是漢字輸入碼本身,就會造成相同漢字在機內可以用不同的編碼表示,這樣顯然不合理,也給計算機內部的漢字處理增加了難度。為了將漢字的各種輸入碼在計算機內部統一起來,就引進了漢字的機內碼。3.用於輸出漢字的編碼——輸出碼(字型碼)
存儲在計算機內的漢字在屏幕上顯示或在列印機上列印出來時,必須以漢字字形輸出,才能被人們所接受和理解。漢字的輸出碼實際上是漢字的字型碼,它是由漢字的字模信息所組成的。漢字是一種象形文字,每個漢字東可以看成一個特定的圖形,這種圖形可以用點陣、向量等方式表示,而最基本的是用點陣表示。所謂點陣方式,就是將漢字分解成由若干個「點」組成的點陣字型,將此點陣字型至於網狀方格上,每個方各試點陣中的一個「點」。

E. 漢字的編碼有幾種各有什麼用途

漢字編碼(Chinese character encoding )是為漢字設計的一種便於輸入計算機的代碼。由於電子計算機現有的輸入鍵盤與英文打字機鍵盤完全兼容。因而如何輸入非拉丁字母的文字(包括漢字)便成了多年來人們研究的課題。 漢字信息處理系統一般包括編碼、輸入、存儲、編輯、輸出和傳輸。編碼是關鍵。不解決這個問題,漢字就不能進入計算機。

分類及用途:

計算機中漢字的表示是用二進制編碼,是人為編碼的。

根據應用目的的不同,漢字編碼分為外碼、交換碼、機內碼和字形碼。

1.機內碼

根據國標碼的規定,每一個漢字都有了確定的二進制代碼,在微機內部漢字代碼都用機內碼,在磁碟上記錄漢字代碼也使用機內碼。

2.漢字地址碼

漢字地址碼是指漢字型檔中存儲漢字字形信息的邏輯地址碼。它與漢字內碼有著簡單的對應關系,以簡化內碼到地址碼的轉換。

3.外碼(輸入碼)

外碼也叫輸入碼,是用來將漢字輸入到計算機中的一組鍵盤符號。常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認知碼、區位碼和電報碼等,一種好的編碼應有編碼規則簡單、易學好記、操作方便、重碼率低、輸入速度快等優點,每個人可根據自己的需要進行選擇。

4.漢字地址碼

漢字地址碼是指漢字型檔中存儲漢字字形信息的邏輯地址碼。它與漢字內碼有著簡單的對應關系,以簡化內碼到地址碼的轉換。

5.交換碼(國標碼)

計算機內部處理的信息,都是用二進制代碼表示的,漢字也不例外。而二進制代碼使用起來是不方便的,於是需要採用信息交換碼。中國標准總局1981年制定了中華人民共和國國家標准GB2312--80《信息交換用漢字編碼字元集--基本集》,即國標碼。

F. 常用漢字編碼標准有哪些GB2312-80共分多少個區每個區有多少位

你學計算機嗎?常用漢字編碼標准有BIG-5GBK和GB2312-80.GB2312-80分為94個區,每個區包含94個字元,共收錄漢字6763個.

G. 漢字在計算機系統中存儲所用的編碼是什麼

GB國標碼:中文內碼之一,代表中文簡化字,在中國大陸廣泛使用,影響所及,使用量漸見普及。
「國家標准信息交換用漢字編碼」(GB2312-80標准),簡稱國標碼。國標碼是指1980年中國制定的用於不同的具有漢字處理功能的計算機系統間交換漢字信息時使用的編碼。國際碼是二位元組碼,
用兩個七位二進制數編碼表示一個漢字。目前國標碼收入6763個漢字,
其中一級漢字(最常用)3755個,
二級漢字3008個,
另外還包括682個西文字元、圖符。

H. 漢字在計算機系統中存儲所用的編碼是什麼

機內碼。

漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。

機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。

(8)漢字存儲編碼大全擴展閱讀:

因為漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。

例如:有兩個位元組的內容為30H和21H,它既可表示漢字「啊」的國標碼,又可表示西文「0」和「!」的ASCII碼。為此,漢字機內碼應對國標碼加以適當處理和變換。

國標碼的機內碼為二位元組長的代碼,它是在相應國標碼的每個位元組最高位上加「1」,即

漢字機內碼=漢字國標碼+8080H

例如,上述「啊」字的國標碼是3021H,其漢字機內碼則是B0A1H。

I. 漢字編碼一般分為哪幾類

漢字編碼分為如下幾類
(1)漢字輸入碼,簡稱外碼,其作用是將漢字信息輸入到計算機內部;
(2)漢字交換碼,其作用是在漢字信息系統之間進行漢字交換時所使用的編碼;
(3)漢字內碼,其作用是信息處理系統內部存儲、處理、傳輸漢字而使用的編碼;
(4)漢字字形碼,其作用是表示漢字字形信息的編碼,在顯示或列印的時候使用;
參考資料:《大學計算機-計算思維導論》,清華大學出版社2019