當前位置:首頁 » 服務存儲 » 存儲漢字採用什麼碼
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

存儲漢字採用什麼碼

發布時間: 2022-11-14 22:35:34

⑴ 在計算機內部,對漢字進行傳輸、處理和存儲時使用的是漢字的()

在電腦內部對漢字進行傳輸處理和存儲時使用漢字的機內碼。
電腦內部漢字信息的存儲運算的代碼有四種:輸入碼、國標碼、內碼和字型碼。
輸入碼:包括拼音編碼和字型編碼。微軟拼音ABC就是拼音編碼,五筆字型輸入法就是字型編碼。
國標碼:又稱為漢字交換碼,在計算機之間交換信息用。用兩個位元組來表示,每個位元組的最高位均為0,因此可以表示的漢字數為2的14次冪,就是16384個。將漢字區位碼的高位位元組、低位位元組各加十進制數32(即十六進制數的20),便得到國標碼。例如「中」字的國標碼為8680(十進制)或7468(十六進制)。
內碼:漢字內碼是在設備和信息處理系統內部存儲、處理、傳輸漢字用的代碼。無論使用何種輸入碼,進入計算機後就立即被轉換為機內碼。規則是將國標碼的高位位元組、低位位元組各自加上128(十進制)或80(十六進制)。例如,「中」字的內碼以十六進製表示時應為F4E8。這樣做的目的是使漢字內碼區別於西文的ASCII,因為每個西文字母的ASCII的高位均為0,而漢字內碼的每個位元組的高位均為1。
字型碼:表示漢字字形的字模數據,因此也稱為字模碼,是漢字的輸出形式。通常用點陣、矢量函數等表示。用點陣表示時,字形碼指的就是這個漢字字形點陣的代碼。根據輸出漢字的要求不同,點陣的多少也不同。簡易型漢字為16′16點陣、提高型漢字為24′24點陣、48′48點陣等。如果是24′24點陣,每行24個點就是24個二進制位,存儲一行代碼需要3個位元組。那麼,24行共佔用3′24=72個位元組。計算公式:每行點數/8′行數。依此,對於48′48的點陣,一個漢字字形需要佔用的存儲空間為48/8′48=6′48=288個位元組。

⑵ 漢字在計算機中存儲用二進制代碼

不論是什麼,在電腦中存儲都是二進制代碼
2樓說的有誤。漢字不一定用的是Unicode編碼。編碼有很多種,目前存儲漢字用的最普遍的是GB2312碼。在GB2312碼中,漢字佔2個位元組,英文、數字(半形的)佔一個位元組。在Unicode中,通通占兩個位元組

⑶ 漢字在計算機系統中存儲所用的編碼是什麼

GB國標碼:中文內碼之一,代表中文簡化字,在中國大陸廣泛使用,影響所及,使用量漸見普及。
「國家標准信息交換用漢字編碼」(GB2312-80標准),簡稱國標碼。國標碼是指1980年中國制定的用於不同的具有漢字處理功能的計算機系統間交換漢字信息時使用的編碼。國際碼是二位元組碼,
用兩個七位二進制數編碼表示一個漢字。目前國標碼收入6763個漢字,
其中一級漢字(最常用)3755個,
二級漢字3008個,
另外還包括682個西文字元、圖符。

⑷ 在計算機中,漢字採用什麼碼存放。

機內碼。計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。 漢字交換碼(國標碼)主要用於漢字信息交換,《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元進行了編碼。

國標碼是漢字信息交換的標准編碼,但因其前後位元組的最高位為0,與ASCII碼發生沖突,國標碼是不可能在計算機內部直接採用的,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變。

(4)存儲漢字採用什麼碼擴展閱讀

漢字用兩個位元組表示,原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。

這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。

⑸ 漢字是用啥編碼存的

是漢字的輸出碼,叫做字形碼或者字模碼。

主要是用點陣來存放漢字的形狀,一般的是簡單字形就16×16點陣,麻煩的漢字就用24×24或者32×32的點陣。每個點用一個二進制單位來存儲。

如要以漢字型檔的形式,用來顯示或輸出的。比如屏幕輸出,列印輸出等都是用的點陣形式。
希望對你能有所幫助。

⑹ 什麼編碼用於漢字的存取、處理和傳輸

漢字機內碼用於漢字的存取、處理和傳輸。

漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。

機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。

(6)存儲漢字採用什麼碼擴展閱讀:

內碼是指計算機漢字系統中使用的二進制字元編碼,是溝通輸入、輸出與系統平台之間的交換碼,通過內碼可以達到通用和高效率傳輸文本的目的。

英文ASCII字元採用一個位元組的內碼表示,中文字元如國標字元集中,GB2312、GB12345、GB13000皆用雙位元組內碼。

GB18030(27,533漢字)雙位元組內碼漢字為20,902個,其餘6,631個漢字用四位元組內碼。

⑺ 漢字在計算機內部都是以()形式存儲的 a:交換碼 b:機內碼 c:國標碼 d:區位碼

d:區位碼。
漢字是以機內碼的形式存儲的

⑻ 漢字系統中的漢字字型檔里存放的漢字的(謝謝回答) A 機內碼 B輸入碼 C 字形碼 D國標碼

漢字系統中的漢字字型檔里存放的漢字的是C字形碼。

A機內碼:漢字在計算機內存儲、處理時的編碼

B輸入碼:輸入漢字時使用的編碼,如全拼輸入「中」時,中的輸入碼為「zhong」

C字形碼:為在計算機內表示漢字而統一的編碼方式形成漢字編碼叫內碼,內碼是惟一的。為方便漢字輸入而形成的漢字編碼為輸入碼,屬於漢字的外碼,輸入碼因編碼方式不同而不同,是多種多樣的。為顯示和列印輸出漢字而形成的漢字編碼為字形碼,計算機通過漢字內碼在字模庫中找出漢字的字形碼,實現其轉換。

D國標碼:中華人民共和國官方強制使用GB 18030標准,但較舊的計算機仍然使用GB 2312。

所以正確答案為C。

(8)存儲漢字採用什麼碼擴展閱讀:

漢字編碼的類型。

整字輸入法:將三四千個常用漢字排列在一個具有三四百個鍵位的大鍵盤上。大多是將這些漢字按XY坐標排列在一張字表上,通常叫「字表法」,或「筆觸字表法」。

字形分解法:將漢字的形體分解成筆畫或部件,按一定順序輸進機器。筆畫一般分成 8種:橫一、豎(丨)、撇(丿)、點(丶)、折(□)、彎(□)、叉十、方(口)。部件一般歸納出一二百個。

字形為主、字音為輔的編碼法:這種編碼法與字形分解法的不同在於還要利用某些字音信息。如有的方案為了簡化編碼規則,縮短碼長,在字形碼上附加字音碼,有的方案為了採用標准英文電傳機,將分解歸納出來的字素通過關系字的讀音轉化為拉丁字母。

全拼音輸入法:絕大多數是以現行的漢語拼音方案為基礎進行設計。關鍵問題是區分同音字,因而有的方案提出「以詞定字」的方法,還有的方案提出「拼音-漢字轉換法」,即「漢語拼音輸入 ──機內軟體變換(實為查機器詞表)──漢字輸出」系統。

拼音為主、字形為輔的編碼法:在拼音碼前面或後面再添加一些字形碼。拼音碼有用現行漢語拼音方案或稍加簡化的,還有的為了縮短碼長而把聲母和韻母都用單字母或單字鍵表示的「雙拼方案」或「雙打方案」。

⑼ 在計算機中對漢字進行存儲、處理和傳輸的漢字碼是什麼碼

在計算機中對漢字進行存儲、處理和傳輸的漢字碼是機內碼。

機內碼是在計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。

輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。

漢字的機內碼採用十六進制進行表示,且第1位和第三位必定大於8。因為漢字機內碼的基礎是漢字國際碼,轉換方式是:漢字機內碼=漢字國際碼+8080H。

(9)存儲漢字採用什麼碼擴展閱讀

漢字機內碼、國標碼和區位碼三者之間的關系為:

區位碼(十進制)的兩個位元組分別轉換為十六進制後加2020H得到對應的國標碼;機內碼是漢字交換碼(國標碼)兩個位元組的最高位分別加1,即漢字交換碼(國標碼)的兩個位元組分別加80H得到對應的機內碼;區位碼(十進制)的兩個位元組分別轉換為十六進制後加A0H得到對應的機內碼。