當前位置:首頁 » 服務存儲 » 怎麼看漢字存儲內碼
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

怎麼看漢字存儲內碼

發布時間: 2023-05-22 17:07:51

㈠ 怎麼判斷是不是正確的漢字機內碼

漢子機內碼用十六進製表示時,第1位和第三位必定大於8。漢字機內碼的基礎是漢子國際碼。漢字機內碼=漢字國際碼+8080H。這是為了和國際碼區分開來,因為加了8080H,所以漢字機內碼第1、3位大於等於8。

所謂的國際碼加廳帶野8080H。首先國際碼和機內碼扮喊都是由兩個位元組組成的。區分的依據是機內碼里每個位元組的最高位為1【行瞎二進制】。即兩個位元組分別加80h,所以機內碼第一、三位大於等於8。

(1)怎麼看漢字存儲內碼擴展閱讀:

因為漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。例如:有兩個位元組的內容為30H和21H,它既可表示漢字「啊」的國標碼,又可表示西文「0」和「!」的ASCII碼。為此,漢字機內碼應對國標碼加以適當處理和變換。

國標碼的機內碼為二位元組長的代碼,它是在相應國標碼的每個位元組最高位上加「1」,即

漢字機內碼=漢字國標碼+8080H

例如,上述「啊」字的國標碼是3021H,其漢字機內碼則是B0A1H。

漢字機內碼的基礎是漢字國標碼。

㈡ 什麼是內碼什麼是外碼

我們常說漢字的"內碼"與"外碼"。

內碼是漢字在計算機內部存儲,處理和傳輸用的信息編碼。它必須與ASCII碼兼容但又不能沖突。

所以把國標碼兩個位元組的最高位置'1',以區別於西文,這就是內碼。漢字的輸入碼稱為"外碼"。輸入碼即指我們輸入漢字時使用的編碼。常見的外碼分為數字編碼(如區位碼),拼音編碼和字形編碼(如五筆)。

再說區位碼,"啊"的區位碼是1601,寫成16進制是0x10,0x01。這和計算機廣泛使用的ASCII編碼沖突。為了兼容00-7f的 ASCII編碼,我們在區位碼的高、低位元組上分別加上A0。這樣"啊"的編碼就成為B0A1。我們將加過兩個A0的編碼也稱為GB2312編碼,雖然 GB2312的原文根本沒提到這一點。
內碼是指操作系統內部的字元編碼。早期操作系統的內碼是與語言相關的.現在的Windows在內部統一使用Unicode,然後用代碼頁適應各種語言,"內碼"的概念就比較模糊了。我們一般將預設代碼頁指定的編碼說成是內碼。內碼這個詞彙,並沒有什麼官方的定義。代碼頁也只是微軟的一種習慣叫法。作為程序員,我們只要知道它們是什麼東西,沒有必要過多地考證這些名詞。
所謂代碼頁(code page)就是針對一種語言文字的字元編碼。例如GBK的code page是CP936,BIG5的code page是CP950,GB2312的code page是CP20936。
Windows中有預設代碼頁的概念,即預設用什麼編碼來解釋字元。例如Windows的記事本打開了一個文本文件,裡面的內容是位元組流:BA、BA、 D7、D6。Windows應該去怎麼解釋它呢?是按照Unicode編碼解釋、還是按照GBK解釋、還是按照BIG5解釋,還是按照ISO8859-1 去解釋?如果按GBK去解釋,就會得到"漢字"兩個字。按照其它編碼解釋,可能找不到對應的字元,也可能找到錯誤的字元。所謂"錯誤"是指與文本作者的本意不符,這時就產生了亂碼。
答案是Windows按照當前的預設代碼頁去解釋文本文件里的位元組流。預設代碼頁可以通過控制面板的區域選項設置。記事本的另存為中有一項ANSI,其實就是按照預設代碼頁的編碼方法保存。
Windows的內碼是Unicode,它在技術上可以同時支持多個代碼頁。只要文件能說明自己使用什麼編碼,用戶又安裝了對應的代碼頁,Windows就能正確顯示,例如在HTML文件中就可以指定charset。
有的HTML文件作者,特別是英文作者,認為世界上所有人都使用英文,在文件中不指定charset。如果他使用了0x80-0xff之間的字元,中文Windows又按照預設的GBK去解釋,就會出現亂碼。這時只要在這個html文件中加上指定charset的語句,例如:
<meta http-equiv="Content-Type" content="text/html; charset=ISO8859-1">
如果原作者使用的代碼頁和ISO8859-1兼容,就不會出現亂碼了

㈢ 漢字機內碼怎麼算出來的

D6DOH

國際碼一區位碼4-2020H,漢字機內碼一國際碼+8080H。首先將區位碼轉換成簡腔國際碼,然後將國際碼加上8080H,即得機內碼。

(3)怎麼看漢字存儲內碼擴展閱讀:

機內碼、國際碼、滲迅區位碼叢咐此之間的換算

一、將區位碼轉換為國標碼.兩區位碼改寫成十六進制,XXOOH.XX是區碼,OO是衛碼H代表十六進制.將XXOOH加2020H得到的就是國標碼。

二、國標碼轉換成機內碼.將所得到的國標碼加8080H,就可得機內碼。

如果是機內碼轉化成國標碼,或者是國標碼轉化成區位碼,做減法就可以了

區位碼、國標碼與機內碼的轉換關系方法:

(1)區位碼先轉換成十六進制數表示

(2)(區位碼的十六進製表示)+2020H=國標碼;

(3)國標碼+8080H=機內碼

舉例:以漢字「大」為例,「大」字的區內碼為2083

1、區號為20,位號為83

2、將區位號2083轉換為十六進製表示為1453H

3、1453H+2020H=3473H,得到國標碼3473H

4、3473H+8080H=B4F3H,得到機內碼為B4F3H

小結:字元編碼的兩種表示方式:ASCII(字元的表示);GB2312(國標碼,漢字編碼)

㈣ 如何查詢漢字的機內碼

漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字前腔最基本的編碼,不管是什麼漢字系統和漢字輸入方慧桐衫法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。
漢字內碼查看器是一款簡單易用的漢字內碼查詢工具。該軟體只需要輸入一個漢字就可以查看它所對應的十進制和十輪亮六進制的區位碼(GBC)、Unicode碼和GBK內碼。

㈤ 如何查看字元內碼

漢字的內部碼:也稱(機)內碼,是計算機內處理漢字信息時所用的漢字代碼。

可以使用網路在線漢字轉碼,如圖:

按國際標准制定的漢字和符號的交換碼,國標gb2312-80中收仔悔錄了7445個漢字及字元,根據每一個字元的特點和位置,所有字元分為94個區、94個位。把區位碼區和位分別轉換成閉戚團十六進制數。轎橘


㈥ 漢字內碼是什麼

內碼是DEB8H。

5E38H是16進製表示的。

先轉化為10進制再轉化為2進制。

轉化為10進制是5*(16的3次方)+E*(16的2次方)+3*(16的1次方)+8*(16的0次方)=24376

然後將24376轉化為2進制,是11111110 0111000

在漢字的國標碼的這兩個位元組的最高位分別置1即得到該漢字內碼,所以內碼是11111110 1111000=DEB8H。

記住這條規律:國標碼+8080H=機內碼

5E38+8080 = ?

5+8=13,做雀銀D

E+0=E

3+8=11,B

8+0=8

最後加H表示這是十六進制數,所以內碼:DEB8H。

(6)怎麼看漢字存儲內碼擴展閱讀

每個漢純宴字有個二進制編碼,叫漢字國標碼。

在我國漢字代碼標准GB2312-80中有6763個常用漢字規定了二進制編碼。歲答

每個漢字使用2個位元組。

GB2312-80GB2312將代碼表分為94個區,對應第一位元組;每個區94個位,對應第二位元組,兩個位元組的值分別為區號值和位號值加32(20H),因此也稱為區位碼。

01-09區為符號、數字區,16-87區為漢字區,10-15區、88-94區是有待進一步標准化的空白區。

GB2312將收錄的漢字分成兩級:第一級是常用漢字計 3755個,置於16-55區,按漢語拼音字母/筆形順序排列;第二級漢字是次常用漢字計3008個,置於56-87區,按部首/筆畫順序排列。故而 GB2312最多能表示6763個漢字。

㈦ 什麼是漢字的內碼、外碼、交換碼、字形碼

1、內碼是指計算機漢字系統中使用的二進制字元編碼,是溝通輸入、輸出與系統平台之間的交換碼,通過內碼可以達到通用和高效率傳輸文本的目的。如ASCII。

2、外碼是相對於內碼而言的辭匯。在計算機科學及相關領域中,外碼指的是「外在的『經過學習之後,可直接了解的編碼形式(例如:文字或語音符號)』」。

中文輸入法對漢字的編碼即屬外碼。常見的中文外碼有倉頡碼、行列碼、大易碼、嘸蝦米碼、注音碼、拼音碼。

3、交換碼是指用於交換文件所使用的編碼。對於計算機而言,不同的系統有可能使用不同的內碼。但如果不同系統間要基冊交換文件,則會發生亂碼現象。解決方法則為,在交換文件前,文件提供者先將由內碼形式儲存的文件轉換成交換碼形式再做交換。在接收文件後,文件接收者再由交物鋒手換碼轉成內碼。

4、字形碼,點陣代碼的一種。為了將漢字在顯示器或列印機上輸出,把漢字按圖形符號設計成點陣圖,就得到了相應的點陣代碼(字形碼)。用於顯示的字型檔叫顯示字型檔。顯示一個漢字一般採用16×16點陣或24×24點陣或48×48點陣。已知漢字點陣的大小,可以計算出存儲一個漢字所需佔用的位元組空間。

5、漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算罩嫌機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。