Ⅰ 一个汉字的国标码需用2字节存储,其每个字节的最高二进制位的值分别为______。
一个汉字的国标码需用2字节存储,其每个字节的最高二进制位的值分别为()。
A 0,0
B 1,0
C 0,l
D 1,1
【答案】
A
【解析】
国标码两个字节的最高位都为0,机内码两个字节的最高位都为1。
Ⅱ 汉字国标码规定每个汉字用几个字节表示
汉字国标码规定每个汉字用2个字节表示。
汉字国标码规定每个汉字用2个字节表示,第一个字节称为“高位字节,第二个字节称为“低位字节。
每个汉字有个二进制编码,叫汉字国标码。在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。
输入码
1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。
国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。
Ⅲ 一个汉字的国标码需用2个字节存储,其每个字节的最高二进制位的值分别为
汉字机内码的每个字节都大于128。这是为了解决与ascii码的冲突问题。gb2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20h),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。gb2312将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而gb2312最多能表示6763个汉字国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20h,就得到国标码。如:“保”字的国标码为3123h,它是经过下面的转换得到的:1703d->1103h->+20h->3123h。国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ascii码发生冲突,如“保”?字,国标码为31h和23h,而西文字符“1”和“#”的ascii也为31h和23h,现假如内存中有两个字节为31h和23h,这到底是一个汉字?,还是两个西文字符“1”和“#”于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123h,前字节为00110001b,后字节为00100011b,高位改1为10110001b和10100011b即为b1a3h,因此,汉字的机内码就是b1a3h。
Ⅳ TQ1037 一个汉字的国标码用2个字节存储,其每个字节的最高二进制位的值分别为__________。
国标码一个汉字的内码用2个字节来存储,并且把每个字节的最高二进制位置“1”作为汉字内码的标识。
国标码:一个汉字用两个字节表示,每个字节只有7位,每个字节最高位为0区位码:每一行称为一个区,编号01-94,每一列称为一个位,编号为01-94机内码:采用将国标码每个字节最高位置为1。
(4)一个汉子的国标码需要2字节存储扩展阅读:
在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。每个汉字使用2个字节。
GB2312-80GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H)。
01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级。
第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而 GB2312最多能表示6763个汉字。
Ⅳ 为什么一个汉字的国标码用两个字节表示
中国字比较复杂,1字节=8位,8位从0000 0000到1111 1111只能表示256个字符,2个字节是2*8=16位,从0000 0000 0000 0000到1111 1111 1111 1111可以表示65535个字符。
6万多个足以表示我们经常用的那些字了。所以我们用2字节表示汉字。如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。
Ⅵ 一个汉字的机内码需用几个字节存储
一个汉字的机内码需用2个字节存储。
我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示。
原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。
这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。
(6)一个汉子的国标码需要2字节存储扩展阅读:
机内码的相关规定:
国家标准局颁布的《信息交换用汉字编码字符集基本集》(代号为GB2312-80)规定的汉字交换码作为国家标准汉字编码。
GB2312-80中共有7445个字符符号:汉字符号6763个一级汉字3755个(按汉语拼音字母顺序排列)二级汉字3008个(按部首笔划顺序排列)非汉字符号682个GB2312-80规定,键盘是当前微机的主要输入设备,输入码就是使用英文键盘输入汉字时的编码。
目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码、音码、形码、音形码四类,如“保”字,用全拼,输入码为“BAO”,用区位码,输入码为“1703”,用五笔字型则为“WKS”。
参考资料来源:网络-机内码
Ⅶ 国标码存储一个汉字所需要的存储空间是多少
一个中文汉字占两个字节的空间,一个汉字中的标点也是两个字节。
计算机信息技术用于计量存储容量的一种计量单位,通常情况下一字节等于八位,也在一些计算机编程语言中表示数据类型和语言字符。
一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制,最小值-128,最大值127。如一个ASCII码就是一个字节。
数据存储是以“字节”(Byte)为单位,数据传输大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。
B与iB:
1KiB(Kibibyte)=1024byte
1KB(Kilobyte)=1000byte
1MiB(Mebibyte)=1048576byte
1MB(Megabyte)=1000000byte
Ⅷ 通常一个汉字的国标码需要几个字节来存放
GB2312编码是2个字节,UTF-8是3个字节。
Ⅸ 汉字国标码规定每个汉字用几个字节表示
汉字国标码规定每个汉字用两个字节表示,第一个字节称为“高位字节”,第二个字节称为“低位字节”。汉字国标码,创建于1980年,目的为了使每个汉字有一个全国统一的代码而颁布了汉字编码的国家标准。
每个汉字有个二进制编码,叫汉字国标码。在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H)。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而GB2312最多能表示6763个汉字。
Ⅹ 储存一个汉字的国标码所需要的字节数2字节那么可以表示多少汉字和符号呢
汉字机内码用2个字节表示,且每个字节的MSB必为“1”,因此,可以表示65536/2=32768个。