㈠ 在c語言中如何指定字元串編碼方式
計算機用兩個位元組來表示一個漢字,「我」在內存里就是這樣存放的:CE D2。CE是str[0]的內容,D2是str[1]的內容。第一次循環輸出str[0],但是這個字元在ASCII字元集里代表這樣一個東西Î(不知道在這兒能不能正常顯示……),但是Windows的命令提示符程序讀取到這里就會自動使用寬字元集,也就是說,它已經准備好讀取下一個字元,然後把他們當成一個字元顯示出來。於是就出現了那個漢字。 #include <stdio.h> int main() { printf("%c%c",(char)0xce,(char)0xd2); }
㈡ c語言字元編碼
1,八進制整常數八進制整常數必須以0開頭,即以0作為八進制數的前綴。數碼取值為0~7。八進制數通常是無符號數。
以下各數是合法的八進制數:
015(十進制為13) 0101(十進制為65) 0177777(十進制為65535)
以下各數不是合法的八進制數:
根據上面的定義'\101'不是八禁止的編碼,因為八進制是以0開頭的,C1='\101',和C1=65完全不一樣
C1='\101'是轉義字元,它不是十進制也不是八進制啊,各位大哥,C1=65表示的是十進制整數和字元
如int c1=65表示十進制整數
char c1=65表示字元ascll碼
65的ascll值是A
256(無前綴0) 03A2(包含了非八進制數碼) -0127(出現了負號)
2.十六進制整常數
十六進制整常數的前綴為0X或0x。其數碼取值為0~9,A~F或a~f。
以下各數是合法的十六進制整常數:
0X2A(十進制為42) 0XA0 (十進制為160) 0XFFFF (十進制為65535)
以下各數不是合法的十六進制整常數:
5A (無前綴0X) 0X3H (含有非十六進制數碼)
㈢ C語言讀寫文件的時候怎麼控制字元編碼方式
C語言讀寫文件有兩種方式: 一種是文本方式,另一種是2進制方式。日文,中文,unicode, 都要用2進制方式。文件內容的編碼和編碼的轉化,同一種編碼的大端或小端編碼,都要自己安排處理。
C語言不管讀寫都要通過fopen函數來,其中mode參數可以控制以二進制打開還是以文本方式打開。
fopen的函數原型:FILE * fopen(const char * path,const char * mode);
fopen函數的第一個參數是文件路徑,第二個參數是打開方式,有以下幾種方式:
r 以只讀方式打開文件,該文件必須存在。
r+ 以可讀寫方式打開文件,該文件必須存在。
rb+ 讀寫打開一個二進制文件,允許讀數據。
rw+ 讀寫打開一個文本文件,允許讀和寫。
w 打開只寫文件,若文件存在則文件長度清為0,即該文件內容會消失。若文件不存在則建立該文件。
w+ 打開可讀寫文件,若文件存在則文件長度清為零,即該文件內容會消失。若文件不存在則建立該文件。
a 以附加的方式打開只寫文件。若文件不存在,則會建立該文件,如果文件存在,寫入的數據會被加到文件尾,即文件原先的內容會被保留。(EOF符保留)
a+ 以附加方式打開可讀寫的文件。若文件不存在,則會建立該文件,如果文件存在,寫入的數據會被加到文件尾後,即文件原先的內容會被保留。 (原來的EOF符不保留)
wb 只寫打開或新建一個二進制文件;只允許寫數據。
wb+ 讀寫打開或建立一個二進制文件,允許讀和寫。
wt+ 讀寫打開或著建立一個文本文件;允許讀寫。
at+ 讀寫打開一個文本文件,允許讀或在文本末追加數據。
ab+ 讀寫打開一個二進制文件,允許讀或在文件末追加數據。
上述的形態字元串都可以再加一個b字元,如rb、w+b或ab+等組合,加入b 字元用來告訴函數庫打開的文件為二進制文件,而非純文字文件。
㈣ c語言中文編碼的問題
輸入可以採用GB2312或者GBK編碼,如果繁體,就用UTF-8
讀入漢字,從文件或者標准輸入讀,每次讀一個位元組,依次存入數組
如果可以確定是全部漢字,那麼可以一次讀入兩個位元組
結束符可以用\0,但是由於雙位元組漢字編碼低位可能是0 所以結束符要用雙\0
針對英文字元和漢字混合的情況,可以這樣判斷
每次讀入一個字元,如果該字元大於0x80 則這是一個漢字的高位,繼續讀入並存儲
如果該字元小於0x80 則這是一個英文字元,直接存儲
do
read one byte
check
if > 0x80 read next
save
while(!end)
大致這樣
直到讀入約定的end標志,可以是\n 可以是eof
㈤ C語言判斷漢字
#include<stdio.h>
intmain()
{inti;
unsignedchars[200];
scanf("%s",s);
for(i=0;s[i];i++)
if(s[i]>127)
{printf("漢字");
i++;
}
elseprintf("字母");
return0;
}
(5)c語言怎麼判斷字元編碼格式擴展閱讀
C++利用漢字的ASCII編碼小於0的特性判斷漢字
//coding:utf-8
#include"stdio.h"
intmain()
{
constchar*str="ENG漢字測試ddd";
for(inti=0;str[i]!='