當前位置:首頁 » 編程語言 » sql寬位元組獲取資料庫
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

sql寬位元組獲取資料庫

發布時間: 2023-01-28 16:35:09

sql server中,N''表示什麼意思

加上 N 代表存入資料庫時以 Unicode 格式存儲

N'string' 表示string是個Unicode字元串

Unicode 字元串的格式與普通字元串相似,但它前面有一個 N 標識符(N 代表 SQL-92 標准中的國際語言 (National Language))。N 前綴必須是大寫字母。例如,'Michél' 是字元串常量而 N'Michél' 則是 Unicode 常量。Unicode 常量被解釋為 Unicode 數據,並且不使用代碼頁進行計算。Unicode 常量確實有排序規則,主要用於控制比較和區分大小寫。

Unicode字元串常量支持增強的排序規則。

(1)sql寬位元組獲取資料庫擴展閱讀:

Unicode是國際組織制定的可以容納世界上所有文字和符號的字元編碼方案。目前的Unicode字元分為17組編排,0x0000 至 0x10FFFF,每組稱為平面(Plane),而每平面擁有65536個碼位,共1114112個。然而目前只用了少數平面。UTF-8、UTF-16、UTF-32都是將數字轉換到程序數據的編碼方案。

通用字元集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或稱ISO/IEC 10646)標准所定義的標准字元集。UCS-2用兩個位元組編碼,UCS-4用4個位元組編碼。

歷史上存在兩個獨立的嘗試創立單一字元集的組織,即國際標准化組織(ISO)和多語言軟體製造商組成的統一碼聯盟。前者開發的 ISO/IEC 10646 項目,後者開發的統一碼項目。因此最初制定了不同的標准。

⑵ 如何用SQLLDR導入unicode格式文件到資料庫

要把unicode格式(其中有UTF16編碼與UTF8編碼的)的文件導入資料庫,除了在control文件中設定一般
的參數之外,另外還要加入下面兩個參數。
CHARACTERSET : 它指明你的導入文件是什麼格式的,可以是UTF16,UTF8. 如果這里指定的編碼方式與你
導入的文件不相符導入會出錯。
例如: CHARACTERSET 'UTF16'
LENGTH : 此參數是接著放在CHARACTERSET參數之後的,Oracle字元欄位的長度可以是BYTE或CHARACTER,
如果你的導入文件是多位元組字元集的,此參數要設定為CHARACTER,否則在導入時會因長度不夠會被reject.
LENGTH CHARACTER
另外對於UTF16的文件,SQLLDR默認是CHARACTER,所以在control文件里不設定也不會有問題,對於文件開頭
帶Unicode Signature (BOM -Byte Order)Mark的,SQLLDR也是可以正確處理的.

CONTROL文件1
LOAD DATA
CHARACTERSET 'UTF16'
BADFILE 'sample.bad'
DISCARDFILE 'sample.dsc'
REPLACE
INTO TABLE "COUNTRIES"
fields terminated by '/t'
(
LOCATION CHAR(20),
CNTRY_REF CHAR(20),
CNTRY_ISO_CODE CHAR(10),
CNTRY_DESC CHAR(100),
LANG_CODE CHAR(20),
SOURCE CHAR(50),
SOURCE_STATUSCHAR(20),
SOURCE_SYSTEM CHAR(20)
)
CONTROL文件2
LOAD DATA
CHARACTERSET 'UTF8'
LENGTH CHARACTER
BADFILE 'sample.bad'
DISCARDFILE 'sample.dsc'
REPLACE
INTO TABLE "COUNTRIES"
fields terminated by '/t'
(
LOCATION CHAR(20),
CNTRY_REF CHAR(20),
CNTRY_ISO_CODE CHAR(10),
CNTRY_DESC CHAR(100),
LANG_CODE CHAR(20),
SOURCE CHAR(50),
SOURCE_STATUS CHAR(20),
SOURCE_SYSTEM CHAR(20)
)

⑶ mysql應該用什麼編碼格式儲存在資料庫里呢

mysql中一般用UTF-8編碼。

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,又稱萬國碼。由Ken Thompson於1992年創建。現在已經標准化為RFC 3629。UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。

修改資料庫編碼的命令為:

alterdatabaseapp_relationcharactersetutf8;

它相當於下面的三句指令:

SETcharacter_set_client=utf8;
SETcharacter_set_results=utf8;
SETcharacter_set_connection=utf8;