<dfn id="is4kg"></dfn>
  • <ul id="is4kg"></ul>
  • <abbr id="is4kg"></abbr>
  • <ul id="is4kg"></ul>
    <bdo id="is4kg"></bdo>

    曙海教育集團(tuán)論壇開(kāi)發(fā)語(yǔ)言培訓(xùn)專區(qū)SQL Server數(shù)據(jù)庫(kù) → 國(guó)際化使用UTF-8造成數(shù)據(jù)庫(kù)MSSQL Server 2000/2005存儲(chǔ)亂碼的分析


      共有7137人關(guān)注過(guò)本帖樹(shù)形打印

    主題:國(guó)際化使用UTF-8造成數(shù)據(jù)庫(kù)MSSQL Server 2000/2005存儲(chǔ)亂碼的分析

    美女呀,離線,留言給我吧!
    wangxinxin
      1樓 個(gè)性首頁(yè) | 博客 | 信息 | 搜索 | 郵箱 | 主頁(yè) | UC


    加好友 發(fā)短信
    等級(jí):青蜂俠 帖子:1393 積分:14038 威望:0 精華:0 注冊(cè):2010-11-12 11:08:23
    國(guó)際化使用UTF-8造成數(shù)據(jù)庫(kù)MSSQL Server 2000/2005存儲(chǔ)亂碼的分析  發(fā)帖心情 Post By:2010-12-13 13:34:58

    看了許多網(wǎng)上使用MSSQL Server 2000/2005使用UTF-8造成數(shù)據(jù)庫(kù)存儲(chǔ)亂碼的描述,也說(shuō)一下自己做的一個(gè)國(guó)際化項(xiàng)目的經(jīng)驗(yàn)。
    這個(gè)項(xiàng)目描述:
    架構(gòu):VC++的ATL Server進(jìn)行開(kāi)發(fā);
    頁(yè)面:web頁(yè)面是UTF-8編碼,CodePage=65001;
    應(yīng)用服務(wù)器程序:編譯好的dll是Unicode編碼;
    操作系統(tǒng):中文Windows 2003 Server;
    數(shù)據(jù)庫(kù)聯(lián)接方式:OLEDB
    數(shù)據(jù)庫(kù):中文MSSQL Sever2005,顯示Codepage=936,
    字段都是支持Unicode的nchar,nvarcha,nText;
    SELECT COLLATIONPROPERTY('Chinese_PRC_Stroke_CI_AI', 'CodePage')
    936
    ________________________________________________

    發(fā)現(xiàn)從Web頁(yè)面提交的數(shù)據(jù)到數(shù)據(jù)后查詢總是亂碼,經(jīng)過(guò)檢查,發(fā)現(xiàn)保存的數(shù)據(jù)直接就是是UTF-8編碼,其CodePage=65001,而數(shù)據(jù)默認(rèn)顯示支持的Unicode語(yǔ)言版本Codepage=936(即是簡(jiǎn)體中文),所以數(shù)據(jù)查詢的就是亂碼,想過(guò)兩種方案:
    1,懷疑是數(shù)據(jù)時(shí)UTF-8編碼,而SQLServer是UCS-2 版本,相通過(guò)UTF-8-〉UCS-2轉(zhuǎn)換,發(fā)現(xiàn)還是行不通,仍然亂碼,此路不通;
    2,
    搜索了網(wǎng)絡(luò)發(fā)現(xiàn)并沒(méi)有現(xiàn)成的例子,經(jīng)過(guò)測(cè)試中文系統(tǒng)使用Web頁(yè)面為GB2312編碼提交的數(shù)據(jù)到數(shù)據(jù)很正常,基于Windows2003是支持
    Unicode(UCS-2),排除操作系統(tǒng)的問(wèn)題,這個(gè)過(guò)程經(jīng)過(guò)分析可以這么理解:936(Web頁(yè)面編碼GB2312)-〉Unicode(應(yīng)用服務(wù)
    器端)-〉Unicode(數(shù)據(jù)庫(kù)OLEDB傳輸)-〉UCS-2(數(shù)據(jù)庫(kù))-〉自動(dòng)轉(zhuǎn)化為936(Unicode簡(jiǎn)體中文語(yǔ)言版本),而使用UTF-8
    的Web頁(yè)面這個(gè)過(guò)程就是:65001(Web頁(yè)面編碼UTF-8)-〉Unicode(應(yīng)用服務(wù)器端)-〉Unicode(數(shù)據(jù)庫(kù)OLEDB傳輸)-〉
    UCS-2(數(shù)據(jù)庫(kù))-〉自動(dòng)轉(zhuǎn)化為936(Unicode簡(jiǎn)體中文語(yǔ)言版本),所以最后的使用數(shù)據(jù)分析查詢器看到的就是亂碼,最后確定的方案就是兩種手
    段:一是更改數(shù)據(jù)查詢分析器的Codepage為65001,很顯然當(dāng)前的SQLServer沒(méi)有這個(gè)功能(沒(méi)找到?知道的告訴我);二是將前端的UTF
    -8轉(zhuǎn)為GB2312編碼,很顯然這個(gè)最后成功了,這個(gè)過(guò)程程序還是保留了所有的多語(yǔ)言的特性,一位UTF-8-〉GB2312,這個(gè)過(guò)程是無(wú)損的(新的
    驗(yàn)證會(huì)出現(xiàn)部分方塊無(wú)法顯示),因?yàn)槭荱TF-8->Unicode->GB2312.
    總結(jié):
    1,MSSQL
    Server不支持UTF-8(Codepage=65001)直接顯示,數(shù)據(jù)庫(kù)查詢的顯示數(shù)據(jù)使用默認(rèn)的Codepage,如簡(jiǎn)體中文版就是936,繁
    體中文是950,韓文949等,因此從使用的Web頁(yè)面UTF-8提交的數(shù)據(jù)自動(dòng)轉(zhuǎn)換為所用的Codepage顯示,因此就是亂碼,這個(gè)有待MS
    SQL
    Server進(jìn)一步發(fā)展,因?yàn)楝F(xiàn)在Oracle和MySQL是可以支持直接UTF-8存儲(chǔ)顯示,國(guó)際化時(shí)請(qǐng)先將數(shù)據(jù)由UTF-8編碼轉(zhuǎn)化為MSSQL數(shù)據(jù)
    庫(kù)默認(rèn)的編碼,讀寫出來(lái)這個(gè)過(guò)程著相反進(jìn)行轉(zhuǎn)化,這個(gè)過(guò)程看起來(lái)會(huì)因?yàn)檗D(zhuǎn)化過(guò)程影響處理速度(抉擇于國(guó)際化);
    2,ASP/ASPX/JSP/PHP使用MSSQL Server編程支持UTF-8都會(huì)面臨這樣的問(wèn)題,可以看看MSDN有關(guān)這個(gè)方面的解釋
    補(bǔ)充:根據(jù)測(cè)試和MSDN分析,將UTF-8轉(zhuǎn)化為GB2312并不是很好的方案,這樣會(huì)使包含韓文、阿拉伯文等等,這些都會(huì)變成問(wèn)號(hào),所以整個(gè)過(guò)程并不是很繁瑣,簡(jiǎn)化一下:
    寫數(shù)據(jù)庫(kù):瀏覽器表單提交數(shù)據(jù)(UTF-8)(ANSI編碼)-〉應(yīng)用服務(wù)器端程序(進(jìn)行UTF-8-〉Unicode)-〉MS SQL Server(自動(dòng)轉(zhuǎn)化為字符集936編碼顯示內(nèi)容,但數(shù)據(jù)肯定是Unicode方式存儲(chǔ)的);
    讀數(shù)據(jù)庫(kù):MS SQL Server(936 - Unicode)-〉應(yīng)用服務(wù)器端程序(進(jìn)行Unicode-〉UTF-8)-〉瀏覽器顯示
    注意:其他條件設(shè)置不變
     
    兩個(gè)使用的函數(shù):
    1,UTF8轉(zhuǎn)化為Unicode,inline為了編譯后更快運(yùn)行,老用到了,返回字符串為了使用鏈?zhǔn)奖磉_(dá)式
    inline WCHAR  *UTF8ToUnicode(const char *str) throw()
     {
      int i = MultiByteToWideChar(CP_UTF8,MB_ERR_INVALID_CHARS,str,-1,NULL,0);        
      WCHAR   *strUnicode=new   WCHAR[i];        
      MultiByteToWideChar(CP_UTF8,MB_ERR_INVALID_CHARS,str,-1,strUnicode,i);
      return strUnicode;
      delete []strUnicode;
     }
    一定要返回WCHAR 或wchar_t類型,否則有些字符就會(huì)變成“?”,Unicode(UCS-2)是2個(gè)字節(jié)寬
     
    2,Unicode轉(zhuǎn)化為UTF8,inline同上意義
    inline char *UnicodeToUTF8(const WCHAR* pText) throw()
     {
      int i= WideCharToMultiByte(CP_UTF8

    支持(0中立(0反對(duì)(0單帖管理 | 引用 | 回復(fù) 回到頂部

    返回版面帖子列表

    國(guó)際化使用UTF-8造成數(shù)據(jù)庫(kù)MSSQL Server 2000/2005存儲(chǔ)亂碼的分析








    簽名
    主站蜘蛛池模板: 精品少妇ay一区二区三区| 久久久久亚洲av无码尤物| 第一福利视频导航| 国产激情视频在线播放| 一级做a爱视频| 日本制服丝袜在线| 亚洲欧美一区二区三区图片| 肥臀熟女一区二区三区| 大香伊蕉在人线国产最新75| 久草资源福利站| 欧美精品一区二区三区免费观看 | 国产午夜毛片一区二区三区| GOGO人体大胆全球少妇| 成人av在线一区二区三区| 亚洲av无码专区在线播放| 欧美激情一区二区三区在线| 国产18禁黄网站免费观看| 高清中文字幕在线| 国产精品自在欧美一区| 一区在线免费观看| 成人毛片手机版免费看| 么公的又大又深又硬视频| 欧美午夜片欧美片在线观看| 免费乱码中文字幕网站| 精品国产麻豆免费网站| 国产公开免费人成视频| **网站欧美大片在线观看| 国产麻豆精品高清在线播放| 一级毛片免费在线观看网站| 成年入口无限观看免费完整大片| 亚洲av无码成人网站在线观看| 欧美成人一区二区三区在线观看 | chinese打桩大学生twink| 强行扒开双腿猛烈进入| 久久久香蕉视频| 日韩免费无码一区二区视频| 亚洲在成人网在线看| 欧美真实破苞流血在线播放| 免费扒开女人下面使劲桶| 精品久久久久久无码人妻蜜桃| 国产乱人伦av在线a|