·建站首页 ·钻石 ·繁體
您的位置: 中国建站之家 -> 网站开发设计 -> ASP教程 -> 用XMLHTTP Post/Get HTML页面时的中文乱码之完全Script解决方案

用XMLHTTP Post/Get HTML页面时的中文乱码之完全Script解决方案

作者:未知  来源:转载  发布时间:2005-9-15 20:38:22  发布人:acx

以前我曾经贴过一篇用XMLHTTP Post Form 的帖子,那里的代码中我Post E文的Value毫无问题,但是后来发现Post含有中文的表单时会出现乱码,原因当然是UTF-8 和GB2312 之间的转换问题了!TNND,打倒GB2312!大家都用UTF8多好。

用XMLHTTP Post Form时的表单乱码有两方面的原因——Post表单数据时中文乱码;服务器Response被XMLHTTP不正确编码引起的乱码。换句话说,本文主要解决两个问题——怎样正确Post中文内容&怎样正确显示得到的中文内容。

Part I Post中文内容

先看看E文的表单是怎么提交的:

<script language="&#106avascript">
strA = "submit1=Submit&text1;=scsdfsd";
var oReq = new ActiveXObject("MSXML2.XMLHTTP");
oReq.open("POST","http://ServerName/VDir/TstResult.asp",false);
oReq.setRequestHeader("Content-Length",strA.length);  
oReq.setRequestHeader("CONTENT-TYPE","application/x-www-form-urlencoded");
oReq.send(strA);
</script>

如果把strA = "submit1=Submit&text1;=scsdfsd";换成:
strA = "submit1=Submit&text1;=中文";

你会发现提交上去的东东根本不对,ASP中Request.Form("Text1")根本取不到值。俺用Request.BinaryRead把一个HTML Form中的Post内容写出来看了看,才发现问题——Form提交时也要编码的,编码后的中文是类似于%??%??的转义字符,比如“中文”就被编码为:%D6%D0%CE%C4。呵呵,也怪俺笨,人家CONTENT-TYPE里明明写的清清楚楚——application/x-www-form-urlencoded,urlencoded嘛当然就是这个样子了。既然这样,那我们也知道该怎么办了——自己做转换,代码见下:

<script language="VBscript">
Function URLEncoding(vstrIn)
    strReturn = ""
    For i = 1 To Len(vstrIn)
        ThisChr = Mid(vStrIn,i,1)
        If Abs(Asc(ThisChr)) < &HFF; Then
            strReturn = strReturn & ThisChr
        Else
            innerCode = Asc(ThisChr)
            If innerCode < 0 Then
                innerCode = innerCode + &H10000;
            End If
            Hight8 = (innerCode  And &HFF00;)\ &HFF;
            Low8 = innerCode And &HFF;
            strReturn = strReturn & "%" & Hex(Hight8) &  "%" & Hex(Low8)
        End If
    Next
    URLEncoding = strReturn
End Function

strA = URLEncoding("submit1=Submit&text1;=中文")
oReq = CreateObject("MSXML2.XMLHTTP")
oReq.open "POST","http://ServerName/VDir/TstResult.asp",false
oReq.setRequestHeader "Content-Length",Len(strA)
oReq.setRequestHeader "CONTENT-TYPE","application/x-www-form-urlencoded"
oReq.send strA
</script>

(在这里俺把前面的&#106avascript的代码改成了VBscript,不是吃饱了撑的没事干,原因见后)

Part II.正确显示得到的中文内容

OK,如果你在Server端把Form的内容写到数据库/文件的话,你在那里看到的中文毫无问题,但是,假如你想看看Server的Response——问题来了:如果Response的结果不是XML,XMLHTTP.responseXML里当然是不会有东东的,那就用responseText好了,在代码的最后加一句:

alert(oReq.responseText)
看看俺们辛勤劳动的结果  :P

但是但是.....怎么所有的中文全变成了方格? (我打不出来,有兴趣自己去试,也不用Post,Get一个含有中文的网页就可以发现了。)

原因很简单:XMLHTTP得到Response时假定Response是UTF8编码的,如果Response是XML,那还可以通过encoding来指定编码,但HTML就不行了。(见鬼的GB2312,再次打倒!)所以它把含GB2312编码的HTML当成UTF8格式,不出错才有鬼!

不过好在还有补救的办法:XMLHTTP的responseBody 属性里包含的可是未解码的Resonse——"a raw undecoded bytes as received directly from the server" :),唯一的问题是,responseBody返回的是一个unsigned bytes数组,我们怎么去访问它,怎么把它转换成BSTR?

这就是为什么我在上面把代码改成VBscript的原因——VBscript Can do it,but &#106avascript Cannot!

代码见下:
<script language="VBscript">
Function URLEncoding(vstrIn)
    strReturn = ""
    For i = 1 To Len(vstrIn)
        ThisChr = Mid(vStrIn,i,1)
        If Abs(Asc(ThisChr)) < &HFF; Then
            strReturn = strReturn & ThisChr
        Else
            innerCode = Asc(ThisChr)
            If innerCode < 0 Then
                innerCode = innerCode + &H10000;
            End If
            Hight8 = (innerCode  And &HFF00;)\ &HFF;
            Low8 = innerCode And &HFF;
            strReturn = strReturn & "%" & Hex(Hight8) &  "%" & Hex(Low8)
        End If
    Next
    URLEncoding = strReturn
End Function

Function bytes2BSTR(vIn)
    strReturn = ""
    For i = 1 To LenB(vIn)
        ThisCharCode = AscB(MidB(vIn,i,1))
        If ThisCharCode < &H80; Then
            strReturn = strReturn & Chr(ThisCharCode)
        Else
            NextCharCode = AscB(MidB(vIn,i+1,1))
            strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100; + CInt(NextCharCode))
            i = i + 1
        End If
    Next
    bytes2BSTR = strReturn
End Function

strA = URLEncoding("submit1=Submit&text1;=中文")
oReq = CreateObject("MSXML2.XMLHTTP")
oReq.open "POST","http://ServerName/VDir/TstResult.asp",false
oReq.setRequestHeader "Content-Length",Len(strA)
oReq.setRequestHeader "CONTENT-TYPE","application/x-www-form-urlencoded"
oReq.send strA
alert bytes2BSTR(oReq.responseBody)
</script>

嘿嘿,是不是很简单啊,用这个再试试看?一切OK!

(顺便说说byte(),这个东东在VBscript里的表现只能用妖来形容——对它调用VarType 返回8209——vbArray + vbByte,用LBound、UBound能拿到数组的上界下界,但是就是不能用name(i)的形式访问,搞得我以为在script里根本没法处理这种类型,在bytes2BSTR函数里可以看到我是把它当成String来处理的——LenB/MidB什么的,发现这点纯属意外——我开始往这个函数里传的是XMLHTTP.responseText,想一个Byte一个Byte地看看里面到底有点什么,后来一时性起把responseText改成responseBody,结果就中奖了,哈哈)

最后的废话:
1、以上代码在MSXML Parser 3 Release+VBscript 5.5环境下通过。那位兄弟有早一点版本的script可以帮我试试看能不能成。
2、一直以为&#106ava&#115;cript vs VB&#115;cript应该是&#106ava&#115;cript略好,所以有时候想彻底抛弃VB&#115;cript,ASP Server/Client统统用&#106ava&#115;cript,看来未必是个好主意。</span> </font></div><div id="Message" class="Message"></div> <p><a href="javascript:window.open('http://shuqian.qq.com/post?from=3&title='+encodeURIComponent(document.title)+'&uri='+encodeURIComponent(document.location.href)+'&jumpback=2&noui=1','favit','width=930,height=470,left=50,top=50,toolbar=no,menubar=no,location=no,scrollbars=yes,status=yes,resizable=yes');void(0)" style="text-decoration:none;color:#155da5;display:block;background:url('http://shuqian.qq.com/img/add.gif') no-repeat 0px 0px;height:23px;width:300px;padding:2px 2px 0px 20px;font-size:14px;">将本文收藏到QQ书签与更多好友分享</a></p> <p><script language=javascript src=/wz/sg.JS></script></p> </div> </div> <div class="user_nav"><p>上一篇:<a href="/Article/10/130/2005/2005091512788.html">ASP中巧用Split()函数生成SQL查询语句</a></p> <p>下一篇:<a href="/Article/10/130/2005/2005091512790.html">用HTML框架减少服务器流量</a> &nbsp;&nbsp;<script language=javascript src=/wz/wangzhai/wangzhai.js></script></p> </div> <div class="list_menu_b"> <div class="left"> <h2>热门阅读 &raquo;</h2> <ul> <li class="showlist1">· <a href="/Article/10/138/2005/200507256912.html" title="注册码大全二">注册码大全二</a></li> <li class="showlist2">· <a href="/Article/10/138/2005/200507256914.html" title="注册码大全四">注册码大全四</a></li> <li class="showlist1">· <a href="/Article/10/138/2005/200507256911.html" title="注册码大全一">注册码大全一</a></li> <li class="showlist2">· <a href="/Article/196/197/2005/2005081911736.html" title="要10G免费网络硬盘的请进来!">要10G免费网络硬盘的请进来!...</a></li> <li class="showlist1">· <a href="/Article/206/2007/2007030319347.html" title="通过google 赶快来赚美金">通过google 赶快来赚美金</a></li> <li class="showlist2">· <a href="/Article/10/138/2005/200507256919.html" title="注册码大全十">注册码大全十</a></li> <li class="showlist1">· <a href="/Article/10/138/2005/200507256913.html" title="注册码大全三">注册码大全三</a></li> <li class="showlist2">· <a href="/Article/14/253/2005/2005092114218.html" title="头像-qq头像(qq新头像)4">头像-qq头像(qq新头像)4</a></li> <li class="showlist1">· <a href="/Article/13/150/2006/2006022316028.html" title="让你轻松架设FTP服务器1">让你轻松架设FTP服务器1</a></li> <li class="showlist2">· <a href="/Article/14/244/2005/2005092014121.html" title="梦幻背景图片7">梦幻背景图片7</a></li> </ul> </div> <div class="right"> <h2>相关阅读 &raquo;</h2> <ul> <li class="showlist11">· <a href="/Article/10/133/2005/200507216508.html" target="_blank" title="变量的变量,PHP 和 你">变量的变量,PHP 和 你</a></li> <li class="showlist12">· <a href="/Article/10/135/2005/2005122915106.html" target="_blank" title="top、clientTop、scrollTop、offsetTop">top、clientTop、scroll...</a></li> <li class="showlist11">· <a href="/Article/13/153/2006/2006012615734.html" target="_blank" title="JSP连接mysql数据库攻略">JSP连接mysql数据库攻略...</a></li> <li class="showlist12">· <a href="/Article/11/140/2005/200507181468.html" target="_blank" title="flash中通过XMLSocket监控生产系统(2-3)">flash中通过XMLSocket监...</a></li> <li class="showlist11">· <a href="/Article/10/132/2005/200507204676.html" target="_blank" title="教你用Javascript制作连续滚动的字幕">教你用Javascript制作连...</a></li> <li class="showlist12">· <a href="/Article/10/130/2005/200507288401.html" target="_blank" title="存储过程对页面访问速度的影响">存储过程对页面访问速度...</a></li> <li class="showlist11">· <a href="/Article/223/291/2006/2006111217919.html" target="_blank" title="实景地图意外&quot;搜&quot;到超女老家 制作方始料未及">实景地图意外&quot;搜&quot;到超女...</a></li> <li class="showlist12">· <a href="/Article/11/143/2005/200507193537.html" target="_blank" title="体验PS CS2的Bridge文件浏览器(10)">体验PS CS2的Bridge文件...</a></li> <li class="showlist11">· <a href="/Article/10/130/2007/2007110822559.html" target="_blank" title="汉字转拼音ASP函数">汉字转拼音ASP函数</a></li> <li class="showlist12">· <a href="/Article/10/133/2007/2007070920798.html" target="_blank" title="绝对简单易学的PHP入门教程">绝对简单易学的PHP入门教...</a></li> </ul> </div> </div> </div> <div id="footer"> <div class="link"> <A href="http://www.jz123.cn/support/about.asp" target="_blank">关于我们</A> | <A href="http://www.jz123.cn/support/help.asp" target="_blank">网站帮助</A> | <A href="http://www.jz123.cn/support/advertise.asp" target="_blank">广告合作</A> | <A href="http://www.jz123.cn/" target="_blank">源码下载</A> | <A href="http://www.jz123.cn/support/sitemap.asp" target="_blank">网站地图</A> | <A href="http://www.jz123.cn/support/declare.asp" target="_blank">下载声明</A> | <font color=red>文章源码投搞:</font>jz123cn@126.com</A> </div> <div class="copyright"> Copyright &copy; 2002-2005 <b>jz123<font color=#ffffff>.cn</font></b></font></a>. All Rights Reserved . <center><script src='http://s6.cnzz.com/stat.php?id=44148&web_id=44148&show=pic' language='JavaScript' charset='gb2312'></script> </div> </div> </div> </body> </html> <span id="naruco_ad_body" style="display:none;"> <script language=javascript src=/adfile/top1.js></script> </span> <script type="text/javascript"> var naruco_ad = document.getElementById('naruco_ad'); if (naruco_ad != null) { naruco_ad.innerHTML=naruco_ad_body.innerHTML; naruco_ad_body.innerHTML=""; } </script>