频道直达 - 学院 - 下载 - 交易 - 特效 - 字库 - 手册 -排名-工具- 繁體
网页教学网站开发 设为首页
加入收藏
联系我们
建站搜索: 常用广告代码   用户注册 | 用户登陆
您当前的位置:中国建站之家 -> 网站服务器架设维护教程 -> 服务器应用技术技巧 -> 抓住机遇 构筑稳健的中文Linux系统1

抓住机遇 构筑稳健的中文Linux系统1

作者:jz123  来源:www.jz123.cn  发布时间:2006-1-29 6:19:39  发布人:jz123

减小字体 增大字体

Linux是操作系统中的一朵奇葩,是中国软件发展的机遇。要使这朵奇葩在中国的大地上生根、发芽、开花,要想抓住Linux机遇,首先必须解决中文本地化的问题。

1999年政府公开支持在中国发展Linux,国内出现了好几家制作中文Linux发布版本的公司,推动了Linux在中国的发展和普及,但在初期中文Linux都是采用中文平台的方式。

一、“中文平台”

“中文平台”是为了让计算机能处理中文信息,在操作系统上建立必要的中文处理手段,即在ASCII码的操作系统上架构一个中文处理环境,用来提供中文的输入、显示、打印和中文文件的存储、处理、传输,并为应用软件开发和运行提供支持,俗称“中文平台”。

中文平台的主要技术特点是在ASCII码的操作系统上架构一个中文处理环境。该中文处理环境为了简化字符处理而使用的处理码可能是把汉字作为一个宽字符来处理,但进出核心的代码流都采用文件码,即多字节字符,所以中文平台本质上仍是按字节处理中文。

从显示方式来讲,可分为字符界面和图形界面两种“中文化”方式。字符界面的“中文化”又可分为内核汉化和外挂式两种。内核汉化是直接修改Linux内核的源程序,使之能处理中文信息。外挂式是不修改Linux内核的源程序,在原有应用程序接口(API)之外增加一层中文信息处理的支撑平台。

图形界面的“中文化”本质上都属外挂式,但实现的方式有:

修改XFree 86、即修改X Server;

修改XWindow的库函数Lib X11.so;

利用LD-PRELOAD载入动态库。

中文平台具体实现的技术特点各不相同,充分展现了中国人的聪明才智,但也带来一些问题。

1. 没有相应的标准,使中文应用软件在多版本之间的可移植性造成困难。有可能出现在某一版本中文平台上运行的中文应用软件在另一个版本的中文平台就不能运行或不能很好运行的情况。中文应用软件开发商可能要为每一个版本的中文平台开发一个产品。这对中文应用程序的发展很不利,而应用又是Linux能否发展的一个极重要的问题。

2.中文平台实际上仍是字节处理,而不是以字符为单位来处理,可能与ASCII码造成冲突,不能彻底解决汉字与ASCII码的冲突。而且不能彻底解决汉字的输入、输出问题,比如半个汉字的问题(显示、删除半个汉字,光标半个汉字移动)。

3.中国是由56个民族组成的大家庭。中国使用汉字的人占绝大多数,中文主要是汉语,但也包括其他少数民族的语言文字。海内外华人使用的汉字有简体与繁体,日本语、朝鲜语中也有汉字。“中文平台”和“中文化”是个很不确切的说法。而且中文平台也解决不了在一个系统内使用汉字、少数民族语言、日本和朝鲜的汉字问题。

4.POSIX是操作系统的一个标准。 Linux是符合POSIX标准的。而POSIX标准是采用国际化/本地化模式来解决多国语言文字的本地化。

1999年8月底成立了Linux国际化工作组,开始了Linux国际化(缩写为Li18nux)工作,同时也为中文本地化指出了正确道路。在这之前搞中文平台,是因为那时还没有Linux国际化组织,也没有Linux国际化标准。而且Linux是芬兰人发明,在美国成长起来的,开始也没有想到它会如此成功,会走向世界,因此Linux以前也没有考虑国际化的问题。Linux中文平台对Linux在中国的发展和普及起了重要的作用,但它已完成了它的历史使命。它只是一种暂时过渡的方法,是不得已而为之的方法,并不是中文Linux发展的正确之路。

二、Linux的国际化/本地化

国际化

国际化(Internationalization,缩写为I18n,即取首尾两个字母,中间有18个字母)是规定在一个计算机程序内部的能力,使它适应不同的本地语言、本地风俗和编码字符集。

国际化标准定义一组国际化的应用程序编程界面和用户界面。

国际化主要包括用双字节/多字节编码代替单字节7位或8位编码,使用统一的大字符集ISO 10646,建立本地化数据库Locale DB,提供输入、输出服务(I/O服务)等内容。

1. 用双字节/多字节编码代替单字节7位或8位编码

在国际化标准中,系统字处理中,必须以字符为单位,而不能以字节为单位。字符既可以是单字节字符,也可以是多字节字符,所以彻底解决了半个汉字现象。

由于历史的原因,计算机为了实现不同硬件和软件系统之间数据传输的标准化,是使用7位编码的,称为ASCII(American standard code for information interchange)。ASCII是信息交换使用的美国国家标准编码,它是美国的标准。ASCII字符集是用7个数据位表示的代码,它用二进制数值来表示ASCII字符,代码值的范围在0到127之间。大部分基于PC的系统则使用八个数据位的扩展ASCII代码。这样可以使用额外的128个字符代表一些特殊符号、外语字符、图形符号。

通信软件的高位(第8位)是作为奇偶校验位,用来检测和改正通信错误。这种7位有效位的假定,渗透到很多软件中,如电子邮件的实现。

随着计算机应用的不断发展,7位编码已不够了。虽然以后又使用8位的扩展ASCII码,但256个字符即使对使用拼音文字的单文种的国家的用户也是不敷使用了。虽然用了7位或8位能覆盖基本字母,但还有多种多样的符号及印刷元素,其数量远大于256。各国拼音文字的字母和各种符号就有一万个左右,汉字则有七八万之多,使用双字节(16位)编码,也只能标识65536个符号。所以,如果想要计算机能使用多国文字,特别是使用汉字,则必须用双字节/多字节。

如果说用两位数表示年是计算机的千年虫问题,那么用单字节编码ASCII处理字符则是计算机文字处理的“千年虫”问题。但单字节编码的危害还没有引起人们足够的重视。

国际化的首要工作就是在系统字处理中,必须以字符为单位,而不是以字节为单位,即用双字节/多字节编码代替原来的单字节编码,这就是用宽字符(wide character,为了统一地处理单字节字符和多字节字符,而采用统一编码宽度的字符的内部表示)代替单字节字符。


将本文收藏到QQ书签与更多好友分享
[打 印]
[] [返回上一页] [收 藏]
∷相关文章评论∷    (评论内容只代表网友观点,与本站立场无关!) [更多评论...]
精彩推荐
热门文章
· 注册码大全二
· 注册码大全四
· 注册码大全一
· 要10G免费网络硬盘的请进..
· 通过google 赶快来赚美金..
· 注册码大全十
· 头像-qq头像(qq新头像)4..
· 让你轻松架设FTP服务器1..
· 注册码大全三
· 梦幻背景图片7
· 卡通动物图片6
· 网页制作素材-按钮素材2..
· 让你轻松架设FTP服务器5..
· 风景图片8
· 注册码大全九
· 让你轻松架设FTP服务器2..
关注此文读者还看过
· JSP/JAVABEAN+TOMCAT4.0..
· Flash MX 2004 updater ..
· PHOTOSHOP打造1像素点边..
· 如何在网页中变化图象(速..
· 淘宝宣布全年业绩 累计总..
· eBay封杀虚拟财产交易 “..
· 如何增加网站PV
· 教你玩转PhotoShop CS2
· 正则表达式系统教程(六)..
· 背景音乐是如何插入的?
· XML简明教程第8课:访问经..
· Serv-U3.0的Domain设置 ..
· 百度明年赴日"搜索" 与G..
· 调查:五月IM攻击增长500..
· 投票管理程序
· SQL Server 2005数据加密..
相关文章
· 抓住机遇 构筑稳健的中文Li..
· 抓住机遇 构筑稳健的中文Li..
· 抓住机遇 构筑稳健的中文Li..
关于本站 - 网站帮助 - 广告合作 - 下载声明 - 友情连接 - 网站地图 - 人才招聘
网站合作、内容监督、商务咨询:QQ: 9576619
Copyright ? 2005--2008 中国建站之家版权所有
粤ICP备05092265号