第0239章 推行汉字编码统一标准

    第0239章 推行汉字编码统一标准 (第2/3页)

这个历史悠久的利舞台,对于利氏家族意义非凡,但在原本时空里,还是抵不住地产利益的诱_惑,于1991年被拆除,改建为一座以购物及饮食为主的商业大厦,即利舞台广场。

    所以眼前的形势就是,计算机生产基地没有其它选择,只有宝岛配套设施完善、成本低廉,面积更小的新加坡条件次之,而大陆还在缓慢起步。

    好在自己这个美国出产的亿万富翁的身份,已经足以让他在这些抱着美国大腿的地区之间,游刃有余地无视小粒度的政_治风险了。

    ……

    和昨天热闹的晚会相比,今天的大中华区中高层会议,就显得肃穆多了。

    居中而坐的唐焕,左手边是黄亘诚、周密、朱邦复、倪光南等人,右边是简明仁、施崇棠、周伟焜、冯星君等人,不想来当花瓶的胡音梦,也被强制性地安置了一个位置。

    “诸位,二代方圆个人电脑已经研发成功了,其性能足以保证在世界同行里,维持至少三年的中高端产品的生命周期。”唐焕自信地做着判断。

    “我对大家的工作要求,概括起来有两点。首先就是市场占有率,将亚洲市场变为自家的后花园。目前,MC68000、Intel 8086、MOS6502三大系列的产品,已经全面涵盖了高中低档次,而软件平台也是统一的,这是IBM、HP、DEC、王安电脑、NEC等等竞争者还暂时无法达到的优势,完成这个目标,应该问题不大。”

    唐焕环视着众人,“这是传统的要求,但我想说的另外一点更为重要,也就是我们的硬件平台更加强大了,是时候大力推行汉字编码统一标准了。这件事情于私而言,就是让公司掌握业界标准,立于不败之地;于公而言,就像造纸术、印刷术一样伟大,汉字越快搭上信息化这趟列车,中华文化的传承发展,也必将越快迎来一个新契机。有了这个统一的标准后,业界也就不用浪费资源搞什么万码奔腾了,把心思放在如何开发中文计算机的新功能便好了。大家已经衣食无忧了,想必愿意参与一番青史留名的雅事。”

    唐焕就是如此善于蛊惑人心,忽悠得部下们纷纷眼前一亮。

    计算机处理数据的基石,是信息化编码,就拿处理字符来讲,如同首先设定了一张由行列构成的表格,然后将各个字符按照特定的顺序,填入其中,这样每个字符就得到了一个序号编码,而计算机也只能通过这个序号编码来识别字符。

    围绕着这个序号编码,产生了三个意义关联的概念,即内码、交换码、外码。

    内码,是存在于计算机存储器上的序号编码,供CPU、程序以及开发者使用。

    就好像现在美国那边百家争鸣、各式各样的个人电脑一样,每个厂商都可以弄一套自己独有的硬件架构,内码也是如此。

    不难想象,在IBM象棋计划的工程师们眼里,管你是字母还是汉字,统统都是一个抽象的序号编码。

    尤其是受限于现在存储器的容量,各个厂商更有理由设计自己认为合理的编码方案。

    原本时空里的技术成熟阶段,英文系统中的内码为ASCII,繁体中文系统中常用的内码为big5,简体中文系统中的内码则为国标码,最后都逐渐统一采用Unicode。

    因为不同的系统有可能使用不同的内码。所以在彼此之间交换文件的时候,会发生乱码现象。

    解决方法就是交换文件之前,文件提供者先将由内码形式储存的文件,转换成交换码形式后再做交换。文件接收者在接收文件后,再由交换码转成内码。

    同样,交换码主要面对的使用者,是CPU、程序以及开发人员。

    而外码面对的使用者,则是非技术专业的普通用户,比如拼音码、注音码等各种中文输入法。

    像英语这样的表音文字,只有26个字母,处理起来相对简单,内码、交换码、外码三者相同即可;但像汉字这样的表语文字就不行了,光是常用字就有好几千,外码方面,没有键盘能够容纳得下,内码方面也需要考虑存储器容量的问题,这就客观上给汉字的信息化带来了难度。

    此外,信息化编码是非常考验技巧的,说是一门艺术也不为过。

    比如阿拉伯数字“0”到“9”的序号编码为48到57,对应的十六进制数字是30到39,只需一步简单的逻辑操作,就可以在序号编码和真实数字之间相互转换。

    再如英文大写字母“A”的序号编码为97,小写字母“a”的序号编码为65,相减的差是32,所有大小写字母都是这个差距,这并非偶然,同样只需一步简单的逻辑操作,就可以在大小写之间方便转换。

    繁体中文当中的异形字,也有类似英文大小写来回转换的需求,但异形字数目往往并非只有两个那么简单。

    显然,汉字信息化编码除了技巧之外,还要

    (本章未完,请点击下一页继续阅读)