“好,那我先说说我设想的这个《中华大字库》的思路。”
会议室里顿时传出“嗡”的一声,所有人心里的第一个反应就是——少年人你好大的口气!当真不知道天高地厚了!
倒是麦主任先将手举起来,将会场秩序重新控制住:“大家先别急着讨论,我们会给大家留够讨论的时间。我们先让周至同学说说他的想法。”
与会的大多数人,都露出了以为深长的笑容,虽然麦主任今天带着大家过来了,想必昨天就和辜主任进行过讨论,然而直到现在都没有任何的表态,却支着这个少年上台,那意思很明白——我来是来给你面子的,如果你一定要让这孩子出丑,那我也管不着。
周至却毫不怯场,手里连个稿子都没有:“想来大家都知道,我们目前在使用的GB 2312字库,是我国第一个简体中文字符集的国家标准,于1980年,由中国国家标准总局发布,1981年5月1日实施。”
“它的准确全称,是叫做《信息交换用汉字编码字符集基本集》,其中规定了6763个汉字,以及682个非汉字图形。”
“与西方文字不同,汉字是表意文字,成千上万的不同含义需要成千上万的不同汉字来表示。西方文字主要是拼音文字,通过几十个字母的组合就可以变出成千上万的单词。在计算机里面,西方文字只需要给几十个字母编码就够了,而每一个汉字都要一个编码才行。”
“随着时代的进步和发展,GB2312已经满足不了应用的需要,比如‘镕’字现在是高频率使用字,而 GB 2312却没有为它编码,因而政府、新闻、出版、印刷等行业和部门,在使用中感到十分不便。”
“所以说,随着信息技术的发展,GB2312的6763个汉字,已经不能再满足人们使用要求。”
“而对于蜀大中文系,历史系,图书馆这些单位来说,六千多个汉字,更是难以满足信息数字化的需要。”
“最近,国际标准化组织下属编码字符集工作组,研制了一套新的编码字符集标准,叫做ISO/IEC 。”
会议室里又是一阵惊呼。
之前说的那些都是实际情况介绍,只要是稍微有点兴趣的人,翻翻资料,都能够说得出来。
可是ISO/IEC 国际标准则是国际标准化组织刚刚提出来的,而且到现在都只颁布了一部分,这孩子已经接触到前沿信息了。
周至继续说道:“这是一个针对多文种处理的编码字符集标准,目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。”
“理论上以此为基础,我们能构建出一个在信息技术工程上通用的多八位编码字符集,搭建出一个多文种的基本编码体系结构。”