阅读上一个主题 :: 阅读下一个主题 |
作者 |
准吴文:吴文与邢文的杂交体 |
 |
吴耐 [个人文集]
加入时间: 2004/03/06 文章: 1164
经验值: 54086
|
|
|
作者:吴耐 在 驴鸣镇 发贴, 来自 http://www.hjclub.org
本来我对文字改革的话题已经厌倦了,总觉得文改已经过了黄金时期,变成了几个人形影相吊钻牛角尖的行为。不过现在看起来还是有许多人感兴趣,尤其是老稀还准备编写一套程序帮助转换。这促使我又认真思考了一番。我觉得“吴文”虽然理念是好的,但是需要发明一套新的字母体系,才能使得用吴文写出的文章看起来“好看”。因为吴文主要是“偏旁+拼音”,如果“偏旁”看起来像汉字,拼音看起来像“英文字母”,合在一起看上去是很怪异的。比如“吴耐”写成“口WU2寸NAI4”,“芦笛”写成“艹LU2竹DI2”,看上去不像真正的文字。我就想能不能把吴文改造一下,不需要发明新字母,也不需要英文字母,只是利用现有的汉字字符集来书写吴文,并且还能够做到“实用”?“实用”就是说,网友可以利用现有的键盘来书写“吴文”文章,读者也可以很容易的就能看懂用吴文写出来的文章。
这个想法其实也是受到了“邢文”的启发。“邢文”据说只有老邢能写得出来,也只有老邢能看得懂,号称密码文字。其实不然,老芦曾经破译过邢文,并且把邢文翻译成了现代汉语文。后来我也看过几篇邢文,只要反复阅读几遍,也是能够看懂的。邢文有这么一些优点和缺点:
优点1:邢文都是用现有的汉字字符集内的字符书写的。
优点2:邢文不需要在汉词之间加空格,也即是不需要考虑“分词连写”问题。“分词连写”是现代汉语拼音化的一个难点,邢文完全不需要考虑,把这个难点给绕过去了。
缺点1:邢文没有区分声调。比如老邢把“争取一下”写成了“争娶医瞎”,声调错的厉害。其实如果老邢的邢文能够忠实于原文的声调,那么读者读起来就不需要反复阅读几遍才能看懂,而只需要阅读一遍,基本上就能看明白。就像听收音机,虽然汉语同音字众多,但是听众在听的过程中,基本不需要去回想听到的汉字的字形是什么样的,而是直接从声音理解到含义。所以,大部分听众,在绝大部分时间里听收音机是完全能够听懂的。同样的,邢文如果区分声调,基本上读者在阅读的时候,就可以做到先把汉字念出来,转换成声音,再把声音当成收音机来听,就能明白。
缺点2:邢文每次写出来都不一样。同一篇文章,用邢文写第一遍和写第二遍就不一样,这在密码学上倒是有个说法,忘了叫什么了。密码学上这么做是为了防止破译。如果同样的一条信息,加密后的密文每次都一样,就比较容易被猜测出来。作为密码这么做是必须的,是优点,作为一种文字这么做就是缺点了。文字最好是用少量的字符来组合出大量的单字或者单词,这样的字符就是“字母”。实在不能用字母,用有限数量的汉字来组合出其他更多的汉字,也比使用所有的汉字要好。这有限多的汉字可以叫做“基本汉字”。
再来看看吴文的优点和缺点。
缺点1:需要创造新字母来书写拼音,写出来的文字才好看。如果简单的使用现代汉语拼音,写出来看上去是很怪异的。
优点1:一维线性书写,有利于键盘输入。
优点2:与现代汉语汉字一一对应,有利于来回自动转换。
下面结合邢文和吴文,发明一种新文字,姑且叫做“准吴文”吧。“准吴文”的汉字构成规则如下:
1)在现代汉语汉字当中,选择一定数量的汉字作为“准吴文”的“字母”。“字母”共有大概1600个左右。我还没有仔细研究到底需要多少个字母才合适。这些字母一定要包括所有的偏旁部首。比如要包括“木母目氵亻金火土”等等。
2)“准吴文”的每一个汉字,写法是如下三种格式之一:(1)“拼音”;(2)“拼音”[“部首”];(3) “拼音”[“ 部首” “部首”]。也就是说每一个准吴文汉字都是由一个“拼音”部分加上零个,一个,或者两个偏旁部首部分组合出来的,而部首部分要用中括号括起来。举例说明可能更容易理解一些。比如现代汉语的汉字“见间渐涧”这4个汉字分别可以用准吴文写成“见”,“见[门]”,“见[氵]”,“见[氵门]”这4个准吴文汉字。
3)每一个拼音部分只需要一个“字母”来表示。这一点与“吴文”是不同的。“吴文”需要把“拼音”分解成“声母”,“韵母”和“声调”三个部分才行。因为汉字至少有1200多个音节,所以准吴文至少需要1200多个字母才行。比如“jiao1”,“jiao2”,“jiao3”,“jiao4”就是4个音节,需要“交”,“嚼”,“角”,“叫”4个“字母”来分别表示这4个音节的拼音部分。
4)准吴文的每一个“部首”部分也只需要一个“字母”来表示,这一点与“吴文”是相同的。
5)“准吴文”的汉字与现代汉语的汉字是一一对应的。不允许一个准吴文汉字对应于两个或者更多个现代汉语汉字。但是如果一个现代汉语的汉字是多音字,那么这个汉字可以对应于多个准吴文汉字。比如“糊”有三个发音“hu1”,“hu2”,“hu4”,对应于三个准吴文汉字“乎[米]”,“壶[米]”,“户[米]”。
6)“准吴文”汉字与所有的汉字对应,也就是说,可以把任何一个汉字,不管这个汉字是不是现代汉字,是不是日本汉字,韩国汉字还是越南汉字,也不管这个汉字是繁体字,还是简体字,都可以转换成准吴文汉字。当然日本汉字韩国汉字越南汉字如何确定其发音,还需要进一步研究。这里只是指出准吴文是有这种能力可以把古今中外所有的汉字转换成准吴文汉字的。
下面我们来进一步探讨一下如何选取准吴文的“字母”。准吴文的字母都是现代汉语的汉字,但是选取哪些汉字作为字母还是需要花费一番功夫的。字母可以分为做偏旁部首的“部首字母”和做拼音用的“音节字母”。有些字母当然可以同时做“部首字母”和“音节字母”。据说康熙字典总共收录了204个部首,日韩等国仍然使用康熙字典的部首作为标准。而且现在国内的语文委员会也在制定部首标准规范,据说初始方案也是采用了204个部首。所以我们也可以采用204个部首作为准吴文的部首字母。具体的字母选取规则如下。
1)对于每个部首,选择一个汉字作为“部首字母”。例如,“日月金木水火土,人口心手足身页”以及“鸟豸鱼虫,马牛羊犬,衣丝瓦缶”等等。
2)对于某一个音节,如果已经存在发音相同的“部首字母”,就用这个部首字母来作为这个音节的“音节字母”。比如,“ma3”这个音节存在一个部首字母“马”,就用“马”来做这个音节的“音节字母”。如果一个音节存在多个同音的“部首字母”,那么选择那个最常用的部首字母来做这个音节的“音节字母”。比如“木目”发音都是“mu4”,我们选择“木”作为这个音节的“音节字母”。
3)对于某一个音节,如果没有发音相同的“部首字母”,但是存在常用的象形字,那么选择这个象形字作为音节字母。例如,“zhu3”这个音节中,不存在部首汉字,但是存在象形字“主”,我们就选取这个“主”作为这个音节的音节字母。对于个别外形上笔画相连的会意字和指事字,也可以当作象形字来对待。比如“之”和“中”虽然不是象形字,而是会意字,但是我们仍然选取他们来作为音节字母。
4)对于某一个音节,如果没有发音相同的“部首字母”,也没有常用象形字,那么选择最常用的那个汉字作为这个音节的“音节字母”。比如对于音节“an1”,汉字“安”最常用,而“鞍氨庵铵桉”等等都没有“安”常用,所以选择“安”作为这个音节的“音节字母”。
5)一个汉字只能作为一个音节的“音节字母”,不能作为多个音节的“音节字母”。这主要是对于多音字而言的。比如“的”只能作为“de1”这个音节的音节字母,不能同时作为音节“de1”和“di4”这两个音节的音节字母。
如何把现代汉字转换为准吴文汉字?遵守如下规则:
1)如果一个现代汉语的汉字本身就是准吴文汉字的“字母”,那么这个汉字就直接作为准吴文的汉字了。比如“安的马木目”等等,都不要转换,他们也同时就是准吴文的汉字。
2)一个形声字,如果不是准吴文的字母,那么可以转换为准吴文的一个“音节字母”加一个“部首字母”。“部首字母”一般就是这个形声字的“形旁”。比如,“鞍氨庵铵桉”分别转换为“安[革]”,“安[气]”,“安[广]”,“安[金]”,“安[木]”。
3)会意字和指事字可以转换为一个“音节字母”加一个“部首字母”。“部首字母”可以是这种字的任何一个“义符”。比如“集”是一个会意字,意思是“隹”聚集在“木”上。我们可以取“隹”,也可以取“木”,作为这个汉字的“部首字母”。又因为“极楫”等汉字的部首字母是“木”,为了减少同音同部首汉字的数量,我们取“隹”作为“集”的部首,而不取“木”。这样,“集”对应的准吴文汉字就是“及[隹]”。到底应该选择哪个“义符”做“部首”比较好呢?原则就是选择那个能够减少同音节同部首汉字个数的“义符”。
4)象形字大部分本身就是准吴文的“字母”。个别不是“字母”的象形字,可以按照它的含义来找到一个含义与其最接近的“部首字母”,作为这个象形字转换成准吴文后的“部首字母”。比如“兽”本身是象形字,我们可以用“豸”或者“犬”作为它的“部首”。这样,“兽”就转换成了“受[豸]”或者“受[犬]”。
5)如果一个音节上,存在多个同音节同部首的汉字,那么最常用的汉字转换为一个音节字母加一个部首字母,其他的汉字转换为一个音节字母加两个部首字母。例如,“jian4”这个音节存在“渐涧溅”等同部首汉字,那么“渐”因为最常用,所以转换成“见[水]”,其他汉字则是“涧”=“见[水门]”,“溅”=“见[水贝]”。
下面用准吴文来写一段文章,让大家具体感受一下这种文字。下面这段文字是从老芦的帖子《野蛮的俄罗斯“反世界”(十四)》里摘出来的。原文是:
------------------------------------
如布哈林披露的那样,斯大林预见到了这必然是场血腥的战争,为此甚至发明了“社会主义越前进,阶级斗争就越激烈”的理论,作为发动这场战争的舆论准备。如他过去向列宁保证的那样:“我们的手不会颤抖”。他无与伦比的铁石心肠与超人的意志,决定了他为达目的使出来的恐怖手段,将令革命后的红色恐怖相形见绌,而广袤的俄罗斯大地上则处处“血雨随心翻作浪,白骨着意化为樵”。
------------------------------------
转换成准吴文之后变成了如下模样:
------------------------------------
如不[巾]哈林批[扌]露的那样,丝[斤]大林玉[页]见到了这必然示[日]厂[土]血星[月]的占[戈]争,为此甚至发明了“设[示]会主义月[走]前进,接[阜]及[丝]斗争臼[京]月[走]几[水]列[火]”的里[王]论,作为发动这厂[土]占[戈]争的鱼[车]论准贝[田]。如他过去象[口]列宁保正[言]的那样:“我们的手不会颤抖”。他无雨[一]仑[人]匕[匕]的铁石心长[月]雨[一]超人的义[心]至[心],决定了他为达目地[白]矢[人]出来的孔[心]不[心]手段,江[寸]令革命后的红色孔[心]不[心]象[目]行[彡]见处[糸],儿[彡]广贸[衣]的额[人]罗丝[斤]大地上责[刀]处处“血雨随心翻作浪,白骨卓[目]义[心]化为乔[木火]”。
------------------------------------
我统计了一下,原文共有157个汉字,转换后准吴文中总共有48个汉字需要添加部首字母,比例为48/157=31%,将近三分之一的汉字。这也就是说,在实际的文章当中,或者说在动态状态下,差不多有三分之二的汉字不需要转换,或者说不需要添加部首字母而直接使用,三分之一的汉字需要转换成音节字母加部首字母。
读者在阅读准吴文的时候,可以跳过中括号内括起来的部首字母部分,而只要读出括号外的汉字发音,把准吴文转化为声音,然后根据声音基本就能够听明白文章的含义。对于实在无法靠听就能明白的部分,再去仔细研究括号内的部首部分来得到正确的含义就可以了。
我把音节为“jian4”的所有汉字与准吴文汉字之间的对应关系列在下面,帮助大家进一步加深理解。
见 = 见
建 = 见[廴]
间 = 见[门]
件 = 见[牛]
健 = 见[人]
监 = 见[皿]
践 = 见[足]
鉴 = 见[金]
键 = 见[金廴]
渐 = 见[水]
剑 = 见[刀]
舰 = 见[舟]
荐 = 见[艹]
箭 = 见[竹]
贱 = 见[贝]
溅 = 见[水贝]
槛 = 见[木]
涧 = 见[水门]
谏 = 见[言]
饯 = 见[食]
锏 = 见[金门]
腱 = 见[月]
毽 = 见[毛]
踺 = 见[足廴]
僭 = 见[人白]
楗 = 见[木廴]
大家可以先感觉一下这种文字的视觉效果和阅读效果。如果还值得试用一下的话,我准备花费一点时间,与老稀一起做如下几件事:
1)确定准吴文的所有字母。
2)对于每一个现代汉语的汉字,找出它的部首是什么,翻译成准吴文的时候应该是如何书写的。编写一份现代汉语所有汉字与准吴文汉字之间的转换表。
3)编写一个汉字输入法用来输入准吴文。这个输入法将不需要“选字”。我们知道,现在的google拼音输入法,或者搜狗拼音输入法,在输入拼音之后,还需要输入数字键,从众多的同音字中选出自己需要的那个汉字。如果同音字多于10个,还需要翻页查找。“选字”是造成汉字拼音输入法效率极低的主要原因。准吴文基本就杜绝了“选字”,只要输入拼音,就能够得到准吴文的字母。我猜测,如果,我是说如果,准吴文能够流行起来的话,主要的功劳要归功于键盘输入时的不需要“选字”。老邢为什么坚持写邢文?老芦的分析是认为防止盗版,保护老邢自己的知识产权。我认为是老邢太懒,在输入拼音之后,懒得“选字”,不愿意按数字键去选择正确的汉字,而是直接按空格键把第一个出现的汉字输出到屏幕上去。其实,许多人是很不喜欢“选字”的。英语不需要选字,汉语是不得已而为之。如果有办法避免选字,许多人会喜欢使用的。准吴文就提供了这种可能性。从这个角度讲,准吴文也许是为了上网打字方便而发明的一种文字。
4)编写一个转换程序,在现代汉语汉字文章和准吴文文章之间提供双向转换。这个程序也可以与输入法合成在一起。比如提供一个“输出”选项,允许用户按准吴文的规则输入字母,但是输出上屏的却是现代汉语的汉字,或者反过来也行。
作者:吴耐 在 驴鸣镇 发贴, 来自 http://www.hjclub.org
上一次由吴耐于2009-11-13 周五, 下午12:37修改,总共修改了1次 |
|
|
返回顶端 |
|
 |
|
|
|
您不能在本论坛发表新主题 您不能在本论坛回复主题 您不能在本论坛编辑自己的文章 您不能在本论坛删除自己的文章 您不能在本论坛发表投票 您不能在这个论坛添加附件 您可以在这个论坛下载文件
|
based on phpbb, All rights reserved.
|