海纳百川

登录 | 登录并检查站内短信 | 个人设置 网站首页 |  论坛首页 |  博客 |  搜索 |  收藏夹 |  帮助 |  团队  | 注册  | RSS
主题: 为何阅读汉语拼音不能一目十行?
回复主题   printer-friendly view    海纳百川首页 -> 驴鸣镇
阅读上一个主题 :: 阅读下一个主题  
作者 为何阅读汉语拼音不能一目十行?   
所跟贴 不行啊,中文的另一問題就是難以斷詞的問題,如同日文難以斷字一般,我在舊作中說過這問題 -- 芦笛 - (0 Byte) 2011-11-11 周五, 下午2:56 (93 reads)
吴耐
[个人文集]






加入时间: 2004/03/06
文章: 1164

经验值: 54086


文章标题: 是的,其他人也提到过分词连写的难度问题。所以两难并一难了。只要解决了分词问题,也就解决了字形分辨率不高的问题。 (110 reads)      时间: 2011-11-11 周五, 下午6:04

作者:吴耐驴鸣镇 发贴, 来自 http://www.hjclub.org

分词问题并非不能解决,而是不同的人有不同的看法,很难统一。并非技术上有什么难度。

一个简单办法是利用英语单词来给汉字分词做参考。就是如果一个汉字串能够翻译成一个英文单词,那这个字串就是一个汉词。比如“红色的”翻译成“red”,那“红色的”就是一个单词。“吃饭”翻译成什么?只能是“eat meal”或者“eat food”,所以不能是一个单词,而是两个单词“吃”和“饭”,等等。

其实我发现汉字文章没有分词,一个原因是“单字词”太多。如果真的要在汉词之间加入空格,你会发现几乎满篇都是空格,或者说几乎一半的汉词是“单字词”也就是单个汉字。

作者:吴耐驴鸣镇 发贴, 来自 http://www.hjclub.org
返回顶端
阅读会员资料 吴耐离线  发送站内短信
    显示文章:     
    回复主题   printer-friendly view    海纳百川首页 -> 驴鸣镇 所有的时间均为 北京时间


     
    论坛转跳:   
    不能在本论坛发表新主题
    不能在本论坛回复主题
    不能在本论坛编辑自己的文章
    不能在本论坛删除自己的文章
    不能在本论坛发表投票
    不能在这个论坛添加附件
    可以在这个论坛下载文件


    based on phpbb, All rights reserved.
    [ Page generation time: 1.997427 seconds ] :: [ 28 queries excuted ] :: [ GZIP compression enabled ]