海纳百川
登录
|
登录并检查站内短信
|
个人设置
网站首页
|
论坛首页
|
博客
|
搜索
|
收藏夹
|
帮助
|
团队
|
注册
|
RSS
主题:
启明:关于汉字信息熵不妨接着谈,我起个头,我认为汉字处理可分为四个部份
海纳百川首页
->
罕见奇谈
阅读上一个主题
::
阅读下一个主题
作者
启明:关于汉字信息熵不妨接着谈,我起个头,我认为汉字处理可分为四个部份
所跟贴
汉字信息熵大是汉字难以在信息领域方便使用的主要原因,这是大字符集的必然缺陷!
--
Anonymous
- (560 Byte) 2005-1-17 周一, 上午10:14
(150 reads)
越南人
[
个人文集
]
加入时间: 2004/02/14
文章: 7096
经验值: 97883
标题:
你这些问题在10年前是问题,随硬件发展这些大都不是问题了.
(109 reads)
时间:
2005-1-17 周一, 上午10:30
(内容为空)
返回顶端
信息熵揭示的汉字问题不是硬件可以解决的,它不过是从一个形式转变成另一种而已!
--
启明
- (50 Byte) 2005-1-17 周一, 上午10:39
(105 reads)
例子在底下.
--
越南人
- (0 Byte) 2005-1-17 周一, 上午10:45
(73 reads)
信息熵揭示的汉字问题不是硬件可以解决的,它不过是从一个形式转变成另一种而已!
--
启明
- (0 Byte) 2005-1-17 周一, 上午10:38
(102 reads)
比如说检索:8位机检索ASCII码最好,16位机检索2Byte最有效率
--
越南人
- (31 Byte) 2005-1-17 周一, 上午10:43
(116 reads)
汉字词汇一没有序二没有词界,所以关键词的检索比英文差很多,我不是说硬件的位数.
--
启明
- (0 Byte) 2005-1-17 周一, 下午3:18
(119 reads)
你说的词界很重要,Thank you.
--
越南人
- (0 Byte) 2005-1-17 周一, 下午6:02
(97 reads)
当然对于小文字系统,英文绝对有利.但你提到的这些制约,在现在也算不上大问题.
--
越南人
- (0 Byte) 2005-1-17 周一, 下午4:15
(97 reads)
现在文章中的文字检索主要是指"文字的匹配",汉字可以简单地16bit匹配.
--
越南人
- (0 Byte) 2005-1-17 周一, 下午3:41
(96 reads)
显示文章:
所有文章
1天
7天
2周
1个月
3个月
6个月
1年
时间顺序
时间逆序
海纳百川首页
->
罕见奇谈
所有的时间均为 北京时间
论坛转跳:
您
不能
在本论坛发表新主题
您
不能
在本论坛回复主题
您
不能
在本论坛编辑自己的文章
您
不能
在本论坛删除自己的文章
您
不能
在本论坛发表投票
您
不能
在这个论坛添加附件
您
不能
在这个论坛下载文件
based on phpbb, All rights reserved.
[ Page generation time: 3.499085 seconds ] :: [ 27 queries excuted ] :: [ GZIP compression enabled ]