海纳百川 :: 阅读主题 - 刚才仔细看了一下启明转贴的那个文章，刚看了一点，我就不懂了。

海纳百川

登录 \| 登录并检查站内短信 \| 个人设置	网站首页 \| 论坛首页 \| 博客 \| 搜索 \| 收藏夹 \| 帮助 \| 团队 \| 注册 \| RSS


	主题: 刚才仔细看了一下启明转贴的那个文章，刚看了一点，我就不懂了。

printer-friendly view

海纳百川首页 -> 罕见奇谈

阅读上一个主题 :: 阅读下一个主题

作者

刚才仔细看了一下启明转贴的那个文章，刚看了一点，我就不懂了。

所跟贴

刚才仔细看了一下启明转贴的那个文章，刚看了一点，我就不懂了。 -- Anonymous - (907 Byte) 2005-1-14 周五, 上午11:39 (525 reads)

黄药师

加入时间: 2004/02/14
文章: 999

经验值: 116

标题: 这么简单的问题没看明白，实在难以理解如何攻读数学博士学位 (197 reads) 时间: 2005-1-14 周五, 下午12:18

作者：黄药师 在罕见奇谈发贴, 来自 http://www.hjclub.org

那篇文章毛病甚多
比如：
例如英文，一共有26个字母字符，大小写和各种标点符号都算上，只要90字节左右就够了，不到中文字符消耗的千分之一。
=========================================================
这里千分之一显然计算错误，应该是百分之一。这个错误虽说不上多严重，但反映出作者文风的不严谨。

不过你说的问题很容易：
1 汉字的计算方法与英语类似，比如“的”的频率远高于其他汉字，类似于e.把几千汉字的使用频率统计出来再套用那个公式就成了。
2 H = - E（n， r=1） LOG （2） P （r）
这里 E显然是求和符号（西格马），r 是某个特定的字符。p(r)就是那个字符的使用频率（介于0和1之间），n在拼音文字中比较固定，比如英语是26，俄语是33（对么？没学过俄语，呵呵）...至于汉字则比较复杂了，不过原文说的很清楚，作者采用的是12366个汉字的数据。

作者：黄药师 在罕见奇谈发贴, 来自 http://www.hjclub.org

阅读会员资料

黄药师离线

发送站内短信

看表达就知道，什么第一个结果，第二个结果， -- 冬冬 - (18 Byte) 2005-1-14 周五, 下午12:35 (139 reads)

更正：什么叫第一个结果的概率，第2个结果的概率？ -- 冬冬 - (21 Byte) 2005-1-14 周五, 下午12:36 (99 reads)

这就不一定了，关于汉字， -- 冬冬 - (64 Byte) 2005-1-14 周五, 下午12:28 (139 reads)

你怎么这么笨啊 -- 黄药师 - (168 Byte) 2005-1-14 周五, 下午12:36 (161 reads)

我是这样想的， -- 冬冬 - (116 Byte) 2005-1-14 周五, 下午12:48 (134 reads)

另外 -- 黄药师 - (167 Byte) 2005-1-14 周五, 下午12:56 (141 reads)

你说(的)出现频率是0.08等，你是怎么知道的？ -- 冬冬 - (0 Byte) 2005-1-14 周五, 下午1:01 (120 reads)

你这不是抬杠么 -- 黄药师 - (54 Byte) 2005-1-14 周五, 下午1:03 (144 reads)

我不是抬杠，我以为你真知道呢 -- 冬冬 - (0 Byte) 2005-1-14 周五, 下午1:07 (93 reads)

我并没说那文章没有问题啊 -- 黄药师 - (31 Byte) 2005-1-14 周五, 下午12:52 (129 reads)

随你怎么说吧，不过我真是不明白什么第一个结果的概率这样的话 -- 冬冬 - (0 Byte) 2005-1-14 周五, 下午12:58 (118 reads)

作者说的不严谨，但作为有点数学修养的人士 -- 黄药师 - (29 Byte) 2005-1-14 周五, 下午1:01 (138 reads)

我确实没看明白,随你怎么说吧，我不辩解 -- 冬冬 - (0 Byte) 2005-1-14 周五, 下午1:06 (118 reads)

没什么，不过现在总该明白了吧 -- 黄药师 - (0 Byte) 2005-1-14 周五, 下午1:10 (132 reads)

现在明白了，可是这也不是改汉字的理由呀， -- 冬冬 - (58 Byte) 2005-1-14 周五, 下午1:15 (120 reads)

汉字改不改我可管不着 -- 黄药师 - (141 Byte) 2005-1-14 周五, 下午1:25 (139 reads)

还有个问题，与数字无关的，文章说联合国5个工作语言里，有俄语吗？ -- 冬冬 - (13 Byte) 2005-1-14 周五, 下午12:32 (122 reads)

最初是英语，俄语，法语，汉语，西班牙语 -- 黄药师 - (33 Byte) 2005-1-14 周五, 下午12:42 (126 reads)

嗯，多谢 -- 冬冬 - (0 Byte) 2005-1-14 周五, 下午12:51 (94 reads)

显示文章:

printer-friendly view

海纳百川首页 -> 罕见奇谈

所有的时间均为北京时间

您不能在本论坛发表新主题
您不能在本论坛回复主题
您不能在本论坛编辑自己的文章
您不能在本论坛删除自己的文章
您不能在本论坛发表投票
您不能在这个论坛添加附件
您不能在这个论坛下载文件

based on phpbb, All rights reserved.

[ Page generation time: 0.804881 seconds ] :: [ 23 queries excuted ] :: [ GZIP compression enabled ]