Post Slug似乎有点问题
每次我删除那一长串中文(%..符号组成的)的post slug之后,它又会回来。所以只好改成英文的。下面几个帖子的slug被我改了,如果你通过原来的链接来到这里,可能会看到空白页。
每次我删除那一长串中文(%..符号组成的)的post slug之后,它又会回来。所以只好改成英文的。下面几个帖子的slug被我改了,如果你通过原来的链接来到这里,可能会看到空白页。
这两天,MIT好像有点乱。事情的起因大概是这样的:MIT的网站主页很有特色,首页定期更新不同的话题。前两天,主页上宣传的主题似乎是关于MIT的开放式课程(OCW)的一个课程,名字是Visualizing Cultures,由John W. Dower 和Shigeru Miyagawa 负责。这个课程的网页还没完全完工,但大概是通过绘画作品来研究日本近代的发展。其中有一个部分叫做“脱离亚洲”(Throwing off Asia)。这个部分展示了日本浮世绘描写的中日战争(1894-95)的日俄战争(1904-05)。其中有些表现战争场面的的浮世绘引起了一些中国学生的抗议,比如这个页面中的这一幅。(我并没有亲眼见到宣传那个OCW的MIT主页页面,谁能给我个截图?)
我大致读了一下这几个OCW的网页。我不是历史学家,对其中的深层次问题不好说。不过,我觉得一幅画、一张照片或者一部电影的价值可能会随着环境的不同而改变。例如,在一个崇尚和平和人道的环境中,这个OCW网页中任何一个表现战争的浮世绘都会让观众想到当时日本的残暴。但是如果换个环境,比如让一群右翼分子来看,他们可能会高呼万岁。
我觉得,至少MIT在这个问题上可能没有考虑周全,这也就是为什么MIT在遇到抗议之后,才在那幅画上加了一个声明:“请注意:这里的一些图片是绘画,在本质上是暴力的,编入它们仅仅是为了学术分析。MIT、以及参与这个计划的教员不希望以任何方式认可所描绘的任何暴力行为。”
这个声明,似乎有点迟了。
Update:就在我写完这个帖子之后不久,这个关于Throwing off Asia的网站就暂时关闭了(有人保存了下来)。MIT的校方与中国学生和学者联合会见面之后,在网站上发布了一个声明。
《凉宫春日的忧郁》(涼宮ハルヒの憂鬱)及其后续小说是日本青年作家谷川流的校园幻想小说。最近因为它被改编成了动画而在国内变得热门起来。简单地概括一下这套小说的内容,就是一个叫做凉宫春日的女生有着奇怪的爱好,那就是找到宇宙人、未来人和超能力者,然后和他们一起玩。于是,她的身边就真的出现了宇宙人、未来人和超能力者……
……真是大杂烩式的设定啊。这套小说的类型比较接近于科幻小说,但是出版社似乎认为是奇幻。我倒是认为这完全是个校园青春小说,只不过借了“幻”的壳子。我听到有的读者说这套小说很有科学哲理。这样想是不妥的,因为谷川只不过是为了唬人而堆砌了一些科学名词、概念。比如小说里关于“人择原理”的叙述,其实和情节没有太大关系,而且还讲错了:
你听过人类原理这个名词吗?
没听过。
古泉突然发出换气似的笑声说道:
“总之,就是‘人类藉由观测才得以发现宇宙的存在’这样的理论。”
完全不懂。
“因为观测,所以才有宇宙的存在。总之,就是世上名为人类的知识生命体在发现许多物理法则和定律后,藉由观测了解宇宙的生成,并得知宇宙的存在。假设观测宇宙的人类和地球没有进化到目前这种程度,那么就无法进行观测,也无法发现宇宙的存在。也就是说不管宇宙存在与否,对没有进化到某个程度的人类来说都是一样的。正因有如此进化的人类存在,宇宙的存在才会为大家所接受。这就是以人类的角度思考得来的想法。”
“人类藉由观测才得以发现宇宙的存在”不是人择原理,听上去更类似于薛定谔猫佯谬一类的问题。那么,人择原理(小说译作了人类原理)是什么呢?简单地说,人择原理是一个经常出现在宇宙学领域的概念,它大致可以理解为,因为我们人类存在,所以关于宇宙的理论必须允许我们的存在。(韦氏大词典把它描述为“观测到的宇宙的状况,必须允许观测者的存在”)
你可以这样想。如果你有一天遇到了一个外星人(凉宫春日一定很高兴),外星人注意到了你的眼睛这种器官。那么外星人就可以推测,你们日常用来记录信息的符号(就是我们说的文字),应该不会每一个都有300米高,同时,它们也不太可能很微小,因为你的眼睛存在分辨率的极限。这就类似于人择原理想要叙述的东西。你的(眼睛)的存在限制了日常使用的字符的大小的可能性。
美国进化论生物学家古尔德曾经有一个著名的“就是如此”的理论。这个理论大致上是说,生物的某些结构“就是如此”偶然出现的,并无进化上的特定意义。古尔德拿圣马可大教堂的拱肩作为例子,说明拱肩只不过是建筑设计上的巧合(副产物),而不是特意设计的。对于生物,你如果问为什么骨头是白色的?实际上,骨头可以具有其他颜色,比如绿色、蓝色或者红色。白色的骨头颜色可能并无任何增加适应度的功能,它很可能不过是一个偶然的副产物。
与古尔德的理论不同,人择原理似乎是一个“为什么如此”的理论(当然,它们的适用领域可能不同)。然而,你或许会觉得人择原理有点滑头,它似乎不是一个真正的理论,而更像一个循环式的论证。事实上,人择原理在宇宙学中确实能够发挥作用。
人们通常把人择原理分为三种,弱人择原理、强人择原理和终极人择原理。这次我们主要来谈谈前两种。人们通常使用英国天文学家John Barrow等人提出的叙述:
弱人择原理:物理学和宇宙学的所有量的观测值,不是同等可能的;它们偏爱那些应该存在使碳基生命得以进化的地域以及宇宙应该足够年老以便做到这点等等条件所限定的数值。
强人择原理:宇宙必须具备允许生命在其某个历史阶段得以在其中发展的那些性质。
(摘自约翰·格里宾的《大宇宙百科全书》中文版)
假如有人对宇宙进行了一番观测(光学的、红外线的、微波的,等等……),得出结论说宇宙今天的年龄是5亿岁。那么从人择原理角度出发,这个结论可能是有问题的。原因如下:
我们是生物,
生物是有机的,
有机物需要碳元素,
碳元素需要由恒星的死亡来制造,
因此至少要等到宇宙的第一代恒星死亡之后,才能提供碳元素,
恒星的寿命有几十亿年,
所以今天宇宙的年龄至少应该有几十亿年。
于是,我们人类的存在,就给一种宇宙学理论施加了约束条件。如果有人来问“为什么引力常数是这个数值呢”的问题,那么你就有了“就是如此”之外的另一种选择。你可以说:“如果引力常数比我们现在测到的大,那么日地距离就可能不同,地球上也就没法留住液态水。并且,太阳的寿命可能缩短,在我们出现之前,它就烧死了。”
谷川流倒是在后面的文字中涉及到了一点:
“真是奇怪的想法!不管人类存不存在,宇宙就是宇宙啊!”
“没错。所以人类原理并不符合科学,不过是一种思索理论罢了。但是,这里头倒浮现了些有趣的事实。”计程车因红灯而停了下来。司机直视着前方,连看都没看我们一眼。
“为何宇宙会以适合人类生存的形态被创造?重力常数只要有一点点地差距,宇宙就不会是目前这个世界的样貌了。其他像是普朗克定数、粒子的质量比,简直就像为人类量身定做似地恰好符合某个特定值,才造就了世界及人类。你不觉得这非常不可思议吗?”(引文皆摘自《凉宫春日的忧郁》pp216-217 )
然而,最后这段话似乎表明了他实际上没有弄懂什么是人择原理。
从东清彦的blog上看到,《四叶妹妹!》的第五卷将在本月底出版。
经典对话:
美丽:那你算是人吗?是Homo sapiens吗?
(大而无当的)巨无霸:我是人啦,是Homo sapiens啦!
(摘自第3卷)
另外,在同一卷中,三姐妹中的大姐朝仪小时候给妈妈找到了一个四叶三叶草,结果妈妈非但没收下,反而让朝仪去找五片叶子的三叶草。嗯,果然还是小时候比较可爱……不对!我想说的是,其实五片叶子的三叶草与四片叶子的出现机率差不了太多。当然,四片叶子的三叶草的出现机率大约是1/10000……
首先来看看下面的两句话:
小李告诉小王,这条信息已经加密了。
Bob told Alice that the message has been encrypted.
这两句话分别是由汉语和英语写成的,你可以很容易看出它们的相似之处,甚至它们之间可以做简单的词对词翻译(汉语和英语都是SVO结构的)。但是不同之处在那里,你可能会说名字不一样,或者汉语没有动词时态的变化。你说的对,但是你可能没有注意到汉语和英语以及其他拼音文字的一个不同之处。如果我把上面两句话写成下面的形式,你可能就会发现:
小李告诉小王,这条信息已经加密了。
BobtoldAlicethatthemessagehasbeenencrypted
一个熟悉英语的人,如果花一点时间,仍然可以读出第二句的意思。但是如果一整本书都用着这方式写成,那么它对我们所有人都是一场灾难。现在你应该发觉了,这个不同之处就是:汉语似乎没有空格的概念。
我把它称作熟悉的麻木。当我们书写汉语的时候,我们不会考虑空格。为什么?回想一下,似乎从我们上小学的时候,老师就教给我们一个接一个地连续书写汉字从而造句。当我们有能力阅读印刷品之后,我们读到的也是连续书写的汉字。简而言之,这是一种习惯。把所有空格都扔掉的英文是一场灾难,但是没有空格概念的汉语的文字却很少对我们的日常生活产生什么负面的影响。你可能会说,这是因为每个汉字都是正方形的,我们很容易把一个字和另一个字分开。除非你遇到了猫扑式的“走召弓虽”或者“女口果人尔能看日月白这段言舌,那言兑日月人尔白勺目艮目青有严重白勺散光”这样的句子,幸运的是它们并不常见。(正方形并不总是有效,比如“同学会同意这种做法”,主语到底是“同学”还是“同学会”呢?有时候,我们在生活中会被这种歧异所困扰。)
从汉语言的演化历史中,可以理解为什么汉语没有空格的概念。在古代汉语中,人们基本只用单个字来代表一种意思。古代汉语单字词的支配地位,可以从古文中轻易地看出。随便从《左传》中摘录一段:“夫战,勇气也。一鼓作气,再而衰,三而竭。彼竭我盈,故克之”,这里面几乎每一个字都是词(一鼓作气后来才成为成语)。这时候,词就是字,而字是方形的,很容易切分,也就不需要空格。
随着社会的发展,这种用单个汉字表意的做法逐渐遇到了困难。新概念新事物层出不穷,就需要新的字来记录。然而字符集不能无限增长,原因也很简单:没有多少人能记住那么多字。东汉时代的《说文解字》收录了将近1万个小篆汉字,20世纪90年代,人们对汉字加以搜集整理,出版的《中华字海》收录了8.5万多汉字。对于我们现代人,这部《字海》里的90%以上的汉字都死了。一个必然的选择是,用汉字组成双字词或多字词,在不增加汉字的情况下,扩充词汇数量。时至今日,汉语词汇中的双字词数量已经超过了单字词的数量。
回到本文最初的例子上来。我们能够理解“小李告诉小王,这条信息已经加密了”这句话,在根本上并不是因为汉字是正方形的,而是因为我们的大脑“人工”“智能”地对这句话进行了处理,把它切分成了“小李 告诉 小王,这条 信息 已经 加密 了”的形式。儿童是语言学习的大师,我们从小就学会了自动切分句子从而正确地读出句子的含义。对于外国汉语初学者,这确实会令他们产生一定的困扰,因为这种学习者大多已经不是儿童了。
无论如何,我们还能应付这种情况。但是当我们进入信息化时代之后,我们这些使用汉语的人就遇到了一个很大的麻烦:计算机的如何对句子中的汉语词进行切分?而这种切分对于计算机有效处理信息是至关重要的。Google的科学家吴军介绍了用数学对汉语信息进行处理的一些方法(1 2 3),而对自然语言进行处理,就需要建立在词的基础上。
你可能听说过Google和它的竞争对手Baidu在中文检索能力上的一些争论,其中一个争论就是关于中文分词能力的问题。分词,就是把一短汉语以恰当的方式切分成词。我本人不太清楚两者谁的分词能力更好,但是这个问题肯定会影响到检索的效率。
20世纪80年代,北航的梁南元在《书面汉语自动分词系统》这篇论文中提出了一个基本的汉语书面语分词方法,也就是用查字典的方法切分句子。他在这篇论文中写道:“1982年,北京航空学院计算机科学与工程系曾经作过一次试验,三十余个具有高中毕业文化水平的青年对五百字的一个语言材料人工分词,同一率只有50%左右。经过短期培训后,同一率也只能达到80%左右。”
吴军在Google黑板报上的文章讨论的是如何用计算机自动分词(也正是这篇文章激发了我的这篇)。但是分词不仅仅涉及到Google。在关于汉语拉丁化的讨论中,分词也是一个重要的问题。
这个问题最初被称为“词汇连写”,后来又称为“词儿连写”,现在通常称作“分词连写”。分词连写对应的就是不分词连写。
很显然,“小李告诉小王,这条信息已经加密了”这句话对于把汉语作为母语的人是很容易理解的。写成“小李 告诉 小王,这条 信息 已经 加密 了”似乎有点多余。但是如果把这句话写成拉丁字母的形式,我们可以写成:
xiao li gao su xiao wang, zhe tiao xin xi yi jing jia mi le.
xiaoligaosuxiaowang, zhetiaoxinxiyijingjiamile.
Xiao Li gaosu Xiao Wang, zhe tiao xinxi yijing jiamile.
(以上都省略了声调符号)
第二种形式几乎也是一场灾难(我找一位朋友试着读这句话,他读出来了,但是速度很慢。你可以想象整本书都这样写的后果);第一种也遇到了类似的困难。
第三种方法就是我们说的“分词连写”,即用空格分开一句(用拼音记录的)话的各个词。
分词连写是汉语拉丁化首先要解决的问题之一。有趣的是,尽管20世纪80年代以来,汉语拉丁化的热度降低,汉语拼音的分词连写却得到了发展。1996年,中国公布了《汉语拼音正词法基本规则》的国家标准(GB/T16159-1996)。这个标准说:
本标准规定了用《汉语拼音方案》拼写现代汉语的规则。内容包括分词连写法、成语拼写法、外来词拼写法、人名地名拼写法、标调法、移行规则等。为了适应特殊的需要,同时提出一些可供技术处理的变通方式。
本标准适用于文教、出版、信息处理及其他部门,作为用《汉语拼音方案》拼写现代汉语的统一规范。
注意,它的名称使用了“正词法”,而不是“正字法”,这表明它强调的是分词问题。进行分词连写处理之后的汉语拼音句子,为汉语的拉丁化提供了一个基础。这部国标或许可以看作汉语拉丁化的最新发展。
即便你不热衷于汉语拉丁化,这部《汉语拼音正词法基本规则》仍然为你提供了一个切分汉语词的统一标准。记住,分词对于处理汉语信息,是很重要的。
顺便说一下,有些港澳人士常常用汉字简化过程中合并了某些字作为攻击汉字简化的弹药,这种以偏概全的攻击恰恰忽视了现代汉语的一大特征,那就是汉语的词汇中占多数的是双字词。“出发”和“头发”两词中的fa在繁体字符集中是两个不同的字,但是在实际使用中,这两个字的合并并不会造成说话者和听话者的困扰,因为汉语是以词的方式运作的。
1:1 起初有人创造了电脑;
1:2 电脑都是混沌空虚的字符界面,对于一般人而言,用起来不太方便;
1:3 Jobs说,要有图形界面,于是就有了图形界面;
1:4 Gates见图形界面是好的,就开发了自己的图形界面OS;
1:5 人们把原来的称作Mac OS,后来的称作Windows;
1:6 Gates说:“天下的电脑都应该是用这种图形界面,使蓝屏出现!”事就这样成了。
1:7 电脑预装了Windows,各种图形界面软件。Gates看了认为好。
1:8 老章看了人人都因为图形界面而会用电脑,心中十分喜悦;
1:9 老章说:来,既然大家都会用电脑了,让我们回到字符界面吧!
Reference:http://yanfeng.org/blog/569/#comment-25554 (last access: Apr 21, 2006)
本周的Science刊登了一篇关于环境科学和blog关系的文章,作者是牛津大学环境中心的Alison Ashlin和Richard Ladle。他们在文章中首先谈到了blog正在成为越来越流行的一种现象,blog的数量每5个月就会加倍。一些blog使用者对Blog上的文章的信任程度甚至超过了传统媒体。
但是,blog文章的准确性如何呢。这两位作者作了一个调查。他们说,根据Google Blog搜索引擎,目前大约有40万个讨论关于环境和保护问题的blog(当然,应该是指英语的)。他们检查了一个关键词,那就是全球物种的灭绝率。这个数字不太确定,但是公认大约是每天灭绝74到150个物种。他们用extinct per day和extinct every day作为关键词检索出了30个相关的blog。
结果,他们发现,这些blog对于全球物种灭绝率的描述参差不齐。他们在文章中写道:“我们所检查的blog中有大约40%认为灭绝率大于200/日。日灭绝率数字的范围从1跨越到了1000!”
可见这科普的工作还是任重道远啊。这两位作者说,科学家常常纠正传统媒体的错误,但是许多还没有意识到blog上关于科学的讨论,“如果环境科学家忽视了blog这类网络交流平台,在这个地球资源不断减少的关键时刻,我们就面临着创造出一代环境文盲的消费者和选民的危险”。
他们对科学家提出了几个建议,并且认为这些可能适用于所有的学科。
首先是对于科学家个人,环境科学家应该积极地参与到书写blog中来,从而让blog圈中增加那种“informed opinions ”。我把它换句话说,就是:如果事实缺席,那么谎言就会充斥。这让我想到了去年的所谓圆明园事件。一个八卦假教授(1 2),忽悠了整个中国。理性的声音(1 2 3)完全被淹没在了一种狂热的情绪中。(见xys关于圆明园事件的专题)
其次是对研究团体,blog可以作为讨论新想法和发布研究成果的渠道。第三,blog还可以用来报道和评论国际性的学术会议。第四,在野外工作的环境科学家还可以用blog实时地与别的科学家分享他们的职业技能。随着无线通讯手段的发展,这种在地球角落上写blog的事情并不困难。
最后,两位作者认为,对blog采取一种审稿机制是不必要的,环境科学家“有责任在环境辩论中提供知情的见解,并在blog圈中发展出一种集体的存在。这样,就可以增加blog的内在可靠性。”
这几天,得克萨斯大学奥斯汀分校的Eric Pianka搅乱了半个地球。今天下午,当我登陆MSN Messenger的时候,它的“今日焦点”窗口里的头条新闻就是这个:《专家提出消灭人口救地球》。
好吧,既然它来到了中国,我们就来谈谈这件事。简而言之,上个月Pianka在St. Edward’s 大学作了一次演讲,在演讲中他提到了地球上的人口已经太多了,过多的人口可能会因为疾病的流行而大量死亡。他认为埃博拉病毒如果突变出空气传染的能力,它就可能杀死世界人口的90%。
作为一个生态学家,他的观点是世界人口的增长需要控制。然而,聆听这次演讲的另一个人,Forrest M. Mims 却不这么认为。Mims认为Pianka是在鼓吹科学家制造生物武器去消灭世界人口的90%。随后他两次上书得克萨斯科学院(TAS),强烈反对TAS授予Pianka 2006年得克萨斯卓越科学家荣誉。Mims把Pianka称作“毁灭博士”(Dr. Doom)。他与Pianka进行过邮件沟通,然而他始终认为Pianka是要毁灭世界。
终于,在本月2日,Gazette-Enterprise of Seguin这家报纸刊登了一篇题为UT professor says death is imminent的报道,把Mims对Pianka的置疑捅了出来。然后,这个话题立刻传遍了美国,再然后……就是这样,你在中国也看到了它。
但是,我们需要注意,这个事件的真正主角不是Pianka,而是Mims。他似乎是为数不多认为Pianka在鼓吹对全人类进行大屠杀的人。Pianka本人认为他的演讲被扭曲了,他说他只是警告人们,如果人口增长不加以控制,致命的疾病流行就是一个威胁。见这篇报道:
However, Eric Pianka says his remarks about his beliefs were taken out of context, that he was just raising a warning that deadly disease epidemics are a threat if population growth isn’t contained.
"What we really need to do is start thinking about controlling our population before it’s too late," he said Monday. "It’s already too late, but we’re not even thinking about it. We’re just mindlessly rushing ahead breeding our brains out."
我认为Pianka的解释是可信的。作为一个科学家,公然鼓吹用生物武器杀死地球90%的人口,这是很难让人相信的。你也可以读读他的主页上的一篇关于人口的文章。从中看不出Pianka在鼓吹大屠杀。他可能确实说了“HIV太慢了,它不够好”这句话。但是这句话更可以理解为他的一种幽默,而不是真的要去杀人(HIV本身确实是毒力比较弱的病毒)。不幸的是,离开了当时的语境,他的话就容易产生误解了。
Pianka关于人口的思想并非什么新鲜的事物,18世纪末英国的马尔萨斯就曾经在他的小册子《人口原理》中提出,人口以几何级数增长,而食物的产量却以算术级数增长。如果人口不加人为控制,各种灾难(比如贫穷,战争、瘟疫)就会削减人口。
我的电脑显示器出了点故障,先写到这里。这件事似乎可以和老冯提到的“30种颜色”相类比。