» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

博大精深的汉语却无那般的精准

说来说去,你还是自己兜圈回避问题

我的问题:

你一开始说的是很多方面,“很多”这个形容词,请问我们可不可以理解为多数情况下?

而你举出的例子,没有一个证明“很多”,紧紧局限于你接触的日文原生(注意还不是中文原生)游戏具备或漫画,这么窄的局限性,我们先不去考究文字,你如何证明“很多”?
而我给出的“很多”中文例子,你无法用日文去表达意境,这是不是事实?

既然这么多中文无法用日文准确表达,那“很多”又怎么能成立呢?

你一直没正面去回答,而是用理解“很多”需要有日语知识,实在很难让人信服。

而你有一直嘴硬不肯修改观点,改为你自己的中文表达能力比日文差,或者是动漫领域表达日本人青涩感情的方面日文比中文强,同时一再自封没人推翻你的观点。

我只能觉得囧


TOP

引用:
原帖由 kyosuke2004 于 2007-5-22 17:21 发表

你需要看完整个帖子中我所有的回复。
您可以总结下,我没有爬楼的习惯。
这样更利于交流,不是吗?



TOP

引用:
原帖由 村上春樹 于 2007-5-22 17:00 发表
kyosuke2004 轉了一大圈,為何不拿日本文學大家的小說原文與華文出版譯者的內文作參考?

我前面有貼村上春樹小說的原文與華文翻譯,人家好歹也作了十幾年的村上文學翻譯,要比中文
能力與日文水平絕對有資格從作品來評判"中文是否可以實現日文的意境"。

再說你拿的還是文學界根本談不上認可的ACG文學,村上春樹在日本作家中使用語言的精煉程度與
表述現代人情感的失落與孤絕獨樹一格堪稱最高。如果中文都可以在某程度(翻譯本身就會磨損原意)
上對日本現代文學最高一人之一的作品實現高度的契合,這將更突顯得你自顧自拿著不成氣候的中文
解讀日文段落,大唱"日文表述情感勝於中文"的荒謬與突兀。
是因为我现在对那方面接触少了。

是的,我说过,一定程度上可以互换的,这帖中我也说过情况并非绝对,这一点本帖中我已经很多次提过了,从最早我帖我的一堆翻译的地方开始。

未必,你太小看ACG了。日文表述情感胜中文也是看情形的,并不是所有方面完胜,所以我说不是绝对的。


TOP

引用:
原帖由 借酒一杯. 于 2007-5-22 17:24 发表


您可以总结下,我没有爬楼的习惯。
这样更利于交流,不是吗?
我已经一遍又一遍的提过了,还是请你自己去看吧,我有些累了。

TOP

引用:
原帖由 流川枫 于 2007-5-22 17:23 发表
说来说去,你还是自己兜圈回避问题

我的问题:

你一开始说的是很多方面,“很多”这个形容词,请问我们可不可以理解为多数情况下?

而你举出的例子,没有一个证明“很多”,紧紧局限于你接触的日文原生(注意还不是中文原生)游戏具备或漫画,这么窄的局限性,我们先不去考究文字,你如何证明“很多”?
而我给出的“很多”中文例子,你无法用日文去表达意境,这是不是事实?

既然这么多中文无法用日文准确表达,那“很多”又怎么能成立呢?

你一直没正面去回答,而是用理解“很多”需要有日语知识,实在很难让人信服。

而你有一直嘴硬不肯修改观点,改为你自己的中文表达能力比日文差,或者是动漫领域表达日本人青涩感情的方面日文比中文强,同时一再自封没人推翻你的观点。

我只能觉得囧
很多,就是很多,小到词上的つっこみ,大到表现上的“侧敲旁击”,分别到描写各种情况的“副词”、形容词、形容动词等等等等,形象上到意境、情感的表达上。

古池やかえる飛び込む水の音

青蛙跳入水塘,激起“扑通”一声水的声音。

[ 本帖最后由 kyosuke2004 于 2007-5-22 17:33 编辑 ]

TOP

某K真牛B,难道是象辜鸿铭那样的语言天才?

TOP

如果有人拿中文的高度修辭原文來相比日文,當日文缺乏某些"對映"可加以重現時,這是否
也代表日文在某些地方上有所不足呢?問題是這種不足有什麼實質意義?真的代表了在一
廣度上的情感集合上都會顯示某語言的表現力不足?

語言沒有完美無瑕的,文學的養成與作家深受文化涵養的影響有關。「翻譯」的本身就是一
種「意象磨損」(理解不一)並加以「反純化」(參入譯者文筆的成分)的過程。你理解一個科
學定理,每個人就語言而非數學算式與符號上的的表述方式也有不同。

如果譯文在意境上能達到高度契合,那我想這可以認為兩者已經實現高度的表述契合。如
果真的還要比日文與中文在表述能力上的差異,拿性質類似的中文日文兩篇原文同列,讓
讀者自己心神領會,看那語言究竟實現的多少的穿透力與共感才是評判標準。

堅決反對以「譯文」形式來當作絕對的語言表述高下評判標準。

[ 本帖最后由 村上春樹 于 2007-5-22 17:35 编辑 ]

TOP

引用:
原帖由 kyosuke2004 于 2007-5-22 17:28 发表


我已经一遍又一遍的提过了,还是请你自己去看吧,我有些累了。
我好崇拜你呀,被战了一下午只是“有些”累……体力和神经强壮炫耀帖

TOP

(转帖)为什么汉语的思维速度比其他语言快? [裙裾飘飘] 于:2003-11-03 12:47:08


中国人心里有这样一种成见;认为汉语迟早要被英语所淘汰。记得有一次,大概是胡
野碧在辩论时干脆把它清楚地说了出来。前几天‘世纪大讲堂’请了一位学者李锐也认为
全球化的结果是让英语统治世界。只有阮次山在一次‘大时代,小故事’中谈到汉语的思
维速度比英语快。但是,他又提出一个问题;既然由于汉语使用了‘声’使得汉语的思维
速度比英语快,那么,由于广东话中的声比普通话多,是不是广东话的思维速度比普通话
更快呢?我的回答是,广东话虽然使用的声调多于普通话,但是,广东话有两个缺点,第
一、它的文字规划得不好,文字表达欠佳,且有闭音节的声音存在。第二、它的声音利用
率不高,普通话有21个声母、35个韵母和四声,连乘的结果是2900个声音,但是能够被利
用的是2500个,而真正被用到普通话中的仅1200个。广东话有九声,即使它的声母和韵母
与普通话一样多,那么它实际使用的声音也应该是普通话的两倍多才对,但是,广东话中
实际使用的声音仅有1500个,与普通话相差不多,而它的利用率比普通话小了几乎一倍。
利用率小,就说明难学。因为同样的一个声母或韵母,每次的使用实际上也是一种练习的
过程,利用率高的声母或韵母必然容易记忆、容易掌握。日常生活中也可以看到,凡是常
用的语言元素,包括声母、韵母、汉字和单词等到,越是经常使用的越容易掌握。语言的
好坏其实取决于两个方面,第一、是不是能够用很少的记忆来掌握,第二、是不是能够在
有生之年掌握到比其他人更多的知识?用一句极限的话来讲应该是:最好的语言是不学而
知,但是所掌握的知识又最多的语言,或者说,学少而知多的语言。

  英语与普通话相比则不同,国际音标中,英语有20个元音和20个辅音,所以英语的声
音种类不会超过20×20=400个;反过来说,不在这四百个声音之内的任何声音都不被英
语所承认,或者被认为是不正确的发音;这里所说的不是‘音节’。比较一下就会看出,
汉语的发音种类是英语的3倍,两者的比值远大于广东话与普通话的比值。

  下面要说一下,为什么声音种类越多,思维速度就越快。这个问题,去年我在‘北大
中文’论坛讨论了一个月才使大家弄清楚,在这里我希望尽量说得简单。假设有一个仅会
发两种声音的人,具体地讲,他就会发A和B两个音。根据电脑的理论,我们知道,他用这
两个符号依然可以表达整个世界。再假设,世界上仅有400种事物需要表达,那么,一个
英国人可以用每一个发音来表达400种事物中的一件,而仅会发两个声音的人,有时就不
得不用九个发音来表达400种事物中的一件,因为二的九次方才大于400。比如,英国人用
‘I’代表‘我’而仅会两个声音的人可能要用ABBABABBA代表‘我’这个概念。一般人每
发一个声音大约需要消耗四分之一秒的时间。比较两者就会看出,仅会两个声音的人,不
但表达得慢,而且还费力气。在表达‘我’这个概念的时候,英国人使用四分之一秒的时
间,而仅会两个声音的人使用了二又四分之一秒。如果两个人总以这样的比例生活一辈子
,他们一生中所享受到的所有信息将是它的反比9:1。实际的情况中,最明显的是日语与
汉语的对照,我们知道,日语使用了100种不同的声音,而汉语使用了1200种声音,因此
很多汉字让日本人一念就必须用两个或者三个声音来表达。我们假设日语中所有的字都用
两个声音来表达,那么岂不是说,日本人一生所能够享受到的信息仅仅是中国人的一半吗
?我曾经思考过,这是不是与日本历史上从来没有出现过伟大的思想家有关。我们知道,
思维实际上是一种心里说的过程,如果在说话时表达得快,那么,思维的速度也应该跟着
快。具体的例子是赵元任曾经比较用英语和汉语背诵乘法口诀的速度,汉语使用了30秒,
而英语使用了45秒。因此,如果两个人同时用英语和汉语来背诵的话,到了30秒的时候,
汉语使用者一定想到了九九八十一,而英语使用者则一定到不了这里,说不定,他想到的
仅仅是七七四十九。这就证明了使用发音种类多的语言比使用发音种类少的语言思维速度
快。这一点曾经被国、内外许多学者所证实。至于思维速度快是否就代表聪明这个问题是
被很多学者所承认的。

  我的证据是解释一个历史上的‘谜’古希腊人为什么比其他人更聪明?因为希腊的文
化来自古菲尼基人,我们知道菲尼基人发明了人类的拼音字母,就声音的分解来说,这是
一大进步,就思维速度来说,它是一大倒退。因为,为了筛选容易区分的声音元素,菲尼
基人仅仅使用了22个辅音,这样,它的表达速度当然比现在任何语言都慢,而希腊人则采
用了元音,我们知道元音与辅音结合以后,声音种类等于增加了好几倍。事实上,菲尼基
人的声音中也有元音,否则他们是发不出来的。所谓的22个辅音是说他们仅承认这22个辅
音为信息栽体,也就是,ma、me、mu、mai、muo在他们的耳朵里与一个M没有任何区别。
就像me的四种声调对于英国人来讲没有任何区别一样。由于声音种类的突然增加使得希腊
人的思维突飞猛进,造成了后来的现象。论坛上曾经有人问汉语的声音种类依然多于英语
,为什么没有英国先进。我的回答是,当声音种类突然增加的时候就有新思想出现,反之
,当声音种类减少时,思想就趋于保守,而元朝以后,中国的声音中失掉了一个‘入’声
,中国的衰弱正巧从那时开始。最后,在讨论尼安德特人的时候,人们也发现,使用声音
种类少的人种会被历史淘汰。

  我之所以认为汉语必定战胜英语的根据还不在这里,关键是要解决人类目前所面临的
知识爆炸问题。我们知道,目前的英语单词包括各种生物名称及专利发明的新术语已经超
过了数百万,如果考虑到英语中有一些可以推导和联想的成份;比如前、后缀和复合词等
,它所需要记忆的基本单词也有一百万个。而所有这些单词在汉语中都可以用四千个汉字
来表达。根本的原因还是英语的发音种类不够。

  比如pork这个词,在英语中代表猪肉,它和猪pig、肉meat没有任何关系而仅仅代表
它们的一个联合体而已,如果把猪肉pork、羊肉mutton、牛肉beef、猪油lard、羊油suet
和牛油talon放在一起进行比较的话就发现,英语中所有的联体词都是一个与其中任何一
个分解词毫无关联的新符号,而它们却构成了英语词汇的主体,英语中几百万的单词就是
这样来的。它的根本原因是由于如果将pork改成pig和meat连在一起的形式,那么就要发
音四次而pork仅仅发音两次;所以联体的词能够节省发音却要增加记忆,而分体的词,无
需记忆可是却增加了发音次数。设想,一位屠夫,每天要用到‘猪肉’这个词上千次,使
用两次发音的单词要比使用四次发音的词节省两千次发音,何乐不为?但是遇到不常用的
词的时候,英语还是和汉语一样,使用分解的词,比如驴肉就用donkey meat来表达。因
为不常用的词,即使设立了符号形式,别人也记不住。汉语能够将英语中联体词汇分解的
功能,非常有用,它使所需要记忆的词汇大大地减少;不仅如此,它还能够将词汇在人们
头脑中的位置整理得清清楚楚。达尔文主义的诞生就是建立在林奈的双名法的基础之上的
,这种方法使得各种印象在脑子中由原来的平面,变成立体的。比如,在林奈以前,人们
给所有的生物一个名字,结果,由于种类太多,同一种生物可能有两种名字,而另外的生
物,可能没有名字。林奈则将所有的生物先分类,并且给出一个类名,然后在类名的下面
放一个词,两者组成双名法的名字。这样不但清晰,而且大大的减少了需要记忆的符号;
比如原来有一万个名字,现在分成一百个类,又在每类中分成一百种,我们所需要记忆的
仅仅是一百个类名和一百个种名,共二百个,而不是原来的一万个。随着知识爆炸的问题
逐渐恶化,人类就有必要将其他的术语也仿照这个方法改造,而目前唯一的办法就是按照
汉语的结构进行改革。而原因还是在于发音种类的数量。

  这个现象最先是德国的莱布尼兹体会到的,他认为汉语是自亚里士多得以来,西方世
界梦寐以求的组义语言。但是,他没有看到声音的真正特性,却由于汉字的数量上的性能
而定义汉字是世界上最先进的文字。我想,如果他看到今天知识爆炸的世界,他一定会要
求世界上所有的国家废除拼音文字而采用汉字。

  最后,谈一下关于人的一生中到底能够记住多少单词或符号的问题。中国人所使用的
汉字通常在三到四千,而莎士比亚时代的英语仅有三万个单词,他本人能够全部掌握。但
是,到了丘吉尔时代,他的单词量依然是三万个,可是,那个时候的英语已经拥有近百万
个单词了。所以,我认为,莎士比亚使用英语单词的熟练程度是后人根本无法达到的。我
曾经在网上向很多英语中高等教育的语言机构请教,到底学习英语应该掌握多少单词才成
,但是,他们的回答总是含糊不清,或者扯一些别的东西。后来,在一些无法避免这个问
题的文章中我发现,语言学家们对于英语单词的要求是:一个受过教育的英语使用者应该
掌握五到二十五万单词,不但差距范围很大,而且,用这个标准来衡量,莎士比亚和丘吉
尔都应该是文盲,至少是没受过教育的人。我认为,这是任何推崇英语的人的软肋,只要
他们能够躲过别人问这个问题,其他的方面 ......

  我的观点曾经在北大中文网上讨论过。但是,可以看得出来,不知道的人还有很多,
他们都认为自己是劣等民族和劣等文化。所以,在鼓舞中国人的信心方面还有很多事情要
大家努力。其实,只要大家能够恢复信心,中国人在很多事情上早就应该领先于世界的。
可是我们太爱钻牛角尖,总是当外国人设立一套标准的时候,我们拼命地追呀赶呀。为什
么,我们自己不能够设立标准,也让他们换换口味?我记起几年以前,西方国家有一个喜
欢指手划脚的毛病,那时,我也有一个毛病--喜欢掣肘拖腿。美国有一份COX报告,内
中例举了大量的对比,用以说明中国人不可能通过三、四十次的核实验取得与美国一千多
次核试相同的成果。唯一的解释就是中国盗窃了美国技术。有人也称这次事件为李文何事
件。我那个时候给美国所有的参议员各发了一封电子信件。内容是说,如果他们希望彻底
调查此事,就应该设立另外一个调查小组,好好研究一下汉语和英语在思维上面的差异。
只有这样才能够弄清楚,为什么中国三、四十次的核试所取得的进展与美国一千多次核试
的进展相差无几。在信的后面又附上了我的对于两种语言对比的计算书。后来,接到了不
少回信,要求我告诉他们我的真实地址才肯继续考虑。

  ……我也明白,不会有哪个美国参议员会提出任何有关的议案的,因为,任何有关议
案的提出,其本身都是对于汉语的一种变相宣传,都是对于英语的贬低。没有任何美国人
愿意辩论它。道理非常明显,如果辩论下去,必然牵扯到语音和语言学中的诸多问题,每
一个问题都是他们的一块伤疤。目前,美国一直要求中国降低人民币汇率,但是,态度依
然没有超出礼貌的范围,所以,这套理论还不适合。一旦他们超出了理性,那么,非常容
易扯到语言学的问题上来。换句话说,是:由于英语的思考范围狭窄,所以不能够从更加
长远的利益来考虑问题。但是,这话我还不敢说,至少不敢对美国人说。因为我是学工科
的,工程上的事情我有点把握,可是一碰到经济问题,我心里没底。

  类似的事情还有就是找世界语BBS进行辩论。谁都知道,世界语实际上是将英语改头
换面设计的语言,当然不懂得使用‘声调’。我的问题是,英语的单词已经远远超过了常
人的记忆极限,世界语有什么办法弥补这个缺陷吗?当时有人回答我说,世界语中使用派
生的结构比英语更加明显。可是,当我将汉语中的声音种类,以及‘声调’的利用方法向
他们解释以后,再也没有人发言了。

  还有就是美国有一个‘只说英语运动’English Only曾经向全世界争求意见。可想而
知,我的意见是什么了。我告诉他们,你们一意推行英语实际上是将美国文化推向深渊,
是在摧毁美国文化。拯救你们的方法只有重新选择一门带有‘声调’的语言。对于这些没
学过汉语的人来说,他们一般不懂得什么是‘声调’,所以,只好用唱歌时候的音阶来向
他们解释;任何一个英语‘音节’都可以跟随音阶变化出至少八种不同的声音,这和‘声
调’的作用差不多。上述所说的实际上就是美国人的软肋,没有必要的话,我是不会乱碰
的,影响团结。而且,随着中国国力的增加,我们可以说的也越来越少,因为说多了,就
给人借口说中国威胁他们。

TOP

引用:
原帖由 村上春樹 于 2007-5-22 17:33 发表
如果有人拿中文的高度修辭原文來相比日文,當日文缺乏某些"對映"可加以重現時,這是否
也代表日文在某些地方上有所不足呢?

語言沒有完美無瑕的,文學的養成與作家深受文化涵養的影響有關。「翻譯」的本身就 ...
所以我很早前就说过了,语言(日文中文)都各有优劣的。

我最开始那句说的也就是中文不如日文的一些地方,但自始至终都没有一杆子打死中文。

翻译的话我说实话也不是绝对的。
像へらへら、くすくす、くっくっく、けっけっけ、ほほほほ、ひひひひ、ふふふふ、はははは等等等等都是笑声,真的,有时候你用日文写文能表达出来,但用中文的时候就未必有效果对应的词,只能用其他方法表达这个效果。

[ 本帖最后由 kyosuke2004 于 2007-5-22 17:43 编辑 ]

TOP

关于汉语学
我只想举个例子

就拿楼主所说的“游戏”来说吧

同样的一个行为,一个修辞

在汉语

可以使用

“玩”
“耍”
“戏”
“弄”

至少四种单词就可以替代“游戏”,且表达的情感、语态随环境任意变化

具体到游戏的真正形式,我们还可以做更深层的表达

棋的游戏:“弈"
曲的游戏:“唱和”
篮球的游戏:“斗牛”
男女的游戏:“媾”
戏弄他人的游戏:“逗”
互相争胜的游戏:“斗”
踢球的游戏:"鞠”

等等。。。。。

TOP

引用:
原帖由 灌水马甲 于 2007-5-22 17:35 发表
(转帖)为什么汉语的思维速度比其他语言快? [裙裾飘飘] 于:2003-11-03 12:47:08


中国人心里有这样一种成见;认为汉语迟早要被英语所淘汰。记得有一次,大概是胡
野碧在辩论时干脆把它清楚地说了出来。 ...
这篇文章是非常普及的

推荐朋友们看下

TOP

引用:
原帖由 kyosuke2004 于 2007-5-22 16:49 发表

我叫你们翻,是因为我知道我们条件不同,根本无法交汇,希望你们能就此忍下这口气而拿出的强硬手段。
我给出前两页的剧本不是为了给你们翻译,而是直接拿出来说明。那些东西都是给看得懂的人看的,而没有细细 ...
副词上,那剧本中比如一下这段中的“ぱた‐ぱた”。
用中文来说就是“拍、拍”的情形,但说实话,你就翻成“拍、拍”都脱离了原来的感觉。另外,这个词还有一个意思是指做事之类的很顺畅的样子。
主人公背对鸟的情况:
(鸟)ぱたぱた… 拍……拍(这里你只能翻成“听到了它拍打翅膀的声音”,而翻成啪、啪,或者拍、拍说实话都无法直接表达日语的那种感觉。
(主人公)あの子のあしおとが聞こえてきた。 它的脚步声传了过来
(主人公)ずっと待っていたから、うれしい。 原来它一直等待在这里,好开心
(鸟)ぼくは寄っていく 我一点一点靠近她

你过于拘泥于形式了。话说虽然剧本本来就是形式主义的东西。这四句不拘泥于形式的话非常好翻。即便是按照剧本也没什么问题。

ぱたぱた,这句话根本就没有任何感觉。翻译过来就是啪、啪,啪嗒,啪嗒之类的象声词。在这里你就犯了一个在翻译剧本的时候非常严重的错误。剧本是什么,其根本,是供演员演出时候的参照。如果你翻译成听到了它拍打翅膀的声音,这只能放在人物的描写当中。试想,如果这里要翻译成“听到了它拍打翅膀的声音”。那就意味着鸟要说出这样一段话,或者有心理对白是这样一段。这不是笑话么?
剧本是实景的描述,你却在阅读的时候构建了一个场景,然而却不以实景描述的方式写剧本,就会这样搞笑。

为什么你会觉得ぱたぱた,和啪,啪有这么大的区别?ぱたぱた究其词根,其实是由象声而来。其实在这里论其表现,和啪嗒,啪嗒没有什么直接的差别。只是因为你对日文并不是一个非常密切的习惯,因此这个词不会像中文,对你显的有些俗气这样。只是因为你接触的比较多而已。而且,ぱたぱた给人的感觉,是鸟在很快的拍动翅膀。而这个场景,看上去其实是一个以静为主,静中有动的场景。用ぱたぱた反而不如,啪嗒,啪嗒来的感觉更好。因为这中间有个空白的节奏,在安静的场景中就不会显的太刺耳。ぱたぱた像是鸟儿刚刚飞来,而啪嗒,啪嗒,就像是鸟儿一直在那里,只是轻轻的,扇动了两下翅膀。

你在读剧本的时候,通过场景描述,人物描述和对白、独白、心理描述构建起了一个情景。因此,在翻译的时候,你要做的不是直接把这种情景描写出来,而是把前面讲到的几个要素翻译好。让人在读的时候,再度建立起一个生动的画面。你一旦试图直接描写那种感觉,那就脱离了剧本的本质,自然觉得四不像翻译不对了。

在下面一句,其实是表达主人公听到了鸟的拍打翅膀的声音。也是一个很静的画面,因为刚才的一声轻响,而被打破了。而你翻译成它的脚步声传了过来。这表达的画面是一个由远及近的信息,自然也会觉得不对。而且,原本是一个偏向主动的描述,虽然发出声音,并不是主人公控制的,但是主动的描述表示了其实主人公在暗暗有所期待,而你的翻译就成了一个被动的,单纯在听的位置上的角色。自然也会觉得有差异。结合下一句,原来它一直在这里,可以说明主人公其实是有所期待的。所以这句其实可以加上“终于”之类的副词,来表现主人公的期待,也同时能把被动,转化为主动。

这句话在日文中也是很普通的句子,没有什么特别优雅之处。一切都是因为你忽视了这是个剧本,你要做的是去构建一个环境,而不是构建一个结果。你搞错了你要做的事情,加上日文相对中文对你更稍显神秘,才使得你觉得无法达到那种感觉。其实你用中文构建一个这样的环境,只要表现出几点,主人公背对镜头的静,鸟儿突然拍翅膀的动短暂的打破了这种静,主人公按奈又期待的心情,加上带一点点乌托邦式爱情的内敛性的心情碰撞,每个都不要直接描述,都是暗含一点意味即可。

看来楼主的翻译功底和汉语言的掌握能力还是不够,还是先多下苦工,深入日文也深入中文,再来研究中文究竟能否表达吧。最关键的是,不要让自己对语言掌握熟练的差异成为你阅读时的错觉就可以了。

TOP

广东话读唐诗宋词和一些古文真是有味道啊, 哈哈。

TOP

(转帖)语言的编码效率

语言究竟是什么呢?语言是一套编码系统。人类的语言和电子设备的通信协议,本质上是一样的。就是我有信息,我通过这套代码和协议传送给你,你接受到我的信息并且理解,我们完成了这个交流的过程。(我觉得没有学习过电子工程的语言学家们可能不能从这个角度理解语言,所以有时候会冒出些偏颇的结论。)


语言有两个方面,口头和书面。人类语言都是从口头语言发展起来的,成熟的语言会发展到书面形式。如果这么理解的话,口头和书面好像是一个事物的两个方面。但是如果你从编码的角度理解,你就会有个新的视角——口头和书面是两套代码,一套音频代码,一套视频代码。这两套代码是个多对多的映射关系。口头和书面,不如我们想象中的联系那么紧密。


从这个结论出发,我们会得到很多推论。随意的举几个例子:
一、我们可以有全新的一套视频代码替换现有的,而这个系统工作正常,比如有人提出抛弃汉字,全部拼音化。
二、口头语言的编码效率和书面语言的编码效率是可以分开来看的,比如汉语的口头语言的效率要比汉字的效率高。
三、书面的字符集要包括上标点符号,因为标点符号是传达不可或缺的信息的。比如英语离开空格是无法工作的。不要小看这个空格,这里面有讲头,以后再讲。
等等等等

有人说汉字的效率高,因为同样的一篇文章,肯定是中文的最短。我并不是太确定。这里面有个字体大小的问题。你必须有个标准。比如,把字体调到能让人能看清的最小限度,在同样面积的里面,究竟哪种语言能传送更多的信息。我没有明确的结论。


从书写的角度,汉字的速度显然慢。所以汉字才被简化以提高书写速度。

显然汉字可以进一步简化而不引起歧义。为了提高效率,越简化越好吗?不是的。编码学还有另一个指标,叫做容错。一条信息的冗余越小,它的容错率就越差。比如英语也可以简化,就是缩写。Quantity可以缩写成Qty而不引起任何歧义,但是容错能力巨减。如果你错写一个字母或者少写一个字母,比如写成Quatity,读者可以猜测你的意思,但是如果Qty变成Qt,读者就是错误理解为quarter。所以效率的提高是以牺牲容错能力为代价的。


汉字的书写速度慢,但是阅读速度快。因为汉字接近图形,而人对图形的反应比对字符的反应要快得多。所以你看软件菜单里,有的干脆用汉字作图标(让不认识汉字的人使用汉字图标!)


因为汉字的传出(书写)成本高,传入(阅读)成本低,可以得出一个有趣的结论是,汉字在大规模信息传递中,效率比其他语言高。也就是说,假设所有人都懂汉语和英语,纯粹以效率来衡量,一对一的书面交流应该用英文,出版报纸则应该用中文。


纸面书写是传统方式,在计算机时代,键盘输入和硬盘内存储存是新的衡量标准。结论也是显而易见,汉字输入慢,汉字存储密度高。中文输入法仍然是个软点。

讲完书面讲口头。

代码集大的系统有优势。汉语的优势在乎声调。汉语有四声,再加上轻声,共有5种声调, 21个声母,35个韵母。英语有28个辅音,20个元音。这个差别还是比较大的。

一个比较合理的计量方法是:
汉语,比如“汉”,计作2,因为它包含h和an。但是“睡”要计作3,因为它有sh, u, i。如果是三声的“水”,要计作4,因为三声和其他声调不同,它是个拐音。

英语。Pen,计作2,道理与汉语相同。Language要计作6,因为它有l, an, g, u, i,
ge。Select要计作6,这里的每个字母都发音。汉语的拐声被多计一个数,相应的,英语的长音要计作2,比如cheese要计作4,因为它用时略长。

注意上面不是我们常说的音节,我算得比较细,权且称为“音数”吧。

常见的日常词汇里,大概四五个音数就搞定了。但是英语稍微复杂一点音数就开始增长,即使像常见的finish, prepare, tooth
paste。flower是个更过分的例子,这么常用的词竟然有5个音。

而中文词汇基本上都用两个汉字,到四个汉字就到了成语的领域。(成语需要单独讨论。古语的信息载量更大,四个字顶一句话。)中文里四个以上的词汇极少。即使像“绻缱”这么罕见的词都是两个字。


再据个例子,“造”是基本的通用的字,“盖”精确一些涵盖面小一点,“建设”算是比较高级的词。他们的音数分别是2,2,5。对应成英文:make, build,
construct。音数分别是3,4,7。稍微复杂一点单词就变长了。

TOP

发新话题
     
官方公众号及微博