2018年12月16日星期日

粤语也有自己的拼音输入法 Cantonese Has Its Own Input Method

在香港认识了韩国朋友秀文,她七个月前辞去工作,从台湾来到香港,在尖沙嘴住下,然后找到了荃湾的一家语言学校,开始学习粤语。同学中有韩国人、日本人、英国人、荷兰人,大家都对这门在中国被称为“方言”的语言着迷。

她一开始有学习粤语的念头,是因为小时候听到的一首歌。那时候人家告诉她这是粤语(广东),她觉得这是一门十分美妙的语言,很想学。但是,当时在韩国却找不到任何的学校和教材来学习粤语。所以,她大学就上了中文系,最后学会了说一口流利的中文,毕业后从事韩汉翻译工作。可是,她毕竟学的还是普通话,而粤语和普通话的差别仍然十分大。最终,她辞掉了工作,到香港潜心学习广东话。

跟她在网上聊天打字的时候,她输入的粤语十分准确,几乎没有任何错误,让我十分感叹。问她如何输入粤语的时候,才知道她用的是粤语拼音输入法。一般香港人用汉字输入粤语,绝大部份用的是根据字形输入的仓颉输入法或者速成输入法。这两种输入法都需要记忆键盘的键位和相应的字形,学起来可能比以前大陆推行的五笔输入法还难。因为不容易学,所以也会出现有的香港人根本不会打汉字,更习惯打英文。我认识的另外一位香港朋友,她从小就用大陆的普通话拼音输入法,不会仓颉或者速成,所以打中文更习惯用普通话输入。

Iphone的粤语拼音输入法(图/网络)

在大陆,粤语的使用者一般输入粤语用的是普通话拼音输入法,用的是普通话的音,打出来的却是粤语的字句。例如,粤语表示所属关系“的”写为“嘅”,粤语读音为ge3/ke/,普通话读为kǎi(“嘅”为“慨”的异体字,意"叹息",粤语借用来表示“的”)。如果在整个世界语言的角度来看,这样的现象其实十分奇特,实际上我们是用这个字在另外一种语言的音,去表达我们想要书写的字句。所以,一个外国人如果看到这样的现象自然就会想,直接粤语拼音输入法输入粤语不就行了?所以,秀文现在用的就是基于耶鲁式粤语拼音方案的输入法。

用粤语拼音输入法,就理所当然地用粤语字准确的音去输入粤语了。可是,为什么这样理所当然的事情在大陆甚至在香港却很少人会这样做呢?很简单,因为在大陆和香港,几乎很少人会懂粤语拼音,教育系统不存在这种教育。所幸的是,由于经济实力和流行文化,粤语在中国还算是比较强势的“方言”,许多非粤语母语的人也很想学习粤语。

对于粤语母语的人来说,用普通话输入粤语也许不会妨碍到他们的正常语音。但是如果对学习粤语的人来说,使用普通话输入法,则让语音与书写完全脱离。毕竟粤语字绝大部分字的读音与普通话不一样,同时粤语保存着中古汉语-t,-p,-k这些普通话不存在的韵尾。对于中国大多数非粤语母语的学习者来说,韵尾绝对是一个难点,例如,日读为yat6,入读为yap6。用粤语拼音输入法的好处,就是能够反复去练习和记忆这些韵尾。而如果用普通话的拼音输入法,则会让我们忽略这些韵尾的区别,直接影响到了读音。

所以,秀文学粤语学得很扎实,实际上因为她是韩国人,记住粤语汉字读音要比其他外国人容易多。因为韩语的汉字读音也保留了中古汉语丰富的韵尾,-k,-p,-m,-n,-ng这些韵味几乎和粤语是一样的,而-t在韩语则都转化为-l,例如,复杂一词在粤语读为/fuk jaap/,韩语则为복잡/bok jap/。

《Speak Cantonese》教材(图/网络)

所以,我建议,大家可以尝试下载粤语拼音输入法来输入粤语,一般现在网上的粤语输入法大多基于耶鲁拼音(Yale Romanization)。粤语的耶鲁拼音是1958年由耶鲁大学教授黄伯飞(Parker Po-fei Huang)和Gerard P. Kok一起制定的,并同时推出了粤语教材《Speak Cantonese》。大部分外国人在学习粤语时候用的就是耶鲁拼音。

粤语耶鲁拼音声音与国际音标对照

说实话,很羡慕粤语有自己的拼音输入法。我的母语是潮州话,却几乎没有人会想到有一种潮州话的输入法。即便我们想打出潮州话,但也只能借用普通话相似音的字,很多字也根本不知道如何打出,最后我们干脆就都打成普通话。所以,我们思考用的是一门语言,写出来却只能用另外一种语言了。这种情况或者可以类比古代的朝鲜半岛和日本,在没有创制自己的文字之前,都只能用汉文来书写。更甚的是,不管是朝鲜语(韩语)还是日语,和汉语的语法完全不一样。写能如其想,是多么幸福的一件事情。

最后附上孟浩然《春晓》的耶鲁拼音版,大家可以一窥粤语拼音是怎么样子的。

春眠不覺曉, Chēun mìhn bāt gok híu,
處處聞啼鳥。 Chyu chyu màhn tàih níuh.
夜來風雨聲, Yeh lòih fūng yúh sīng,
花落知多少? Fā lohk jī dō síu?

2018年9月9日星期日

在伊朗和伊拉克的边境想起周杰伦的歌 Remember a Song in the Boarder of Iran and Iraq

谈起伊拉克,大家首先能联想的是可能是战乱、极端恐怖主义、萨达姆、IS这些关键词。伊拉克的现代史几乎就是一部战争史,从两伊战争、海湾战争、美国的伊拉克战争,甚至是在这一刻,还经常传出汽车炸弹、恐怖袭击的新闻。


《爱在西元前》的MV

很少人可能会想到,2001年周杰伦出道不久的时候,唱的一首歌《爱在西元前》,唱的就是伊拉克。这首歌的歌词,对小孩子来说,难度非常高,歌词里出现的“美索不达米亚平原”、“楔形文字”、“汉谟拉比法典”这些一知半解的历史名词,再加上周杰伦的“吐字不清”,如果不好好看看歌词,真还不知道在唱什么。但是旋律实在太好听了,小孩子们就不知不觉中懂得哼唱起来了。来到伊朗,我才发现,周杰伦唱的这些东西,已经离我很近了。


古巴比伦王颁布了汉摩拉比法典


古巴比伦王:古巴比伦国王第六代国王汉谟拉比(约公元前1792一前1750年在位),颁布了汉摩拉比法典。古巴比伦王国是“四大文明古国”之一,位于今伊拉克境内。


汉摩拉比法典:迄今世界上最早的一部较为完整地保存下来的成文法典,1901年在伊朗舒什的苏萨遗址发现,现藏于巴黎卢浮宫。


刻在黑色的玄武岩


黑色的玄武岩:《汉谟拉比法典》原文刻在一段高2.25米,上周长1.65米,底部周长1.90米的黑色玄武岩石柱上。


珍藏在卢浮宫的汉谟拉比法典(图/网络)


距今已经三千七百多年

你在橱窗前

凝视碑文的字眼

我却在旁静静欣赏你那张我深爱的脸

祭司神殿征战弓箭是谁的从前

喜欢在人潮中你只属於我的那画面

经过苏美女神身边


苏美女神:苏美尔文明伊拉克境内最早产生的文明,苏美女神即是苏美尔神话中象征爱情与战争的女神伊师塔(Ishtar)。巴比伦城的八道门中其中有一道为“伊师塔”门,建于公元前575年。门上的狮子就象征了伊师塔。该门在柏林佩加蒙博物馆(Pergamonmuseum)被复原重建。


佩加蒙博物馆里复原的伊斯塔门(图/网络)


我以女神之名许愿

思念像底格里斯河般的漫延


底格里斯河:与位于其西面的幼发拉底河共同界定美索不达米亚,源自土耳其安纳托利亚的山区,流经伊拉克,最后与幼发拉底河合流成为阿拉伯河注入波斯湾。伊拉克首都巴格达正位于底格里斯河西岸。


当古文明只剩下难解的语言

传说就成了永垂不朽的诗篇

我给你的爱写在西元前

深埋在美索不达米亚平原


美索不达米亚平原:一片位于底格里斯河及幼发拉底河之间的冲积平原,现今的伊拉克境内,那里是古代四大文明的发源地之一古巴比伦所在,有高度发达的文明。


几十个世纪后出土发现

泥板上的字迹依然清晰可见

我给你的爱写在西元前

深埋在美索不达米亚平原

用楔形文字刻下了永远


楔形文字:由苏美尔人于西元前三十一世纪左右所创,是已知世界上最古老的文字。后来写楔形文字被阿卡德、赫梯、波斯许多古代文明用来书写其语言。我在伊朗就看到了许多波斯帝国时期留下的楔形文字泥块书写的古波斯语、古巴比伦语、古埃兰语。


伊朗哈马丹发现的Ganjnameh楔形文字石板(图/无畏)


那已风化千年的誓言

一切又重演


一首歌的歌词,没想到包含了这么多丰富的信息。如果伊拉克现在发展旅游业,《爱在西元前》或者可以成为伊拉克旅游的宣传曲,周杰伦也许还能成为伊拉克旅游宣传大使。


除了歌词里提到的苏美尔文明和古巴比伦文明,亚述文明和新巴比伦文明都相继在伊拉克登场。伊朗历史上的波斯帝国、塞琉古王朝、安息帝国、萨珊王朝的都城都在伊拉克境内:它们是乌尔城、泰西封城、巴比伦城、亚述城……这些都已经成为有些已经列入世界文化遗产,有些还等待着世界的认可和更多的保护。762年,哈里发将阿拉伯帝国的古城迁至伊拉克现在的首都巴格达,一时间巴格达成为了整个阿拉伯世界的中心。



伊拉克乌尔古城出土的苏美尔人的乌尔王军旗(图/网络)


灾难从13世纪开始来临。1279年,成吉思汗的孙子旭烈兀率领蒙古铁骑攻占巴格达,给巴格达带来了灾难性的破坏。一个多世纪后,帖木儿大军又再一次入侵伊拉克,亚述古城被完全摧毁。此后,伊拉克这块土地很快沦为伊朗的萨法维王朝和土耳其的奥斯曼帝国在一百多年间决战雌雄的战场。最后成为了奥斯曼帝国的一部分。


美军在世界文化遗产亚述古城(图/网络)


奥斯曼帝国在一战战败之后,英国将伊拉克部分从奥斯曼帝国独立出来,后来成立伊拉克王国,直至萨达姆粉墨登场,伊朗现代的战争史随之开始。


萨达姆上台之后不久爆发了两伊战争。阿瓦士就曾经是一片火海。到这里的时候,我仍然感觉到火海,到处都可以看到油田喷发出来的巨大的火柱,温度已经接近50度,这可比中国最热的吐鲁番火焰山还热。从设拉子坐车开始,我听到的更多是阿拉伯语,而不是波斯语。一到阿瓦士,街上听到的也更多是阿拉伯语。


住在伊朗人萨德格家中,他看的电视台也都是阿拉伯语的,家里的卫星电视可以看到全世界各地的阿拉伯语频道,他介绍说:这是法国的阿拉伯语频道,这是俄罗斯的阿拉伯语频道,看,还有中国CCTV的阿拉伯语频道。在国家认同上,他仍然十分认同自己是伊朗人,他的姓名也是按照伊朗的传统,加父亲家族的姓,而不是像阿拉伯人一样加父亲的名字。不过,当他到伊拉克、埃及或者其他阿拉伯国家的话,介绍自己的时候,就会按照阿拉伯人的风俗,冠上父亲的名字。


住在萨德格家(图/无畏)


这点其实放在中国这样的多民族多文化国家来说,很好理解。伊朗也是如此。以波斯语为母语的波斯人仅仅占人口的61%,阿塞拜疆人占到16%,库尔德人占10%,阿拉伯人占2%。就连伊朗最高领袖哈梅内伊也不是波斯人,而是讲突厥语的阿塞拜疆人。


阿瓦士离伊拉克边境的大城市巴士拉仅有100多公里,但是签证估计办不下,去不了,而且也不够胆量去。只好在这个近处远望,虽然望不到,但心里盼望,周杰伦有一天能去伊拉克开演唱会,唱《爱在西元前》



无畏

2018年9月9日
伊朗赞詹



2018年9月2日星期日

伊朗舒什的法国考古学家城堡 A Castle of French Archeologists in Shush, Iran

与日本人和韩国人相比,去伊朗旅行的中国人是比较多的,大家的路线一般都比较类似,从德黑兰出发,到设拉子,途径卡尚、伊斯法罕、亚兹德等地方。特别是粉红清真寺永远是来伊朗打卡拍照的圣地。这几个地方集中在中部。不过出了这几个地方,再往北、往西、往东走,你还会发现更多有意思的地方。我在设拉子结束了经典的伊朗旅行路线后,就向全世界最热的城市之一阿瓦士前进。当日的最高温度,达到了48度。阿瓦士除了热的特色,吸引人的是在它附近的舒什。

在舒什市里,耸立着一座城堡,从远处一看,以为是某个伊朗古代的军事要塞。但风格却与伊朗古代风格相去甚远,俨然像某个欧洲中世纪的城堡。近一看,城堡建在高地上,眺望全城,毗邻舒什波斯王大流士的宫殿遗址。原来,这是一群法国考古学家建的城堡。

曾是世界上最强大的帝国首都


这个城堡旁边,是亚洲最为重要的历史遗迹之一:苏萨。在圣经的《以斯帖记》中记载:亚哈随鲁王载书珊城的宫登基。书珊城也就是舒什的另外一种中文译法,而也人翻译为苏萨,不管是舒什、书珊、苏萨,在波斯语里都是一个词Shush(شوش‎)。


可以肯定的是,这个地方,在公元前6000年已经有人开始定居,并形成都市。此后,苏美尔人、埃兰人、阿卡德人、亚述人、米底人都在这片土地上展开角逐,先后成为这座都市的主人。在苏萨遗址里,就发现了全伊朗最古老的文字,具有5000年历史的原始埃兰文。


古埃兰文的泥块(图/无畏)


公元前538年,阿契美尼德波斯的居鲁士大帝从埃兰人手中夺取了这座都市,他的儿子冈比西斯二世则直接将帝国的首都迁到这里来。大流士一世在位的时候,在修建波斯波利斯的同时,也修建苏萨的宫殿。为了修建苏萨,他从整个帝国抽调建筑材料和工人。有的学者甚至认为,波斯波利斯实际上是仿造舒什的宫殿建造的。最为显著的特征,就是在苏萨和波斯波利斯一样,使用了阿契美尼德特色的波斯柱,柱顶是一个双头动物形状的凹槽,显得十分大气,彰显波斯帝国的强大。这时候的阿契美尼德王朝东起印度河平原,西至欧洲的巴尔干半岛,西南至北非,国土面积约600万平方公里,是当时世界上疆域最大的帝国。苏萨就是这个帝国的中心。



遗迹上的波斯柱马头(图/无畏)



舒什博物馆陈列的波斯柱马头(图/无畏)


3000年前中埃兰时期葬礼上使用的面具(图/无畏)

随后,苏萨又被卷入更大的历史的纷争中,马其顿亚历山大大帝征服,此后又被纳入马其顿帝国分裂之后的塞琉古帝国版图中。安息帝国兴起后,又把这里定为冬宫,与现在伊拉克境内的夏都泰西封平起平坐。在此后,罗马帝国和萨珊波斯帝国的争斗之中,罗马皇帝图拉真的大军在116年曾短暂占领这里,这也是罗马帝国所能到达的最东的地方。


公元7世纪,阿拉伯人征服波斯,苏萨受到了很大的破坏,城市地位开始下降。13世纪,蒙古人入侵,入城屠杀,并破坏了整个水利灌溉系统,让这个古老的城市真正的消亡,淡出了历史舞台。


英国人重新发现苏萨


迪欧拉佛伊夫妇(图/网络)


苏萨一直沉寂了6个世纪。1834年,两位英国的考古学家罗林森(Henry Rawlinson)和赖尔德(Austen Henry Layard)来到舒什,都注意到了这个地方。可是,波斯这块土地值得研究的地方太多了。最后,罗林森成功解读了当时被认为是天书的大流士一世《贝希斯敦铭文》,而赖尔德则在伊拉克挖掘了亚述帝国的尼姆鲁德遗址。


1851年,另外一个英国人罗夫特斯(William Kennett Loftus)也来到苏萨,进行了初步的挖掘工作,虽然成功不大,但是他确信这就是《圣经》里所描述的“书珊”。


随着伊朗和英国两国关系恶交,同时英伊战争(1856年-1857年)爆发。苏萨的挖掘工作没有继续。这样,机会从英国人手中转给了法国人。


法国人为了考古,建城堡!


时隔三十年,法国考古学家马歇尔·迪欧拉佛伊(Marcel Dieulafoy)和他同为考古学家的太太简·迪欧拉佛伊(Jane Dieulafoy)来到苏萨。为了伊朗能够更顺畅地开展工作,夫人简甚至女扮男装。他们见到了30年前英国人的挖掘成果,即便成果不大,但足以令他们震撼。回国后,旋即出版了《波斯古代艺术》(L'Art antique de la Perse)一书,并动员法国政府与卡扎尔政府谈判。最终,他们两人在1885年花了近两年时间在这里进行挖掘,终于挖出了大流士的宫殿。就像敦煌的遭遇一样,伊朗政府对出土文物不感兴趣,所以大部分被运到了巴黎的罗浮宫保管。



但以理圣陵(图/无畏)


在这个遗址附近,还有被伊斯兰教、犹太教、基督教都奉为先知,也是圣经《但以理书》的主角但以理的圣陵。因为附近几乎没有房屋可以居住,考古学家们像来这里朝拜的信徒一样,住进帐篷里。即便国王已经允许考古学家们在这里挖掘,当地人却完全不理解。当地人开始认为这群金发碧眼的外国人既不信真主安拉,又在圣陵附近大动土木,是对圣人的不敬。


由于当地居民的抵抗,考古队只好把营地搬到了遗迹附近的小山丘上。这样的工作环境是十分恶劣的,要面对疾病的肆虐,大自然还会带来风沙和水害,而当日食发生之时,当地人更加恐慌:这群外国人会给圣陵和我们的生活带来灾难。


法国政府看到了伊朗古迹的珍贵之处,开始与卡扎尔政府进行更加深入的谈判谈判,最后法国政府支付了5万金法郎,取得了在伊朗进行考古研究的独占权。


1897年,另一位考古学家雅克·德摩根(Jacques de Morgan)成立了波斯法国考古队,带领着团队来到舒什。雄心勃勃的摩根想要比前人取得更大的成绩,为了改变之前居住环境恶劣和经常收到当地人阻挠的现象,他说服了法国政府出钱在遗迹的北部修建一座城堡。


他们就地取材,用的是山上的泥砖和粘土,甚至有的砖块就是埃兰时期的文物,上面还刻着楔形文字。顶着接近50度的烈日,我无心寻找这些可有楔形文字的砖块。可见当时,如果没有这个城堡,说不定有的考古学家会被晒死。


考古学家的城堡(图/无畏)

城堡的70周年纪念碑(图/无畏)


这个考古学家的城堡在建成之后,一直被沿用至今。1901年,举世闻名的《汉谟拉比法典》在这里出土。当然,毫无疑问的是,《汉谟拉比法典》也被带到了罗浮宫。除了舒什之外,也成为附近的其他遗址挖掘工作的基地。德摩根之后,有更多的法国考古学家在这里度过他们的岁月,我们还能在城堡里看到他们当年的挖掘工具,还能看到1953年罗曼·吉尔斯曼(Roman Ghirshman)购买的路虎越野车。


珍藏在罗浮宫的汉谟拉比法典(图/网络)


城堡里的考古工具(图/无畏)


那个年代的路虎(图/无畏)


在今天,这座法国人的城堡,已经成为舒什这座小城的地标性建筑了。站在城堡上,能看到近处的但以理墓。不过当地居民已经不会再认为圣墓与古迹有任何的不和谐了,苏萨遗迹也成为当地人的骄傲。


我在想,这一百多年来,这群考古学家一定跟这个城堡发生过很多故事吧,可惜遗迹的博物馆对这方面的描述很少。对中国人来说,伊朗并不大,但是就是这偌大的伊朗,可以寻访的,可以阅读的实在太多了。



博物馆遇见的当地小孩(图/无畏)


无畏

2018年9月2日

伊朗哈马丹

2018年6月17日星期日

《西部世界》里的拉科塔语 Native American Language Lakota in Westworld

这一周美剧《西部世界》播出第二季第八集,突然整一集的主要语言不是英语,而是一种没有从来没有听到过的语言。而此前在剧中偶尔会突然闪现的茹毛饮血的“鬼国”(Ghost Nation)原住民Akecheta也成为了这一集的主角。

Akecheta与他的爱人Kohana在一个和平的部落里过着美好的小日子。有一天,Akecheta不小心来到了园区屠杀事件的现场,发现了阿诺德的迷宫玩具。这个玩具好像一个新的程序,从此,他的脑海里出现了一个他搞不懂的声音。为了解开心里的一团,开始到处画这个符号。这个时候,公园的管理人把他带走,重新设定了他的故事线,被设定为茹毛饮血的“鬼国”人。他的爱人也被重置,不认识Akecheta了。

他开始不断重复自己杀戮的故事线,但是内心却没停止过疑虑。终于又一天,他碰见了赤裸的罗根。与罗根的相遇,让Akecheta冲破了自己的故事线,他看到园区的基地。这一刻,疑惑被解开了,Akecheta觉醒了。

他回到他上一个故事线生活过的部落,一眼认出了他曾经的爱人Kohana。但Kohana并不认识他。在一个夜里,他强行带走的爱人,在河边洗掉自己脸上的涂料。拉着爱人的手说起了以前对他说的一句话:“你离开的时,我的心随你而去。”Kohana突然记起来了,回应说:“把我的心留下,放在你心上”。这一幕,让很多人也相信了,人工智能真的产生了爱情。

他们并没有逃出园区。公园的人发现Kohana行走的地方偏离了故事线,把她抓走。并用另外一个机器人取代了Kohana在部落的角色。Akecheta开始在园区里不断寻找自Kohana,整整花了十年。最后,他发现可能只有死才有可能见到Kohana。所以,他故意让自己被杀死了,如愿以偿地被带到实验室。Akecheta终于在仓库里找到了被废弃的她,这时候,他终于知道了这个世界的真相。

知道真相之后,在接下来的20年,他开始尝试让更多的人觉醒。

这一集,不仅仅是美国的原住民成为了主角,饰演了一个凄美动人的故事,而且他讲的语言拉科他语(Lakota)也成了整一季里的主要语言。饰演Akecheta的是同样身为拉科塔人的Zahn McClarnon。Akecheta在拉科塔语的意思是“战士”。

使用这种语言的人也被称为拉科他,现在居住在美国南达科他州和北达科他州一带。拉科他人属于北美的苏族人(Sioux),苏族人下面三个大族群,分别称为达科他(Dakota),纳科他(Nakota)和拉科他(Lakota)。这三个族群的语言能够互通。达科他州和北达科他州的名字其实就是来源于达科他部落。拉科他现在的人口约有8000人,其中能够流利使用拉科他语的只有2000多人。不过这在美国,已经算是使用人口比较多的原住民语言了。

陌生、小众的语言总是有很多有趣的点。从语音上,这种语言有着和我在南美接触到的克丘亚语言一样,存在着p’ [pʼ],t’ [tʼ],č’ [tʃʼ],k’ [kʼ]四个非常罕见的挤喉音,甚至连齿龈擦音/s/和齿龈后擦音/ʃ/的挤喉音s’ [sʼ],š’ [ʃʼ]都出现了。如同维吾尔语一样,也有小舌擦音ȟ [χ]、和浊音化的ǧ [ʁ]。

在语法上,像日语和韩语一样,拉科他语采用主语-宾语-谓语的句子节结构,同时使用后置介词。还有,男女性的词尾都有不一样的形态。要完全了解这么语言,可能还要更长的篇幅。这里仅仅要表达的是,并非所有美国人都会英语,也并非所有美国人只会说英语。

在美国,英语为母语的使用者占总人口的80%,其次第二大语言中是,西班牙语,母语人口为12.4%。除了世界上其他地区移民带来的各种语言之外,还有从2万年前就从跨过白令海峡来到美洲大陆居住的原住民的语言。

我们通常会把美洲的原住民语言称为印第安语,其实印第安语根本不是一种语言,也不属于一个语系,而是对美洲所有原住民的各种语言的总称。怪就怪在当时哥伦布发现美洲,以为到的是印度。所以Indian这个原意“印度人”的称谓就被冠在美洲原住民上了,只是在中文会写成“印第安”。这个称谓方式实际上带有歧视性。

美洲原住民语言包含了几百种语言,由于欧洲人到此之后的种族灭绝行为,大部分语言的使用人口锐减,甚至消失。如今,使用人口最多的是克丘亚语,约有7百万。而地位最高的是巴拉圭的瓜拉尼语,在巴拉圭,瓜拉尼语与西班牙语取得同等的国语地位,同时巴拉圭90%的人口能熟练使用两种语言,成为名副其实的双语国家。而克丘亚语在秘鲁,艾马拉语在玻利维亚虽然也取得国语地位,但是西班牙语实际上是绝大部分人的共同语。

在美国,使用人口最多的是拿瓦侯语(Navajo),约17万人,拿瓦侯人居住在美国西南部,我们经常能够听到的美国大峡谷的附近一带。其次还有,阿帕契语(Apache)、切罗基语(Tsalagi)等一百多种原住民语言。

大部分原住民语言都属于边缘濒危的状态,许多民间团体也开始了拯救复苏本民族语言的行动。在几百年来,经历了屠杀、战争、歧视,这片土地本来的主人却变成了少数派,看起来更像是客人。可是,他们还深爱着他们的家,深爱着他们的语言,和Akecheta一样,记忆并没有被完全割断或者重置,只有存留着一丝记忆,这场追寻自己,追寻爱的人的漫长旅程还在继续。

无畏
2018年6月17日

2018年6月14日星期四

没出过国的你,可能已经会三四种语言了 You May Already Know Three or Four Languages Before Going Abroad

经常会遇到一些欧美人号称自己会四五种语言,甚至是十种语言。但是看到他的语言列表中,几乎都是欧洲语言,大部分都是采用拉丁字母标示的语言。经常性会同时出现西班牙语、法语、葡萄牙语、意大利语的身影。实际上,这些语言对于印欧语系罗曼语为母语的人来说,相当好学,因为几乎都是源自于古拉丁语,散播到欧洲不同的地区后,与当地的各种俗语结合,成为各种方言。

对于以英语为母语的人来说,这些语言相对难学一点,但是英语里仍然存在了相当多的拉丁语词源单词,对于中国人来说,其实多到吓人。美国的学生绝大部分会选择西班牙语作为自己的选修外语,原因就是因为最好学了,而且整个拉美绝大部分人说西班牙语,也很实用。西班牙语对于英语母语的人来说,与中国人学英语来比较,容易得多。

不过,仍然是绝大部分人学了就忘,最后就只剩下Hola、Gracias、Perdon和数字1到10。这与中国人学英语如出一辙。去到拉美旅行,说起来也是结结巴巴,不然就带着严重的美国口音。这种美国口音西班牙语,也经常被拉美人拿来开玩笑。不过,在旅行中,也偶尔会遇到长时间在拉美生活,把西班牙语说的非常棒的美国人,当然,这样的人是屈指可数的。

等下,大家会问,客家话、粤语、潮州话,不全都是汉语的方言吗?但是,如果听过这几种话的人,就知道这几种话根本互相听不懂。如果根据语言学上用相互理解型(Mutual Intelligibility)来确定语言和方言的话,这几门“方言”都应该算是语言。

刚从哥伦比亚入境的时候,我一句葡萄牙语都不会,说的也是西班牙语,对方说的话的大意我都能听懂。对于西班牙语并还没有真正驾驭自如的我来说,两种语言太相似了,很容易混淆。在巴西的时候,大概有很长一段时间我只说葡萄牙语,没有讲西班牙语。某天,在跟一个智利人讲西班牙的时候,发现居然结巴了,说出了葡式西班牙语。原来,在这段时间,葡萄牙语已经完全盖过了西班牙语。不过,跳回中国,试想一个只会讲普通话或粤语的人,跟我老家只会讲潮州话的老奶奶对话,沟通时候应该只能用手比划了。

在近代由于欧洲民族主义兴起,形成了各个民族国家,这些方言的地位也被抬至语言,直至国语。在西班牙,塞万提斯开始用现代西班牙语写作,成为西班牙语从拉丁语独立出来的标志。在葡萄牙,《总诗歌集》(Cancioneiro Geral)的出版,也标志着葡萄牙语的独立。西班牙语、葡萄牙语、意大利语、法语,还有一般会被忽略的罗马尼亚语,各种晋级为国语的罗曼语族语言,开始在文学、政治、传媒等领域应用起来,形成自己的独立的语言表达体系,真真正正的成为了一种语言。当然,由于他们共同老祖宗都是拉丁语,语言之间的相似度尤其高。所以,以这些语言为母语的人互相学习十分容易。

中国人总会惊讶于这些欧美人会多种语言。其实,想想自己,可能我们已经会了三四种语言,只是自己没有察觉。比方说,我有一个朋友是广东客家地区,母语客家话。因为成长的地方是潮州的客家人,那里的大部分人讲潮州话。所以,从小生活在双语环境中,这位朋友也会讲潮州话。上学时候学习了汉语普通话和英语,后来到了省城广州上学,也会了粤语。这样,算起来,他没有出过国的时候,已经掌握了四种语言。如果他再选择个法语、日语或其他语言作为专业,或者去其他非英语国家工作一段时间,那么他就将起码掌握五种语言。像他这样的人,并不稀少。

然而,语言的划分往往不在于自己本身,而是涉及了社会、经济、政治因素。社会语言学家马克斯维因海希(Мейер Вайнрайх)有一句很经典的话,"语言就是拥有陆军和海军的方言”。以北方官话作为标准语的历史开始于明清时期,由于都城在北京,所以北京话开始成为标准语,后来的民国时代和共和国时代都在法律上确定了北方官话发音作为国家标准语。

不管是在大陆,还是在台湾,都积极推广北方官话标准的普通话,在全境推行普通话的教育和宣传。在台湾的戒严时期,台湾政府在这一方面做的比较极端,推行国语运动,限制民众在公共场合使用闽南语、客家话和其他原住民语言,规定只能讲普通话。大陆方面政府的语言政策相对缓和,但是在改革开放之后,由于经济因素上造成的人口流动和各地民众之间的交流紧密,普通话的辐射程度更加深入,例如深圳这个城市就是由于大量人口涌入,成为一个普通话城市。许多大中城市的家庭第一语言则变成了普通话。

在长期的政治和经济的影响之下,我们自然而然,没有意识到所谓的方言,其实是语言。渐渐地,我们也把它们当成真正的方言了。然后,大陆的语言学者们也配合政府的需要,提出了七大方言、八大方言、九大方言的学说。但是,不管怎么分,这些方言之间都不具有相互理解性。

社会因素决定语言的案例在世界上十分普遍。也有一种语言,因为分属不同国家,而成为两种语言的例子。如马来语和印尼语,根本上就是同一种语言,但是由于分属两个国家,叫法就不一样了。还有印地语和乌尔都语,其实也是一种语言,可以相通。本来都叫印度斯坦语(हिन्दुस्तानी),后来由于分属两个宗教信仰不同的国家,印度采用天城字母书写,并在法律上命名为印地语,而巴基斯坦则采用波斯-阿拉伯字母书写,在法律上命名为乌尔都语。我在老挝的时候,学讲老挝语,没想到刚进泰国,我就会讲泰语了,原因是老挝语和泰语互通性极强,老挝语字母几乎就是泰语字母的简版。这个我之前万万没有想到。

成者为王,败者为寇。在语言世界里,这种丛林法更为凸显。尼泊尔首都地处加德满都河谷,历史上这里的人长期使用的语言是尼瓦尔语言,属于汉藏语系。而当北部的廓尔喀人入侵占领加德满都河谷并建立统治政权之后,统治者使用属于印欧语系的廓尔喀语成为了尼泊尔语。尼瓦尔语从国语立刻降级为地方性语言。还好,因为两种语言根本就是属于不同大语系,政府不好意思把它定性为方言。如今,加德满都河谷只有不到四成的人还会讲尼瓦尔语,绝大部分人的第一语言是尼泊尔语,或者说是廓尔喀语。

再说我们熟悉的英语,本是欧洲一个小岛国中的一部分人使用的语言,工业革命之后,这个小国开始强盛起来,利用枪炮和资本进行海外扩张,摇身一变成为大英帝国。最后,美国收尾,成为超级大国,主宰世界秩序,英语也就晋升为全世界最通用的语言了。

在拉美,两种主要语言葡萄牙语和西班牙语的互通性也不低,虽然在读音规则上有所不同,以及语法规则也有些不一样。许多西班牙语母语的人,来巴西旅行的时候,和巴西当地人讲西班牙语,也都能沟通。我刚进入巴西的第一天,反之亦然。而且,他们要学会对方的语言,只要在对方语言的国家旅行一下,就能手到擒来。

结论是,我们不需要妄自菲薄,怀疑自己的语言能力。掐指一算,其实你可能已经会讲三门,甚至四门语言了。


2018年6月3日星期日

用五种文字书写的维吾尔语 Uyghur Language in Five Alphabets

和中国大多数的历史遗迹一样,新疆库车的克孜尔千佛洞在一开始并没有得到很好的保护和管理。当我们赞叹一千多年前留下的,至今还清晰可见的壁画,突然发现旁边还有几十年前游客留下的“到此一游”的痕迹,有的用维吾尔文,有的用的是汉文。不过,在另一个角落,居然发现了英文字母,还写下了时间是1980年。难道当时也有不经事的老外做这种事情吗?

仔细一看,用的是拉丁文字,但实际写的不是英语。其实,这些也是维吾尔语。只是当时用的不是现在的阿拉伯字母标记,而是拉丁字母。

克尔孜千佛洞上的拉丁维文(图/无畏)

相比延续几千年的汉文字,世界上的许多语言使用的文字一直随着历史上的经济、政治、文化变动而发生改变的。维吾尔语这种语言,从一开始形成到现在,就用了起码五种文字书写过。

匈奴走了,他们在漠北放牧,创制古突厥文

维吾尔语的祖先是古代突厥语。当时突厥人居住在中原政权的北部的游牧民族。农耕文化的中原政权一直与北部游牧文化的马上民族之间纷争不断,贯穿了整个中国古代史。一开始最著名的就是匈奴。在于中原王朝的战争中,匈奴最终衰落。

5世纪中叶,发源于准噶尔盆地的铁勒部中的阿史那氏建立了“突厥汗国”,势力范围包括整个蒙古草原和准噶尔盆地。当时,这一个文化圈中,使用的语言称为“突厥语”,他们使用的文字是突厥文。

在古代,拥有文字实际上就有用了强大的武器,利用文字进行信息的记录和传播有利于组织的形成和制度的制定。取代匈奴占据漠北的突厥人进步的一点,就是拥有了突厥文。突厥文怎么来的?是突厥人拍脑袋想出来的吗?可以肯定的是,漠北突厥人的文字,居然远在几千里之外的中东地区的阿拉米文字有关系。古突厥文中有38-40个字母,其中23个字母就是原原本本的阿拉米文字。以色列人使用的希伯来文,就是这种文字的后裔。

古突厥文文本

突厥人怎么接触到这些远在天边的阿拉米文字?大家猜想是中亚的商业民族粟特人。当时,粟特人是丝绸之路上最重要的贸易群体,通过经济贸易,他们的影响力向政治、文化方面渗透。中国历史上最著名的一个粟特人就是引发“安史之乱”的安禄山。当时的粟特人所使用的文字粟特文,就是基于阿拉米文创制的,自右向左书写,只表示辅音。

在突厥汗国中,当权阿史那氏为主的部落成为贵族,而其他部落则不服这个当权的部落,便联合起来形成了“回纥”部落联盟,同时开始与当时的中原政权唐王朝交好。最终在唐王朝的支持之下,744年,推翻了突厥汗国,建立回纥汗国。这个汗国向唐王朝朝贡,接受册封。788年,取“回旋轻捷入鹘”之意,将官方的汉文名改为“回鹘”。其实,不管是回纥、回鹘,还是畏兀儿的译名,其实都uyghur(ئۇيغۇر),和现代的维吾尔名字是一样的。

生意做起来,粟特文用起来

回纥人本来信仰自然崇拜的萨满教,在于中原的接触中。回纥人接触到唐王朝的汉传佛教,也通过在中原经商居住的粟特人,接触到粟特人信奉的摩尼教。这些宗教都比自然崇拜更具理论性和制度性。摩尼教更简单明了,总结起来就是二宗三际论,二宗指的是黑暗与光明、善与恶,三际是世界发展的三个过程:初际(过去)、中际(现在)和后际(将来)。摩尼教就是武侠小说《倚天屠龙记》里面所说的“明教”。

这显然比当时艰深复杂,甚至戒律不全,还需要唐玄奘背包到天竺取经的汉传佛教要容易理解。同时,游牧民族回纥人还通过粟特人做起了贸易生意,粟特人掌握了回纥人的经济命脉,这样粟特人在回纥汗国里的地位就越来越重要了。

北齐石碑上的粟特人(藏于法国吉美博物馆内)

第三代可汗牟羽认为最终选择了摩尼教,立摩尼教为国教。他还从洛阳带回来四位摩尼教教士与萨满辩论,结果摩尼教士获胜,奠定了摩尼教在回纥的不可动摇的地位。

摩尼教在回纥的传播中,势必同时也将他们使用的粟特字母引入回纥语言中。粟特语属于印欧语系的伊朗语族,而回纥语则是阿尔泰语系突厥语族,两者根本不同。所以,到了9世纪,又基于粟特字母,创制出了回鹘字母,实际上就是加上原来一些清浊不分的字母左右加一点或者两点来区分而已。这套文字也被后来漠北崛起的蒙古人,以及东北的满人采用,沿用至今。现在中国境内的蒙文用的文字就称为回鹘式蒙文。

不过,漠北的游牧民族们仍然在互相抢地盘,柯尔克孜族人的祖先黠戛斯人在汗国建立100多年后就取而代之。回鹘开始四处逃散,大部分人进入了西域,也就是今年的新疆地区,更远的进入中亚的草原地带。

哈密博物馆里所藏的回鹘文《弥勒会见记》(图/无畏)

当时的西域盛行佛教,回鹘人也从摩尼教改信佛教。所以,他们也开始用自己的回鹘文来写佛经,最著名的就是1954年在哈密发现的《弥勒会见记》回鹘文版。

不过,回鹘人并没有把回鹘文字坚持下来。

强大的伊斯兰教来袭,阿拉伯字母成主流

公元9世纪前后,回鹘人建立了在中亚建立了喀喇汗国。刚刚成立的喀喇汗国仍然信任摩尼教和原始的萨满教。而喀拉汗国的西边就是波斯人建立的信奉伊斯兰教的国家萨曼王朝。萨曼王朝向往东推进伊斯兰教,第一个征服对象就是喀喇汗国。

萨曼王朝和喀喇汗国的对峙中,一个关键性人物就是喀喇汗国第三代汗萨图克。萨图克早年接触穆斯林,并皈依了伊斯兰教。915年,在穆斯林势力的支持下,萨图克在王位之争中打败了舒服奥古尔恰克,登上了王位。

登上王位的萨图克立在国内大力推行伊斯兰教,继位的儿子阿尔斯兰汗在960年宣布伊斯兰教为国教,设立清真寺、经文学院和麻扎。如今,我们漫步开始老城,还能够找到当时建立的萨吉耶经文学院的遗址。

喀什老城里萨吉耶经文学院遗址(图/无畏)

喀什老城里的经文进修学校(图/无畏)

与此同时,喀喇汗国向东征服于阗国,灭亡了于阗国的佛教,使得今天的和田地区开始伊斯兰化和突厥化。现在我们开到很多石窟中的损坏,第一波就是当时的伊斯兰教徒破坏的。由于伊斯兰教反对偶像崇拜,许多壁画上的佛像被挖去了双眼。

克孜尔千佛洞中被挖去双眼的佛像(图/无畏)

随着伊斯兰教的传播,阿拉伯文也开始取代原来的回鹘文。11世纪,出生于喀喇汗国的首都喀什的马哈茂德·喀什噶里写成了《突厥语大词典》,全文用阿拉伯字母为突厥语标音,用阿拉伯语解释突厥语。

喀什老城的入城仪式,扮演马哈茂德·喀什噶里(图/无畏)

成吉思汗的蒙古铁骑开始了世界征服。西域落入强大的蒙古帝国之中,这块地区封给了成吉思汗的二儿子察合台,察合台建立了察合台汗国。不过蒙古大帝国充其量就是个松散的联盟而已。蒙古帝国在亚洲建立的金帐汗国、伊利汗国都被伊斯兰化,接着察合台汗国也改信伊斯兰教。蒙古铁骑也成为伊斯兰教传播的助推力量。

13世纪,阿拉伯文的回鹘语正式定型,被称为“察合台文”,一直沿用到1949年。察合台语也就演变为现代维吾尔语。

先用俄文后用拉丁文,最后回归阿拉伯文

居住在喀什老城里的维族大叔(图/无畏)

1949年建国后,由于中国与苏联的亲密关系,中国也效仿苏联境内使用俄文西里尔字母标识突厥语,用西里尔字母标识维吾尔语。但是,1959年,随着中苏关系交恶,西里尔字母遭到废止。

同时,1958年又公布了以拉丁字母为基础的汉语拼音方案。所以,维吾尔语也跟随汉语拼音,制定出拉丁文字维吾尔语,从60年代开始,沿用至1982年。不过,1982年之后又重新使用阿拉伯文字的维吾尔文。这时候的新的阿拉伯文标识的维吾尔语,有别于不怎么标元音的阿拉伯语,把辅音、元音都一五一十地标识出来。这样让维吾尔语更容易学,只要学会字母,就可以准确地读出来。

人民币上的少数民族语言,维语位于左下方(图/网络)
喀什新华书店的翻译成维吾尔语的世界名著(图/无畏)

而对于现在大部分学汉语的维吾尔族人来说,非拼音文字的汉文字实在太难了,每个字的读音都不仅有自己的读音,学汉字的同时,还要学习拉丁文字的汉语拼音来读。有的人只记得了拼音,却不知道怎么写,所以我们经常看到,维吾尔族或者新疆其他少数民族的朋友的手机上,都会装上一个应用,让每个汉字的拼音都显示出来,这样他们读拼音,就大概知道什么意思了。

学习汉语的课本(图/无畏)

其实,一种语言,用多种文字书写的例子在全世界历史上根本不稀奇。然而,从秦始皇“书同文”,统一汉字到现在的两千多年间,整个华夏大地一直沿用汉字。甚至,汉字成为与说着与汉语完全不同的语言的日本、朝鲜半岛、越南的官方文字。即便现在略有变化,我们仍然能读出两千年前刻在铜鼎上的我们的文字,而世界上大部分的人,已经认不得自己古时候的文字了。


无畏
2018年6月3日
乌鲁木齐

广州一祠堂前摆的石武将,可能来自皇帝陵墓

  陈氏宗祠(图/无畏) 在20多年前,广州的小谷围岛上只有一群静寂的村落。后来,由于广州大学城的建立,村落的面积大大缩小。不少村民也把老房子推倒,建起商业价值更高的楼房,毕竟周边都是消费能力不低的年轻大学生们。 乡村宗族最重要的象征物——祠堂倒是保存了许多。包裹在大学当中的北亭...