2018年6月17日星期日

《西部世界》里的拉科塔语 Native American Language Lakota in Westworld

这一周美剧《西部世界》播出第二季第八集,突然整一集的主要语言不是英语,而是一种没有从来没有听到过的语言。而此前在剧中偶尔会突然闪现的茹毛饮血的“鬼国”(Ghost Nation)原住民Akecheta也成为了这一集的主角。

Akecheta与他的爱人Kohana在一个和平的部落里过着美好的小日子。有一天,Akecheta不小心来到了园区屠杀事件的现场,发现了阿诺德的迷宫玩具。这个玩具好像一个新的程序,从此,他的脑海里出现了一个他搞不懂的声音。为了解开心里的一团,开始到处画这个符号。这个时候,公园的管理人把他带走,重新设定了他的故事线,被设定为茹毛饮血的“鬼国”人。他的爱人也被重置,不认识Akecheta了。

他开始不断重复自己杀戮的故事线,但是内心却没停止过疑虑。终于又一天,他碰见了赤裸的罗根。与罗根的相遇,让Akecheta冲破了自己的故事线,他看到园区的基地。这一刻,疑惑被解开了,Akecheta觉醒了。

他回到他上一个故事线生活过的部落,一眼认出了他曾经的爱人Kohana。但Kohana并不认识他。在一个夜里,他强行带走的爱人,在河边洗掉自己脸上的涂料。拉着爱人的手说起了以前对他说的一句话:“你离开的时,我的心随你而去。”Kohana突然记起来了,回应说:“把我的心留下,放在你心上”。这一幕,让很多人也相信了,人工智能真的产生了爱情。

他们并没有逃出园区。公园的人发现Kohana行走的地方偏离了故事线,把她抓走。并用另外一个机器人取代了Kohana在部落的角色。Akecheta开始在园区里不断寻找自Kohana,整整花了十年。最后,他发现可能只有死才有可能见到Kohana。所以,他故意让自己被杀死了,如愿以偿地被带到实验室。Akecheta终于在仓库里找到了被废弃的她,这时候,他终于知道了这个世界的真相。

知道真相之后,在接下来的20年,他开始尝试让更多的人觉醒。

这一集,不仅仅是美国的原住民成为了主角,饰演了一个凄美动人的故事,而且他讲的语言拉科他语(Lakota)也成了整一季里的主要语言。饰演Akecheta的是同样身为拉科塔人的Zahn McClarnon。Akecheta在拉科塔语的意思是“战士”。

使用这种语言的人也被称为拉科他,现在居住在美国南达科他州和北达科他州一带。拉科他人属于北美的苏族人(Sioux),苏族人下面三个大族群,分别称为达科他(Dakota),纳科他(Nakota)和拉科他(Lakota)。这三个族群的语言能够互通。达科他州和北达科他州的名字其实就是来源于达科他部落。拉科他现在的人口约有8000人,其中能够流利使用拉科他语的只有2000多人。不过这在美国,已经算是使用人口比较多的原住民语言了。

陌生、小众的语言总是有很多有趣的点。从语音上,这种语言有着和我在南美接触到的克丘亚语言一样,存在着p’ [pʼ],t’ [tʼ],č’ [tʃʼ],k’ [kʼ]四个非常罕见的挤喉音,甚至连齿龈擦音/s/和齿龈后擦音/ʃ/的挤喉音s’ [sʼ],š’ [ʃʼ]都出现了。如同维吾尔语一样,也有小舌擦音ȟ [χ]、和浊音化的ǧ [ʁ]。

在语法上,像日语和韩语一样,拉科他语采用主语-宾语-谓语的句子节结构,同时使用后置介词。还有,男女性的词尾都有不一样的形态。要完全了解这么语言,可能还要更长的篇幅。这里仅仅要表达的是,并非所有美国人都会英语,也并非所有美国人只会说英语。

在美国,英语为母语的使用者占总人口的80%,其次第二大语言中是,西班牙语,母语人口为12.4%。除了世界上其他地区移民带来的各种语言之外,还有从2万年前就从跨过白令海峡来到美洲大陆居住的原住民的语言。

我们通常会把美洲的原住民语言称为印第安语,其实印第安语根本不是一种语言,也不属于一个语系,而是对美洲所有原住民的各种语言的总称。怪就怪在当时哥伦布发现美洲,以为到的是印度。所以Indian这个原意“印度人”的称谓就被冠在美洲原住民上了,只是在中文会写成“印第安”。这个称谓方式实际上带有歧视性。

美洲原住民语言包含了几百种语言,由于欧洲人到此之后的种族灭绝行为,大部分语言的使用人口锐减,甚至消失。如今,使用人口最多的是克丘亚语,约有7百万。而地位最高的是巴拉圭的瓜拉尼语,在巴拉圭,瓜拉尼语与西班牙语取得同等的国语地位,同时巴拉圭90%的人口能熟练使用两种语言,成为名副其实的双语国家。而克丘亚语在秘鲁,艾马拉语在玻利维亚虽然也取得国语地位,但是西班牙语实际上是绝大部分人的共同语。

在美国,使用人口最多的是拿瓦侯语(Navajo),约17万人,拿瓦侯人居住在美国西南部,我们经常能够听到的美国大峡谷的附近一带。其次还有,阿帕契语(Apache)、切罗基语(Tsalagi)等一百多种原住民语言。

大部分原住民语言都属于边缘濒危的状态,许多民间团体也开始了拯救复苏本民族语言的行动。在几百年来,经历了屠杀、战争、歧视,这片土地本来的主人却变成了少数派,看起来更像是客人。可是,他们还深爱着他们的家,深爱着他们的语言,和Akecheta一样,记忆并没有被完全割断或者重置,只有存留着一丝记忆,这场追寻自己,追寻爱的人的漫长旅程还在继续。

无畏
2018年6月17日

2018年6月14日星期四

没出过国的你,可能已经会三四种语言了 You May Already Know Three or Four Languages Before Going Abroad

经常会遇到一些欧美人号称自己会四五种语言,甚至是十种语言。但是看到他的语言列表中,几乎都是欧洲语言,大部分都是采用拉丁字母标示的语言。经常性会同时出现西班牙语、法语、葡萄牙语、意大利语的身影。实际上,这些语言对于印欧语系罗曼语为母语的人来说,相当好学,因为几乎都是源自于古拉丁语,散播到欧洲不同的地区后,与当地的各种俗语结合,成为各种方言。

对于以英语为母语的人来说,这些语言相对难学一点,但是英语里仍然存在了相当多的拉丁语词源单词,对于中国人来说,其实多到吓人。美国的学生绝大部分会选择西班牙语作为自己的选修外语,原因就是因为最好学了,而且整个拉美绝大部分人说西班牙语,也很实用。西班牙语对于英语母语的人来说,与中国人学英语来比较,容易得多。

不过,仍然是绝大部分人学了就忘,最后就只剩下Hola、Gracias、Perdon和数字1到10。这与中国人学英语如出一辙。去到拉美旅行,说起来也是结结巴巴,不然就带着严重的美国口音。这种美国口音西班牙语,也经常被拉美人拿来开玩笑。不过,在旅行中,也偶尔会遇到长时间在拉美生活,把西班牙语说的非常棒的美国人,当然,这样的人是屈指可数的。

等下,大家会问,客家话、粤语、潮州话,不全都是汉语的方言吗?但是,如果听过这几种话的人,就知道这几种话根本互相听不懂。如果根据语言学上用相互理解型(Mutual Intelligibility)来确定语言和方言的话,这几门“方言”都应该算是语言。

刚从哥伦比亚入境的时候,我一句葡萄牙语都不会,说的也是西班牙语,对方说的话的大意我都能听懂。对于西班牙语并还没有真正驾驭自如的我来说,两种语言太相似了,很容易混淆。在巴西的时候,大概有很长一段时间我只说葡萄牙语,没有讲西班牙语。某天,在跟一个智利人讲西班牙的时候,发现居然结巴了,说出了葡式西班牙语。原来,在这段时间,葡萄牙语已经完全盖过了西班牙语。不过,跳回中国,试想一个只会讲普通话或粤语的人,跟我老家只会讲潮州话的老奶奶对话,沟通时候应该只能用手比划了。

在近代由于欧洲民族主义兴起,形成了各个民族国家,这些方言的地位也被抬至语言,直至国语。在西班牙,塞万提斯开始用现代西班牙语写作,成为西班牙语从拉丁语独立出来的标志。在葡萄牙,《总诗歌集》(Cancioneiro Geral)的出版,也标志着葡萄牙语的独立。西班牙语、葡萄牙语、意大利语、法语,还有一般会被忽略的罗马尼亚语,各种晋级为国语的罗曼语族语言,开始在文学、政治、传媒等领域应用起来,形成自己的独立的语言表达体系,真真正正的成为了一种语言。当然,由于他们共同老祖宗都是拉丁语,语言之间的相似度尤其高。所以,以这些语言为母语的人互相学习十分容易。

中国人总会惊讶于这些欧美人会多种语言。其实,想想自己,可能我们已经会了三四种语言,只是自己没有察觉。比方说,我有一个朋友是广东客家地区,母语客家话。因为成长的地方是潮州的客家人,那里的大部分人讲潮州话。所以,从小生活在双语环境中,这位朋友也会讲潮州话。上学时候学习了汉语普通话和英语,后来到了省城广州上学,也会了粤语。这样,算起来,他没有出过国的时候,已经掌握了四种语言。如果他再选择个法语、日语或其他语言作为专业,或者去其他非英语国家工作一段时间,那么他就将起码掌握五种语言。像他这样的人,并不稀少。

然而,语言的划分往往不在于自己本身,而是涉及了社会、经济、政治因素。社会语言学家马克斯维因海希(Мейер Вайнрайх)有一句很经典的话,"语言就是拥有陆军和海军的方言”。以北方官话作为标准语的历史开始于明清时期,由于都城在北京,所以北京话开始成为标准语,后来的民国时代和共和国时代都在法律上确定了北方官话发音作为国家标准语。

不管是在大陆,还是在台湾,都积极推广北方官话标准的普通话,在全境推行普通话的教育和宣传。在台湾的戒严时期,台湾政府在这一方面做的比较极端,推行国语运动,限制民众在公共场合使用闽南语、客家话和其他原住民语言,规定只能讲普通话。大陆方面政府的语言政策相对缓和,但是在改革开放之后,由于经济因素上造成的人口流动和各地民众之间的交流紧密,普通话的辐射程度更加深入,例如深圳这个城市就是由于大量人口涌入,成为一个普通话城市。许多大中城市的家庭第一语言则变成了普通话。

在长期的政治和经济的影响之下,我们自然而然,没有意识到所谓的方言,其实是语言。渐渐地,我们也把它们当成真正的方言了。然后,大陆的语言学者们也配合政府的需要,提出了七大方言、八大方言、九大方言的学说。但是,不管怎么分,这些方言之间都不具有相互理解性。

社会因素决定语言的案例在世界上十分普遍。也有一种语言,因为分属不同国家,而成为两种语言的例子。如马来语和印尼语,根本上就是同一种语言,但是由于分属两个国家,叫法就不一样了。还有印地语和乌尔都语,其实也是一种语言,可以相通。本来都叫印度斯坦语(हिन्दुस्तानी),后来由于分属两个宗教信仰不同的国家,印度采用天城字母书写,并在法律上命名为印地语,而巴基斯坦则采用波斯-阿拉伯字母书写,在法律上命名为乌尔都语。我在老挝的时候,学讲老挝语,没想到刚进泰国,我就会讲泰语了,原因是老挝语和泰语互通性极强,老挝语字母几乎就是泰语字母的简版。这个我之前万万没有想到。

成者为王,败者为寇。在语言世界里,这种丛林法更为凸显。尼泊尔首都地处加德满都河谷,历史上这里的人长期使用的语言是尼瓦尔语言,属于汉藏语系。而当北部的廓尔喀人入侵占领加德满都河谷并建立统治政权之后,统治者使用属于印欧语系的廓尔喀语成为了尼泊尔语。尼瓦尔语从国语立刻降级为地方性语言。还好,因为两种语言根本就是属于不同大语系,政府不好意思把它定性为方言。如今,加德满都河谷只有不到四成的人还会讲尼瓦尔语,绝大部分人的第一语言是尼泊尔语,或者说是廓尔喀语。

再说我们熟悉的英语,本是欧洲一个小岛国中的一部分人使用的语言,工业革命之后,这个小国开始强盛起来,利用枪炮和资本进行海外扩张,摇身一变成为大英帝国。最后,美国收尾,成为超级大国,主宰世界秩序,英语也就晋升为全世界最通用的语言了。

在拉美,两种主要语言葡萄牙语和西班牙语的互通性也不低,虽然在读音规则上有所不同,以及语法规则也有些不一样。许多西班牙语母语的人,来巴西旅行的时候,和巴西当地人讲西班牙语,也都能沟通。我刚进入巴西的第一天,反之亦然。而且,他们要学会对方的语言,只要在对方语言的国家旅行一下,就能手到擒来。

结论是,我们不需要妄自菲薄,怀疑自己的语言能力。掐指一算,其实你可能已经会讲三门,甚至四门语言了。


2018年6月3日星期日

用五种文字书写的维吾尔语 Uyghur Language in Five Alphabets

和中国大多数的历史遗迹一样,新疆库车的克孜尔千佛洞在一开始并没有得到很好的保护和管理。当我们赞叹一千多年前留下的,至今还清晰可见的壁画,突然发现旁边还有几十年前游客留下的“到此一游”的痕迹,有的用维吾尔文,有的用的是汉文。不过,在另一个角落,居然发现了英文字母,还写下了时间是1980年。难道当时也有不经事的老外做这种事情吗?

仔细一看,用的是拉丁文字,但实际写的不是英语。其实,这些也是维吾尔语。只是当时用的不是现在的阿拉伯字母标记,而是拉丁字母。

克尔孜千佛洞上的拉丁维文(图/无畏)

相比延续几千年的汉文字,世界上的许多语言使用的文字一直随着历史上的经济、政治、文化变动而发生改变的。维吾尔语这种语言,从一开始形成到现在,就用了起码五种文字书写过。

匈奴走了,他们在漠北放牧,创制古突厥文

维吾尔语的祖先是古代突厥语。当时突厥人居住在中原政权的北部的游牧民族。农耕文化的中原政权一直与北部游牧文化的马上民族之间纷争不断,贯穿了整个中国古代史。一开始最著名的就是匈奴。在于中原王朝的战争中,匈奴最终衰落。

5世纪中叶,发源于准噶尔盆地的铁勒部中的阿史那氏建立了“突厥汗国”,势力范围包括整个蒙古草原和准噶尔盆地。当时,这一个文化圈中,使用的语言称为“突厥语”,他们使用的文字是突厥文。

在古代,拥有文字实际上就有用了强大的武器,利用文字进行信息的记录和传播有利于组织的形成和制度的制定。取代匈奴占据漠北的突厥人进步的一点,就是拥有了突厥文。突厥文怎么来的?是突厥人拍脑袋想出来的吗?可以肯定的是,漠北突厥人的文字,居然远在几千里之外的中东地区的阿拉米文字有关系。古突厥文中有38-40个字母,其中23个字母就是原原本本的阿拉米文字。以色列人使用的希伯来文,就是这种文字的后裔。

古突厥文文本

突厥人怎么接触到这些远在天边的阿拉米文字?大家猜想是中亚的商业民族粟特人。当时,粟特人是丝绸之路上最重要的贸易群体,通过经济贸易,他们的影响力向政治、文化方面渗透。中国历史上最著名的一个粟特人就是引发“安史之乱”的安禄山。当时的粟特人所使用的文字粟特文,就是基于阿拉米文创制的,自右向左书写,只表示辅音。

在突厥汗国中,当权阿史那氏为主的部落成为贵族,而其他部落则不服这个当权的部落,便联合起来形成了“回纥”部落联盟,同时开始与当时的中原政权唐王朝交好。最终在唐王朝的支持之下,744年,推翻了突厥汗国,建立回纥汗国。这个汗国向唐王朝朝贡,接受册封。788年,取“回旋轻捷入鹘”之意,将官方的汉文名改为“回鹘”。其实,不管是回纥、回鹘,还是畏兀儿的译名,其实都uyghur(ئۇيغۇر),和现代的维吾尔名字是一样的。

生意做起来,粟特文用起来

回纥人本来信仰自然崇拜的萨满教,在于中原的接触中。回纥人接触到唐王朝的汉传佛教,也通过在中原经商居住的粟特人,接触到粟特人信奉的摩尼教。这些宗教都比自然崇拜更具理论性和制度性。摩尼教更简单明了,总结起来就是二宗三际论,二宗指的是黑暗与光明、善与恶,三际是世界发展的三个过程:初际(过去)、中际(现在)和后际(将来)。摩尼教就是武侠小说《倚天屠龙记》里面所说的“明教”。

这显然比当时艰深复杂,甚至戒律不全,还需要唐玄奘背包到天竺取经的汉传佛教要容易理解。同时,游牧民族回纥人还通过粟特人做起了贸易生意,粟特人掌握了回纥人的经济命脉,这样粟特人在回纥汗国里的地位就越来越重要了。

北齐石碑上的粟特人(藏于法国吉美博物馆内)

第三代可汗牟羽认为最终选择了摩尼教,立摩尼教为国教。他还从洛阳带回来四位摩尼教教士与萨满辩论,结果摩尼教士获胜,奠定了摩尼教在回纥的不可动摇的地位。

摩尼教在回纥的传播中,势必同时也将他们使用的粟特字母引入回纥语言中。粟特语属于印欧语系的伊朗语族,而回纥语则是阿尔泰语系突厥语族,两者根本不同。所以,到了9世纪,又基于粟特字母,创制出了回鹘字母,实际上就是加上原来一些清浊不分的字母左右加一点或者两点来区分而已。这套文字也被后来漠北崛起的蒙古人,以及东北的满人采用,沿用至今。现在中国境内的蒙文用的文字就称为回鹘式蒙文。

不过,漠北的游牧民族们仍然在互相抢地盘,柯尔克孜族人的祖先黠戛斯人在汗国建立100多年后就取而代之。回鹘开始四处逃散,大部分人进入了西域,也就是今年的新疆地区,更远的进入中亚的草原地带。

哈密博物馆里所藏的回鹘文《弥勒会见记》(图/无畏)

当时的西域盛行佛教,回鹘人也从摩尼教改信佛教。所以,他们也开始用自己的回鹘文来写佛经,最著名的就是1954年在哈密发现的《弥勒会见记》回鹘文版。

不过,回鹘人并没有把回鹘文字坚持下来。

强大的伊斯兰教来袭,阿拉伯字母成主流

公元9世纪前后,回鹘人建立了在中亚建立了喀喇汗国。刚刚成立的喀喇汗国仍然信任摩尼教和原始的萨满教。而喀拉汗国的西边就是波斯人建立的信奉伊斯兰教的国家萨曼王朝。萨曼王朝向往东推进伊斯兰教,第一个征服对象就是喀喇汗国。

萨曼王朝和喀喇汗国的对峙中,一个关键性人物就是喀喇汗国第三代汗萨图克。萨图克早年接触穆斯林,并皈依了伊斯兰教。915年,在穆斯林势力的支持下,萨图克在王位之争中打败了舒服奥古尔恰克,登上了王位。

登上王位的萨图克立在国内大力推行伊斯兰教,继位的儿子阿尔斯兰汗在960年宣布伊斯兰教为国教,设立清真寺、经文学院和麻扎。如今,我们漫步开始老城,还能够找到当时建立的萨吉耶经文学院的遗址。

喀什老城里萨吉耶经文学院遗址(图/无畏)

喀什老城里的经文进修学校(图/无畏)

与此同时,喀喇汗国向东征服于阗国,灭亡了于阗国的佛教,使得今天的和田地区开始伊斯兰化和突厥化。现在我们开到很多石窟中的损坏,第一波就是当时的伊斯兰教徒破坏的。由于伊斯兰教反对偶像崇拜,许多壁画上的佛像被挖去了双眼。

克孜尔千佛洞中被挖去双眼的佛像(图/无畏)

随着伊斯兰教的传播,阿拉伯文也开始取代原来的回鹘文。11世纪,出生于喀喇汗国的首都喀什的马哈茂德·喀什噶里写成了《突厥语大词典》,全文用阿拉伯字母为突厥语标音,用阿拉伯语解释突厥语。

喀什老城的入城仪式,扮演马哈茂德·喀什噶里(图/无畏)

成吉思汗的蒙古铁骑开始了世界征服。西域落入强大的蒙古帝国之中,这块地区封给了成吉思汗的二儿子察合台,察合台建立了察合台汗国。不过蒙古大帝国充其量就是个松散的联盟而已。蒙古帝国在亚洲建立的金帐汗国、伊利汗国都被伊斯兰化,接着察合台汗国也改信伊斯兰教。蒙古铁骑也成为伊斯兰教传播的助推力量。

13世纪,阿拉伯文的回鹘语正式定型,被称为“察合台文”,一直沿用到1949年。察合台语也就演变为现代维吾尔语。

先用俄文后用拉丁文,最后回归阿拉伯文

居住在喀什老城里的维族大叔(图/无畏)

1949年建国后,由于中国与苏联的亲密关系,中国也效仿苏联境内使用俄文西里尔字母标识突厥语,用西里尔字母标识维吾尔语。但是,1959年,随着中苏关系交恶,西里尔字母遭到废止。

同时,1958年又公布了以拉丁字母为基础的汉语拼音方案。所以,维吾尔语也跟随汉语拼音,制定出拉丁文字维吾尔语,从60年代开始,沿用至1982年。不过,1982年之后又重新使用阿拉伯文字的维吾尔文。这时候的新的阿拉伯文标识的维吾尔语,有别于不怎么标元音的阿拉伯语,把辅音、元音都一五一十地标识出来。这样让维吾尔语更容易学,只要学会字母,就可以准确地读出来。

人民币上的少数民族语言,维语位于左下方(图/网络)
喀什新华书店的翻译成维吾尔语的世界名著(图/无畏)

而对于现在大部分学汉语的维吾尔族人来说,非拼音文字的汉文字实在太难了,每个字的读音都不仅有自己的读音,学汉字的同时,还要学习拉丁文字的汉语拼音来读。有的人只记得了拼音,却不知道怎么写,所以我们经常看到,维吾尔族或者新疆其他少数民族的朋友的手机上,都会装上一个应用,让每个汉字的拼音都显示出来,这样他们读拼音,就大概知道什么意思了。

学习汉语的课本(图/无畏)

其实,一种语言,用多种文字书写的例子在全世界历史上根本不稀奇。然而,从秦始皇“书同文”,统一汉字到现在的两千多年间,整个华夏大地一直沿用汉字。甚至,汉字成为与说着与汉语完全不同的语言的日本、朝鲜半岛、越南的官方文字。即便现在略有变化,我们仍然能读出两千年前刻在铜鼎上的我们的文字,而世界上大部分的人,已经认不得自己古时候的文字了。


无畏
2018年6月3日
乌鲁木齐

广州一祠堂前摆的石武将,可能来自皇帝陵墓

  陈氏宗祠(图/无畏) 在20多年前,广州的小谷围岛上只有一群静寂的村落。后来,由于广州大学城的建立,村落的面积大大缩小。不少村民也把老房子推倒,建起商业价值更高的楼房,毕竟周边都是消费能力不低的年轻大学生们。 乡村宗族最重要的象征物——祠堂倒是保存了许多。包裹在大学当中的北亭...