

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 14/14北方官話和東南諸方言詞匯語(yǔ)法“基因”的透視 Modern Linguistics 現(xiàn)代語(yǔ)言學(xué), 2017, 5(1), 40-57 Published Online February 2017 in Hans. http:/./doc/d0b505bc951ea76e58fafab069dc5022aaea46c1.html /journal/ml https:/http:/./doc/d0b505bc951ea76e58fafab069dc5022aaea46c1.html /10.12677/ml.2017.51007 文章引用: 項(xiàng)夢(mèng)冰. 北方官話和東南諸方言詞匯語(yǔ)法“基因”
2、的透視J. 現(xiàn)代語(yǔ)言學(xué), 2017, 5(1): 40-57. The North and the South: A Perspective of Their Lexicon and Grammar “Genes” Mengbing Xiang 1,2 1 Department of Chinese Language and Literature accepted: Feb. 20th , 2017; published: Feb. 24th , 2017 Abstract One of the most obvious divisions in Chinese dialects is the
3、 confrontation between northern man-darin and southeastern dialects. In this paper, the author selected 16 items from the vocabulary and the grammar volumes of Linguistic Atlas of Chinese Dialects and analyzed the feature se-quences of the 16 items of 930 Chinese dialects with MEGA (Molecular Evolut
4、ionary Genetics Analysis) by simulating DNA sequences. The results showed that lexicon-grammar items alone could also basically reveal the North-South opposition just as phonology items do. Therefore, the introduction of lexicon-grammar items into the Chinese dialect classification is meaningful. Of
5、 course, the so-called “feature sequence” in dialectology is not the real DNA sequence and when using MEGA for large sample calculation, it is normal that bootstrap values are low. The important thing is to observe the grouping trends embodied in the phylogenetic trees. Keywords Mandarin, Southeaste
6、rn Dialects, Lexicon-Grammar Feature Sequences, Phylogenetic Analysis 北方官話和東南諸方言詞匯語(yǔ)法 “基因”的透視 項(xiàng)夢(mèng)冰1,2 1 北京大學(xué)中文系暨中國(guó)語(yǔ)言學(xué)研究中心,計(jì)算語(yǔ)言學(xué)重點(diǎn)實(shí)驗(yàn)室,北京 2 新加坡國(guó)立大學(xué)中文系,新加坡 收稿日期:2017年2月7日;錄用日期:2017年2月20日;發(fā)布日期:2017年2月24日 項(xiàng)夢(mèng)冰 摘 要 漢語(yǔ)方言的一個(gè)最明顯的分野是北方官話和東南諸方言的對(duì)立,即南北對(duì)立。本文從漢語(yǔ)方言地圖集的詞匯卷和語(yǔ)法卷選取16個(gè)項(xiàng)目,模擬DNA 序列用MEGA (Molecular Evolution
7、ary Genetics Analysis 分子進(jìn)化遺傳分析)軟件對(duì)930個(gè)漢語(yǔ)方言點(diǎn)的這16個(gè)項(xiàng)目的特征序列進(jìn)行分析,結(jié)果發(fā)現(xiàn)只選用詞匯、語(yǔ)法項(xiàng)目也能大致看到南北對(duì)立,說明在漢語(yǔ)方言的分區(qū)工作中引入詞匯和語(yǔ)法標(biāo)準(zhǔn)是有意義的。當(dāng)然方言學(xué)里的所謂“特征序列”并非真正的DNA 序列,而用MEGA 來進(jìn)行大樣本計(jì)算時(shí),自展值低也是正常情況,重要的是從中觀察進(jìn)化樹所體現(xiàn)的分組趨勢(shì)。 關(guān)鍵詞 官話,東南方言,詞匯-語(yǔ)法特征序列,進(jìn)化分析 Copyright ? 2017 by author and Hans Publishers Inc. This work is licensed under the
8、Creative Commons Attribution International License (CC BY). http:/./doc/d0b505bc951ea76e58fafab069dc5022aaea46c1.html /licenses/by/4.0/ 1. 引言 漢語(yǔ)方言的一個(gè)最明顯的分野是北方官話和東南諸方言的對(duì)立,即南北對(duì)立。本文從漢語(yǔ)方言地圖集1的詞匯卷和語(yǔ)法卷選取16個(gè)詞匯、語(yǔ)法項(xiàng)目,模擬DNA 序列用MEGA (Molecular Evolutionary Genetics Analysis 分子進(jìn)化遺傳分析)軟件進(jìn)行分析(MEGA 的操作可參看 Hall 200
9、8 2),并加以必要的檢驗(yàn),目的是探討在漢語(yǔ)方言分區(qū)研究中引入詞匯、語(yǔ)法標(biāo)準(zhǔn)以及借助生物學(xué)軟件進(jìn)行輔助分析的可行性。 2. 數(shù)據(jù)處理 本文選取的16個(gè)詞匯、語(yǔ)法項(xiàng)目在漢語(yǔ)方言地圖集里的詞形分類往往都比較復(fù)雜,例如詞匯卷014圖(簡(jiǎn)稱為L(zhǎng)V014)“面兒玉米,辣椒”的詞形有4大類30小類,可轉(zhuǎn)寫如表1(略去代表各類詞形的符號(hào),“=”表示同音字)。 本文立足于南北對(duì)立,將表1的30種詞形概括為兩類:“面”及其派生形式為一類,剩下的其他形式為另一類。即A 、C 為一類,B 、D 為一類,各有15小類。本文只區(qū)分大類,不區(qū)分小類。本文對(duì)選取的16個(gè)詞匯、語(yǔ)法項(xiàng)目所做的詞形分類如表2所示?!暗貓D集分類”
10、斜線前后的數(shù)字分別為漢語(yǔ)方言地圖集的大類數(shù)和小類數(shù)。 詞形二分法的設(shè)計(jì)目的是凸顯北方的特點(diǎn)。因此凡碰到兼用南北不同詞形或南北詞形合璧時(shí),都一律歸入北方型。例如詞匯卷179“痛疼”(兼用南北詞形)歸為“疼”類,而不歸為“其他”。詞匯卷101“房子屋”、“房子屋子”、“房屋”、“房屋”(兼用南北詞形)以及“房屋”、“房屋屋”、“厝房厝”(南北詞形合璧)歸為“房”類,而不歸為“其他”。 漢語(yǔ)方言地圖集共設(shè)930個(gè)方言點(diǎn)。根據(jù)每個(gè)方言點(diǎn)對(duì)16個(gè)詞匯語(yǔ)法項(xiàng)目Y/N 的不同反應(yīng),可以得到930個(gè)YN 序列。以北京、南京和廣州為例(見表3,第一行為16個(gè)詞匯語(yǔ)法項(xiàng)目的編號(hào))。 即北京、南京、廣州的特征序列分
11、別為:YYYYYYYYYYYYYYYY YYYYYYYYYY N YYYY N NNNNN Y NNNNNNNNNN 。其中北京對(duì)16個(gè)項(xiàng)目的反應(yīng)都是Y ,南京除了對(duì)11、16兩個(gè)項(xiàng)目的反應(yīng)是 Table 1. The classification of word forms for “powder” on Map 014 of LACD vocabulary volume Open Access 項(xiàng)夢(mèng)冰 表1. LV014的詞形分類 A B C D 1 面兒粉面兒粉末 2 面粉末面兒粉兒末兒 3 面面兒粉灰面兒粉子末子 4 面子粉子面粉屑 5 面子面兒粉不包括“粉子”面面粉粉灰 6 面子面粉
12、粉絨 7 面面糝子 8 面面面?兒 9 面面兒餑 10 面勇= Table 2. The word-form classification of 16 lexicon-grammar items 表2. 16個(gè)詞匯、語(yǔ)法項(xiàng)目的詞形分類 地圖集編號(hào)地圖集分類本文的二分法 1. 下雨詞匯卷005 3/13 動(dòng)詞用“下”;動(dòng)詞用其他形式 2. 面兒(玉米,辣椒)詞匯卷014 4/30 “面”類;其他 3. 窩(鳥)詞匯卷037 5/23 “窩”類;其他 4. 兒子(敘稱)詞匯卷052 5/61 “兒”類;其他 5. 穿(鞋)詞匯卷079 5/9 “穿”類;其他 6. 房子(一座)詞匯卷101 5/3
13、3 “房”類;其他 7. 鍋詞匯卷109 6/51 “鍋”類;其他 8. 站(起來)詞匯卷134 4/14 “站”類;其他 9. 走(慢慢兒)詞匯卷138 5/15 “走”類;其他 10. 給(他我一個(gè)蘋果)詞匯卷151 6/52 “給”類;其他 11. 疼(摔了)詞匯卷179 4/7 “疼”類;其他 12. 他(姓張)語(yǔ)法卷003 6/46 “他”類;其他 13. 不(明天我去)語(yǔ)法卷028 6/31 “不”類;其他 14. 是(他老師)語(yǔ)法卷038 2/5 “是”類;其他 15. 的(我東西)語(yǔ)法卷041 4/7 “的”類;其他 16. 動(dòng)物性別表示法語(yǔ)法卷076 4/17 “公雞、母雞”
14、類;其他 Table 3. Examples of feature sequences 表3.特征序列舉例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 北京Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y 南京Y Y Y Y Y Y Y Y Y Y N Y Y Y Y N 廣州N N N N N Y N N N N N N N N N N 項(xiàng)夢(mèng)冰N外都是Y,廣州只有第6個(gè)項(xiàng)目的反應(yīng)是Y,其他都是N。每個(gè)序列含16個(gè)Y/N信息,930個(gè)序列含 14,880個(gè)Y/N信息。這些信息都是筆者目視漢語(yǔ)方言地圖集手工轉(zhuǎn)寫的,做了兩遍校對(duì),但個(gè)別差錯(cuò)仍或難免,
15、不過當(dāng)不至影響總體結(jié)論。 用人工手段處理930個(gè)序列不僅耗時(shí)費(fèi)力,還容易出錯(cuò)。因此筆者在逐點(diǎn)查檢16個(gè)項(xiàng)目的Y/N信息時(shí)即利用Access2003直接建立數(shù)據(jù)庫(kù),然后進(jìn)行歸總。930個(gè)序列可以歸納出240種不同的序列,各序列所轄的方言點(diǎn)數(shù)多寡不同。16個(gè)詞匯語(yǔ)法項(xiàng)目的排列順序完全依據(jù)漢語(yǔ)方言地圖集。如果改變項(xiàng)目的排列順序,序列的形式就會(huì)發(fā)生變化,不過不會(huì)影響序列種類的數(shù)量,因?yàn)?30個(gè)方言點(diǎn)對(duì)既定項(xiàng)目的Y/N反應(yīng)是相同的。 在240種不同的序列里,81種為官話所獨(dú)有,不見于東南方言;152種為東南方言所獨(dú)有,不見于官話;7種既見于官話,也見于東南方言。南北共用的7種序列本文按官話和東南方言分開
16、,因此共得247個(gè)序列,見表4。 表4里的名稱由方言屬性和編號(hào)組成,N代表官話,S代表東南方言,點(diǎn)數(shù)指序列所轄的方言點(diǎn)數(shù),序列由對(duì)16個(gè)詞匯語(yǔ)法項(xiàng)目的Y/N反應(yīng)組成,例如N001-116表示官話1號(hào),轄116個(gè)方言點(diǎn),其序列為YYYYYYYYYYYYYYYY,即對(duì)所有的項(xiàng)目都是Y反應(yīng);S001-084表示東南方言1號(hào),轄84個(gè)方言點(diǎn),其序列為NNNNNNNNNNNNNNNN,即對(duì)所有的項(xiàng)目都是N反應(yīng)。先排官話獨(dú)有序列(N001N081),然后是南北共用序列中的官話部分(N082N088),再后是東南方言獨(dú)有序列(S001S152),最后是南北共用序列中的東南方言部分(S153S159)。四類序
17、列都一律按所轄方言點(diǎn)數(shù)降序排列。南北共用序列的名稱都用淺藍(lán)色的字。其中: N082-002=S159-001 NNN YY N YYY NN YYYY N N086-001=S153-003 NNNN Y N Y NNNNNN Y NN N083-002=S156-001 NNN YY N Y N Y NN YYYY N N087-001=S157-001 NNN YY N YYY NN YYYYY N084-001=S154-003 NNNN Y N Y N Y NN YYYY N N088-001=S158-001 NN YYY N YYY N YYYYYY N085-001=S155-0
18、02 NNNN Y N YYY NN YYYY N 3. 進(jìn)化分析 為了便于觀察,本文先進(jìn)行小樣本量的計(jì)算。選取的序列為:N001N032 (所轄方言點(diǎn)數(shù)多于1的官話獨(dú)有序列,轄306個(gè)方言點(diǎn))、N082N088 (見于官話的所有南北共用序列,轄9個(gè)方言點(diǎn))、S001S060 (所轄方言點(diǎn)數(shù)多于1的東南方言獨(dú)有序列,轄462個(gè)方言點(diǎn))、S153S159 (見于東南方言的所有南北共用序列,轄12個(gè)方言點(diǎn))。總共是99種、106個(gè)序列。其中官話39個(gè)序列,轄315個(gè)方言點(diǎn),東南方言67個(gè)序列,轄474個(gè)方言點(diǎn)。官話序列的方言點(diǎn)數(shù)占官話方言點(diǎn)數(shù)的87% (315/364),東南方言序列的方言點(diǎn)數(shù)占東
19、南方言點(diǎn)數(shù)的84% (474/566),兩者合計(jì)占總方言點(diǎn)數(shù)的85% (789/930)。 106個(gè)序列按DNA序列的FASTA格式進(jìn)行轉(zhuǎn)寫后導(dǎo)入MEGA (本文用第6版)即可進(jìn)行計(jì)算。采用ME法(Minimum Evolution最小進(jìn)化法),進(jìn)行1000次構(gòu)樹測(cè)試,以S001-084為樹根(下文的計(jì)算都采用同樣的方式,不再一一說明),用曲線形樹和環(huán)形樹兩種形式輸出進(jìn)化樹,分別如圖1和圖3所示。因?yàn)檩斎氲男蛄胁⒎钦嬲腄NA序列,而且樣本數(shù)也比較大,因此本文一律忽略自展值(bootstrap values),它們實(shí)際上都很低。 本文關(guān)注的是進(jìn)化分析所呈現(xiàn)的宏觀分組態(tài)勢(shì),而非序列的具體進(jìn)化細(xì)節(jié)
20、。我們用四條彩線在圖1里分出四個(gè)區(qū):(1) A線區(qū)為官話獨(dú)有序列,高頻序列(旁標(biāo)藍(lán)點(diǎn)者)都集中在這一區(qū);(2) B線區(qū)為官話獨(dú)有序列和南北共用序列(旁標(biāo)粉紅色的?)的錯(cuò)雜分布區(qū),以官話獨(dú)有序列為主;(3) C線區(qū)為東南方言獨(dú) 項(xiàng)夢(mèng)冰 Figure 1. The phylogenetic tree in curve style 圖1.曲線形進(jìn)化樹 項(xiàng)夢(mèng)冰Table 4. All feature sequences 表4.特征序列匯總 名稱-點(diǎn)數(shù)序列名稱-點(diǎn)數(shù)序列名稱-點(diǎn)數(shù)序列 N001-116 YYYYYYYYYYYYYYYY N084-001 NNNN Y N Y N Y NN YYYY N
21、S079-001 NNNN YY NNNNNNNNNN N002-051 YYY N YYYYYYYYYYYY N085-001 NNNN Y N YYY NN YYYY N S080-001 NNNN YYY N Y NN Y N Y NN N003-043 YYYYY N YYYYYYYYYY N086-001 NNNN Y N Y NNNNNN Y NN S081-001 NNN Y NNNNNNNNN YYY N004-007 N YY N YYYYYY N YYYY N N087-001 NNN YY N YYY NN YYYYY S082-001 NNN Y NNNNN Y NNN
22、 Y N Y N005-007 YYYYYYY N YYYYYYYY N088-001 NN YYY N YYY N YYYYYY S083-001 NNN Y NNNN Y NNNN YY N N006-006 YYY N YYY N YYYYYYYY S001-084 NNNNNNNNNNNNNNNN S084-001 NNN Y NNNN Y NNN YY NN N007-006 YYYYYYYYYY N YYYYY S002-083 NNNNNNNNNNNNN Y NN S085-001 NNN Y NNNN Y NNN YYY N N008-005 YYYYYYYYY N YYYYY
23、Y S003-031 NNN Y NNNN Y NNNN Y NN S086-001 NNN Y NN Y NNNNN YYY N N009-004 Y N YYY N YYYYYYYYYY S004-030 NNNNNN Y NNNNNN Y NN S087-001 NNN YY NNNNNNNN Y N Y N010-004 YY N YYYYYYYYYYYYY S005-022 NNNN Y N Y N Y NNN YY NN S088-001 NNN YY NNNNNNN YY NN N011-004 YYY N YYYYYYYYYYY N S006-020 NNNNNN Y N Y
24、NNN YY NN S089-001 NNN YY NNNNNN Y N YY N N012-003 NNN YYYYY NN YYYYYY S007-014 NNNNNNNN Y NNNN Y NN S090-001 NNN YY NNNN Y NNN Y N Y N013-003 NN YYY N YYY N YYYYY N S008-012 NNNNNNNN Y NNNNNNN S091-001 NNN YY NNN Y NNNN Y N Y N014-003 N YYYYYYYYY N YYYY N S009-011 NNN YY NNN Y NNNN Y NN S092-001 NN
25、N YY NNN YY NNN Y NN N015-003 Y N YYY N YYY N YYYYY N S010-008 N Y N Y N Y NN Y NNNN Y NN S093-001 NNN YY N Y NNNNNNNNN N016-003 Y N YYYYYYYYYYYYYY S011-006 NNNN Y NNNNNNNNNNN S094-001 NNN YY N Y NNNNN YY N Y N017-003 YYY N Y N YYYYYYYYYY S012-006 NNN Y NNNNNNNNN Y NN S095-001 NNN YY N Y NNNN Y N Y
26、NN N018-003 YYY N YYY N YYY N YYYY S013-006 N Y NNNNNNNNNNNNNN S096-001 NNN YY N Y NNNN Y N YY N N019-003 YYY N YYYYYY N YYYY N S014-005 NNNNNNNNNNNNN YY N S097-001 NNN YY N Y NN Y N Y N YY N N020-003 YYYYY N YYY N YYYYYY S015-005 NNNNNNNNNNNN YY NN S098-001 NNN YY N Y N Y NNNN Y N Y N021-003 YYYYY
27、N YYYYYYYYY N S016-005 NNNNNN Y NNNNN YY NN S099-001 NNN YY N Y N Y NNN YY NN N022-003 YYYYYYYYYY N YYYY N S017-005 NNNN Y NNNNNNNN Y NN S100-001 NNN YY N Y N Y NN YYY NN N023-002 NN YYY N YYYYYYYYY N S018-005 NNN YY NNNNNNNN Y NN S101-001 NNN YY N YYY NNN YY NN N024-002 N YYYY N YYYYYYYYY N S019-00
28、4 NNNNNNNNN Y NNN Y NN S102-001 NNN YY N YYY NNN YYYY N025-002 N YYYYYYYY NN YYYY N S020-004 NNNN Y N Y NNNNN YY NN S103-001 NNN YY N YYYY NN YY NN N026-002 Y N YYY N YYY NN YYYYY S021-004 NNNN Y N YYY NNN YY NN S104-001 NNN YYY NN Y NNNN Y NN N027-002 YYY N YYYYYY N YYYYY S022-004 NNN Y NNNNNNNNN Y
29、 N Y S105-001 NNN YYY N YY NNNN Y NN N028-002 YYY N YYYYYYYY N YYY S023-004 NNN Y N Y NN Y NNNN Y NN S106-001 NNN YYYY NNNNNN Y NN N029-002 YYYYY N YYYY N YYYYY S024-003 NNNNNNNNNNNN YYY N S107-001 NNN YYYY NNNN YYY N Y N030-002 YYYYYYY N Y N YYYYYY S025-003 NNNNNNNN Y NNN Y NNN S108-001 NNN YYYY N
30、Y NN YYY NN N031-002 YYYYYYYYY N YYYYY N S026-003 NNNNNN Y NNNNNNNNN S109-001 NNN YYYYYY NN Y N Y NN N032-002 YYYYYYYYYYYYYYY N S027-003 NNNNNN Y N Y NNNN Y NN S110-001 NN Y NNNNNNNNNNNNN N033-001 NNNN Y N Y NNNNNN YY N S028-003 NNNN Y N Y N Y NN YYY NN S111-001 NN Y NNNNN YY NNN Y NN N034-001 NNNN
31、Y N Y N Y NNN YYY N S029-003 NNNN Y N YYY NN YYY NN S112-001 NN Y NNNN YY NNNN Y NN N035-001 NNNN Y N YYY NN Y N YY N S030-003 NNN YY N YYY NNN YYY N S113-001 NN Y NNN Y NNNNNN Y NN N036-001 NNNN YYYY NN YYYYYY S031-003 NN Y N Y N Y N Y NN YYYY N S114-001 NN Y NNN Y N Y NNNNNNN N037-001 NNN YYYY NNN
32、N YYYYY S032-003 N Y N Y N Y NNNNNNN Y NN S115-001 NN Y NNN Y N YY NN YY NN N038-001 NNN YYYY N YY N YYYY N S033-003 N Y N YY NNNNNNNN Y NN S116-001 NN Y NNN YYY NNN YY NN N039-001 NNN YYYYY NNN YYYYY S034-002 NNNNNNNNNNNNNN Y N S117-001 NN Y N Y NNNNNNNNNNN N040-001 NN Y N Y N YY NNN Y N YY N S035-
33、002 NNNNNN Y N Y NNNNNNN S118-001 NN Y N Y NNNNNNNN Y NN N041-001 NN Y N Y N YYY NN Y N YY N S036-002 NNNNN Y NNNNNNN Y NN S119-001 NN Y N Y NNN Y NNNN Y NN 項(xiàng)夢(mèng)冰 Continued N042-001 NN Y N Y N YYYY N YYYY N S037-002 NNNN Y NNNNNNNN YY N S120-001 NN Y N Y N Y NNNN Y N Y NN N043-001 NN Y N YYYYYY N Y N
34、YY N S038-002 NNNN Y NNNNNNN YY NN S121-001 NN Y N Y N Y NN Y NNN YY N N044-001 NN Y N YYYYYY N YYYY N S039-002 NNNN Y NNNNNN Y N Y NN S122-001 NN YYY N Y NNNN Y N Y NN N045-001 NN YYY N YYY NN YYYY N S040-002 NNNN Y NNN Y NNN YY NN S123-001 NN YYY N Y N Y NNN YY NN N046-001 NN YYYYYYYY N YYYY N S04
35、1-002 NNNN Y N Y NNNN Y N Y NN S124-001 NN YYY N YYY NNN YYY N N047-001 N Y NN YYYYY NN YYYYY S042-002 NNNN Y N Y NNNN YYYY N S125-001 NN YYY N YYY NN YYYYY N048-001 N Y N YYYYYYY N YYYYY S043-002 NNNN Y N Y N Y NNNN Y NN S126-001 NN YYY N YYYY N YYYY N N049-001 N YY N YYY N YY N YYYY N S044-002 NNN
36、N Y N YYY NNN YYYY S127-001 NN YYY N YYYY N YYYYY N050-001 N YY N YYYYYY NNN YY N S045-002 NNN Y NNNNNNNN YY NN S128-001 NN YYYYYYYY N YYYYY N051-001 N YY N YYYYYY N Y N YYY S046-002 NNN Y NNNN Y NNNN Y N Y S129-001 N Y NNNNNNNNNNN Y NN N052-001 N YY N YYYYYY N YYYYY S047-002 NNN Y NNNN YY NNN Y NN
37、S130-001 N Y NNN YY N Y NN YYYY N N053-001 N YY N YYYYYYYYYYY N S048-002 NNN Y NN Y N Y NNNN Y NN S131-001 N Y NN Y N Y NNNN Y N Y NN N054-001 N YYYYYYYYY NN YYYY S049-002 NNN Y NN Y N Y NNN YY NN S132-001 N Y NN Y N Y NN Y N Y N YY N N055-001 N YYYYYYYYY N YYYYY S050-002 NNN Y NN Y N Y NNN YYY N S1
38、33-001 N Y NN Y N YY NNN Y N Y NN N056-001 Y NNN Y N YYY NNN YYY N S051-002 NNN Y N Y NNNNNNN Y NN S134-001 N Y NN Y N YYY NN YYY NN N057-001 Y NNN YYY N Y NNN YYY N S052-002 NNN Y N Y NNNNNNN Y N Y S135-001 N Y NN Y N YYY NN YYYY N N058-001 Y NN Y NN Y N Y N Y N YYY N S053-002 NNN Y N Y NN Y NNNN Y
39、 N Y S136-001 N Y NN YYY NNNNNN Y NN N059-001 Y NN YY N Y N Y N YYYYY N S054-002 NNN YY NNN Y NNN YY NN S137-001 N Y NN YYY NNNN YYY N Y N060-001 Y N Y N Y N YYYY N YYYY N S055-002 NNN YY N Y N Y NNN YYY N S138-001 N Y N Y NNNNNNNNN Y NN N061-001 Y N Y N Y N YYYYYY N YY N S056-002 NNN YY N YYY NN Y
40、N YY N S139-001 N Y N Y NN Y N Y NNN YYY N N062-001 Y N Y N YYY N YYYYYYYY S057-002 NNN YYYY N Y NN Y N Y NN S140-001 N Y N YYYYYY NN YYY NN N063-001 Y N YYY N YYYY N YYYYY S058-002 NN Y N Y N YYY NN YYYY N S141-001 N YY NNNNNN Y NNN Y NN N064-001 Y N YYY N YYYYYYYYY N S059-002 N Y NN Y N Y NNNNNN Y
41、 NN S142-001 Y NNNNN Y N Y NNNN YY N N065-001 Y N YYYYYYYY N YYYYY S060-002 Y NN YY N YYY NNN YYY N S143-001 Y NNN Y NNNNNNNN Y NN N066-001 Y N YYYYYYYYYYYYY N S061-001 NNNNNNNNNNNNN Y N Y S144-001 Y NNN Y N Y NNNNNNNNN N067-001 YYY N Y N Y N YYY N YYYY S062-001 NNNNNNN Y NNNN YYY N S145-001 Y NNN Y
42、 N Y N Y NNNN YY N N068-001 YYY N Y N Y N YYYYYY N Y S063-001 NNNNNNN YYY NNNNNN S146-001 Y NN Y NN Y NNNN Y N Y NN N069-001 YYY N YY NN YYYYYYYY S064-001 NNNNNN Y NNNNN Y NNN S147-001 Y NN YY N YYY NNN YYYY N070-001 YYY N YYY N Y N YYYYYY S065-001 NNNNNN Y N Y NNN Y NNN S148-001 Y N YY NNNNNNN Y N
43、YY N N071-001 YYY N YYYY N Y N YYYYY S066-001 NNNNNN Y N YY NNN YY N S149-001 Y N YY NN Y NNNN Y N YY N N072-001 YYY N YYYYY NN YYYYY S067-001 NNNNN Y NNNNNNNNNN S150-001 Y N YYY N Y N Y NN YYYY N N073-001 YYY N YYYYYY N Y N YYY S068-001 NNNNN YY NNNNNN Y NN S151-001 Y N YYY N YYY N YYYYYY N074-001
44、YYYYY N Y N YYY N YYYY S069-001 NNNN Y NNNNNNNN Y N Y S152-001 YY NN Y N YYYY NNN YY N N075-001 YYYYY N Y N YYYYYYYY S070-001 NNNN Y NNN Y NN YYY NN S153-003 NNNN Y N Y NNNNNN Y NN N076-001 YYYYY N YYY N YYYYY N S071-001 NNNN Y NN Y NNNNN YY N S154-003 NNNN Y N Y N Y NN YYYY N N077-001 YYYYYYY N YYY
45、 N YYY N S072-001 NNNN Y NN YY NNNN Y NN S155-002 NNNN Y N YYY NN YYYY N N078-001 YYYYYYYYY N Y N YYYY S073-001 NNNN Y NN YY NNN YY NN S156-001 NNN YY N Y N Y NN YYYY N N079-001 YYYYYYYYYY N Y N YY N S074-001 NNNN Y N Y NNNNN YYY N S157-001 NNN YY N YYY NN YYYYY N080-001 YYYYYYYYYY N Y N YYY S075-00
46、1 NNNN Y N Y NNNN YYY NN S158-001 NN YYY N YYY N YYYYYY N081-001 YYYYYYYYYYY N YY N Y S076-001 NNNN Y N Y N Y NN Y N Y NN S159-001 NNN YY N YYY NN YYYY N N082-002 NNN YY N YYY NN YYYY N S077-001 NNNN Y N YY NNNN YY NN N083-002 NNN YY N Y N Y NN YYYY N S078-001 NNNN Y N YYY NNN YYY N 項(xiàng)夢(mèng)冰 有序列和南北共用序列的錯(cuò)
47、雜分布區(qū),以東南方言獨(dú)有序列為主;(4) D線區(qū)為東南方言獨(dú)有序列,高頻序列(旁標(biāo)紅點(diǎn)者)主要集中在這一區(qū)。如果籠統(tǒng)一點(diǎn),B線區(qū)和C線區(qū)也可以概括為一個(gè)區(qū),即官話獨(dú)有序列、東南方言獨(dú)有序列以及南北共用序列的錯(cuò)雜分布區(qū)。圖1的這種分布態(tài)勢(shì)可以說明官話和東南方言的詞匯、語(yǔ)法“基因”大體上是南北有別的。A線區(qū)、B線區(qū)可以歸為官話序列(A線區(qū)是典型的,B線區(qū)是非典型的),C線區(qū)、D線區(qū)可以歸為東南方言序列(D線區(qū)是典型的,C線區(qū)是非典型的)。樹根(S001-084)是最典型的東南方言序列(即對(duì)16個(gè)詞匯語(yǔ)法項(xiàng)目都是N反應(yīng)),而官話的三個(gè)高頻序列幾乎都集中在樹梢,離樹根最遠(yuǎn)。 南北共用序列的存在說明表現(xiàn)
48、為官話序列的方言不一定就是官話,同樣,表現(xiàn)為東南方言序列的方言不一定就是東南方言。造成這種情況的主要原因是由方言接觸引發(fā)的“基因重組”(Gene recombination)。以N088-001/S158-001序列NN YYY N YYY N YYYYYY(B線區(qū)第一個(gè)標(biāo)?的序列)為例,它只轄銅陵縣(吳語(yǔ)宣州片)、蕪湖市(江淮官話洪巢片)兩個(gè)方言點(diǎn)。宣州片吳語(yǔ)大多處在江淮官話的包圍之中,因此銅陵縣吳語(yǔ)受江淮官話的沖擊導(dǎo)致“基因”變異再明顯不過。同樣,C線區(qū)的N085-001/S155-002序列NNNN Y N YYY NN YYYY N轄郴州(西南官話)、株洲(湘語(yǔ)長(zhǎng)益片)、湘潭縣(湘語(yǔ)長(zhǎng)
49、益片)三個(gè)方言點(diǎn)。郴州所在的西南官話桂柳片湘南小片主要通行于郴州市和桂陽(yáng)縣,北邊是贛語(yǔ)耒資片,南邊是湘南土話,西南官話桂柳片湘南小片可謂被東南方言南北合圍,因此其詞匯、語(yǔ)法“基因”向東南方言趨同完全在情理之中。 從圖1還可以看到,A線要比D線短很多,B線、C線則長(zhǎng)短大致相當(dāng)。官話高頻序列(116、51、43,占58%)與低頻序列(最大值為7)落差較大,而且?guī)缀蹙o挨在一起。東南方言高頻序列(84、83、31,30、22、20,占48%)和低頻序列(最大值為14)的落差較小,分布也不集中。這些情況可以說明:東南方言的“基因變異”范圍較大,而且存在明顯的非中心化(decentralization)趨
50、勢(shì)。 從結(jié)構(gòu)上看,圖1有一個(gè)明顯不合理的地方。即有一個(gè)南北共用序列位于C線區(qū)的南端(NNNN Y N Y NNNNNN Y NN, N086-001/S153-003),而在它的北邊還有1個(gè)東南方言的高頻序列,即S004-030(NNNNNN Y NNNNNN Y NN)。C線區(qū)南端的南北共用序列轄耒陽(yáng)、洪江、麻陽(yáng)、鳳凰四個(gè)方言點(diǎn)。它們的方言歸屬見表5(向左的箭頭表示同左)。即漢語(yǔ)方言地圖集1承襲中國(guó)語(yǔ)言地圖集3的處理,耒陽(yáng)劃歸贛語(yǔ)耒資片,洪江、麻陽(yáng)分歸湘語(yǔ)的長(zhǎng)益片和婁邵片,鳳凰劃歸西南官話黔北片。到了中國(guó)語(yǔ)言地圖集第二版4,除耒陽(yáng)仍劃歸贛語(yǔ)耒資片外,其他三個(gè)點(diǎn)都有程度不同的改變:洪江劃歸西南
51、官話湖廣片懷玉小片,麻陽(yáng)、鳳凰劃歸西南官話湖廣片湘西小片。洪江、麻陽(yáng)由劃歸湘語(yǔ)改成了劃歸西南官話,鳳凰則由西南官話黔北片調(diào)整為湖廣片湘西小片。 按照?qǐng)D1的結(jié)構(gòu),比較好的辦法是不僅洪江、麻陽(yáng)仍應(yīng)留在東南方言里,鳳凰也應(yīng)劃歸東南方言(這里不討論其具體的歸屬)。這樣一來,圖1的D線就可以一直延伸到C線標(biāo)有紅杠的地方(在S156-001和S027-003之間),從樹根到最遠(yuǎn)的高頻序列這一范圍內(nèi)就不會(huì)再出現(xiàn)南北共用序列。事實(shí)上,檢視鳳凰方言的音韻,其白讀層所呈現(xiàn)的特性屬于東南方言是確鑿無疑的(參看項(xiàng)夢(mèng)冰2017 5)。它之所以會(huì)被歸到西南官話里去,跟湖南方言調(diào)查報(bào)告6中的鳳凰音系僅僅反映其文讀層有很大的
52、關(guān)系。 Table 5. The classification of Leiyang, Hongjiang, Mayang, and Fenghuang dialect 表5. 耒陽(yáng)、洪江、麻陽(yáng)、鳳凰的方言歸屬 中國(guó)語(yǔ)言地圖集漢語(yǔ)方言地圖集中國(guó)語(yǔ)言地圖集第二版耒陽(yáng)贛語(yǔ)耒資片 洪江湘語(yǔ)長(zhǎng)益片西南官話湖廣片懷玉小片 麻陽(yáng)湘語(yǔ)婁邵片西南官話湖廣片湘西小片 鳳凰西南官話黔北片西南官話湖廣片湘西小片 項(xiàng)夢(mèng)冰 官話、東南方言序列的不同在于:前者Y值(Y的頻度值,即每個(gè)序列出現(xiàn)Y的次數(shù))較高,后者Y 值較低(參看表6)。 從方言點(diǎn)數(shù)看,A線區(qū)、D線區(qū)是大頭,構(gòu)成了典型的兩頭大、中間小的啞鈴型結(jié)構(gòu)。說明16項(xiàng)
53、詞匯語(yǔ)法特征對(duì)于區(qū)分官話和東南方言是基本有效的?;蛘哒f,詞匯語(yǔ)法的南北“基因”確實(shí)是明顯有別的。官話、東南方言Y值和方言點(diǎn)數(shù)的匹配情況(如圖2所示)也可以直觀地說明這一點(diǎn)。 圖3所呈現(xiàn)的語(yǔ)言景觀跟圖1相同,無需贅述。 Figure 2. The match between Y frequency values and numbers of dialect locations of northern mandarin and southeastern dialects 圖2. 官話、東南方言Y值和方言點(diǎn)數(shù)的匹配(106個(gè)序列789個(gè)方言點(diǎn)) Figure 3. The phylogenetic
54、tree in circle style 圖3.環(huán)形進(jìn)化樹 項(xiàng)夢(mèng)冰4. 檢驗(yàn) 下面將進(jìn)行三方面的檢驗(yàn)工作。(1) 不同計(jì)算方法的對(duì)比。(2) 主坐標(biāo)分析。(3) 247個(gè)序列的完整計(jì)算。 4.1. 不同計(jì)算方法的對(duì)比 MEGA總共提供了5種不同的建樹方法。這5種方法可分為兩組。第一組:1. Maximum Likelihood (最大似然法,簡(jiǎn)稱ML)。2. Neighbor-Joining (鄰接法,簡(jiǎn)稱NJ)。3. Minimum Evolution (最小進(jìn)化法,簡(jiǎn)稱ME)。第二組:4. UPGMA (Unweighted Pair-Group Method with Arithmeti
55、c Means,非加權(quán)組平均法)。5. Maximum Parsimony (最大簡(jiǎn)約法,簡(jiǎn)稱MP)。通常遠(yuǎn)緣序列選擇ML、NJ、ME,近緣序列選擇UPGMA 或MP (多用MP)。 本文對(duì)106個(gè)序列用5種方法分別計(jì)算了3次(其中MP在HP-DX2710SFF-E5200臺(tái)式機(jī)上計(jì)算一次需耗時(shí)兩個(gè)多小時(shí)),然后按計(jì)算方法逐一比對(duì)3棵樹,發(fā)現(xiàn)即使是同一種計(jì)算方法,雖然每次輸出的樹所反映的大趨勢(shì)是相同的,但細(xì)節(jié)并不完全一樣(各區(qū)段的長(zhǎng)短、序列的排列順序都可能存在不同)。說明序列樣本越多,進(jìn)化路徑的可能性越多?;蛘哒f,由于自展值非常低,幾乎不存在優(yōu)選項(xiàng),因此MEGA 只能從計(jì)算結(jié)果中隨機(jī)抓出一棵樹
56、來。南北共用序列本文都按方言的性質(zhì)(官話或東南方言)分開,多數(shù)情況下,被人為分開的同一種南北共用序列會(huì)聚集在進(jìn)化樹的同一個(gè)內(nèi)部節(jié)點(diǎn)(internal node)下,但有時(shí)也會(huì)被分開。就本文的目的而言,同一種序列會(huì)被分開的計(jì)算結(jié)果自然要加以排除。本文從ML、NJ、UPGMA、MP的三次計(jì)算中各選一棵樹作為對(duì)比,見圖4、圖5。 從圖4、圖5可見,每棵樹都有藍(lán)色線段區(qū)(A)和紅色線段區(qū)(D),官話和東南方言的高頻序列分別集中在這兩個(gè)線段區(qū)。ML樹和MP樹跟圖1的ME樹一樣,也有綠色線段區(qū)(B)和橙色線段區(qū)(C),而NJ 樹和UPGMA樹則只有紫色線段區(qū)(BC)。當(dāng)然并非BC絕對(duì)不能分為B和C,而是說
57、其層次不是很分明,勉強(qiáng)分開意義也不大。除了三區(qū)(NJ、UPGMA)、四區(qū)(ML、MP)的區(qū)別外,線段的長(zhǎng)短(代表序列的多少)、序列的具體排列順序每棵樹也不一樣。如果立足于宏觀,可以說圖1、圖4、圖5所給出的五棵進(jìn)化樹都代表了官話和東南方言大致二分的格局,不同計(jì)算方法所得結(jié)果的本質(zhì)并無不同。對(duì)比表6和表7可知,ME樹的層次最為分明(分四區(qū)段,各區(qū)段的Y值表現(xiàn)最符合預(yù)期)。 Table 6. The comparison between different sections of the phylogenetic tree 表6. 進(jìn)化樹不同區(qū)段的對(duì)比 序列數(shù)量方言點(diǎn)數(shù)最大Y值最小Y值平均Y值A(chǔ)線
58、區(qū)17 259 16 13 14.41 B線區(qū)21 54 15 9 12.14 C線區(qū)18 65 9 1 5.43 D線區(qū)50 411 5 0 2.77 Table 7. The comparison between different sections of phylogenetic tree 表7.進(jìn)化樹不同區(qū)段的對(duì)比 序列數(shù)量方言點(diǎn)數(shù)最大Y值最小Y值平均Y值ML NJ UP MP ML NJ UP MP ML NJ UP MP ML NJ UP MP ML NJ UP MP A 19 23 25 20 264 274 286 271 16 16 16 16 12 12 12 12 14.
59、16 13.91 14 14 B B C 13 38 35 17 37 138 84 41 15 15 15 15 11 2 1 10 12.85 8.47 7.94 12.35 C 45 23 171 110 15 9 1 1 5.96 5.22 D 29 45 46 46 317 377 419 367 5 8 8 9 0 0 0 0 2.86 3.22 3.46 3.85 項(xiàng)夢(mèng)冰 Figure 4. The phylogenetic trees in curve style with ML and NJ methods 圖4.用ML和NJ法構(gòu)建的曲線形進(jìn)化樹 項(xiàng)夢(mèng)冰 Figure 5.
60、The phylogenetic trees in curve style with UPGMA and MP methods 圖5.用UPGMA和MP法構(gòu)建的曲線形進(jìn)化樹 項(xiàng)夢(mèng)冰 4.2. 主坐標(biāo)分析 本文采用NTSYSpc2.10e進(jìn)行主坐標(biāo)分析,以三維散點(diǎn)圖檢驗(yàn)MEGA的計(jì)算結(jié)果是否合理。NTSYS 的全稱為“數(shù)值分類和多元分析系統(tǒng)”(Numerical Taxonomy and Multivariate Analysis System)。NTSYS 在漢語(yǔ)方言學(xué)里的運(yùn)用可參看項(xiàng)夢(mèng)冰2015 7, 2016 8。把106個(gè)序列按NTSYS所要求的0 1值格式進(jìn)行轉(zhuǎn)寫后進(jìn)行分步計(jì)算,最后可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 短視頻平臺(tái)內(nèi)容監(jiān)管與網(wǎng)絡(luò)生態(tài)治理創(chuàng)新研究與實(shí)踐報(bào)告
- 數(shù)字孿生視角下2025年城市規(guī)劃與建設(shè)中的智慧城市能源管理系統(tǒng)優(yōu)化與評(píng)估優(yōu)化優(yōu)化報(bào)告
- 2025年智慧交通系統(tǒng)交通流量預(yù)測(cè)技術(shù)智能交通數(shù)據(jù)挖掘與智能控制報(bào)告
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)微服務(wù)架構(gòu)性能測(cè)試報(bào)告2025:邊緣計(jì)算與實(shí)時(shí)性能優(yōu)化
- 電競(jìng)商業(yè)贊助策略報(bào)告:2025年品牌合作案例分析
- 功能性飲料在健身器材銷售中的市場(chǎng)推廣策略報(bào)告
- 培訓(xùn)班門店財(cái)務(wù)管理制度
- 亞馬遜銷售組長(zhǎng)管理制度
- 早餐健康宿舍管理制度
- 房產(chǎn)公司運(yùn)營(yíng)部管理制度
- 2025年宜賓市英語(yǔ)七下期末復(fù)習(xí)檢測(cè)試題含答案
- 項(xiàng)目管理從立項(xiàng)到結(jié)項(xiàng)全解析
- 全國(guó)導(dǎo)游人員資格考試單科綜合測(cè)試卷(科目一:政策與法律法規(guī))
- 2024年中國(guó)鐵路成都局集團(tuán)有限公司招聘考試《鐵路基本常識(shí)》真題庫(kù)及答案
- 中醫(yī)診斷學(xué)考點(diǎn)總結(jié)
- 生態(tài)草場(chǎng)使用權(quán)轉(zhuǎn)讓協(xié)議
- 第18課清朝的邊疆治理教學(xué)設(shè)計(jì)-統(tǒng)編版七年級(jí)歷史下冊(cè)
- 物流實(shí)操試題及答案詳解
- 播出設(shè)備檢修管理制度
- 國(guó)家開放大學(xué)學(xué)習(xí)網(wǎng)電大證券投資分析形考任務(wù)12345答案
- 醫(yī)院醫(yī)保獎(jiǎng)懲管理制度
評(píng)論
0/150
提交評(píng)論