

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 14/14北方官話和東南諸方言詞匯語法“基因”的透視 Modern Linguistics 現代語言學, 2017, 5(1), 40-57 Published Online February 2017 in Hans. http:/./doc/d0b505bc951ea76e58fafab069dc5022aaea46c1.html /journal/ml https:/http:/./doc/d0b505bc951ea76e58fafab069dc5022aaea46c1.html /10.12677/ml.2017.51007 文章引用: 項夢冰. 北方官話和東南諸方言詞匯語法“基因”
2、的透視J. 現代語言學, 2017, 5(1): 40-57. The North and the South: A Perspective of Their Lexicon and Grammar “Genes” Mengbing Xiang 1,2 1 Department of Chinese Language and Literature accepted: Feb. 20th , 2017; published: Feb. 24th , 2017 Abstract One of the most obvious divisions in Chinese dialects is the
3、 confrontation between northern man-darin and southeastern dialects. In this paper, the author selected 16 items from the vocabulary and the grammar volumes of Linguistic Atlas of Chinese Dialects and analyzed the feature se-quences of the 16 items of 930 Chinese dialects with MEGA (Molecular Evolut
4、ionary Genetics Analysis) by simulating DNA sequences. The results showed that lexicon-grammar items alone could also basically reveal the North-South opposition just as phonology items do. Therefore, the introduction of lexicon-grammar items into the Chinese dialect classification is meaningful. Of
5、 course, the so-called “feature sequence” in dialectology is not the real DNA sequence and when using MEGA for large sample calculation, it is normal that bootstrap values are low. The important thing is to observe the grouping trends embodied in the phylogenetic trees. Keywords Mandarin, Southeaste
6、rn Dialects, Lexicon-Grammar Feature Sequences, Phylogenetic Analysis 北方官話和東南諸方言詞匯語法 “基因”的透視 項夢冰1,2 1 北京大學中文系暨中國語言學研究中心,計算語言學重點實驗室,北京 2 新加坡國立大學中文系,新加坡 收稿日期:2017年2月7日;錄用日期:2017年2月20日;發布日期:2017年2月24日 項夢冰 摘 要 漢語方言的一個最明顯的分野是北方官話和東南諸方言的對立,即南北對立。本文從漢語方言地圖集的詞匯卷和語法卷選取16個項目,模擬DNA 序列用MEGA (Molecular Evolution
7、ary Genetics Analysis 分子進化遺傳分析)軟件對930個漢語方言點的這16個項目的特征序列進行分析,結果發現只選用詞匯、語法項目也能大致看到南北對立,說明在漢語方言的分區工作中引入詞匯和語法標準是有意義的。當然方言學里的所謂“特征序列”并非真正的DNA 序列,而用MEGA 來進行大樣本計算時,自展值低也是正常情況,重要的是從中觀察進化樹所體現的分組趨勢。 關鍵詞 官話,東南方言,詞匯-語法特征序列,進化分析 Copyright ? 2017 by author and Hans Publishers Inc. This work is licensed under the
8、Creative Commons Attribution International License (CC BY). http:/./doc/d0b505bc951ea76e58fafab069dc5022aaea46c1.html /licenses/by/4.0/ 1. 引言 漢語方言的一個最明顯的分野是北方官話和東南諸方言的對立,即南北對立。本文從漢語方言地圖集1的詞匯卷和語法卷選取16個詞匯、語法項目,模擬DNA 序列用MEGA (Molecular Evolutionary Genetics Analysis 分子進化遺傳分析)軟件進行分析(MEGA 的操作可參看 Hall 200
9、8 2),并加以必要的檢驗,目的是探討在漢語方言分區研究中引入詞匯、語法標準以及借助生物學軟件進行輔助分析的可行性。 2. 數據處理 本文選取的16個詞匯、語法項目在漢語方言地圖集里的詞形分類往往都比較復雜,例如詞匯卷014圖(簡稱為LV014)“面兒玉米,辣椒”的詞形有4大類30小類,可轉寫如表1(略去代表各類詞形的符號,“=”表示同音字)。 本文立足于南北對立,將表1的30種詞形概括為兩類:“面”及其派生形式為一類,剩下的其他形式為另一類。即A 、C 為一類,B 、D 為一類,各有15小類。本文只區分大類,不區分小類。本文對選取的16個詞匯、語法項目所做的詞形分類如表2所示。“地圖集分類”
10、斜線前后的數字分別為漢語方言地圖集的大類數和小類數。 詞形二分法的設計目的是凸顯北方的特點。因此凡碰到兼用南北不同詞形或南北詞形合璧時,都一律歸入北方型。例如詞匯卷179“痛疼”(兼用南北詞形)歸為“疼”類,而不歸為“其他”。詞匯卷101“房子屋”、“房子屋子”、“房屋”、“房屋”(兼用南北詞形)以及“房屋”、“房屋屋”、“厝房厝”(南北詞形合璧)歸為“房”類,而不歸為“其他”。 漢語方言地圖集共設930個方言點。根據每個方言點對16個詞匯語法項目Y/N 的不同反應,可以得到930個YN 序列。以北京、南京和廣州為例(見表3,第一行為16個詞匯語法項目的編號)。 即北京、南京、廣州的特征序列分
11、別為:YYYYYYYYYYYYYYYY YYYYYYYYYY N YYYY N NNNNN Y NNNNNNNNNN 。其中北京對16個項目的反應都是Y ,南京除了對11、16兩個項目的反應是 Table 1. The classification of word forms for “powder” on Map 014 of LACD vocabulary volume Open Access 項夢冰 表1. LV014的詞形分類 A B C D 1 面兒粉面兒粉末 2 面粉末面兒粉兒末兒 3 面面兒粉灰面兒粉子末子 4 面子粉子面粉屑 5 面子面兒粉不包括“粉子”面面粉粉灰 6 面子面粉
12、粉絨 7 面面糝子 8 面面面?兒 9 面面兒餑 10 面勇= Table 2. The word-form classification of 16 lexicon-grammar items 表2. 16個詞匯、語法項目的詞形分類 地圖集編號地圖集分類本文的二分法 1. 下雨詞匯卷005 3/13 動詞用“下”;動詞用其他形式 2. 面兒(玉米,辣椒)詞匯卷014 4/30 “面”類;其他 3. 窩(鳥)詞匯卷037 5/23 “窩”類;其他 4. 兒子(敘稱)詞匯卷052 5/61 “兒”類;其他 5. 穿(鞋)詞匯卷079 5/9 “穿”類;其他 6. 房子(一座)詞匯卷101 5/3
13、3 “房”類;其他 7. 鍋詞匯卷109 6/51 “鍋”類;其他 8. 站(起來)詞匯卷134 4/14 “站”類;其他 9. 走(慢慢兒)詞匯卷138 5/15 “走”類;其他 10. 給(他我一個蘋果)詞匯卷151 6/52 “給”類;其他 11. 疼(摔了)詞匯卷179 4/7 “疼”類;其他 12. 他(姓張)語法卷003 6/46 “他”類;其他 13. 不(明天我去)語法卷028 6/31 “不”類;其他 14. 是(他老師)語法卷038 2/5 “是”類;其他 15. 的(我東西)語法卷041 4/7 “的”類;其他 16. 動物性別表示法語法卷076 4/17 “公雞、母雞”
14、類;其他 Table 3. Examples of feature sequences 表3.特征序列舉例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 北京Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y 南京Y Y Y Y Y Y Y Y Y Y N Y Y Y Y N 廣州N N N N N Y N N N N N N N N N N 項夢冰N外都是Y,廣州只有第6個項目的反應是Y,其他都是N。每個序列含16個Y/N信息,930個序列含 14,880個Y/N信息。這些信息都是筆者目視漢語方言地圖集手工轉寫的,做了兩遍校對,但個別差錯仍或難免,
15、不過當不至影響總體結論。 用人工手段處理930個序列不僅耗時費力,還容易出錯。因此筆者在逐點查檢16個項目的Y/N信息時即利用Access2003直接建立數據庫,然后進行歸總。930個序列可以歸納出240種不同的序列,各序列所轄的方言點數多寡不同。16個詞匯語法項目的排列順序完全依據漢語方言地圖集。如果改變項目的排列順序,序列的形式就會發生變化,不過不會影響序列種類的數量,因為930個方言點對既定項目的Y/N反應是相同的。 在240種不同的序列里,81種為官話所獨有,不見于東南方言;152種為東南方言所獨有,不見于官話;7種既見于官話,也見于東南方言。南北共用的7種序列本文按官話和東南方言分開
16、,因此共得247個序列,見表4。 表4里的名稱由方言屬性和編號組成,N代表官話,S代表東南方言,點數指序列所轄的方言點數,序列由對16個詞匯語法項目的Y/N反應組成,例如N001-116表示官話1號,轄116個方言點,其序列為YYYYYYYYYYYYYYYY,即對所有的項目都是Y反應;S001-084表示東南方言1號,轄84個方言點,其序列為NNNNNNNNNNNNNNNN,即對所有的項目都是N反應。先排官話獨有序列(N001N081),然后是南北共用序列中的官話部分(N082N088),再后是東南方言獨有序列(S001S152),最后是南北共用序列中的東南方言部分(S153S159)。四類序
17、列都一律按所轄方言點數降序排列。南北共用序列的名稱都用淺藍色的字。其中: N082-002=S159-001 NNN YY N YYY NN YYYY N N086-001=S153-003 NNNN Y N Y NNNNNN Y NN N083-002=S156-001 NNN YY N Y N Y NN YYYY N N087-001=S157-001 NNN YY N YYY NN YYYYY N084-001=S154-003 NNNN Y N Y N Y NN YYYY N N088-001=S158-001 NN YYY N YYY N YYYYYY N085-001=S155-0
18、02 NNNN Y N YYY NN YYYY N 3. 進化分析 為了便于觀察,本文先進行小樣本量的計算。選取的序列為:N001N032 (所轄方言點數多于1的官話獨有序列,轄306個方言點)、N082N088 (見于官話的所有南北共用序列,轄9個方言點)、S001S060 (所轄方言點數多于1的東南方言獨有序列,轄462個方言點)、S153S159 (見于東南方言的所有南北共用序列,轄12個方言點)。總共是99種、106個序列。其中官話39個序列,轄315個方言點,東南方言67個序列,轄474個方言點。官話序列的方言點數占官話方言點數的87% (315/364),東南方言序列的方言點數占東
19、南方言點數的84% (474/566),兩者合計占總方言點數的85% (789/930)。 106個序列按DNA序列的FASTA格式進行轉寫后導入MEGA (本文用第6版)即可進行計算。采用ME法(Minimum Evolution最小進化法),進行1000次構樹測試,以S001-084為樹根(下文的計算都采用同樣的方式,不再一一說明),用曲線形樹和環形樹兩種形式輸出進化樹,分別如圖1和圖3所示。因為輸入的序列并非真正的DNA序列,而且樣本數也比較大,因此本文一律忽略自展值(bootstrap values),它們實際上都很低。 本文關注的是進化分析所呈現的宏觀分組態勢,而非序列的具體進化細節
20、。我們用四條彩線在圖1里分出四個區:(1) A線區為官話獨有序列,高頻序列(旁標藍點者)都集中在這一區;(2) B線區為官話獨有序列和南北共用序列(旁標粉紅色的?)的錯雜分布區,以官話獨有序列為主;(3) C線區為東南方言獨 項夢冰 Figure 1. The phylogenetic tree in curve style 圖1.曲線形進化樹 項夢冰Table 4. All feature sequences 表4.特征序列匯總 名稱-點數序列名稱-點數序列名稱-點數序列 N001-116 YYYYYYYYYYYYYYYY N084-001 NNNN Y N Y N Y NN YYYY N
21、S079-001 NNNN YY NNNNNNNNNN N002-051 YYY N YYYYYYYYYYYY N085-001 NNNN Y N YYY NN YYYY N S080-001 NNNN YYY N Y NN Y N Y NN N003-043 YYYYY N YYYYYYYYYY N086-001 NNNN Y N Y NNNNNN Y NN S081-001 NNN Y NNNNNNNNN YYY N004-007 N YY N YYYYYY N YYYY N N087-001 NNN YY N YYY NN YYYYY S082-001 NNN Y NNNNN Y NNN
22、 Y N Y N005-007 YYYYYYY N YYYYYYYY N088-001 NN YYY N YYY N YYYYYY S083-001 NNN Y NNNN Y NNNN YY N N006-006 YYY N YYY N YYYYYYYY S001-084 NNNNNNNNNNNNNNNN S084-001 NNN Y NNNN Y NNN YY NN N007-006 YYYYYYYYYY N YYYYY S002-083 NNNNNNNNNNNNN Y NN S085-001 NNN Y NNNN Y NNN YYY N N008-005 YYYYYYYYY N YYYYY
23、Y S003-031 NNN Y NNNN Y NNNN Y NN S086-001 NNN Y NN Y NNNNN YYY N N009-004 Y N YYY N YYYYYYYYYY S004-030 NNNNNN Y NNNNNN Y NN S087-001 NNN YY NNNNNNNN Y N Y N010-004 YY N YYYYYYYYYYYYY S005-022 NNNN Y N Y N Y NNN YY NN S088-001 NNN YY NNNNNNN YY NN N011-004 YYY N YYYYYYYYYYY N S006-020 NNNNNN Y N Y
24、NNN YY NN S089-001 NNN YY NNNNNN Y N YY N N012-003 NNN YYYYY NN YYYYYY S007-014 NNNNNNNN Y NNNN Y NN S090-001 NNN YY NNNN Y NNN Y N Y N013-003 NN YYY N YYY N YYYYY N S008-012 NNNNNNNN Y NNNNNNN S091-001 NNN YY NNN Y NNNN Y N Y N014-003 N YYYYYYYYY N YYYY N S009-011 NNN YY NNN Y NNNN Y NN S092-001 NN
25、N YY NNN YY NNN Y NN N015-003 Y N YYY N YYY N YYYYY N S010-008 N Y N Y N Y NN Y NNNN Y NN S093-001 NNN YY N Y NNNNNNNNN N016-003 Y N YYYYYYYYYYYYYY S011-006 NNNN Y NNNNNNNNNNN S094-001 NNN YY N Y NNNNN YY N Y N017-003 YYY N Y N YYYYYYYYYY S012-006 NNN Y NNNNNNNNN Y NN S095-001 NNN YY N Y NNNN Y N Y
26、NN N018-003 YYY N YYY N YYY N YYYY S013-006 N Y NNNNNNNNNNNNNN S096-001 NNN YY N Y NNNN Y N YY N N019-003 YYY N YYYYYY N YYYY N S014-005 NNNNNNNNNNNNN YY N S097-001 NNN YY N Y NN Y N Y N YY N N020-003 YYYYY N YYY N YYYYYY S015-005 NNNNNNNNNNNN YY NN S098-001 NNN YY N Y N Y NNNN Y N Y N021-003 YYYYY
27、N YYYYYYYYY N S016-005 NNNNNN Y NNNNN YY NN S099-001 NNN YY N Y N Y NNN YY NN N022-003 YYYYYYYYYY N YYYY N S017-005 NNNN Y NNNNNNNN Y NN S100-001 NNN YY N Y N Y NN YYY NN N023-002 NN YYY N YYYYYYYYY N S018-005 NNN YY NNNNNNNN Y NN S101-001 NNN YY N YYY NNN YY NN N024-002 N YYYY N YYYYYYYYY N S019-00
28、4 NNNNNNNNN Y NNN Y NN S102-001 NNN YY N YYY NNN YYYY N025-002 N YYYYYYYY NN YYYY N S020-004 NNNN Y N Y NNNNN YY NN S103-001 NNN YY N YYYY NN YY NN N026-002 Y N YYY N YYY NN YYYYY S021-004 NNNN Y N YYY NNN YY NN S104-001 NNN YYY NN Y NNNN Y NN N027-002 YYY N YYYYYY N YYYYY S022-004 NNN Y NNNNNNNNN Y
29、 N Y S105-001 NNN YYY N YY NNNN Y NN N028-002 YYY N YYYYYYYY N YYY S023-004 NNN Y N Y NN Y NNNN Y NN S106-001 NNN YYYY NNNNNN Y NN N029-002 YYYYY N YYYY N YYYYY S024-003 NNNNNNNNNNNN YYY N S107-001 NNN YYYY NNNN YYY N Y N030-002 YYYYYYY N Y N YYYYYY S025-003 NNNNNNNN Y NNN Y NNN S108-001 NNN YYYY N
30、Y NN YYY NN N031-002 YYYYYYYYY N YYYYY N S026-003 NNNNNN Y NNNNNNNNN S109-001 NNN YYYYYY NN Y N Y NN N032-002 YYYYYYYYYYYYYYY N S027-003 NNNNNN Y N Y NNNN Y NN S110-001 NN Y NNNNNNNNNNNNN N033-001 NNNN Y N Y NNNNNN YY N S028-003 NNNN Y N Y N Y NN YYY NN S111-001 NN Y NNNNN YY NNN Y NN N034-001 NNNN
31、Y N Y N Y NNN YYY N S029-003 NNNN Y N YYY NN YYY NN S112-001 NN Y NNNN YY NNNN Y NN N035-001 NNNN Y N YYY NN Y N YY N S030-003 NNN YY N YYY NNN YYY N S113-001 NN Y NNN Y NNNNNN Y NN N036-001 NNNN YYYY NN YYYYYY S031-003 NN Y N Y N Y N Y NN YYYY N S114-001 NN Y NNN Y N Y NNNNNNN N037-001 NNN YYYY NNN
32、N YYYYY S032-003 N Y N Y N Y NNNNNNN Y NN S115-001 NN Y NNN Y N YY NN YY NN N038-001 NNN YYYY N YY N YYYY N S033-003 N Y N YY NNNNNNNN Y NN S116-001 NN Y NNN YYY NNN YY NN N039-001 NNN YYYYY NNN YYYYY S034-002 NNNNNNNNNNNNNN Y N S117-001 NN Y N Y NNNNNNNNNNN N040-001 NN Y N Y N YY NNN Y N YY N S035-
33、002 NNNNNN Y N Y NNNNNNN S118-001 NN Y N Y NNNNNNNN Y NN N041-001 NN Y N Y N YYY NN Y N YY N S036-002 NNNNN Y NNNNNNN Y NN S119-001 NN Y N Y NNN Y NNNN Y NN 項夢冰 Continued N042-001 NN Y N Y N YYYY N YYYY N S037-002 NNNN Y NNNNNNNN YY N S120-001 NN Y N Y N Y NNNN Y N Y NN N043-001 NN Y N YYYYYY N Y N
34、YY N S038-002 NNNN Y NNNNNNN YY NN S121-001 NN Y N Y N Y NN Y NNN YY N N044-001 NN Y N YYYYYY N YYYY N S039-002 NNNN Y NNNNNN Y N Y NN S122-001 NN YYY N Y NNNN Y N Y NN N045-001 NN YYY N YYY NN YYYY N S040-002 NNNN Y NNN Y NNN YY NN S123-001 NN YYY N Y N Y NNN YY NN N046-001 NN YYYYYYYY N YYYY N S04
35、1-002 NNNN Y N Y NNNN Y N Y NN S124-001 NN YYY N YYY NNN YYY N N047-001 N Y NN YYYYY NN YYYYY S042-002 NNNN Y N Y NNNN YYYY N S125-001 NN YYY N YYY NN YYYYY N048-001 N Y N YYYYYYY N YYYYY S043-002 NNNN Y N Y N Y NNNN Y NN S126-001 NN YYY N YYYY N YYYY N N049-001 N YY N YYY N YY N YYYY N S044-002 NNN
36、N Y N YYY NNN YYYY S127-001 NN YYY N YYYY N YYYYY N050-001 N YY N YYYYYY NNN YY N S045-002 NNN Y NNNNNNNN YY NN S128-001 NN YYYYYYYY N YYYYY N051-001 N YY N YYYYYY N Y N YYY S046-002 NNN Y NNNN Y NNNN Y N Y S129-001 N Y NNNNNNNNNNN Y NN N052-001 N YY N YYYYYY N YYYYY S047-002 NNN Y NNNN YY NNN Y NN
37、S130-001 N Y NNN YY N Y NN YYYY N N053-001 N YY N YYYYYYYYYYY N S048-002 NNN Y NN Y N Y NNNN Y NN S131-001 N Y NN Y N Y NNNN Y N Y NN N054-001 N YYYYYYYYY NN YYYY S049-002 NNN Y NN Y N Y NNN YY NN S132-001 N Y NN Y N Y NN Y N Y N YY N N055-001 N YYYYYYYYY N YYYYY S050-002 NNN Y NN Y N Y NNN YYY N S1
38、33-001 N Y NN Y N YY NNN Y N Y NN N056-001 Y NNN Y N YYY NNN YYY N S051-002 NNN Y N Y NNNNNNN Y NN S134-001 N Y NN Y N YYY NN YYY NN N057-001 Y NNN YYY N Y NNN YYY N S052-002 NNN Y N Y NNNNNNN Y N Y S135-001 N Y NN Y N YYY NN YYYY N N058-001 Y NN Y NN Y N Y N Y N YYY N S053-002 NNN Y N Y NN Y NNNN Y
39、 N Y S136-001 N Y NN YYY NNNNNN Y NN N059-001 Y NN YY N Y N Y N YYYYY N S054-002 NNN YY NNN Y NNN YY NN S137-001 N Y NN YYY NNNN YYY N Y N060-001 Y N Y N Y N YYYY N YYYY N S055-002 NNN YY N Y N Y NNN YYY N S138-001 N Y N Y NNNNNNNNN Y NN N061-001 Y N Y N Y N YYYYYY N YY N S056-002 NNN YY N YYY NN Y
40、N YY N S139-001 N Y N Y NN Y N Y NNN YYY N N062-001 Y N Y N YYY N YYYYYYYY S057-002 NNN YYYY N Y NN Y N Y NN S140-001 N Y N YYYYYY NN YYY NN N063-001 Y N YYY N YYYY N YYYYY S058-002 NN Y N Y N YYY NN YYYY N S141-001 N YY NNNNNN Y NNN Y NN N064-001 Y N YYY N YYYYYYYYY N S059-002 N Y NN Y N Y NNNNNN Y
41、 NN S142-001 Y NNNNN Y N Y NNNN YY N N065-001 Y N YYYYYYYY N YYYYY S060-002 Y NN YY N YYY NNN YYY N S143-001 Y NNN Y NNNNNNNN Y NN N066-001 Y N YYYYYYYYYYYYY N S061-001 NNNNNNNNNNNNN Y N Y S144-001 Y NNN Y N Y NNNNNNNNN N067-001 YYY N Y N Y N YYY N YYYY S062-001 NNNNNNN Y NNNN YYY N S145-001 Y NNN Y
42、 N Y N Y NNNN YY N N068-001 YYY N Y N Y N YYYYYY N Y S063-001 NNNNNNN YYY NNNNNN S146-001 Y NN Y NN Y NNNN Y N Y NN N069-001 YYY N YY NN YYYYYYYY S064-001 NNNNNN Y NNNNN Y NNN S147-001 Y NN YY N YYY NNN YYYY N070-001 YYY N YYY N Y N YYYYYY S065-001 NNNNNN Y N Y NNN Y NNN S148-001 Y N YY NNNNNNN Y N
43、YY N N071-001 YYY N YYYY N Y N YYYYY S066-001 NNNNNN Y N YY NNN YY N S149-001 Y N YY NN Y NNNN Y N YY N N072-001 YYY N YYYYY NN YYYYY S067-001 NNNNN Y NNNNNNNNNN S150-001 Y N YYY N Y N Y NN YYYY N N073-001 YYY N YYYYYY N Y N YYY S068-001 NNNNN YY NNNNNN Y NN S151-001 Y N YYY N YYY N YYYYYY N074-001
44、YYYYY N Y N YYY N YYYY S069-001 NNNN Y NNNNNNNN Y N Y S152-001 YY NN Y N YYYY NNN YY N N075-001 YYYYY N Y N YYYYYYYY S070-001 NNNN Y NNN Y NN YYY NN S153-003 NNNN Y N Y NNNNNN Y NN N076-001 YYYYY N YYY N YYYYY N S071-001 NNNN Y NN Y NNNNN YY N S154-003 NNNN Y N Y N Y NN YYYY N N077-001 YYYYYYY N YYY
45、 N YYY N S072-001 NNNN Y NN YY NNNN Y NN S155-002 NNNN Y N YYY NN YYYY N N078-001 YYYYYYYYY N Y N YYYY S073-001 NNNN Y NN YY NNN YY NN S156-001 NNN YY N Y N Y NN YYYY N N079-001 YYYYYYYYYY N Y N YY N S074-001 NNNN Y N Y NNNNN YYY N S157-001 NNN YY N YYY NN YYYYY N080-001 YYYYYYYYYY N Y N YYY S075-00
46、1 NNNN Y N Y NNNN YYY NN S158-001 NN YYY N YYY N YYYYYY N081-001 YYYYYYYYYYY N YY N Y S076-001 NNNN Y N Y N Y NN Y N Y NN S159-001 NNN YY N YYY NN YYYY N N082-002 NNN YY N YYY NN YYYY N S077-001 NNNN Y N YY NNNN YY NN N083-002 NNN YY N Y N Y NN YYYY N S078-001 NNNN Y N YYY NNN YYY N 項夢冰 有序列和南北共用序列的錯
47、雜分布區,以東南方言獨有序列為主;(4) D線區為東南方言獨有序列,高頻序列(旁標紅點者)主要集中在這一區。如果籠統一點,B線區和C線區也可以概括為一個區,即官話獨有序列、東南方言獨有序列以及南北共用序列的錯雜分布區。圖1的這種分布態勢可以說明官話和東南方言的詞匯、語法“基因”大體上是南北有別的。A線區、B線區可以歸為官話序列(A線區是典型的,B線區是非典型的),C線區、D線區可以歸為東南方言序列(D線區是典型的,C線區是非典型的)。樹根(S001-084)是最典型的東南方言序列(即對16個詞匯語法項目都是N反應),而官話的三個高頻序列幾乎都集中在樹梢,離樹根最遠。 南北共用序列的存在說明表現
48、為官話序列的方言不一定就是官話,同樣,表現為東南方言序列的方言不一定就是東南方言。造成這種情況的主要原因是由方言接觸引發的“基因重組”(Gene recombination)。以N088-001/S158-001序列NN YYY N YYY N YYYYYY(B線區第一個標?的序列)為例,它只轄銅陵縣(吳語宣州片)、蕪湖市(江淮官話洪巢片)兩個方言點。宣州片吳語大多處在江淮官話的包圍之中,因此銅陵縣吳語受江淮官話的沖擊導致“基因”變異再明顯不過。同樣,C線區的N085-001/S155-002序列NNNN Y N YYY NN YYYY N轄郴州(西南官話)、株洲(湘語長益片)、湘潭縣(湘語長
49、益片)三個方言點。郴州所在的西南官話桂柳片湘南小片主要通行于郴州市和桂陽縣,北邊是贛語耒資片,南邊是湘南土話,西南官話桂柳片湘南小片可謂被東南方言南北合圍,因此其詞匯、語法“基因”向東南方言趨同完全在情理之中。 從圖1還可以看到,A線要比D線短很多,B線、C線則長短大致相當。官話高頻序列(116、51、43,占58%)與低頻序列(最大值為7)落差較大,而且幾乎緊挨在一起。東南方言高頻序列(84、83、31,30、22、20,占48%)和低頻序列(最大值為14)的落差較小,分布也不集中。這些情況可以說明:東南方言的“基因變異”范圍較大,而且存在明顯的非中心化(decentralization)趨
50、勢。 從結構上看,圖1有一個明顯不合理的地方。即有一個南北共用序列位于C線區的南端(NNNN Y N Y NNNNNN Y NN, N086-001/S153-003),而在它的北邊還有1個東南方言的高頻序列,即S004-030(NNNNNN Y NNNNNN Y NN)。C線區南端的南北共用序列轄耒陽、洪江、麻陽、鳳凰四個方言點。它們的方言歸屬見表5(向左的箭頭表示同左)。即漢語方言地圖集1承襲中國語言地圖集3的處理,耒陽劃歸贛語耒資片,洪江、麻陽分歸湘語的長益片和婁邵片,鳳凰劃歸西南官話黔北片。到了中國語言地圖集第二版4,除耒陽仍劃歸贛語耒資片外,其他三個點都有程度不同的改變:洪江劃歸西南
51、官話湖廣片懷玉小片,麻陽、鳳凰劃歸西南官話湖廣片湘西小片。洪江、麻陽由劃歸湘語改成了劃歸西南官話,鳳凰則由西南官話黔北片調整為湖廣片湘西小片。 按照圖1的結構,比較好的辦法是不僅洪江、麻陽仍應留在東南方言里,鳳凰也應劃歸東南方言(這里不討論其具體的歸屬)。這樣一來,圖1的D線就可以一直延伸到C線標有紅杠的地方(在S156-001和S027-003之間),從樹根到最遠的高頻序列這一范圍內就不會再出現南北共用序列。事實上,檢視鳳凰方言的音韻,其白讀層所呈現的特性屬于東南方言是確鑿無疑的(參看項夢冰2017 5)。它之所以會被歸到西南官話里去,跟湖南方言調查報告6中的鳳凰音系僅僅反映其文讀層有很大的
52、關系。 Table 5. The classification of Leiyang, Hongjiang, Mayang, and Fenghuang dialect 表5. 耒陽、洪江、麻陽、鳳凰的方言歸屬 中國語言地圖集漢語方言地圖集中國語言地圖集第二版耒陽贛語耒資片 洪江湘語長益片西南官話湖廣片懷玉小片 麻陽湘語婁邵片西南官話湖廣片湘西小片 鳳凰西南官話黔北片西南官話湖廣片湘西小片 項夢冰 官話、東南方言序列的不同在于:前者Y值(Y的頻度值,即每個序列出現Y的次數)較高,后者Y 值較低(參看表6)。 從方言點數看,A線區、D線區是大頭,構成了典型的兩頭大、中間小的啞鈴型結構。說明16項
53、詞匯語法特征對于區分官話和東南方言是基本有效的。或者說,詞匯語法的南北“基因”確實是明顯有別的。官話、東南方言Y值和方言點數的匹配情況(如圖2所示)也可以直觀地說明這一點。 圖3所呈現的語言景觀跟圖1相同,無需贅述。 Figure 2. The match between Y frequency values and numbers of dialect locations of northern mandarin and southeastern dialects 圖2. 官話、東南方言Y值和方言點數的匹配(106個序列789個方言點) Figure 3. The phylogenetic
54、tree in circle style 圖3.環形進化樹 項夢冰4. 檢驗 下面將進行三方面的檢驗工作。(1) 不同計算方法的對比。(2) 主坐標分析。(3) 247個序列的完整計算。 4.1. 不同計算方法的對比 MEGA總共提供了5種不同的建樹方法。這5種方法可分為兩組。第一組:1. Maximum Likelihood (最大似然法,簡稱ML)。2. Neighbor-Joining (鄰接法,簡稱NJ)。3. Minimum Evolution (最小進化法,簡稱ME)。第二組:4. UPGMA (Unweighted Pair-Group Method with Arithmeti
55、c Means,非加權組平均法)。5. Maximum Parsimony (最大簡約法,簡稱MP)。通常遠緣序列選擇ML、NJ、ME,近緣序列選擇UPGMA 或MP (多用MP)。 本文對106個序列用5種方法分別計算了3次(其中MP在HP-DX2710SFF-E5200臺式機上計算一次需耗時兩個多小時),然后按計算方法逐一比對3棵樹,發現即使是同一種計算方法,雖然每次輸出的樹所反映的大趨勢是相同的,但細節并不完全一樣(各區段的長短、序列的排列順序都可能存在不同)。說明序列樣本越多,進化路徑的可能性越多。或者說,由于自展值非常低,幾乎不存在優選項,因此MEGA 只能從計算結果中隨機抓出一棵樹
56、來。南北共用序列本文都按方言的性質(官話或東南方言)分開,多數情況下,被人為分開的同一種南北共用序列會聚集在進化樹的同一個內部節點(internal node)下,但有時也會被分開。就本文的目的而言,同一種序列會被分開的計算結果自然要加以排除。本文從ML、NJ、UPGMA、MP的三次計算中各選一棵樹作為對比,見圖4、圖5。 從圖4、圖5可見,每棵樹都有藍色線段區(A)和紅色線段區(D),官話和東南方言的高頻序列分別集中在這兩個線段區。ML樹和MP樹跟圖1的ME樹一樣,也有綠色線段區(B)和橙色線段區(C),而NJ 樹和UPGMA樹則只有紫色線段區(BC)。當然并非BC絕對不能分為B和C,而是說
57、其層次不是很分明,勉強分開意義也不大。除了三區(NJ、UPGMA)、四區(ML、MP)的區別外,線段的長短(代表序列的多少)、序列的具體排列順序每棵樹也不一樣。如果立足于宏觀,可以說圖1、圖4、圖5所給出的五棵進化樹都代表了官話和東南方言大致二分的格局,不同計算方法所得結果的本質并無不同。對比表6和表7可知,ME樹的層次最為分明(分四區段,各區段的Y值表現最符合預期)。 Table 6. The comparison between different sections of the phylogenetic tree 表6. 進化樹不同區段的對比 序列數量方言點數最大Y值最小Y值平均Y值A線
58、區17 259 16 13 14.41 B線區21 54 15 9 12.14 C線區18 65 9 1 5.43 D線區50 411 5 0 2.77 Table 7. The comparison between different sections of phylogenetic tree 表7.進化樹不同區段的對比 序列數量方言點數最大Y值最小Y值平均Y值ML NJ UP MP ML NJ UP MP ML NJ UP MP ML NJ UP MP ML NJ UP MP A 19 23 25 20 264 274 286 271 16 16 16 16 12 12 12 12 14.
59、16 13.91 14 14 B B C 13 38 35 17 37 138 84 41 15 15 15 15 11 2 1 10 12.85 8.47 7.94 12.35 C 45 23 171 110 15 9 1 1 5.96 5.22 D 29 45 46 46 317 377 419 367 5 8 8 9 0 0 0 0 2.86 3.22 3.46 3.85 項夢冰 Figure 4. The phylogenetic trees in curve style with ML and NJ methods 圖4.用ML和NJ法構建的曲線形進化樹 項夢冰 Figure 5.
60、The phylogenetic trees in curve style with UPGMA and MP methods 圖5.用UPGMA和MP法構建的曲線形進化樹 項夢冰 4.2. 主坐標分析 本文采用NTSYSpc2.10e進行主坐標分析,以三維散點圖檢驗MEGA的計算結果是否合理。NTSYS 的全稱為“數值分類和多元分析系統”(Numerical Taxonomy and Multivariate Analysis System)。NTSYS 在漢語方言學里的運用可參看項夢冰2015 7, 2016 8。把106個序列按NTSYS所要求的0 1值格式進行轉寫后進行分步計算,最后可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業腳輪 A、B 地塊項目報告表
- 2025年互聯網醫療平臺在線問診平臺與醫院信息化系統融合報告
- 2025年助理醫師資格證考試之口腔助理醫師綜合檢測試卷B卷含答案
- 2025年互聯網醫療平臺在線問診服務質量與患者就醫體驗優化策略報告
- 統編版語文五年級上冊第二單元整體教學設計說課課件
- D2C模式引領未來互聯網消費時代-服裝行業的D2C模式研究 工商管理專業
- 江西中考角度題目及答案
- 電力基建工程題庫及答案
- 高職考試試題及答案
- 重慶輕工職業學院《舞蹈基礎訓練》2023-2024學年第二學期期末試卷
- 車床作業指導書及操作規范
- 脈動真空滅菌器的工作原理及維修保養
- 全文版曼娜回憶錄
- 綠地率計算方式
- 2023年山東省工業和信息化廳工業行業離退休干部服務中心招考聘用2人筆試歷年難、易錯考點試題后附答案帶解析
- 2023職業健康檢查質量控制評價指南
- 幼兒園公開課:中班語言《跑跑鎮》課件
- 孩子的玩耍與學習的平衡
- 大學物理實驗(上):透鏡焦距的測量
- 煙氣余熱回收計算
- BEC-V-劍橋商務英語中級真題集-第三輯第四輯第五輯合并-Word版-附答案及聽力原文
評論
0/150
提交評論