徐烈炯《生成语法理论》读书笔记

徐烈炯《生成语法理论:标准理论到最简方案》一书简要介绍 Chomsky 生成语法理论(主要是句法)及其流变。此为本书的读书笔记。

生成语法学的科学性质及哲学基础

传统语法学家要了解生成语法,并不比历史学家要了解物理学容易多少。——徐烈炯

An undercurrent of hostility to generative grammar arises because many who identify themselves as linguists believe that Chomsky wishes to define them out of the field of linguistics. ——F Newmayer (1983)

  • Chomsky 的生成语法试图使用实证的(empirical)自然科学手段研究句法(syntax)。[3-4]

  • Chomsky 对结构主义(structuralism)的方法论有以下批判:

    • 归纳法不能完整地描写语言。
    • 结构主义的发现程序(discovery procedure)严格按照语音—音位—语素—句子单向且独立地进行分析,这种规定繁复而不必要。
    • 结构主义研究本质上是在列举观察到的语言事实,最终目标局限于进行分类(taxonomy),而非提出理论假设。[11]
  • Chomsky 认为结构主义的贡献在于扩充了可用的语言材料,提高了其可靠性,以及指出语言中结构关系的存在。

  • 在行为主义(behaviorism)影响下的结构主义,特别是以 Bloomfield 为代表的描写语言学派把言语视作行为,一种与思想无关的刺激—反应活动,不承认语言的心理表现。认为语言不存在心理表现,则仅能研究已经说出或写出的语言形式,而不能研究所有可能说出或写出的语言形式。而 Chomsky 认为语言反映了心理

  • Chomsky 认为一部分语言能力是先天的遗传的),但不是所有的。Chomsky 并认为深层结构是天生的

  • Chomsky 后期强调区分 I 语言(I-language)和 E 语言(E-language)。最开始分别是内在语言(internal)和外表语言(external)的缩写,Chomsky 又补充 I 语言具有内涵的(intensional)和个人的(individual)的特点。I 语言属于个人语言机能的范畴,E 语言则是社会的(也就是传统意义上的语言)。

  • Chomsky 认为语言是派生自语法的

  • Chomsky 重视人类的语言能力(competence),而非语言运用(performance)。

  • Chomsky 认为语言学是一种特殊的心理学。或许,他相信还原论(reductionism)。

  • Chomsky 认为语言学研究在于深入理解语言并构建科学化的模型,而非尽可能涵盖更多的事实。

    All of this is part of what you might call the 'Galilean style': The dedication to finding understanding, not just coverage.——An interview on minimalism, Chomsky(2002)

生成语法学的研究内容及研究方法

  • E 语言具有递归性(recursive)。形式语言上的某些操作(operation)可以无限次地运用,构造出无限长的合式的句子(由于人类生理上的限制,这样的句子并不一定实际存在,但仍然是合式的)。这一命题的重要推论是:自然语言中的句子是无穷的

  • E 语言的句子是由离散的符号构成的,且这些符号之间存在有层次的结构关系。在这一点上,Chomsky 延续了结构主义的基本思路,在生成语法理论中保留了语类(category)的概念,包括词组语类(NP、VP……)和单词语类(N、V、D……)。

  • I 语言是一种生成(generate)句子的语法装置(或许可以直接理解为数理逻辑中的形式系统)。凡是可以通过 I 语言的规则生成出的句子都是合式(well-fromed)的,否则是不合式(ill-formed)的。生成语法的目标是用形式化的语言描述 I 语言。“英语”本身是 E 语言,而我们说一个人“掌握了英语”,则是说他掌握了可以生成英语的 I 语言。

  • Chomsky 学派把语法(grammar)划分为三个部分:句法(syntax)、音系(phonology)、语义(semantics),这种分类为后人所沿用。但语义是否属于语法,Chomsky 本人也有过犹豫。传统意义上的形态学(morphology)被分入句法和音系领域。

  • 普遍语法(Universal Grammar,UG)

    This biological endowment may be regarded as a function that maps a body of experience into a particular grammar. The function itself is commonly referred to as universal grammar (u.g.) and can be expressed, in part, as a system of principles that determine the class of accessible particular grammars and their properties. ——Knowledge of Language: its lements and origin, Chomsky(1982)

    普遍语法是限制语法的一系列原则。因此,普遍语法不是语法。在普遍语法的限制范围内允许一定的差异,称作参数(parameter)。不同的原则可以组合起来,构成某一条语法,这称作组合理论(modular theory)。在一定的参数下,不同原则组合并构成核心语法(core grammar),可以基本理解为 I 语言的语法。普遍语法理论试图解释人类语言习得过程中仅需少量语料就可以掌握语法的事实。

  • Chomsky 学派研究人类的语言能力(competence),而非语言运用(performance)。语言的实际运用中可能产生错误。可接受性(acceptability)是语言运用决定的(合乎语法的句子可能不被偏好),合法性(grammaticality)则是由语言能力决定的。实际研究中,研究的是一个理想化的人的语言能力。

  • Chomsky 学派不描写语言能力,而是解释语言能力,这要求研究语言获得机制。Chomsky 认为,一个充分的解释应该能从给定语言的所有语法系统中选择出最能充分描写该语言的语法系统。若两种语法系统的描写能力相当,在 UG 理论阶段,认为最符合 UG 的系统是最优的(由于 UG 就是人脑中的语言获得机制的基础,而 UG 本身是通过对语言的描写构拟的,这里有循环论证之嫌?),而在最简方案阶段则以简洁为优。

  • Chomsky 学派使用内省(introspective)的心理实验检验语法理论。

  • Chomsky 学派主张在少量材料上通过深入研究建立假设或理论,而后在其他材料上进行验证、推广和修正。

规则及规则系统

句法规则

  • Chomsky 标准理论中使用形式化的语类规则/词组结构规则(phrase structure rules)定义语法规则。如:S -> NP VP; NP -> D N; ...。这些规则可以递归运算。(注:但 Chomsky 学派的词组结构类是粗粒度的)

  • 利用形式规则解析句法的过程可以用句法树表示。通过句法树中的层次结构可以定义语法关系项(grammatical relation),即传统语法中的直接成分(尝试用 XPath 表示:如主语//S/NP[1] ,宾语//VP/NP[last()])。

  • 标准理论认为人类大脑中存在词库(lexicon),其中的词项(lexical item)构成形式规则的终结符号(如 NP -> car),包含语音、句法、语义三方面的特征。导入词项的规则称作词汇插入规则

  • 由于语类不足以描述所有句法的限制(比如不及物动词:VP -> V NP; V -> die 最终会得到不合法的结构 *die NP),因此需要引入子语类(subcategory)。同样地,为了描述语义的限制,Chomsky 曾尝试使用选择限制(selection restriction)。

  • 转换规则(transformational rules, T 规则)形如:

    分别称为删略、插入和移位规则。举例,移位规则:wh-移位:

           He is John.
        *<----^
    *<-----------^			 
    Who is he?

    此外还有改变特征规则( 比如 I like me => I like myself)和复制规则(,比如 He is good => He is good, isn't he)。

    包含转换规则的语法称作转换语法(transformational grammar),否则称作短语结构语法(phrase structure grammar)。

    依次运用语类规则、词汇插入规则、转换规则,得到语言的表达式。运用转换规则前得到的表达式称作深层结构(deep structure),运用后称作表层结构(surface structure)。深层结构既不是语义表示不是(运用词汇插入规则前的)词汇前结构,也不是某一条转换规则的结构描写

  • 深层结构不是天赋的,也不是说它比表层结构有更底层的心理表现。深层结构和表层结构没有先后之分(因为句法规则不一定是顺序应用的)。

  • 论证深层结构存在的一个例子:英语从句主语的移位:

             he say who  was coming? // D-structure
    *<--------------^        
    who  did he say      was coming? // S-structure
    whom ...                         // WRONG!
  • Lees & Klima(1963) 提出转换规则有一定的使用顺序,发展了规则有序理论(ordering theory)。

  • Chomsky(1965) 提出转换规则需要由内至外,自下而上进行,即层级理论(cyclic theory)。

    John wants [Bill to look at him].
    NP   V      NP   V          NP
    John wants [Bill to look at himself].
                ^<--------------^
    ^-----------x---------------^

音系规则

  • Morris Halle 是生成音系学的开创人物。书中本节主要依据 The Sound Pattern of English, Chomsky & Halle(1968)。
  • 最初生成音系学只研究句法有关的音系规则(词汇后音系学,postlexical phonology),Kiparsky(1982) 和 Mohanan(1982) 提出了词汇音系学(lexical phonology)。Goldsmith(1976) 通过对非洲有声调语言的研究,发现音系表达式是非线性的,应该由独立自主的音片(tier)构成,开创了非线性音系学(non-linear phonology)。
  • 生成音系学使用一系列区别特征(distinctive feature)构成的向量描写音素。在线性音系学中,音系表达式可以视作一个矩阵。
  • 音系规则包括改变、增添、插入、省略、换位等。通常采用 A->B / X_Y 表示规则 XAY -> XBY。比如词尾的 /z/ 在清辅音后清化:/z/->[-VOICE] / [-VOICE]_#。音系规则同样有应用顺序和层级。
  • 生成音系学的主要目标是将表层句法结构映射到合法的语音形式。在生成音系学中取消了结构主义音系学的音位(phoneme)。
  • Chomsky 将形态学的部分特征(数、体等等)的变形操作,称作再调整规则(readjustment rule),和音系规则共同作为语法规则的音系子系统,位于句法的转换系统之后。

语义规则

  • Katz & Postal(1964) 提出将语义学包含在语法学之中,Chomsky 在 1965 年建立标准理论时采纳了这一观点,但随后放弃了标准理论框架下的语义理论。语义领域同样分为语法的和语用的知识。
  • 必须在元语言中定义语义。和语音一样,标准理论也认为语义来自词库
  • 标准理论框架下的语义理论基于投射规则(projection rule)。这建立在语义与句法同构的假说之上(除去语义中的转换部分),特别地,Katz-Postal 假说认为句法转换规则和音系规则都不影响语义,语义自深层结构派生,因而陈述句与疑问句的语义是相同的。

表达式及表达式之间的关系

生成语义学

  • 1960 年代中期起,Paul Postal,George Lakoff,James McCawley,John Robert Ross(“启示录四骑士”)提出生成语义学(generative semantics),核心思想是取消深层结构语义是_生成_的,而句法解读语义,引发的论争史称 Linguistics Wars。生成语义学后来发展为认知语言学(cognitive linguistics)。

  • 标准理论的[[生成语法理论——标准理论到最简方案#语义规则|语义生成部分]](Katz-Postal 假说)过于机械化,要求语义不同的语段句法深层结构必须不同,语义相同的则深层结构必须相同,导致了深层结构变得过于抽象和复杂。比如 McCawley(1968) 提出的经典的词项分解说,将 kill 视作 cause + become + not + alive 的组合。

  • 生成语义学把语法(grammar)的范围扩大了,同时针对合法性和语法结构的界限问题提出了模糊语法(fuzzy grammar),但非形式化的语法难以开展研究。

扩充标准理论

  • Katz-Postal 假说的诸多反例被提出:

    • Chomsky(1972) 提出被动转换会影响语义:

      • Einstein has visited Princeton.
      • Princeton has been visited by Einstein.

      逝者与现在时搭配不合法,但被动变换后则合法。

    • Jackendoff(1969) 提出了著名的量词辖域问题:

      • Not many arrows hit the target.
      • Many arrows didn't hit the target.

      在标准理论下两句的深层结构是一样的,但语义完全不同。前一句中 not 在量词 many 辖域外(称占“宽域”),后者则在 many 辖域内(占“窄域”)。量词的辖域明显和表层结构有关。

    • 另外一个标准理论的反例是焦点(focus)和预设(presupposition)的问题,焦点和预设体现在表层结构之后的语音层面,但深层结构没有差异。

      • Q: Is it John who writes poetry?
      • A1: No, it is Bill who writes poetry.
      • A2: No, John writes only short stories.
  • Chomsky(1970) 提出派生名词不是句法的范畴。比如,John is easy to please 对应的动名词形式可以转换得到(John's being easy to please),但派生名词不可以(John's easiness to please 语义发生了变化)。派生名词可以有不同的语义,而且具有名词词组的特性。这一理论称作词汇说(lexicalism)。Chomsky 意图通过词汇说指出转换应当存在一定的限制,从而解决标准理论滥用转换引发的复杂性。

  • 标准理论时期认为代词是名词转换而来,但 Dougherty(1969) 提出量词会干扰这种转换(比如 Each of the man thought that he(?=each of the man) was the tallest)。排除深层结构转换的解释是:表层结构存在某种共指关系(coreference, 比如 The president has promised that he will end the war 和 The president has promised that he will end the war 不同)。为了解决省略的问题,扩展理论提出了空节点,即后来的空语类(比如 He wants himself to win 对比 He wants to win )。

  • Chomsky 为了解决语义和深层结构之间的关系,发展了语迹(trace)的概念,即深层结构在转换操作后,原位置仍然保留着某种“痕迹”——语迹 。语迹说解决了 Postal(1971) 提出的 wh-移位问题,而不用考虑“跨越”:

    • Who said Mary kissed him?
    • *Who he said Mary kissed ?

    在包含语迹的表层结构中,he said Mary kissed 是不合法的。

  • 在扩展标准理论中,Chomsky 把语义按照是否为逻辑式切分成了两部分,并将非逻辑的语义排除在语法之外。