Lexicon & Morphology

词汇与构词全景图

这一页负责自然语言从声音进入意义的第一道稳定结构:词如何形成,词内部还能怎样继续拆分。 词汇不是一串静态标签,构词也不是简单造词技巧;它们共同解释语言怎样把经验切成可命名、可组合、可扩展的单位。 如果说 `语音与音系` 讲声音怎样成为语言,这一页就讲声音之后的形式怎样成为词、词素和词义网络。

词汇网络
词不是孤岛,而是意义、搭配和类别关系的网络
词素结构
词根、词缀、复合和屈折让词内部也有结构
造词机制
派生、复合、缩略、借词和转类持续扩展词库
跨语言差异
汉语、英语、西语在构词和形态标记上取舍不同
一、为什么要把词汇与构词单独拆出来

因为词是自然语言里最容易被误以为“已经懂了”的层。真正复杂的地方,是词如何被切分、组合、扩展和重新解释。

词把经验变成可调用单位
人类不是每次都从零描述世界,而是借助词把事物、动作、性质和关系压缩成可重复调用的语言单位。
经验 命名 调用
词内部也有结构
很多词不是不可再分的整体,而是由词根、词缀、语法标记或多个词素组合而成。看见词内部结构,才能看清语言如何节省表达资源。
词根 词素 词形
词库会持续生长
新经验、新物品、新动作和新关系都会推动词汇扩展。语言既要让新词被理解,又要让旧词在新语境中继续可用。
新经验 新表达 词库更新
二、先抓六个核心部件

这一页不追求一次讲完所有构词术语,而是先把词汇层最核心的结构关系搭起来。

词与词汇项
词汇
关注什么算一个词,词在词典、语法和真实使用中为什么不总是同一回事,以及固定表达和多词单位怎样进入词库。
核心问题: “一个词”到底是声音单位、书写单位、意义单位,还是使用单位
词汇项 固定表达
词素与词根
词法
词素是能承载意义或语法功能的最小形式单位。词根提供核心意义,词缀和其他成分则让词义或语法功能发生变化。
核心问题: 词为什么还能继续拆,拆到哪里才不再是语言中的意义单位
词素 词根 词缀
复合与派生
构词
复合把多个成分合成新词,派生通过前缀、后缀或其他形式改变词义和词类。它们是词库扩展最常见的两条路径。
核心问题: 新词怎样在已有材料上生长,而不是每次完全凭空创造
复合 派生 词类
屈折与语法标记
形态
有些语言会把时态、数、格、人称、性等语法信息压进词形里;有些语言则更多依靠语序、虚词或上下文表达这些关系。
核心问题: 语法信息究竟写在词里,还是交给句子结构和语境
屈折 时态
词义扩展
意义
词义不是固定贴纸。隐喻、转喻、泛化、窄化和语境重解,会让旧词进入新意义区间,也会改变词之间的关系。
核心问题: 为什么同一个词可以在不同语境里延伸出多个相关意义
多义 隐喻 转喻
借词与新词
扩展
语言会通过借词、音译、意译、缩略、首字母词和转类等方式扩展词库。新词能否稳定下来,取决于形式、意义和使用频率。
核心问题: 一个新表达怎样从临时说法变成共同体可以识别的词
借词 缩略 新词
三、用几种语言建立比较感

同样是“造词”和“标记语法”,不同自然语言会把信息放在不同位置。

汉语:复合、语序和语境
现代汉语大量依靠复合构词,词形变化少,很多语法关系更多由语序、虚词、语境和词汇搭配承担。
可观察点: 复合词、量词、轻重词、词类活用、双音节化
英语:派生、复合和弱屈折
英语保留一定屈折,但更多依靠派生、复合、转类和固定搭配扩展词库。词根与前后缀关系常能暴露词义线索。
可观察点: prefixes、suffixes、conversion、compound words
西语:屈折与词尾信息
西语通过动词变位、名词和形容词的一致关系,把大量语法信息写进词尾,适合观察词形如何承载句法关系。
可观察点: conjugation、gender、number、agreement
四、最值得继续往下拆的专题

如果后续继续扩页,词汇与构词这一层可以自然拆成几条更细的线。

词素与词法类型
可拆页
专门比较孤立语、黏着语、屈折语等语言如何把意义和语法信息编码到词形里。
构词法与新词生成
可拆页
专门看复合、派生、缩略、转类和类推如何持续制造新词。
词义变化与多义网络
可拆页
专门解释旧词如何通过隐喻、转喻、泛化和窄化扩展意义。
汉语词汇系统
围绕汉语复合词、双音节化、成词边界、量词、外来词和方言词汇,给汉语页补一条词汇入口。
五、和自然语言主干怎么连接

词汇与构词位于声音和句法之间:它从语音得到可识别形式,又向句法和语义提供可组合单位。

回到语音与音系
如果你想看词的形式如何先从声音流里被切出来,可以回到语音与音系页,看声音、音节和边界。
声音 词形
回到语言结构页
如果你想看词法如何接到句法、语义、语用和篇章,结构页是更高一层的骨架入口。
词法 语言结构
回到自然语言总览
如果你想重新看自然语言全局,包括声音、结构、意义、使用和变化,总览页更适合。
词汇层 自然语言
六、常见误区

词汇层最怕被读成“背单词表”。这里真正重要的是词怎样组成系统,怎样被构造和重新解释。

误区一:把词汇等同于词典列表
误区
词典只是记录方式。真实词汇系统还包括搭配、语域、词义网络、构词能力和使用频率。
误区二:以为词义固定不变
误区
词义会随着语境、搭配和使用习惯变化。很多词不是只有一个定义,而是一组相互关联的意义节点。
误区三:只看单词,不看构词规则
误区
词库之所以能持续扩展,是因为语言拥有可复用的构词模式。只背孤立词,会错过词汇系统的生产力。
误区四:以为所有语言都同样依赖词形变化
边界
有些语言把语法信息压在词形里,有些语言更多依靠语序、虚词和语境。比较词法,就是看这些编码策略的差异。
这一页的定位: 它是 `自然语言` 分支下第二张中层专题页,负责把 `语言结构` 里的词法层和总览页里的 `词汇与构词` 拆厚。 后续如果继续做自然语言,建议沿 `句法与层级结构 → 语义与语用 → 语言类型学` 继续生长。