计算语言学基础

分类: 图书,计算机/网络,计算机理论,
作者: 冯志伟 著
出 版 社: 商务印书馆
出版时间: 2001-8-1字数:版次: 1页数: 280印刷时间: 2008/01/01开本: 32开印次: 2纸张: 胶版纸I S B N : 9787100032841包装: 平装内容简介
本书从语言学的角度,回顾了计算语言学的产生和发展的历史,从词汇的计算机处理、自动句法分析、自动语义分析等方面,系统地讲述计算语言学的基础知识,特别是介绍了计算语言学的基本理论和方法。这是一本计算语言学的基础性入门读物,作者尽量考虑到计算语言学跨学科的特点。叙述力求深入浅出,文字力求简明扼要,可供语言学工作者、计算机工作者、计算语言学工作者以及对语言信息处理有兴趣的广大读者阅读。
目录
第1章 计算语言学的兴起和发展
第一节 计算语言学的性质
第二节 计算语言的萌芽期
第三节 计算语言的发展期
第四节 计算语言学的繁荣期
第五节 我国计算语言学的发展
第六节 计算语言学与传统语言学的区别
第2章 词汇的计算机处理
第一节 词汇统计与词表的制定
第二节 词语分布的统计分析
第三节 机器词典
第四节 现代汉语文本的自动切词与标注
第五节 词网和词汇知识系统的建造
第3章 自动句法分析
第一节 自顶向下分析法
第二节 自底向上分析法
第三节 富田算法
第四节 左角分析法
第五节 CYK算法
第4章 自动语义分析
第一节 义素分析法
第二节 单词的语义特征分类
第三节 语义关系与格语法
第5章 汉语计算语言学的特殊问题
第一节 信息时代汉字的标准化和共通化
第二节 汉语自动分析中的关键问题
书摘插图
第四节 现代汉语文本的自动切词与标注
书面汉语不同于英语、德语、法语等印欧语言,英语、德语、法语在书写时,词与词之间用空格分开,因而词与词之间的界限在书面上是渭泾分明的,而汉语在书写时,词与词之间不留空白,一个汉语句子就是一大串前后相续的汉字的字符串,词与词之间的界限,被前后相续的汉字淹没得无影无踪了。
汉语的形态不丰富,书面汉语的单词基本上没有形态变化,在这种情况下,书面汉语词法分析的主要任务不是分析单词的形态变化,而是进行单词的自动切分,使被前后相续的汉字淹没得无影无踪的词与词之间的界限暴露出来。词是语言中最小的能独立运用的单位,利用计算机把汉语的一个句子、一篇文章、一部著作中的单词,逐一地切分出来,才有可能对汉语进行进一步的分析。因此,书面汉语的自动切词,是汉外机器翻译、书面汉语文献自动标引、书面汉语自然语言理解等研究工作的基础和前提。
……
