语言是反映人的思维的重要的一面镜子,又是人与人之间交流的重要的媒介。对语言的研究,是一个经久不衰的古老课题。几千年来,中外学者从语言与思维、语言与现实的关系等不同角度,在词源、注释、分类、语法等各个方面开展了广泛的研究。近一两百年来,西方学者在逻辑学、数学和分析哲学方面的成果,大大推动了语言形式化的研究。而随着计算机科学的发展,建立语言的形式化计算模型成为语言学的重要课题。计算语言学作为以形式化的计算模型来分析、理解和处理语言的科学也就应运而生。而信息革命的展开,更使计算语言学的研究达到了一个空前的程度。
翁富良,斯坦福国际研究所语音技术和研究实验室研究工程师。1984年毕业于复旦大学计算机科学系。在1984-1989年间,师从吴立德教授进行模式识别和自然语言理解方面的研究。1989年,赴卡内基一梅隆大学机器翻译中心继续自然语言理解的研究。1993年,在新墨西哥州立大学获硕士学位。自1994年起,在斯坦福国际研究所的语音技术和研究实验室从事语言、语音模型研究。先后单独或与同事合作在一些专业杂志和会议上发表论文20余篇,曾获1986年国家教委科技进步一等奖,第三届中国国家自然科学四等奖。
王野翊,1985年于上海交通大学计算机科学与工程系获学士学位。后师从上海交通大学孙永强教授和中科院数学研究所陆汝钤研究员进行自然语言处理的研究,并于1988年获上海交通大学计算机科学与工程系硕士学位。1992年于美国卡内基一梅隆大学(Carnegie Mellon University)获计算语言学硕士学位,现为卡内基一梅隆大学计算机科学学院语言技术研究所(Lan-guage Technologies Institute,School of Computer Science)博士候选人。主要研究课题包括统计学机器翻译、语言模型、语言学习、神经网络。
第一章 计算语言学简介
第一节 计算语言学是一门边缘科学
第二节 计算语言学研究的基本问题
第三节 计算语言学研究的基本方法
一 理性主义和经验主义:计算语言学研究方法的哲学分野
二 计算语言学研究方法
第四节 计算语言学的应用
第二章 预备知识
第一节 离散数学基础
一 集合及相关的概念
二 图及相关的概念
三 字符串及相关的概念
四 栈及相关的概念
五 序及相关的概念
第二节 概率统计理论基础
第三节 信息论基础
第三章 形式语言及自动机
第一节 形式语言和自动机的直观意义
第二节 形式语言和自动机的定义
一 形式语言的定义
二 自动机的定义
第四章 语法理论和表示形式
第一节 GB理论
第二节 词汇功能语法
第三节 广义词组结构语法
第四节 树连接语法
第五节 链语法
第五章 语言的识别与分析
第一节 有限状态语法的识别和分析算法
第二节 上下文无关语法的识别和分析算法
一 移进-归约法
二 由底向上的图表法
三 欧雷算法
四 GLR算法
五 链语法的识别算法
第三节 其他类型的分析器
一 基于原则的分析方法
二 基于归一 的分析方法
第六章 计算语义方面的一 些工作
第一节 语义理论简介
一 词的指称作为意义
二 心理图像,大脑图像或思想作为意义
三 说话者的意图作为意义
四 过程语义
五 词汇分解学派
六 条件真理模型
七 情景语义学
八 语义网络
九 模态逻辑
第二节 计算语义学的一 些代表工作
一 概念依赖理论
二 选择限制学说
三 指代化解
四 计算语义学的一 些其他方面
第七章 容错分析
第八章 概率语法
第九章 语言学习
第十章 当前计算语言学的研究
附录A 汉英术语对照
附录B 有关计算语言学的重要期刊和会议
附录C 参考文献