本书将语料库语言学应用于马克思主义中国化话语体系研究中, 为马克思主义中国化话语体系研究, 提供了全新的方法, 提供了全新的思路, 开辟了全新的领域。从方法论基础、基本原则、逻辑思路、基本应用等四个层面, 探讨了马克思主义中国化话语语料库建设与应用的基本问题; 从技术支持系统、智力支持系统、评估与反馈系统等方面, 探析了马克思主义中国化话语语料库建设的系统架构; 从词汇频率、类符/形符对数比、词汇密度、词长分布、平均句长等层面, 解析了马克思主义中国化话语语料库的基本工具; 从词汇性质、词汇结构、词汇搭配、词汇意义等方面, 阐述了马克思主义中国化话语语料库的词汇研究问题。
语言研究的定性与定量之争由来已久。理性主义者主张使用内省和演绎的方法,以语言的概念系统和逻辑框架来论证语言中的普遍性规律。经验主义者主张使用统计和归纳的方法,以语言的统计数据来发掘语言中隐藏的趋势性规律。“工欲善其事,必先利其器。”此乃我国古训。本书将语料库技术引入马克思主义中国化话语体系研究之中,旨在通过对语言的计量学研究来发现语言的社会学本质。从这个意义上讲,以实践为基础的语言社会学构成了马克思主义中国化话语语料库建设与应用研究的本体论基础。
如今,语料库不仅是以电子形式存储的自然语言材料的集合体,更重要的是已经从语料库中衍生出把对语言事实的频率数据和数量模型的定量研究与把对语言事实的逻辑抽象和理论建构的定性研究相结合的哲学范式。语料库语言学和计算语言学共同构成马克思主义中国化话语语料库建设的方法论基础。真实性、广泛性、代表性、历史性成为马克思主义中国化话语语料库建设的基本原则。从项目的设计与规划到语料的采集与取样,到语料的标注与索引,到语料的检索与统计,再到网络资源共享平台的建构,构成马克思主义中国化话语语料库建设的逻辑思路。从技术支持系统,到智力支持系统,再到评估与反馈系统,构成马克思主义中国化话语语料库建设的系统架构。从词语频率到类符/形符对数比,到词汇密度,到词长分布,再到平均句长,构成马克思主义中国化话语语料库的基本工具。
在语言本质研究中使用语料库已经成为标配。从词汇研究到句子研究,再到语篇分析研究,基于语料库探讨语言形式的统计学规律将会大有作为。基于语料库探讨马克思主义中国化话语体系的统计学规律,并非想要把握超验的终极实在,而是试图为马克思主义中国化话语体系的研究范式提供基本的概念框架和预设性前提,或者说是建立起马克思主义中国化话语体系研究的学理基础。基于马克思主义中国化话语语料库的词汇研究将运用实证方法来研究词汇的性质、词汇的结构、词汇的搭配、词汇的意义。基于马克思主义中国化话语语料库的句子研究通过运用定量方法着手句子的共现频率分析、句子的语法结构分析、句子的语义成分分析、句子的机器学习分析。基于马克思主义中国化话语语料库的语篇分析研究正随着计算机技术的发展而逐渐走向成熟,探讨了基于语料库的语篇分析的可能性问题、研究范式、理论框架、研究特征、发展趋势。
课程教学与语料库研究已经形成学科共进关系。语料库技术应用于马克思主义中国化学科教学大纲的编制中,将在教学目的、教学要求、教学内容、重点难点、教学进度、日常作业、考核测评提供频率数据支持,保证教学大纲编制的均衡性。语料库技术应用于马克思主义中国化学科教材的编写中,将在教学素材的选择、教材结构的规划、知识架构的布局等提供相对客观的参数,使学科教材的编写有了量化的科学标准。语料库技术应用于马克思主义中国化学科的课件制作中,将在语料来源、阅读界面、检索功能、分析工具、课堂互动、资源共享平台等方面为课件制作提供先进的技术手段,实现课件制作的整体优化。语料库技术应用于马克思主义中国化学科的网络课程建设中,将推动网络课程朝着资源共享性、协作共创性、时空开放性、媒体多样性方向发展,进而使网络课程成为知识探索型教学模式。语料库技术应用于马克思主义中国化学科的教学辞典编纂中,将使词目的筛选、词目的释义、词目的搭配、辞典的更新与修订都能得到真实语言材料的印证和确认,使教学辞典的编纂更具科学性。
语料库是语言翻译研究的基础性资源。语料库翻译学采用定量和定性研究相结合的研究方法,系统分析翻译语言特征、翻译规范、翻译本质等双语转换规律。语料库技术应用于马克思主义中国化话语体系的翻译共性研究中,通过词频、词汇密度、平均句长等统计分析,来揭示译本中语言信息的简化、显化、范化、隐化、整齐化处理的趋势。语料库技术应用于马克思主义中国化话语体系的翻译风格研究中,以词频、词汇密度、词长分布等数据函数,来判定译本或简洁或冗长,或生动或抽象,或清新或晦涩,或直白或含蓄等翻译风格。语料库技术应用于马克思主义中国化话语体系的翻译教学研究中,通过对节点词的语境检索,计算出节点词的文本等值概率,发现词语搭配的语言习惯,进而发现译本的翻译特点和翻译规律。语料库技术应用于马克思主义中国化话语体系的机器翻译研究中,建立起面向机器翻译的各种各样的语料库和自然语言的处理工具、检索工具、分析工具,通过调用语料库的存储数据,以译文的概率模型来达到翻译的最佳效果。
基于语料库的话语分析乃是通过对语言符号的词频统计、主题词分析、语义韵分析、索引分析等,为对语言功能的抽象阐释的定性分析提供数据依据,有效地增强话语分析的可信度与说服力。运用词频统计方法来探讨马克思主义中国化话语体系的词汇总体分布状态,来揭示词语使用的普遍性情况,进而揭示话语背后的社会问题、权力关系、社会文化、意识形态、社会历史、意义解释等。利用语料库的统计方法来对马克思主义中国化话语体系的主题词进行计量分析,来探讨文献资料的语义联系和联想关系,进而揭示出社会存在、社会关系、时代特征的变化。利用语料库的概率工具对马克思主义中国化话语体系的关键词邻近语境中共现的搭配词进行统计分析,来发现潜藏于话语字里行间的隐秘的、隐蔽的、无意识的语义韵意义,探知话语主体的认知态度、社会立场、情感情绪、价值评价、意识形态、行为倾向。运用语料库的索引分析技术探解马克思主义中国化话语体系,能够如实地呈现词汇性质、词汇逻辑、词汇意义等方面的表现特征,对词汇性质的定量分析把握其意识形态立场,对词汇语法结构研究发掘其语义联系,对词汇的共现词研究透视其价值取向。
作为经验主义研究的语料库研究,通过对语言事实的计量分析,总结和抽象出语言事实的内在规律性,并以此验证语言知识的有效性问题。语言研究无论是本体研究还是应用研究都起于语言事实,研究有效性的校验也终于语言事实。马克思主义中国化话语语料库建设,本书主张采用经验主义的态度,着眼于话语资源建设,主要解决语料库“为何建”、“如何建”以及“如何用”的问题。“为何建”解决的是语言研究的文献来源的客观性问题,通过马克思主义中国化话语语料库建设,及时跟进鲜活的语言事实资料,从而保证马克思主义中国化话语体系研究的时代性。“如何建”解决的是语言事实从语言资源向语言学资源的转化问题,马克思主义中国化话语语料库建设要着眼于通用性,根据预先设定的语料库元属性来确定哪些文本应被纳入、以何种方式纳入、以何种比例纳入等都需要精心策划和精准布局。“如何用”解决的是如何为问题研究提供契合的语言事实资源支持问题,马克思主义中国化话语体系研究要着眼于问题性,根据语料库的元属性,对语料库进行适当裁剪,明确适用范围,选定计量方式,形成既适合分析,又客观的话语资源。任何语料库,无论它有多博大,无论它有多专业,也不可能穷尽学术研究所需要的文献资料,因此,学术研究只靠经验数据是不够的。所以,我的基本结论是,基于直觉的语言研究和基于语料库的语言研究彼此需要,或者,更为准确地说,应该把两种研究范式的品质融为一体。
收起全部↑
邓伯军,法学博士,博士生导师,南京航空航天大学马克思主义学院教授,网络空间公共安全研究中心(智库)主任,研究方向为马克思主义话语体系。发表学术论文七十余篇,主持和参与国家、省部级课题多项。
序言
引言
一 国内外研究现状述评
二 研究的价值和意义
三 研究的基本架构
四 研究的基本方法
五 研究的创新点
第一章 马克思主义中国化话语语料库建设与应用的基本问题
第一节 马克思主义中国化话语语料库建设的方法论基础
第二节 马克思主义中国化话语语料库建设的基本原则
第三节 马克思主义中国化话语语料库建设的逻辑思路
第四节 马克思主义中国化话语语料库的基本应用
第二章 马克思主义中国化话语语料库建设的系统架构
第一节 技术支持系统
第二节 智力支持系统
第三节 评估与反馈系统
第三章 马克思主义中国化话语语料库的基本工具研究
第一节 词语频率
第二节 类符/形符对数比
第三节 词汇密度
第四节 词长分布
第五节 平均句长
第四章 基于马克思主义中国化话语语料库的词汇研究
第一节 词汇的性质
第二节 词汇的结构
第三节 词汇的搭配
第四节 词汇的意义
第五章 基于马克思主义中国化话语语料库的句子研究
第一节 句子的共现频率分析
第二节 句子的语法结构分析
第三节 句子的语义成分分析
第四节 句子的统计机器学习分析
第六章 基于马克思主义中国化话语语料库的语篇分析研究
第一节 可能性问题
第二节 研究范式
第三节 理论框架
第四节 研究特征
第五节 发展趋势
第七章 基于马克思主义中国化话语语料库的课程教学研究
第一节 教学大纲的编制
第二节 教学教材的编写
第三节 教学课件的制作
第四节 网络课程的建设
第五节 教学辞典的编纂
第八章 基于马克思主义中国化话语语料库的语言翻译研究
第一节 翻译共性研究
第二节 翻译风格研究
第三节 翻译教学研究
第四节 机器翻译研究
第九章 基于马克思主义中国化话语语料库的话语分析研究
第一节 词频统计研究
第二节 主题词统计研究
第三节 语义韵研究
第四节 索引分析技术研究
参考文献
后记
现代科学研究是以语言为载体的研究,随着计算机技术的发展,尤其是大数据技术的快速进步,传统的依靠个体大脑的皓首穷经式的抽象研究已经远远不适应形势的发展,因此,为顺应大数据时代语言资源智能化处理的需要,建立语料库以数字化形式采集知识、汇集知识、挖掘知识、探索知识、发现知识、创新知识,利用语料库技术来解决科学研究问题。也就是说,知识价值和服务价值成为语料库建设的基本价值取向,知识价值体现为用户在语料库中挖掘知识、甄别知识并利用知识来解决问题,服务价值体现为把知识放在语料库的服务平台上加以利用和开发,提高知识的利用效率。建设马克思主义中国化话语语料库,就是要以语言资源的采集、加工、处理、重组、查新的知识能力为基础,根据学术研究问题和要求,提供有效的知识检索、知识统计、知识创新等服务。也就是说,马克思主义中国化话语语料库能够利用先进的技术手段,对非结构化的语言资源进行加工和利用,这样就可以高效地从浩如烟海的语言资源中将研究所需要的知识提炼出来,这样就可以借助庞大的语料库资源和分类检索技术,为语言研究提供高级化的信息服务。因此,要保证马克思主义中国化话语语料库的知识服务的效率和效益,就要建立起马克思主义中国化话语语料库知识服务的评估和反馈机制,运用要素分析法、标准检验法、定量评价法、过程分析法等对马克思主义中国化话语语料库建设的技术支持系统、项目管理系统、项目应用系统等进行评估,并且将知识服务评估的效率和效益结果反馈给马克思主义中国化话语语料库建设过程,从而使马克思主义中国化话语语料库改善和调节系统的运行机制,最大限度地发挥其知识服务的基本能力。
对马克思主义中国化话语语料库建设的评估方法主要有要素分析法、标准检验法、过程分析法等。运用要素分析法对马克思主义中国化话语语料库建设进行评估,主要是从技术、资源、管理等构成要素展开质量评价,从而实现对知识服务质量行之有效的控制。就技术要素而言,要对语料采集技术、语料加工技术、语料分析技术进行质量评估,审查采用的技术能够在多大程度上解决语料库建设的数据稀疏问题、语言歧义问题、语言模型的精确度问题等。就资源要素而言,要对语料库的语料资源进行空间和时间的评估,审核语料资源来源的空间地域的涵盖指数和时间脉络的覆盖指数等问题,解决语料库建设的语料来源的均衡性与代表性问题。就管理要素而言,要对语料库建设的人、财、物、信息、方法等管理要素进行评估,解决语料库建设的计划、组织、指挥、协调、控制等问题。运用标准检验法对马克思主义中国化话语语料库建设进行评估,就是要以知识服务的过程标准、服务标准、管理标准等对语料库建设进行质量评价。从过程标准看,要对语料库建设的流程制定业务标准,要以业务的流程标准对语料库建设进行评估,来解决语料库建设的部门协调问题。从服务标准看,要对语料库建设的知识服务确立服务标准,以明确性、准确性、可行性的服务标准对语料库建设进行评估,解决语料库建设的科学性问题。从管理标准看,要对语料库建设的管理事项确立技术标准,以量化的、高效的、系统的管理标准对语料库建设进行评估,解决语料库建设的管理秩序问题。运用过程分析法对马克思主义中国化话语语料库建设进行评估,就是要对语料库建设过程的有效性进行科学评估。依据技术的系统性原则、科学性原则、实用性原则,对语料库建设的技术支持系统的有效性进行评估,寻找对应的最佳技术支持,确保语料库的技术支持系统得以最优化地利用。依据管理的系统性原则、整体性原则、协调性原则,对语料库建设的项目管理系统的有效性进行评估,使管理的各个要素的潜能得以最大程度发挥,来保证语料库建设的项目管理系统通过有效管理实现整体的优势。根据应用的适用性、协调性、实用性原则,对语料库建设的项目应用系统的有效性进行评估,从语料库应用形式发展出基础理论知识,进而为语料库解决实际的问题提供科学的根据。
对马克思主义中国化话语语料库进行知识服务效率的评估。知识服务效率评估是对语料库建设所取得的效益与所花费的成本的一种比值的评估。知识服务效率评估的指标体系主要包括知识获取能力评估、知识处理能力评估、知识创新能力评估、知识推广能力评估等。对马克思主义中国化话语语料库的知识获取能力进行评估,通过对语料库的索引、主题标引、词的切分、词性标注、句法分析、语义分析、语用分析等进行评估,来全面地分析语料库的问题搜索能力,分析提炼能力、测量加工能力等知识获取能力。对马克思主义中国化话语语料库的知识处理能力进行评估,通过对语料库的词长、句长、频数、概率、平均数、类符/形符对数比以及更为复杂的因子分析、多元分析、聚类分析等数理统计功能的评估,深刻地探讨语料库的通过定量方式对知识的处理水平。对马克思主义中国化话语语料库的知识共享能力进行评估,对语料库的知识推广能力、知识产权保护、知识应用能力等进行评估,探讨语料库在消除知识壁垒、推动知识的自由流动、降低知识的获取成本、推动知识共享方面的积极作用,有助于提高语料库的知识服务整体效率。对马克思主义中国化话语语料库的知识创新能力进行评估,在对语料库的知识获取能力、知识处理能力、知识共享能力进行评估的基础上,对语料库在追求新发现、创立新学说、创造新方法、积累新知识、探索新规律等方面做出评估,深入地发掘语料库对科学知识发现新路径的重大意义。