语料库:俄语语言学理论和实践的新课题 提 要:语料库语言学是随着计算机和网络技术发展应运而生的新的语言学研究方向或研究手段。世界上英语语料库的发展处于领先水平,但俄语语料库也有了长足的进步。俄语单语、俄汉双语、中国俄语学习者的俄语语料库对于中国俄语教学、俄语语言学研究、俄语教材编撰、俄汉互译、俄语水平测试都有重大意义,是当代俄语语言学理论与实践的新的重大课题。 关键词:语料库;语料库语言学;俄语理论研究与实践 1. 语料库简介 1.1 基本概念 归纳和演绎是语言学家经常使用的两种基本研究方法。采用归纳法进行语言学研究时,语言学家事先没有确定的理论或者假定,他们从言语交际的实践中搜集有声或文字语料,加以整理、归纳,然后总结出一般的语言范式或者规律。演绎法则不同,语言学家心里有了一定的理论或者假定,然后去寻找语言事实,来证实或推翻原有的理论或者假定。定量和定性分析也是语言学研究的主要方法。定性分析要求对观察、搜集到的语料进行综合、归纳,提出一种描述的结论,发现规律或范式。定性分析的好处是观察、收集的资料很丰富、客观,描写深入、细致。定量分析主要有两种方法:统计法和实验法。通过统计或者实验,很容易验证一些语言学和教学理论的可信程度。定量分析的结论可信度高,具有普遍性。然而,无论采用什么方法,语言事实、现象是语言学理论的根本,离开了语料,语言学研究就是无源之水,无本之木。计算机是二十世纪人类最伟大的发明之一,以计算机和网络为主的信息技术的发展向各个学科(包括语言学)提出了新的研究课题,也为各个学科的发展提供了新的手段和方法。语料库语言学(корпусная лингвистика)便是随着计算机和网络技术发展而应运而生的新的语言学研究方向。语料库语言学代表的是一种传统的结构主义描写语言学方法,利用语料库可以对语言进行定量和定性描写。同时,语料库的语料也可以帮助验证语言学家通过演绎法提出的假定。 语料库,顾名思义,就是存放语言材料的仓库。目前,人们通常用语料库指存放在计算机里的未添加标记的原始文本或者经过加工添加了语言学信息标记的文本。现代语料库通常有下面四个特性: 1) 取样和代表性; 2) 有限的规模(选择性的条件); 3) 机器可读性; 4) 标准化的参考资料。 语料库语言学有两层意思,一是利用语料库对语言的某个方面进行研究,这样,所谓“语料库语言学”实际上只是一种研究方法和角度;另一层意思是依据语料库所反映的语言事实进行语言学理论研究,只有在这个意义上“语料库语言学”才能成为一门学科。 1.2 语料库的种类 语料库可以根据不同的标准进行分类: 按照媒体不同分为印刷文本、电子文本、数字化言语、视频、混合型; 按照建立方法不同分为平衡型、金字塔型、随机型; 按照语言参数分为:单语和多语;原语和译语(匹配的和未匹配的);母语和学习者所掌握的外语; 详细文章请查找论文快车http://www.lun-wen.com/0index.html 或http://www.lun-wen.com/ |