中国大学生英汉汉英口笔译语料库(配光盘)
分类: 图书,外语 ,英语专项训练,翻译,
作者: 文秋芳,王金铨 编著
出 版 社: 外语教学与研究出版社
出版时间: 2008-10-1字数:版次: 1页数: 123印刷时间: 2008/10/01开本: 32开印次: 1纸张: 胶版纸I S B N : 9787560079004包装: 平装编辑推荐
我国首个大型学习者英汉、汉英口笔译语料库。包含最真实的学习者口笔译样本,2003—2007年八级考试口译部分全部的语音语料。50万字词的语音转写口译平行语料。160万字词的笔译平行语料。语料库简介:《中国大学生英汉汉英口笔译语料库》(PACCEL)收录了全国18所高等院校英语专业三、四年级学生的英汉、汉英口译和笔译翻译测试语料,其中包括完整的11译语音语料以及根据语音语料转写而成的口译文字语料。
PACCEL分为两个子库:口译平行语料库(PACCEL-S)和笔译平行语料库(PACCEL—W),其中口译部分约50万字词,笔译部分约160万字词。所有文字语料均经过句级对齐并进行了词性赋码。PACCEL的建成对于我们了解和研究中国人学英语的全貌具有重大意义,对口笔译教学和研究、翻译测试、教材编写、英语师资培训、英语网络课程建设等具有重大价值。
本项目为教育部人文社会科学重点研流基地北京外国语大学中国外语教育研究中心的资助项目。
内容简介
PACCEL语料库光盘的总体结构包含三个部分:口译语料库、笔译语料库以及检索工具。口译语料库包含语音文件和文本文件,文本文件包含学生的完整英汉、汉英译作和经过句级对齐的平行语料,平行语料又进一步分为生文本和经过词性赋码的文本。笔译语料只包含文本语料,其分级格式与口译部分相同,同时笔译平行语料也包含生文本和词性赋码文本。本手册共四章,第一章为绪论部分,对PACCEL进行了总体介绍;第二章详细介绍了PACCEL的口译语料库;第三章详细介绍PACCEL的笔译语料库;最后一章对PACCEL检索工具的使用进行了详细说明。
目录
第一章 绪论
1.1 PACCEL建设背景
1.2 PACCEL概述
1.2.1 PACCEL-S简介
1.2.2 PACCEL-w简介
1.2.3 PACCEL总体结构
1.3 PACCEL项目组概况
1.3.1 项目组的构成
1.3.2 提供口笔译语料的学校(排名不分先后)
1.3.3 项目参与人员(排名不分先后)
1.4 PACCEL的安装使用
1.4.1 PACCEL的文件格式
1.4.2 PACCEL的运行要求
1.4.3 PACCEL的安装步骤
第二章 PACCEL-S
2.1 PACCEL-S的建库程序
2.2 语料来源
2.2.1 口试内容
2.2.2 口试评分标准
2.2.3 口试评分步骤
2.3 样本的选择
2.4 转录与转写
2.4.1 声音语料的转录与命名
2.4.2 语音语料的转写与命名
2.5 规模与结构
2.5.1 规模
2.5.2 结构
2.6 文本头标记
2.7 词性赋码
第三章 PACCEL-W
3.1 PACCEL-W的建库程序
3.2 样本的选择
3.3 语料转写
3.4 规模与结构
3.5 文本头标记
3.6 词性赋码
第四章 PACCEL检索工具简介
4.1 ParaConc初始设置
4.1.1 启动
4.1.2 加载语料
4.1.3 标注设置
4.2 ParaConc检索
4.2.1 一般检索
4.2.2 检索设置
4.2.3 高级检索(Advanced Search)
4.2.4 平行检索
4.3 词频统计(Frequency)
4.3.1 词频同现数据(Collocate Frequency Data)
4.3.2 高级同现(Advanced Collocation)
4.3.3 词频排序(Frequency Order)和字母排序(Alphabetical Order)
4.3.4 词频选项(Frequency Option)
参考文献
附录一 PACCEL—S 2003—2007年TEM 8口语试题
附录二 PACCEL—W试题
附录三 PACCEL词性赋码集
书摘插图
第一章 绪论
1.1 PACCEL建设背景
双语平行语料库的创建始于20世纪90年代,英国、挪威以及中国都相继建设了一些双语语料库。英国曼彻斯特大学翻译研究中心于1995年创建了世界上第一个翻译语料库(Translation English Corpus,TEC)。在国内,北京外国语大学中国外语教育研究中心王克非教授主持建设了3,000万词次的通用型汉英平行语料库。中科院自动化研究所、东北大学、哈尔滨工业大学也建立了规模不等的句级对齐双语库。以上语料库基本上都是以已出版的或网络上的翻译文本作为搜集素材,它们对双语词典研编、机器翻译研究以及翻译本体研究都起着重要的作用。
“中国大学生英汉汉英口笔译语料库”(Parallel Corpus of ChineseEFL Learners,以下简称PACCEL)属于学习者语料库,是“中国英
语专业大学生口笔语语料库”的一个组成部分,有别于上文提到的诸多平行语料库。本项目所收集的语料来源于中国英语专业大学生的翻译测试,类似的语料库及其研究在国内外都比较少见。PACCEL的建成对于我们了解和研究中国人学英语的全貌具有重大意义,对口笔译教学和研究、翻译测试、教材编写、英语师资培0il、英语网络课程建设等具有重大价值。
……