Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore 2013 cloud translation technology magazine first one

2013 cloud translation technology magazine first one

Published by divide.sky, 2014-07-21 23:24:25

Description: 2013 cloud translation technology magazine first one

Search

Read the Text Version

技术探索 对的TagEditor 工具。翻译这些内容时有时会因为将页面或界面文档转换成Word文档时没有 将标签强制关闭,导致译员误以为是可以更改的内容而加以翻译,最终导致翻译好的译文在恢 复成HTML 或界面文档时无法运行。 译中功能模块的教学子模块主要提供观察和记录学生翻译过程的手段,并允许教师在学生 出现错误时可以和学生互动,在必要时对翻译质量进行干预。“翻译过程观察”使教师在任意 时段查看学生的登录状态,若学生登录在线,教师则可以抽查任意学生的在线操作,并可以通 过在线通讯模块功能和学生进行互动,也可以在“幕后”观察学生的翻译操作。通过启用“翻 译过程记录工具”,教师可以录制学生具体操作的步骤。“教师辅导和干预”功能提供“译审 同步”功能,就是在学生译员翻译的过程中,教师在后台观察,若出现技术或翻译内容上的错 误时可以进行干预,更改译文错误。教师这时的角色相当于翻译公司的译审,其操作的权限高 于学生的权限,更改后译文会被更新到TM 里。更改后的术语会进入整个系统的术语表里,并 显示在学生操作界面上,以免本学生或其他学生在这个时段后的译文里出现同样的错误。“译 审同步”功能使翻译错误在出现的第一时间就被消灭在萌芽状态,学生能在具体的上下文和 记忆犹新时纠正错误,得到更好的学习,同时也免去了以后在全文中寻找和修改同一错误所 耗费的大量时间,增强了教学效果,提高了生产效率。 2. 3 译后功能模块 本模块的生产子模块提供质量控制、语言资产管理和翻译服务质量反馈机制。译后的“质 量控制”( Quality Control) 有别于译中的质量保证( QualityAssurance) 。在质量保证阶 段,译审或教师发现的问题都可以通过在线通讯模块反馈到译者,由译者按照要求进行修 改。而在质量控制阶段发现的问题,一般都是“生米煮成熟饭”,修改结果不再更新到交给 客户的译稿中,而只是作为对译员翻译质量的评估、考核和计酬用,并将评估结果记录到译 前管理模块的译员业绩积分里。“语言资产管理”提供项目管理功能,让项目管理员( 学生 扮演) 对已完成项目的语言资产( Language Assets) ,如TM 和定稿的术语等进行清理、归 档,以供下次同类项目使用。“服务质量反馈”功能在客户、翻译公司和教学单位之间架起 沟通的桥梁,使客户的要求及时通过翻译公司反映到教学单位的学生( 译员和项目管理员) 和 教师,译员的疑问传递到翻译公司或客户。项目结束后,客户、翻译公司和师生之间也可以 有进一步的对项目的反馈和互动,以减少翻译流程中出现的问题,提高效率和以后类似项目 的翻译质量。 53

技术探索 译后功能模块下的教学子模块提供与翻译作业有关的评估和总结平台。“作业提交及发 布”提供项目作为作业提交的界面,同时也发布类似真实任务的课外作业或下一次新作业的 信息。“作业评估及总结”发布教师对翻译项目的具体反馈,这部分的信息汇集了译审同步 平台上教师对学生的辅导成果,以及服务质量反馈系统里客户或翻译公司对学生译文的具体 反馈。“成绩公布及反馈”可以发布单独和全体学生完成作业/项目的状况( 这部分信息和译 前模块里的项目管理内容大致是一样的,但是教师可以根据班级总体情况给予分数) 以及翻 译公司、客户对项目的反馈( 这部分内容和译后模块生产子模块里的“服务质量反馈”功能 大致相同,但是教师可以在翻译公司和客户反馈的基础上提供额外的反馈及评分) 。 2. 4 在线通讯模块 在线通讯模块在学校和翻译企业之间、教师和学生之间、学生之间提高即时同步的互动通 讯,同时也以Email 或短信的形式支持非同步交流通讯。项目管理交流子模块是公司项目经 理和翻译课教师之间商讨项目和人员安排的交流平台; 翻译过程交流子模块是客户、翻译公 司、教师和学生们针对翻译项目技术要求、翻译过程和质量控制进行交流的渠道;课程相关交 流子模块给教师和学生就课程进行交流以及师生进行课堂外交流提供了可能。 3 校企合作平台实施原型 北京传神联合信息科技有限公司已经开发了这种基于云服务的称为“Transn 翻译实训平 台”。 ( http: / /college. transn. com) 的系统原型,并在全国多家有翻译专业的院校推广和试 用。在这个平台有“Transn 教辅模块”( 图2) 和“Transn 翻译实训平台”( 图3) 两部分。 54

技术探索 教辅子模块集中了图1 翻译教学生产平台系统结构图中的教学子模块,供师生发布课 程信息、存储课程相关文档的服务器空间和在线交流的平台。除了目前尚无翻译过程观 察、记录和译审同步的教师对翻译过程干预机制外,其他功能已经基本建成。师生通过界 面上的链接就可以进入实训平台,领取传神公司提供的实际翻译项目。 实训平台子模块提供了团队实训和个人自由项目实训两个板块,可以跟踪全部项目的 流程和进行项目进度管理。“人力资源管理”模块提供了在系统上的所有译员/学生的擅 长语种、擅长领域、报价、联系方式、历次项目的战绩等信息,公司项目管理员可以通过 查询系统查找符合条件的译员。除了译前的文件格式工具和译后的质量保证模块外,译中 的CAT 工具、术语工具,译后的项目统计工具等都已开发完毕。 图3 Transn 翻译实训平台 这个平台是基于云服务的,不但没有硬件,连软件光盘都没有,很多学校觉得“手中 无货”,往往不愿意投入资金。而且因为平台需要不断更新和维护,采用年费的收费方 式,和学校一般采取的一次性项目采购的方式不协调,导致系统在高校的推进比较艰难。 另外,很多学校的翻译师资没有产业工作经验和对翻译流程的总体认识,对系统功能理解 还不充分,导致了购买动力不足。而对系统功翻译流程非常熟悉的教师又因为学生水平还 不符合实际生产的要求而无法充分发挥系统功能。传神公司则因为没有足够的学校和学生 使用这个系统而无法将很多的实际生产项目放到系统上供师生认领。而学校师生感觉到上 55

技术探索 面的项目不是真实项目后,对系统又失去兴趣,从而产生恶性循环。这个先有鸡还是先有蛋 的问题是技术推广上的一个老大难问题,目前暂时还难以突破。 4 结语 在线翻译教学利多弊少,是翻译教学的大势所趋。从在线翻译教学的研究初现,到目前 已有十多年,国内这方面的研究也日趋活跃,随着网络技术的日趋成熟和网络速度的不断提 高,在线翻译教学已经从理论到实践,网络翻译教学的平台设计已经从空想到现实。但是由 于目前翻译专业教学的职业化要求不断提高以及高校翻译教学和翻译产业及社会的需求脱 节,一个封闭在象牙塔内的虚幻模拟翻译教学平台已经不能满足高校翻译专业教学的需求, 而连接产、学、研的在线翻译教学生产平台可以弥补翻译专业学非所用的缺陷。一个这样的 平台需要有教学、生产和即时通讯三大功能模块来支撑译前、译中和译后的翻译流程需求。 北京传神联合信息技术有限公司研发的“Transn 翻译实训平台”基本上实现了这些设计理 念,但是由于技术和推广中的一些实际问题,这个平台在各个学校翻译教学中的使用还不能 普及开来,系统的功效也还难以完全实现。如何突破“学生水平低不能参与生产,而不参加 生产实践就不能提高翻译水平”的两难境地不是目前这个翻译实训平台能够完全解决的,还 需要学校和翻译企业之间更多的沟通、多方位的合作才能实现。 本文旨在引起翻译学术界对这个瓶颈问题的重视,促进在线翻译教学平台开发研制工作 的不断公开化,促进产学研产业链内部的更多对话,不但使这类系统的用户界面更加友好, 系统的性能更加全面和高效,而且能使校企合作更加深入,真正达到翻译教学和翻译产业的 全面有机的结合,全面提高翻译教学质量,为翻译产业提供更多更好的翻译人才。 56

技术探索 新一代计算机辅助翻译系统的技术思路和前景 多语工程技术研究中心 【摘要】本文对比分析了基于两种基于Office编辑平台下的计算机辅助翻译系统,阐述 了基于VBA的嵌入式辅助翻译模块的技术缺陷,详细分析了基于VSTO技术思路的嵌入辅助翻 译系统,点出新一代计算机辅助翻译系统的技术思路和前景。 【关键词】计算机辅助翻译、Office、VBA、VSTO 计算机辅助翻译系统(TCAT)发展至今,主要有两种开发设计思路:一是独立软件系统 模式,将待译的稿件转换为系统的支持的格式,然后再纳入系统中实现各种辅助翻译的功 能;二是嵌入软件系统模式,主要是在Office(主要是Word)中,采用插件的方式嵌入辅助 翻译功能模块,在进行Office的编辑操作的同时提供辅助翻译的功能。这两种方式中,第一 种方式因为技术开发相对比较容易,因此目前此类的辅助翻译产品较多,最成熟知名的当属 Trados;但是第二种方式——嵌入式软件系统显然更容易被使用者接受,因为绝大多数翻译 工作着采用Word作为主要的工作平台,嵌入系统既可以保持原有的编辑操作习惯,又可以 利用辅助翻译功能提高翻译效率,所以对翻译工作者更加适合,但是嵌入软件系统开发的难 度比较大,目前比较成熟的产品主要是国内传神、多语工程技术研究中心以及国外 LionBridge推出的辅助翻译系统。 既然嵌入式辅助翻译软件系统更能够获得客户的青睐,那么主要由于技术原因导致的大 部分的产品都没有采用这种技术形式,要开发出优秀的嵌入式辅助翻译系统,克服各方面的 技术障碍显然是最重要的。目前的嵌入到Word中的辅助翻译产品大多是采用VBA技术开发 的,总结一下,存在以下几点主要技术障碍: 57

技术探索 1. 嵌入到 Word 中实现辅助翻译功能,必然要通过 Word 的一些既有功能,这就明显 要受限于 Word 的开放接口的程度了,直接导致一些重要的功能不能实现或者实现不充 分,目前的产品主要采用的是 VBA,通过 VBA 能够访问的 Word 接口和资源十分有限; 2. 兼容性是一个很大的问题,不同的 Windows 操作系统和不同的 Office 版本,都有 可能对兼容性造成重要影响,VBA 虽然是标准的,但是不同版本的接口可能有差别,而且 VBA 本身功能较弱,肯定要通过 VBA 访问外部功能模块,这要确保嵌入辅助翻译功能在主 要的 Windows 操作系统和 Office 版本上均能够良好运行并保持一致,绝对是件复杂的工 程; 3. 权限问题经常成为嵌入到 Word 中的辅助翻译功能不能正常运行的重要原因,由于 权限的设置受制于 VBA 本身,因此嵌入辅助翻译模块不能充分保障拥有足够的权限来访问 资源,导致出现诸多问题; 4. 安装问题也不容忽视,采用 VBA 机制通常是通过模板的形式嵌入到 Word 中,在不 同的 Office 版本下经常需要针对性地进行设置,需要考虑的因素很多,如果处理不好就会 导致一系列问题,不仅影响辅助翻译功能的使用,甚至于导致 Word 的功能无法正常运 行; 这些问题能够有效解决,成为能否成功开发嵌入式辅助翻译软件的首要技术保障。大多 数已有的嵌入辅助翻译软件,均由于以上问题的一部分不能有效解决,导致产品的设计被迫 作出牺牲,从而影响了产品的应用价值和推广程度。 多语工程技术研究中心与传神公司联合研究开发了新一代辅助翻译系统(TCAT二代, 又名译神系统),仍然采用了嵌入式辅助翻译系统的产品模式,在充分总结了以往的经验教 训的基础上,采用了新的技术思路——基于VSTO(Visual Studio Tools for Office),摒 弃了以往备受诟病的VBA开发模式。 58

技术探索 VBA是一个很简单的开发环境,集成在很多Office的产品中。每个Office的产品,如 Word,Excel,Outlook,都通过COM暴露了非常丰富的对象模型供程序员编程。大多数嵌入 式辅助翻译软件就是用VBA和这些Office的COM对象模型对Office进行扩展开发的。但是对于 复杂的逻辑操作,单纯用Office提供的函数很难实现,VBA也难以处理,所以功能必然受到很 大限制,另外VBA在安全保护方面也很薄弱。VSTO为中高级开发人员提供了更加强大的开发 平台和语言,并较好地解决了传统嵌入辅助翻译软件开发中的诸多问题(难于更新、可扩展性 差、难以维护、安全性低等),开发人员可以使用熟悉的技术来构建更加灵活的、强大的、跨 平台的辅助翻译解决方案。 对于Office解决方案开发来说,VSTO是简单但强大的框架。这个框架为每个Office开发 者带来了许多令人惊叹的好处:窗体控件、类、安全性、服务器可测量性、面向对象特征、 完整性、易发布,等等。 采用VSTO开发嵌入辅助翻译系统,可以很好地解决前面总结的VBA开发模式所遇到4个 主要技术障碍: 59

技术探索 1).通过 VSTO 能够访问的更多的 Word 接口和资源,并且可 以方便地进行功能扩充,实现 VBA 模式难以或者无法实现的辅助翻译功能; 2).VSTO 采用 Office 插件的形式而不是 VBA 的宏,同样的 VSTO 代码针对不同版本的 Windows 系统和 Office 版本分别进行编译后,可以充分保障对这些版本的兼容性; 3).采用 VSTO 插件形式,可以享有 Office 本身的权限,这样 VBA 宏模式所遭遇的权限 问题基本不存在了; 4).VSTO 本身具有易发布的特点,安装可以容易地采用标准的方式。 5).采用 VSTO 技术开发嵌入辅助翻译功能,可以轻松地实现如下的效果: 从上图中可以看出,通过VSTO技术可以充分利用Word的侧边栏等资源(VBA很难实现 这一点),将辅助翻译功能与Word紧密捆绑在一起,就如辅助翻译功能是Word本身提供的 36

技术探索 功能一样,这不仅大大提升了辅助翻译功能的实现程度,也让辅助翻译功能的可操作性更加 符合用户的感受和要求。下图是新的嵌入辅助翻译功能的实现示例: 采用了VSTO技术思路的嵌入辅助翻译系统,比之前的基于VBA模式的旧系统,不论从 功能的实现,还是操作与性能表现都有了巨大的提升。目前由多语工程技术研究中心和传神 联合研制开发的基于VSTO技术的新一代辅助翻译系统TCloud已经面世,并在网上提供了免 费的版本供下载应用,有兴趣的读者不妨前往体验。 37

技术探索 语联网云计算技术的应用探索 多语工程技术研究中心 摘要:本文阐述了语联网的商业模式及其技术架构,指出了语联网建设的关键技术的四 个主要方向,并对云计算的主要软硬件技术MapReduce和虚拟化等在语联网的应用进行了 详细讨论。 关键词:云计算、语联网、MapReduce、虚拟化 语联网采用先进的云计算技术架构,支持大规模翻译任务基因匹配的并行处理,以及海 量翻译资源的存储。语联网所支持的翻译业务和翻译资源处理能力具有无限的拓展性,作为 语言服务行业的支撑平台可以完全满足不断增长的语言服务需求。 “语联网”创新服务商业模式是基于移动互联网的规模化类电网服务模式,它优先整合 与文化软件实力密切相关的产业,从资源系统到应用系统形成完整的网络语言信息产业生态 链系统,以实现象电网、水网一样,开灯就有亮、打开龙头就流水的方式,成为“立等可 取”的语言服务,使语联网成为全球经济一条化、文化发展中不可或缺的现代化基础设施。 60

技术探索 语联网所创建的第四方服务平台,本身就涉及三个层次,第一层核心技术和支撑层,是 语联网、云翻译所属的翻译技术、语言技术、云计算和SNS模式等研发及运用;第二层是语 言资源及应用层,将通过语联网调动全球语源资源,在云翻译平台上实现语言信息高匹配、 规模化的语言信息服务能力;第三层是客户,集中在上图所示的密切关联的六大领域。当前 语联网主要在国际工程、装备制造、影视传媒、国际贸易、历史文化、服务外包等领域进行 示范应用,历经一年多的实践,使得我们司空见惯的场景发生改变,产生较大的社会价值和 经济效益。 语联网的关键技术有四个方向: 1. 云翻译技术:云计算与多语处理技术结合的云翻译技术,在语联网平台化应用中得到 了显著的提升,是语言信息处理技术的一大突破;基于云翻译技术支撑的大规模碎片化翻译 处理,是语联网海量业务吞吐能力的基础技术保障; 2. 基因匹配技术:语联网采用任务基因和资源基因的匹配作为资源筛选和调度的核心, 使得大规模的资源应用精确有效,同时大规模的基因匹配也是在云计算的支撑下完成的; 3. 虚拟化技术:作为云计算技术重要组成的虚拟化技术,在语联网中得到广泛应用,不 仅提供虚拟化的平台硬件资源优化应用,更将翻译资源产能虚拟化,从而实现产能量化管理 和风险预测; 4. 协同处理技术:通过生态社区实现大规模资源整合,通过智能工作流以及并行机制, 在云计算支撑下实现大规模协同化的任务处理机制以大幅度提升任务处理效率。 语联网的云计算平台在服务器集群上构建的整体架构如图所示: 61

技术探索 语联网的云计算平台在服务器集群上构建的整体架构主要由数据处理和虚拟执行环境两大 部分组成。数据处理部分,首先在集群上部署分布式数据存储子系统,将数据的读写操作进行 封装,对外提供虚拟的数据访问接口。数据并行处理子系统也通过这个接口访问存储的语料数 据,并运行语料匹配服务。平台还提供安全机制对数据进行保护。虚拟执行环境部分,通过部 署在服务器集群的虚拟化资源池对计算资源进行监控和调度,在此基础上构建翻译业务虚拟执 行环境,通过相应的服务对其进行管理。最后,把语料匹配和业务环境管理服务的调用接口发 布到统一的云计算平台,供上层用户使用。 云计算平台的数据资源包括术语、语料、文档的存储与查询,多语种的翻译处理能力等。 云平台可以向用户提供对共享数据资源(如术语库、语料库)的查询服务,对文档的人工翻译 服务。用户还可以在云平台中购买私有的术语、语料和文档资源库存储能力,这些数据资源既 可以独享,也可以作为共享资源开放给云平台中的其他用户。 针对语联网术语和语料资源存储的可扩展性和可用性问题,采用分布式非关系型数据存储 系统来实现语料数据的海量存储和快速存取,以键-值对的形式将数据存储在多个节点上,以 满足高效的语料访问要求。 语联网的云计算平台使用虚拟化技术整合服务器计算资源,提供统一的资源共享与调度, 62

技术探索 在此基础上,以虚拟机为各类用户提供独立的翻译业务执行环境,并对所运行的云翻译服务 进行管理。如图所示,首先在服务器集群上部署虚拟化资源池,用于监控各节点的虚拟计算 资源。然后,通过虚拟执行环境构建、资源调度和服务管理这三个模块来实现对翻译业务虚 拟执行环境的管理维护,并通过服务接口向上层开放。 虚拟化资源池组织维护云计算基础平台的计算和存储资源,为每一类资源都提供一个单 一的虚拟资源逻辑视图。 虚拟执行环境构建模块主要进行云翻译应用运行环境的资源获取和环境部署。使用虚拟 机镜像来保存系统模板,基于增量镜像创建虚拟机,并提供软件自动化部署工具,从而方 便、快速的为用户构建运行服务所需要的计算环境。 资源调度模块根据翻译任务的实时需求动态的调度底层资源,从而在保证服务的前提下 提高资源利用率,降低任务的运行成本。 服务管理模块主要执行翻译业务相关服务的注册、发布、定位等生命期各阶段管理任 务,并对服务运行的可用性提供保障。在语联网中海量资源匹配的分布式处理机制实现是非 常重要的,其中术语语料资源的匹配是核心: 63

技术探索 语联网采用了采用MapReduce模型对海量术语及语料资源进行匹配,如图所示,术语 语料匹配的分布式处理机制由任务预配置模块、数据匹配模块和任务追踪模块三部分构成。 任务预配置模块根据数据匹配任务的特点以及集群系统的资源状况自动为用户提供一个 合适的参数设置方案。此功能可以在不增加硬件开销的前提下大幅度提高MapReduce任务 的运行性能。 数据匹配模块的功能是对海量资源中的词组和句子在术语库和语料库中进行匹配。匹配 模块的输入为要进行术语和语料匹配的文档,MapReduce将大文档分块之后,在每个Map 任务维护一个对数据资源的链接,基于对目标语言的分词模型,对当前分块中的语言进行分 词处理,并在术语和语料库中查询是否有对应的匹配。 任务追踪模块设计一个对用户友好的可交互的程序,来反映MapReduce的任务运行情 况,从而加速定位MapReduce程序的瓶颈以及测试最新的调度算法。 64

技术探索 场景化的专业外语教学与学习平台解决方案 ——云翻译技术以及在高校的应用 多语工程技术研究中心 【摘要】基于云翻译等先进技术打造的,面向高校的“场景化的外语教学与学习平台解决 方案”,是先进的互联网情景化教学实训解决方案,其中“面向工科专业外语教学的以模拟 实际涉外项目运营场景为特色的教学实训平台”,能够为高校专业外语学习提供全新的教学 与实训模式,并在语联网的支持下获得丰富的素材,显著提升专业外语学习的质量。 【关键词】云翻译、场景化、实训平台、语联网 在国内的翻译技术领域,当前最具代表性的是云翻译技术(语联网的技术核心),该技 术是云计算技术和传统翻译技术的结合,代表着第四代语言处理技术水平,在国际上处于领 先地位。 多语工程中心在云翻译技术的研究方面,拥有核心的、完全自主知识产权的发明专利、 著作权,所拥有九大核心专利技术代表了当今翻译技术的最新进展和成果: 1. 碎片云翻译技术:基于云计算架构的碎片化翻译生产模式,实现翻译任务的大规模并 行处理,实现高速翻译交付能力; 2. 流模式技术:全工作流方式的自动化任务控制技术,并可实现无限灵活的翻译工作流 程设置,实现不同形式的翻译任务流自动控制; 3. 翻译记忆引擎技术:多语工程中心最新的翻译记忆引擎技术,可大大提高语料模糊匹 配的精度并提高3倍以上的效率; 65

技术探索 4. 协同翻译技术:多语工程中心全面更新的协同技术,组内成员的工作协作更为方便流 畅,实时效率更强; 5. 实时同步技术:多文档格式的内容远程同步技术,为网络工作模式下的协同翻译提供 了强劲的技术内核支持; 6. 语料整理技术:多语工程中心推出的基于工业化流程方案的语料整理写列软件产品和 流程工艺,使大规模低成本的语料整理成为现实; 7. 数据挖掘技术:多语工程中心推出的采用国际最流行仪表盘模式的数据层次分析法, 通过高速数据引擎挖掘出符合不同级别要求的翻译数据报表; 8. 搜索引擎技术:多语工程中心最新推出的词汇搜索和融合技术,可最大限度地帮助译 员获得疑难术语、词汇的权威解释; 9. 机器翻译技术:在多语工程中心的不懈不利下,机器翻译技术在面向行业的应用中发 挥越来越重要的作用。 基于云翻译技术诞生了一系列最新的翻译软件产品和高校外语教学的解决方案,最具特 色的解决方案就是“场景化”的外语教学与学习平台,既“场景化的外语教学与学习平台解 决方案”,其中既含有面向外语专业教学的情景化实训平台以及翻译实训平台,也有面向工 科专业外语教学的以模拟实际涉外项目运营场景为特色的教学实训平台,本次论文主要论述 后者,即“面向工科专业外语教学的以模拟实际涉外项目运营场景为特色的教学实训平 台”。 随着中国企业国际化经营的迅猛发展,加快培养通晓国际规则和适应国际化经营及跨国 发展需要的国际化经营人才,已经成为当务之急的战略性任务,而有良好的语言能力毋庸置 疑是国际化人才的重要标准,也是目前工科院校语言学习的一项重要目标。 66

技术探索 然而目前的实际情况是,不少工科院校的专业外语教学,仍然延续多年前的传统模式,教 学实际效果不佳,学生的专业外语能力较差,成为学生毕业后就业难度加大的一个重要原因, 以至于在很多时候造成学生的不满情绪。究其原因,最主要的是专业外语的教学实际上有其特 定的要求,与普通的通用外语教学有显著的差别,传统的外语教学方式难以达到预期的效果: 1. 教学的手段要求多元化 对国际化经营人才的外语教学,要力求做到学以致用,集中授课的传统教学方式很难在有 限的时间内达到期望的效果,即使有的时候通过延长课时以及增加课外辅导力度,也仍然无法 保障充足的教学与练习时间;为了应对这种情况,很多高校只能将一些学习材料下发给学员, 在课余有时间就多花一些精力自学,没时间的也就只好听之任之了。在这样的现实下教学手段 多元化的要求日益强烈,充分利用互联网技术等新的技术手段和产品,提供多种学习方式满足 实际需求是当务之急。 2.培训的素材要求专业化 目前用于国际化经营人才外语教学的教案、素材,实际上还是以日常商务英语为主,和普 通的外语教学,其实没有什么本质区别,只不过改换了一下“名头”,而且因为老师也极少有 人是有行业背景的,大都是外语专业出身,所以对专业外语的教学严重缺乏针对性;而专业外 语教学的目的,是达到外语能力与专业技术能力相结合,而不是仅仅是普通外语能力,这样才 能真正在今后的国际化经营中发挥作用,这就如一个外语很好但是不懂得石油专业知识的人做 不好石油行业的翻译是一个道理。因此专业外语的教学,教学素材一定要注重专业化的要求, 针对性强,注重外语能力和技术业务能力的结合与共同提高,才能真正获得需要的学习效果。 3.培训的过程要求情景化 专业外语的教学,既然注重的是外语能力和专业技术的结合,目的性很强,因此采用针对 67

技术探索 性的模拟真实业务环境的情景化教学与练习方式,毋庸置疑是最有效的方式。目前很多教 学模式也声称是情景化的教学,但是这些情景主要都是生活情景,与具体的工作方向和行 业基本无关,没有针对性,实际上是适用于通用外语的教学,专业外语所涉及的工作和行 业特征基本没有关联或者关联不大。而工科学生专业外语的学习,是要学生能够良好地掌 握在未来的业务工作中将可能用到的专业外语知识和能力,因此采用针对未来业务工作场 景的情景化教学才是最需要的。 从以上的分析可以得出结论——工科院校专业外语的学习,必须采用新的模式、方法 和手段,才能有效解决上面阐述的几个方面的要求,必须引进新的技术和新的产品,采用 创新的解决方案,才能形成卓有成效的创新模式,使专业外语的教学能够满足国内企业全 球化业务发展的人才需求以提升学生的实际工作能力和就业竞争力。 目前国内唯一的多语信息处理工程技术研究中心联合传神信息技术有限公司,在通过 先进的技术模式构建创新的专业外语教学实训平台建设方面,已经取得了一系列重要的成 果,发布的基于互联网的“在线专业外语教学实训平台”,区分行业、学科以及工作性 质,采用模拟真实工作场景的情景化学习方式进行阅读写作、听力口语等的专业外语在线 教学与实训,教学素材则直接体现了专业外语与专业知识相结合的特点;平台上的教学与 实训活动全部由软件系统进行管理和操控,并将教师在线教学、离线指导与学生自我实训 等多种形式相辅相成,短期与中长期的教学均可系统化进行,是目前国内对专业外语教学 与培训的最先进最适宜的平台。 “在线专业外语教学实训平台”融合了在线教学指导、场景素材同步、作业协同、自 动化工作流、智能辅助语言转换等诸多先进技术,并很好的切合了上面论述的专业外语教 学的几项特征和要求: 1. 采用互联网在线技术实现教学手段的多元化 68

技术探索 互联网技术应用于外语教学,近几年在高校获得了较大的发展,社会上一些语言培训与服 务机构也纷纷推出了在线培训的应用平台,进行在线语言培训的尝试。互联网技术在专业外语 教学的应用不仅局限于共享专业外语教学的教案素材,以及实现在线的讨论和答疑等常规功 能,其宽带速度的大幅提升以及日益完善的视频聊天技术,对实现在线口语陪练式的教学与实 训提供了可行的技术基础;这几年随着语音识别技术的快速发展,已经开始运用于互联网服务 领域,通过互联网进行口语发音的识别校准,在国外已经出现了比较成熟的应用技术和产品。 这些应用技术的快速发展,使得语言教学可以突破集中授课的传统模式,通过互联网实现异地 学习,教师通过平台进行实时或者非实时的在线指导完成语言教学,通过在线读写和翻译练习 的形式教授语法词汇以及训练阅读写作能力,通过视频聊天技术和语音识别技术等实现真人教 练以及自我学习训练外语听说能力,这样可实现外语教学的手段多元化,并且学生实训的时间 安排也比较灵活机动。 2. 采用与业务紧密相关的专业外语教学与实训素材 从前面的分析,专业外语的教学与实训,必须和专业方向紧密结合,否则是达不到良好的 效果的。机械专业的外语教学一定要采用机械专业相关的外语素材,比如具体的机械项目、机 械类的技术资料等等,培训学员的机械专业外语应用能力,同样水利建设行业的专业外语教学 一定要采用水利建设相关的外语素材,这样的针对性的素材与学生未来的就业工作岗位内容接 近或吻合,对其提升业务能力和就业竞争力才是最有价值的。当然,学习素材必须精心挑选, 选择语言知识适宜而且专业知识比较新的素材文档进行编撰、加工和提炼,既有效提高学生的 专业外语能力,更要在专业外语学习的同时兼顾最新专业技术知识的学习和最新行业背景知识 的掌握,做到外语学习和业务学习相结合,这样才能获得最佳的学习效果。 3. 采用计算机模拟真实工作场景的情景化教学模式 专业外语教学要实现最佳效果,模拟学生未来真实工作场景的情景化培训模式是最适宜 69

技术探索 的,但是这种方式很难实现,因为工作场景确实很多,逐一去实际模拟根本就不现实,而利 用计算机来进行模拟才是现实可行的。计算机模拟可以采用模拟项目或者任务执行的方式, 比如利用图片、文字、语言等元素,模拟在一个具体的工作场景中对某个事件或者任务进行 交流的情形,进行有关文字阅读写作、听力训练以及口语问答等教学与实训内容,同时还兼 顾讲解了关于工作岗位场景的一些技术知识以及提供了一些实践经验,学生可以真切体会到 在这个模拟的工作场景下的感受,学习到和这个工作场景相关的语言知识和专业知识,这比 单纯的语言教学要生动和有效得多。工科院校专业外语的情景化教学,需要的就是类似这样 的大量精心编排的工作场景,以达到快速提升专业外语能力的作用。 4. 教师指导与软件系统结合的模式实现外语学习的系统化长期化 语言学习是一项长时间才能见效的过程,需要系统的循序渐进地有节奏地进行。但是长 周期的学习培养,需要更灵活的学习时间管理,更周密的学习进度安排,这靠传统教学的方 式是很难保障的,因此必须采用软件系统进行学习时间管理以及进度控制,以及进行灵活的 教师指导安排以及阶段性考核、调整。在校的专业外语教学,课堂时间绝对是很有限的,课 堂教学之后还需要提供给学生在课余时间中继续温习和巩固、提高学习成果的平台,这个甚 至要比课堂教学本身更为重要。另外,由于学生的学期授课时间安排,专业外语教学本身也 是分学期分阶段进行,教师的资源也可能会发生变化,但通过平台的辅助学习却是可以实现 持续性和针对性的。专业外语的语言教学实训,采用先进的互联网和计算机技术是模式创新 的根本,正所谓科技是第一生产力,以上四点也正是多语工程中心基于先进技术实现的“场 景化的外语教学与学习平台解决方案”的核心特征。而且从前面的分析阐述中可以得出,也 只有采用新技术实现的以互联网在线模拟真实业务场景的情景化培训为基本特征的,软件系 统流程控制方式的实现语言与专业紧密结合的新型专业外语教学与实训模式,才能真正实现 卓有成效的面向实际应用和岗位需求的专业外语学习,才能为社会培养出真正需要的国际化 经营人才。 70

技术探索 在多语工程中心为高校外语教学的解决方案中,依托语联网的强大资源能力提供了海量 的词汇、语料以及多语文档教学素材,并且提供了丰富的工具软件产品,因此在语联网支持 下的“场景化的外语教学与学习平台解决方案”极大地丰富了高校外语教学的形式和内容, 并且开创了全互联网化的情景化教学与自学习、实训实习相结合的全新的模式。 外语教学的创新,应该成为高校教学模式创新的重要内容,从当前具有强烈需求的专业 外语学习着手,不失为一个良好的开始。 71

专利技术及应用 多语言信息检索方法的分析 多语工程研究中心 【摘要】:本文对多语言信息检索和跨语言信息检索的由来和发展进行了简介, 引入了在多语言检索系统中的一些关键问题,对其表示技术策略及翻译技术进行了详细的 介绍。然后通过对两个多语言信息检索专利技术的详细阐述了现在多语信息检索系统的进 展和发展方向。 【关键词】:多语言检索、跨语言检索、机器翻译、语料库 1.多语言信息检索简介 随着信息技术的飞速发展,各语种的信息量都呈现爆炸性增长,但各语种的内容并没 完全同质化,不同语种间的相关信息仍然有着很大的互补性。由此产生了大量的不同语种 之间信息检索需求,这种需求的产生,使得信息检索领域中的产生了一个非常重要的研究 方向——两种语种之间的跨语言信息检索(Cross-Language Information Retrieval, CLIR),并由此进一步产生了多语言信息检索(Multi-Lingual Information Retrieval, MLIR)。这些研究技术应用于搜索,可以帮助我们查找到更多的有用信息,多语中的信息 可以大大丰富搜索的结果,满足用户更多的信息需求。CLIR和MLIR研究涉及了语言学、情 报学、计算机科学等多门学科知识,是一个综合性强、富有挑战性的研究领域。跨语言检 索技术的实现应用了信息检索、文字处理、和机器翻译等技术,如文字切分技术、词汇翻 译、词频技术、索引技术等。 2.表示技术策略 2.1.不翻译 此种技术常见的是同源匹配,同源匹配是根据两种语言的语词拼写形式或读音相似度 来判断其中一种语言语词的意义,往往用于印欧语系中的英语、法语等有共同的起源的语 72

专利技术及应用 种。它们中的很多词有相似的 拼写形式或者读音,将英语词汇、法语词汇、英法双语文件映射到一个向量空间中,可进行 语义上的比较匹配。只通过使用一些词形处理手段,就可实现CLIR 的技术。同源匹配可以单 独使用,但是多数情况下,可与其它方法结合使用。 2.2.翻译检索词汇 此方法将用户的检索词汇翻译成相应多语种信息,然后在不同语种的文献信息集中查 询。此法视处理检索词汇的方式,又区分成两种方法,一种是控制词汇,另一种是自由词 汇。 控制词汇:使用控制词汇进行检索时,由于为系统内定的词汇,所以,虽然使得检索的 过程比较顺利,可是能找到的资料有限。 自由词汇:可分成三种策略,分别是知识库策略、 语料库策略和混合式策略。 翻译检索词汇工作量较小,可以很容易地与传统单语种信息检索技术紧密结合,但是由 于提问式一般较短,语境信息很少,因此消除翻译过程中产生的词的歧义性相对困难。事实 上,目前对翻译歧义性问题的研究也主要是针对翻译检索词汇策略而言的。翻译检索词汇的 优点是能够在线快速执行,对翻译系统的要求不高,是实现跨语言检索最经济的方法,也是 目前最广泛使用的匹配策略。 2.3.目标文本翻译 目标文本翻译将所有的目标文本转换表示为系统支持的语言。此法可分成两种,一种为 文本的翻译,另一种为文本的特征向量的翻译。从目前的发展来看,第一种方法在实际中比 较难以实现,第二种方法是一个值得研究的方向。 这个方法的优点是:可以离线执行;语境宽泛,能较好地排除翻译的歧义性;返回给用 户的检索结果是用源语种表达的,能帮助用户理解检索出的文档以及判断它们的相关性。缺 点是:将集合中全部文档从一种语言翻译到另一种语言的工作量非常巨大,所需的处理时间 较长,速度很慢,特别是网络信息资源,更新率非常高,全部翻译的话成本很高;需要使用 机器翻译系统来实现翻译,而目前大多数机器翻译系统尚不成熟,翻译质量难以令人满意, 73

专利技术及应用 无法达到实用水平。 3.翻译技术 不同语言之间的“翻译”可以说是跨语言信息检索技术的核心问题,也是目前跨语言信 息检索的研究热点与难点。目前有三种公认的主要翻译方法:机器翻译技术、基于词典的方 法、基于平行或比较语料库的方法。一般而言,上述三种方法并不是孤立存在的,在构建实 际系统时常常会综合利用。 3.1.基于机器翻译方法 对于CLIR和MLIR,机器翻译技术是一种显然的选择,实现跨语言检索系统最直接的方法 是将机器翻译系统应用于检索过程中。具体来说有两种方法:一种方法是将用户的查询翻译 为与文档相同的语种;另一种方法是将文档翻译为与查询相同的语种,然后再用单语种的信 息检索系统进行检索。 机器翻译存在如下问题:现有的机器翻译技术通常是基于整句翻译的,而CLIR中的提问 式常常是几个甚至单个词,由于没有语境信息和领域知识,无法消除翻译歧义;机器翻译中 需要从众多的词中选择一个词,所以择词难;当某个词有多个同义或相关翻译时,选择其中 一个在目标语言中进行检索,往往一些相关文档被漏查;文档的数量往往非常巨大,而现有 机器翻译系统的性能还无法处理大规模的数据,因此这种方法效率不高,在实际检索过程中 会找到很多冗余文档,结果不够精确。但在受限的领域机器翻译质量还是较高的,检索系统 能较好地解决翻译中出现的语法错误,但无法解决语义错误,这主要是因为缺乏语词在不同 领域的使用知识。因此将机器翻译应用到CLIR中也应该是领域受限的。 3.2.基于词典方法 这种方法主要是利用双语词典,将用户提交的提问式翻译成目标语种,然后进行检索。 双语词典是跨语言信息检索系统中的基本资源,基于词典的方法是支持翻译检索词汇策略经 74

专利技术及应用 常使用的技术,初期的跨语言信息检索研究多采用这种翻译方法。 基于双语词典也存在一些问题,包括:不能翻译未包含在词典中的专门性词汇;有固 有的歧义性和增加了无关系的信息;不能翻译多词词汇(如短语)。这些缺点在目前的文 献里被认为是降低跨语言信息检索性能的主要原因。翻译歧义和术语词汇缺乏是错误的主 要来源;对包含有多个单词的名词短语进行人工翻译有助于改善检索性能。目前,在跨语 言信息检索领域,已经有几种较为有效地消除翻译歧义的方法正处于研究之中:词性标注 技术;基于平行语料库的方法;目标语料库中的词的共现技术;提问式扩展技术;提问式 构造方法;双向翻译技术。在短语识别与翻译方面,研究人员提出了诸如翻译图、自动机 等方法。短语翻译的基本技术是建立包含习语或复合词作标题字的双语词典或词表。 3.3.基于语料库方法 语料库是将同一信息或同一主题的信息用两种或多种语言进行描述,并由人工或计算 机建立不同语种问信息联系的集合,来源于对单词用法的统计。基于语料库的方法从大规 模的语料人手,从中抽取所需的信息,自动构建与应用有关的翻译技术。根据所使用的语 料库的类型,基于语料库的方法可分为基于平行语料库的方法和基于比较语料库的方法。 平行语料库是指同一信息用不同的语言进行描述。它强调两种语言文献的一一对应, 不容易取得。比较语料库是指同一主题的信息用不同的语言进行描述。获取比较语料库需 要一定的对齐技术,由于现在自动或者半自动对齐技术与应用密切相关,所以该方法仍受 到一定的限制。研究最多的是基于平行语料库的方法,其次是基于比较语料库的方法。对 于MLIR和CLIR来说,平行或比较语料库是使我们能够抽取有益信息的有用资源。跨语言 潜在语义标引方法利用这种语料库构造多维标引空间。我们也能直接从平行或比较语料库 中获得译文。 4.几种多语检索技术 4.1.多语言信息检索一体化检索方法 75

专利技术及应用 多语言信息检索一体化检索方法是哈尔滨工业大学发明的一项专利技术, 其为了解决现有分离模式的多语言信息检索造成的源语言信息流失、带来大量噪声和检索结 果准确性低的问题,提供一种多语言信息一体化检索方法。该方法采用的是翻译检索词汇的 策略,是一种基于概率分析的方法,其主要思想是对检索词汇的目标关键词进行模式划分, 计算每个目标关键词在查询文档中出现的条件概率和在查询文档中目标关键词能够翻译回源 语言检索词汇关键词的条件概率,从而得到检索词汇在查询文档中的出现的条件概率,然后 按这个概率值的大小输出检索结果。其方法简述如下: 通过计算目标关键词t ij 的不同模式在查询文档中的条件概率得到t ij 在查询文档中出现 的条件概率P(t ij |D);(D为查询文档,t ij 表示源语言检索词汇关键词q 的第j 个目标 i 翻译结果) 计算在查询文档D 中目标语言的关键词t ij 能够翻译成源语言检索词汇关键词q 的条件 i 概率P(q | t ij ,D),由于正比关系,这个可以通过计算源语言检索词汇关键词q 和查 i i 询文档D 的特征向量V D 的相似性sim(q ,t ij + V D )得到; i 计算检索词汇在查询文档中的出现的条件概率p(Q | D);(Q 表示源语言查询关键 k k m m m      词集)p(Q | D)= i 1 p(q | D)= i 1 j 1 P(q ,t ij | D)= i 1 j 1 ( P(t i i ij |D)×P(q | t ij ,D))。 i 这项发明技术通过源语言信息将用户查询翻译和对目标语的单语检索有机地结合在一个 统一的过程中,从而大大减少信息流失给检索带来的噪音,提高检索结果的准确率。实验结 果证明,和传统的将用户查询翻译和对目标语的单语检索独立开来处理的分离模式相比,本 方法具有较大的优势,更加适用于跨语言信息检索。 4.2.多语言信息检索 76

专利技术及应用 多语言信息检索是乐图集团有限公司的一项专利技术,这项技术提供一种 通过多重版本的查询文档以及相应的翻译结果自动扩展查询请求并且增加相关文档检索的可 能性的方法。一方面,采用源语言的搜索查询请求被翻译为采用目标语言的多个搜索参训查 询请求。另外,检索到的目标语言文档可以被翻译回源语言,并且拥有多重翻译结果。这样 不仅与搜索查询匹配的相关当能被检索并展现用户,而且与其同义词、翻译选项或相关语相 匹配的文档也能被检索并且展现给用户。 该技术通过用户投票来对信息检索系统中的同义词辞典进行动态更新的,一方面提供了 一种投票界面,允许用户对与相关语境有关系的特定翻译选项进行编辑、存储,并且可以进 行投票以表示支持或反对。通过积累此类投票,形成了一个多语选词数据库,而且随着时间 不断发展,还可依据用户互动进行动态更新。而且选词数据库是对外开放的,任何感兴趣的 人都可以访问。此外,投票人可以输入相关的词语以规定具体领域,作为翻译选项的一部 分。同时这也是一种可自我学习的翻译引擎,能够根据要求翻译文档,并且选词数据库中多 语言且不断升级的知识进行动态的自我更新。根据不断更新的多语言知识库组织并维护多语 言文档库,且根据相关的语境自动生成多重版本的文档。从而一个文档变为多个相似文档, 从而不论在多语言搜索中,还是在单一语言搜索中,都提高检索相关结果的概率。 4.3.分析 以上两种多语言检索技术在一定的领域和一定的语种限定内都或多或少做到了减少歧 义、增加多语转换准确性、提高检索效率的效果,但总的来看并没有完全达到可以实际使用 的能力。 目前的各种多语检索模型还基本是把查询翻译和检索分为两个相对独立的子问题,这样 比较直观同时也是比较容易实现的想法,但经过仔细分析这种分割也带来了一些问题,其中 大量假定和人为因素,包括从翻译模型中得到的查询词的权重、概率等数值在代入检索模型 时其实都隐含了一种假设,即翻译模型的概率分布和检索模型是相同的,或者是可以线性拟 合的,但这一点并没有得到严格的数学上的证明。此外如果跨语言检索的文档涉及多种语 言,把各个语言的结果进行合并时,人们的做法一般都是根据归一化之后的相似度——即 77

专利技术及应用 不同语言的文档的相似度与该语言文档中最大的相似度的比值大小进行全局排 序,这也隐含了一种假设即各个语言计算得到的原始相似度都是直接可比的,而这一点也没 有得到相应的证明。 5.结语 多语言检索是信息检索领域一个新的课题,总的来说多语言检索的性能与单语言检索总 是存在一定差距,有学者在研究一种统一的跨语言信息检索框架把多语言检索问题转化为单 语言检索问题从而更好地解决这一问题。 其基本思想是把检索视为一种特殊的机器翻译,借助统计翻译模型来进行查询翻译,而 检索过程也可以基于统计语言模型来实现,从而把这两个模型集成到一个统一的框架下,对 所有的文档不再以语言为标准进行分割,而是统一到一个大的集合中,同时对每个文档的词 添加一个语言标记,由于查询已经被扩展到各种语言,因此所有语言的相关文档都能被检索 到并依据统一的策略进行排序通过以上方法跨语言检索问题就变为了单语言检索问题。 尽管跨语言检索技术已经取得了长足的进步,但现有方法的性能仍未达到人们预期的目 标,目前最好的跨语言检索系统的性能整体上和单语言检索仍有差距,并且随着语言种类和 资源的不同其性能差异很大,而且还面临效率、用户界面等实用化问题,尽管基于语料库的 方法为克服这些问题提供了较为有效的手段,但仍然面临着许多障碍。随着信息检索和机器 翻译技术的进步跨语言信息检索领域的研究也在与时俱进,对于跨语言检索方法的研究仍然 有很多工作要做。 78

专利技术及应用 海量参考译文库的快速分类 多语工程研究中心 【摘要】:随着信息技术的发展,信息量成爆炸性增长,面对海量信息,大规模的 数据挖掘技术成为现在的非常重要的课题。翻译参考文献库,是一个有海量文档的庞大的翻 译资源库,对其按行业、学科、领域进行分类,可以大幅度提高检索效率并提升精度。本文 提出了一种基于术语语料库的文档的快速分类方法,用以实现海量文档的初步分类。 【关键词】:海量数据、检索、数据挖掘、文本分类 1.文本自动分类技术简介 文本分类是指在给定的文本分类体系下对待定文本,确定其所属类别,是一个将未知样 本分到已知类的过程。早期的文本分类依靠人工进行,需要较高的专业知识而且要花费的巨 大人力,无法满足大规模文档处理的要求。 文本自动分类是指基于人工智能的方法,包括知识工程方法、统计方法、机器学习方法 等,利用计算机自动分析待定文本的特征,与预定义类别中的文本的共同特征进行比较,然 后将其划分到特征最接近的一类或几类预定义类别中的分类过程。文本自动分类能较好地解 决大量文档信息归类的问题,可以应用到很多情况下,包括基于受控词典的文档自动索引、 文档过滤、元数据的自动生成、词义辨别、Web 资源层次分类等,是很多信息管理任务的 基础工作。 1.1.文本分类的过程 79

专利技术及应用 文本分类的过程包括文本表达、设计与训练分类器、分类器的评价等几个过程,其中文 本的表达包括文本预处理、索引和统计、文本特征抽取等步骤。各部分的主要功能为: Ø 预处理:将原始语料格式化为同一格式,便于后续的统一处理; Ø 索引:将文档分解为基本处理单元,同时降低后续处理的开销; Ø 统计:词频统计,项(单词、概念)与分类的相关概率; Ø 特征抽取:从文档中抽取出反映文档主题的特征; Ø 分类器:分类器的设计和训练; Ø 评价:评价分类器的准确率、召回率。 1.2.文本的分类方法 目前文本自动分类中的方法和技术包括统计方法和机器学习方法和基于语义的文本分类 方法,主要包括: 80

专利技术及应用 1.2.1. 朴素贝叶斯方法 朴素贝叶斯分类是一种概率分类的方法,这类方法以贝叶斯定理为基础,利用贝叶斯公 式通过类别的先验概率和词的分布来计算未知文本属于某一类别的概率,是一种性能很好的 线性分类器。朴素贝叶斯分类的基本假设是文本中的词项之间是条件独立的,但这个假设在 实践中很难成立,为克服这个缺陷,在朴素贝叶斯分类的基础上又发展出了链式贝叶斯分类 等其他方法。 1.2.2. KNN 方法 KNN方法又称K近邻方法,是种常用的基于实例的文本分类和聚类的方法,是与LLSF、 决策树、神经网络同级的分类算法。这种算法思想很简单:给定一个待分类的文档,计算它 与训练样本集中每个文本的相似度,系统在训练样本集合中查找最相似的K个文本,即K个 邻居,根据这些邻居所属的类别情况给该文档打分,取最高分作为它所属的类别。对于该方 法,最重要的是参数K的选择,K值过小,不能充分体现待分类文本的特点;而K值过大,会 造成噪声增加而导致分类效果降低。 1.2.3. 决策树方法 决策树分类通过构造决策树来进行分类判断,通过把实例从根节点排列到某个叶子节点 来分类实例,叶子节点即为实例所属的分类,是一种被广泛使用的归纳学习方法,因为其具 有较强的抗噪音能力及学习反义表达的能力,非常适合于文本分类。比较常用的决策树算法 包括CART 算法、ID3 算法及其后继C4.5和C5.0算法、CHAID算法等。 1.2.4. 支持向量机(SVM)方法 SVM是由Vapnik在1995年提出,用于解决二分类模式识别问题。Joachims 最早将 SVM 方法用于文本分类,它将文本分类问题变为一系列二分类问题。其应用原理是基于结 构风险最小化原则,在向量空间找到一个“决策面”(OSH),使得能“最优”地分割两 81

专利技术及应用 个分类集合中的点。其中所谓最优就是不但使得两个数据集合完全分割出来, 还能使两个集合间的空隙尽可能大。支持向量机集成了降维和分类,相对于传统的方法,具 有更高的计算效率和准确率,非常适合大样本集的分类。 1.2.5. 神经网络分类方法 神经网络技术是人工智能中的成熟技术,广泛应用于人工智能领域。Wiener和Ng分别 将该技术用于文本分类领域。神经网络由一组神经元组成,其输入单元通常代表词项,输出 单元表示类别或类别兴趣度,神经元的连接权重表示条件依赖关系。对于文本分类,文档向 量权重通常作为输入。其训练通常用BP算法来进行,时间开销一般很大。最简单的文本分类 神经网络为感知器。 1.2.6. 基于投票的分类方法 投票分类方法是将多种分类方法联合成一种分类器的技术,其核心思想是:多个专家判 断的有效组合应该优于某个专家个人的判断。这个过程称为投票Voting ,通过将一组分类器 结合起来,以表决的形式进行模式分类。投票算法主要有两种算法:bagging 算法和 boosting 算法。 在具体的分类实践中,这些方法各有优缺点,其中KNN方法,实现最简单、代价也小, 但是效率较高;SVM 也是一种性能优秀的算法。但这些方法的有效性都只是对一部分训练文 本而言,并不能适用于所有文本分类的情况。 2.一种海量文档快速分类方法 2.1. 方法简介 对于一个有着海量数据的文档库,要将其按一定的行业、学科、领域进行分类,不管是 通过哪种文本分类方法都需要进行非常巨大的文本相似性匹配计算,耗费的时间和空间都是 系统很难承受的。而通过大型术语语料库对参考库中文档进行术语数量的计算,可以对文档 82

专利技术及应用 进行行业、学科、领域等属性的初步划分,其所花费的字符串模式匹配计算量大大少 于进行文本相似性匹配计算的计算量。 通常要将文档库中的文档按行业、学科、领域的术语数量进行分类的方法,是用术语为 关键词在文档中进行字符串匹配,得到每个文档的各行业、学科、领域的术语数量。由于文 档库中的文档是一种未排序的散乱文本空间,用这种方式进行分类,需要用千万乃至亿计的 术语为关键词在海量的文档中进行字符串的模式匹配,这种匹配方式不仅耗费的时间非常巨 大,而且整个匹配过程要对参考库中的不同文档的相同词语要反复进行字符串匹配,匹配计 算过程非常重复。 本方法采取一种反向匹配的思路进行对参考库的文档进行术语检索,即以参考库中的所 有词语作为关键词,在术语语料库中进行匹配,由于术语语料库是个具备字符顺序索引结构 的集合,在其中进行字符串匹配最多只需要1+log2n次匹配计算(n为术语语料库的术语 数),即使在亿级的术语语料库中进行匹配,一个词语在术语语料库中的匹配次数也不超过 30次。其效果要具体的匹配及文本分类过程描述如下: 1) 对参考库的所有文档进行文档编号,记为 docID。 2) 对参考库中的所有文档进行分词处理,去除其中的停用词,得到参考库 的所有词语集合,对每个词语进行编号,记为 wordID。 3) 计算每个词语在不同文档中出现的次数,即词频 tf。 4) 计算每个词语在每个文档中出现的位置信息,即该词语是文档中的第几 个词语。 5) 这样对于每个词语就得到了一个如下表所示的词语表结构: 83

专利技术及应用 词语及编号 文档编号 词频 词语位置 wordID docID(i) tf1 pos1、pos2、… (共 n1 个词语位置 记录) docID(j) tf2 pos(1)、pos(2)、 …(共 n2 个词语位 置记录) … … … 6) 按参考库词语信息表的顺序,以词语为模式串,在术语语料库中进行模 式匹配,因为术语语料库已按字符顺序索引,可以用简单的二分法进行匹配,所需的 匹配次数不大于 1+log2n(n 为术语语料库中的术语数)。 7) 顺序匹配完参考库词语信息表中的所有的词语。 8) 计算每个文档的各行业、学科、领域的术语数,根据文档的各行业、学 科领域的术语数量,将该文档归入某个行业、学科、领域。 2.2. 典型应用 翻译参考文献库,是一个有海量文档的辅助翻译资源库,需要对其按一定的行业、学 科、领域进行初步分类,以便于进行进一步的数据挖掘处理。通常方法是用相似性检索的方 法来进行分类,虽然这种方法分类精度相对比较高,但是需要进行非常巨大的文本相似性匹 配计算,耗费的时间和空间都是系统很难承受的。而通过海量文档快速分类的方法对翻译参 考文献库进行行业、学科、领域等属性的初步划分,可以做到对文档类别的一个基本划分, 而且利用所述的反向匹配的方法进行术语匹配可以极大的减少所需的模式匹配的计算量,满 足了实际使用的需要。 84

专利技术及应用 一种译员专业翻译能力的量化方法 多语工程研究中心 【摘要】:翻译能力的评估是促进翻译产业标准化、规模化发展的重要因素。当 今翻译能力评估中,大多是通过更高一级的译者对译文的质量进行评测,主观性强,缺乏一 致性。因此建立一个信度和效度都达到标准的翻译能力测试方法是个非常有益的工作。本文 提出一个新的方法,将译员的语种、行业、学科、领域等基因属性项目进行量化分析,通过 相似性匹配技术、大规模术语语料库技术、结合翻译能力计算模型对译员的专业翻译能力进 行自动评分,得到译员专业翻译能力的一个量化标准。 【关键词】:翻译能力、翻译测试、相似性检索、术语语料库 1. 前言 翻译作为一个拥有巨大商机的新兴产业是各国经济、文化、科技融合的催化剂,同时翻 译行业作为文化和科技融合创新的典型行业,是一个前景非常值得期待的蓬勃发展的朝阳产 业。目前,我国整个翻译产业尚处在初级阶段,问题主要表现在翻译质量无法保证,没有细 化的专业分工,市场竞争不规范等方面。翻译产业要更快更好地为社会服务,帮助各行各业 的用户提高核心竞争力,翻译产业的信息化和标准化是急需解决的问题。翻译行业必须融入 到信息技术的潮流中,利用信息技术和高科技来革新翻译手段,改变传统的翻译模式;从标 准化生产的角度提升翻译行业的工作效率,促进翻译业的变革,翻译服务行业的标准化,能 促进各翻译服务企业相互理解、相互交流、提高信息传递效率,能全面地节约人力和物力, 降低成本,提高服务质量,从而更好的保护顾客和社会公共利益。为此,建立和形成一个高 质量的信息化、标准化的翻译体系是改善翻译产业发展模式和实现翻译产业的规模化发展的 关键因素。 2. 翻译能力测试的现状和发展情况 85

专利技术及应用 翻译能力是集语言能力(表达能力和创造能力)、跨文化交际能力、推理能 力、转换能力及决策能力等若干单项能力为一体的综合能力。翻译能力的评估一直都是翻译理 论的薄弱环节,翻译能力的评估不仅是对翻译理论的检验,也是促进翻译产业发展的重要因 素。在当今翻译能力评估中,大多只对通过更高一级的译者对译文的质量进行评测,主观性强 缺乏一致性。 随着科技的发展,特别是翻译产业与计算技术及IT技术的结合,现代翻译的技术和运作方 式也不断发展,翻译技术形成了一门分类齐全的分支学科,翻译理论和研究方法都不断深入, 各种提高翻译质量和效率的翻译新技术,象计算机辅助翻译技术、协同翻译技术、云翻译等各 种翻译技术大量涌现和应用。现代翻译技术管理包括多个方面,包括:翻译资源的管理、翻译 内容管理、翻译规划、流程管理、辅助工具、客户和团队的管理等方面。其中在翻译资源的管 理中,对译员的翻译能力的评估就是一项尤为重要的工作。在翻译评估中,应该尽可能的保证 测试方法的信度和效度。 相对于文学翻译,专业技术翻译特别是大量特定行业的专业应用文翻译,由于其翻译文章 的文体类型和用途,其翻译要求相对规范、严谨、有一定规律可循,要求的是内容准确、结构 严密、概念清楚,有着高度专业化的特点。而影响专业技术翻译翻译的一个重要的因素是大量 的专业词汇翻译,在不同的行业、学科、领域,普通的通用词汇可能表达的是完全不同的含 义,比如“power”普通的翻译为“力量、权势”,在工程领域则是“电力、功率”的含义、 在数学上则是“幂”的含义,这些含义在不同的专业领域具有单一、无歧义的特点,可以要求 做到到完全准确的翻译;同时专业技术类文章在语篇结构和句法特征方面相对文学类翻译文章 也相对简洁、严谨、可拆分性强。根据专业技术翻译的这种特点,对于译员的专业翻译能力如 何进行有效的量化,本文提出一个新的方法,即将译员的语种、行业、学科、领域等基因属性 项目进行量化分析,通过相似性匹配技术、大规模术语语料库技术结合翻译能力计算模型对译 员的专业翻译能力进行自动评分,得到译员专业翻译能力的一个量化标准。这个量化的方案使 得译员的翻译能力与翻译文档的要求之间容易进行对应,便于对译员的任务分配,以及计算译 员群体的翻译产能。从而确保翻译质量,缩短翻译项目周期和降低成本。实现翻译资源管理过 程的自动化、标准化。 86

专利技术及应用 3. 涉及技术领域 本方法主要涉及技术为相似性检索技术、大规模术语语料库技术、题库分配技术、基因 属性匹配技术等。 相似性检索是指对于给定样本文献,在文献数据集合中查找出与之内容相似的文献的技 术。应用相似性检索技术可以达到很好的网络内容自动排重、相关文章推荐效果。系统支持 用户根据个性化需求设定相似度阈值和检索结果集大小,达到预期的相似检索、内容排重目 标。该技术可应用于文档检索、稿件查重、版权保护、文档自动分类、聚类等诸多领域。 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或 口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规 模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分 析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少 的基础资源。 4. 译员专业翻译能力量化方法简介 译员专业翻译能力量化的方法由测试文档库、术语语料库、登录模块、翻译能力测试模 块、翻译能力计算模块等构成。 测试文档库:是一个由各个语种、行业、学科、领域的翻译测试文档及其标准译文组成 的用于翻译能力测试的标准文档库。每篇测试文档都设定了相应的翻译难度系数和翻译速度 档位,用于计算译员的翻译能力。其包括语种库、行业文档库、学科领域文档库。 译员登录模块:完成译员的身份认证、测试许可认证及登录等功能。该模块用于测试者 的身份认证,可以防止用户对标准测试文档库的恶意读取,保持标准测试文档库的标准性和 一致性。 翻译能力测试模块:该模块用于生成相应语种、行业、学科和领域的测试文章,提交给 译员进行翻译测试。该模块通过调用文档相似性比较模块对翻译译文和标准译文进行相似性 87

专利技术及应用 比较,得到相应文档的相似度值。 术语语料库:是一个包括各个语种、行业、学科和领域的专业大型术语语料库。用来辅 助计算标准测试文档的不同行业、学科、领域术语数,从而得到计算文档的权重的基值。 翻译能力计算模块:将各篇语种、行业、学科、领域的标准测试文档按其难度系数、速 度档位、和权重基值,根据一定的计算模型计算出其权重,再结合各篇文档的相似度值计算 出该译员在该专业的翻译能力分值。 系统整体结构图如下: 系统结构图 文本相似性比 较模块 登录模块 标准测试文档 翻译能力测试模块 库 术语语料库 翻译能力计算模块 5. 在译稿申领系统中的应用 对于一个基于互联网的的协同翻译平台,待译译稿如何合理分配给译员一直是个难以解 决问题。通过对译稿进行语种、行业、学科、领域等属性信息的确认,并对译员在语种、行 业、学科、领域进行翻译能力测试,可以得到待译译稿和申领译员的翻译能力匹配程度,从 而对于选择最合适的译员翻译译稿提供了最重要的决策因子。 具体流程如下: 88

专利技术及应用 Ø 译员登录平台申请领取待译文稿,系统读取待译文稿的语种、行业、学 科、领域等属性信息,若译员具备该属性能力,则进入译员能力比较/选择模块,否 则分配测试许可号给该译员进行该专业属性能力的翻译测试; Ø 系统根据测试许可号,从标准测试文档库中提取数篇相关测试文档给待 测译员,包括语种类文档,行业类文档,学科领域类文档; Ø 译文的权重计算:根据术语语料库计算各篇行业类和学科领域类文档的 相关专业术语的数量,作为计算权重的基值,结合这些文档的难度系数和翻译速度 然后进行归一化处理得到文档的权重集合; Ø 调用相似性比较模块得到译文和标准译文的相似度值; Ø 结合权重和相似度值得到译员在该语种、行业、学科、领域属性的翻译 能力分值。 Ø 进入译员能力比较/选择模块,选择分值最大的译员作为该待译文稿的 翻译译员,分值次大的两位译员作为备用翻译译员。 6. 结语 完整的语篇翻译是翻译测试中最常用的测试方法,主要用于测试译者的跨文化交际能力 以及双语转换能力,这是最能测验译者翻译水平的一种测验方式,具有很高的效度,但最大 的缺点在于评分标准难以控制,对同一个翻译,不同阅卷人,或者同一阅卷人在不同时候, 给出的成绩都可能会有很大的出入。另外,篇章翻译对于阅卷人来说工作量较为巨大,因此 在实际操作中,尽管有详尽的评分标准,评分人往往根据自己的翻译经验或者对译作的印象 打分,这就造成了此种测试方法的信度下降。 翻译能力测试的目的是对译员的翻译能力进行科学的、客观的、公正的鉴定。由于翻译 89

专利技术及应用 本身的主观性特点,普通翻译测试从测试开发、设计、使用到评估,整个流程 主观性都比较强。 待译文稿 能力判定 否 翻译能力测试系统 登录模块 文本相似性比 翻译能力测试模块 标准测试文档库 较模块 是 翻译能力计算模块 术语语料库 译员能力比较 /选择模块 本文所述的通过计算机人工智能技术结合能力属性匹配的方法对译员的翻译能力进行有 效的量化,可以提高翻译测试的信度并大为减轻翻译能力测试过程中的巨大工作量,对翻译 产业的生产过程有着重要的实际意义。 90

解决方案及产品推介 中大型翻译业务管理解决方案(一) 多语工程研究中心 1. 引言:翻译产业概述 翻译自古而有之,自从有了语言的存在,翻译这种职业就产生了。但真正具有较大规 模、以翻译作为核心业务的翻译组织在现代才逐渐产生。归根结底,中大规模的翻译组织正 是应全球经济一体化的时代要求而生,并将进一步专业化、标准化、规模化,在国际交流中 扮演举足轻重的作用,助推经济、文化的交流与融合。随着国际国内市场交流与融合步伐的 加快,中国翻译市场正以前所未有的速度迅猛发展,中国翻译产业在改革开放以及全球化的 背景下迎来了新机遇。多语信息处理产业化发展是推动中国商务国际化、帮助中小企业“走 出去、引进来”的重要前提,产业化发展需要的是标准化和规模化,因此,只有建立一条通 过IT技术驱动的多语信息处理产业生态链机制,才能够最大限度将传统的人力密集型产业转 化为智力密集型的产业,同时配套翻译培训,多语信息处理技术研究,多语信息语料库,多 语信息处理中心等基础服务,形成一整套完整的产业生态链系统,建立产业链驱动的新型发 展模式。 在影响服务外包产业发展的核心要素中:语言能力、市场接包能力、交付能力、文化沟 通能力、缩短信任周期等,都涉及到语言问题,因此提升服务外包产业的发展水平的关键因 素是语言处理能力。发展多语信息处理产业已经成为中国乃至国际服务外包产业取得大发展 的先决条件。 本文将就大中型翻译组织的业务特点进行分析,探讨其业务管理的解决方案。 91

解决方案及产品推介 2. 中大型翻译业务管理的特点及面临的问题 一个小型的翻译组织,一般来说只会涉及单一的语种,单一的行业领域,甚至服务的客 户都是屈指可数。在这种情况下,这个翻译组织无需考虑太多如何管理,只需要做好所覆盖 领域的稿件翻译即可。当翻译组织的规模扩大以后,问题就没有那么简单了。此时,要翻译 的语种多了起来。英、法、德、俄、日、韩、西、葡……常见的语种,不常见的语种,甚至 少数民族语言也可能涉及。客户数量也成百上千,客户所处行业各种各样,有的涉及金融财 经,有的涉及汽车机械,有IT通讯,有能源化工,有交通运输,有电子商务,有法律法规, 还有影视文艺……同样稿件格式也是十分丰富,有word、excel、ppt、html、CAD、XML 等等等等。而且,不同项目的交付周期也是变换不定,缓急不同。有的项目数小时就要提 交,有的项目要做上一年半载…… 在实际的大型翻译业务中,以上这些因素实属所遇到问题的冰山一角。这些因素还会相 互影响,千变万化出不同的组合。面对这么多的项目变化因素,导致处理流程多种多样,所 需要的工具、辅助系统多种多样,不同处理过程既相似但又有其不同。如此复杂的状况我们 如何应对? 再复杂的系统,我们也能努力发掘其规律。中国规模最大的翻译组织传神公司,在千变 万化的复杂业务环境中摸爬滚打,通过抽象及关注点分离等方法,终于逐步总结出了很多复 杂翻译业务处理中的规律,形成了一整套以IT技术为核心的翻译业务管理解决方案。 3. 解决方案综述 正如上一章所述,中大型翻译组织面临的业务环境复杂多变,如想在如此多变的环境中游 刃有余,必须依赖于以IT技术为核心的底层支撑系统,融入恰当的管理思想及管理制度,才 能做到拨开云雾见月明。本文将以IT支撑系统作为脉络主干,进一步剖析整个解决方案的组 成及应用模式。 图:中大型翻译业务管理解决方案组成概要 92

解决方案及产品推介 如上图所示,传神中大型翻译业务管理解决方案由四大部分组成。这四大部分是:多语 工作流程和管理,协同辅助翻译及效率提升工具,术语语料管理及知识库应用,资源管理及 语言技能培训体系。这四大部分分别从业务运营及生产流程的角度,工具工艺等操作层面效 率提升的角度,术语、语料、文档等多语资产积累及复用的角度,以及专业翻译从业人员的 选、育、用、留的角度阐述如何应对繁复的业务环境。这四大部分既相互独立又相互协作, 相互配合,形成了对复杂翻译业务环境的完整支撑。 4. 多语工作流程和管理 4.1 系统概述 多语工作流程和管理最关注的问题是当翻译业务逐渐增多到一定规模时,需要提供有效 的翻译管理系统来规范整个翻译过程。首先需要对翻译任务进行有效的分解派发,同时需要 有效的监控体系,保证翻译进度和翻译质量。在整个任务派发及监控的过程中,还需要有高 效的译员管理及译员考核模式,对译员的质量及工作进行评价考核。 4.2 系统组成 多语工作流程和管理平台包括订单管理、客户管理、项目管理、任务管理、资源管理 (包括译、审、校、排版人员)、财务管理等功能。它创新实现了客户对翻译流程的监控管 93

解决方案及产品推介 理,实现翻译过程的优化和自动化,从而达到降低成本、提高效率的目的。该平台解决了传 统项目进度管理、任务管理、文件管理、项目信息管理、项目统计等中存在的诸多问题。此 外,此平台还包含一套全方位的译员评价和遴选体系,确保为客户筛选出最符合需求的优秀 译员。 4.2.1.客户管理模块 对于客户(即翻译需求方)基本信息的管理,如:对客户的账户、姓名、联系方式、 所属部门等基本信息的有效记录,并可对密码、更新信息等进行编辑与修改。 对于客户(即翻译需求方)订单信息的管理,如:订单编号、订单名称、发送者、下 单及提交时间等,便于对历史订单的搜索与查询。 4.2.2.译员管理模块 对于译员或翻译团队基本信息的管理,如:对译员或翻译团队的账户、姓名、联系方 式、擅长语种、擅长领域、资质等基本信息的详细记录。 管理者可根据译员或翻译团队的历史翻译情况,如翻译水平、翻译速度、合作度等进 行有效测评与记录。 4.2.3.资源管理模块 除译员管理外,企业还可对与翻译业务非直接相关的职能角色,如排版等进行管理, 其功能与译员管理模块类似,既可对职能角色的基本信息进行管理,也可对其相关的合作信 息进行评估记录。 4.2.4.系统管理模块 对于其他管理模块的信息总览,如:用户管理(提供用户角色对照);并增加了一些 其他信息的管理,如:对于部门、行业等信息的管理,包含信息的添加、删除与修改,其功 能与上述其他管理模块类似。 可通过订单编号或流水号等直接删除订单,简化项目流程。 94

解决方案及产品推介 可直接查看历史稿件的列表清单,有效全面了解项目情况。 4.2.5.项目管理模块 项目管理者对于整个项目的管理是一个完整的过程,并且需要经过很多步骤,如项目 管理者需随时查看项目详情,以及对稿件的有序派发和后期的项目总结等。 项目管理者可对项目信息进行修改。 项目管理者可通过系统自定义的规则对项目进行实时监控与跟踪,有效进行风险控 制。 系统自动生成订单列表,项目管理者可进行实时查看,并且不同状态的订单将出现在 不同的模块中,如刚派发的项目将出现在“待处理项目”中,延时的项目将出现在“异常项 目”中等,项目管理者亦可通过“全部项目”了解所有项目的整体情况。 4.2.6.任务管理模块 一个项目可能包含多个任务,项目管理者可选择不同任务及译员进行任务派发。 系统自动将任务生成列表清单,如任务名称、字数、时间、状态等,以备管理者查 看。 一旦有中断情况产生,可转派其他译员跟进项目。 4.2.7.即时通讯模块 每个环节的流转,在下一个环节不同角色都可以收到消息或邮件,如需要短信,可选 择短信通知。 项目人员可点击消息,通过IM技术实现对点对点的消息通信。 系统自带收发信箱,便于译员与管理者对于项目进行有效沟通。 95

解决方案及产品推介 高校外语教学辅助系统解决方案 多语工程研究中心 1. 方案背景 传神公司提供的翻译辅助教学和外语实训平台为高校建设一流的翻译实验室提供了强 有力的软件支撑。此举是贯彻《教育规划纲要》,加强实践教学和更新教学硬件建设采取 的一项重要举措。实验室项目的实施对培养学生实战能力,培养复合应用型人才具有重大 意义。 传神高校事业部成立于2009年6月。部门成立以来始终致力于为各大高校提供翻译实 验室解决方案。大力拓展校企之间的产学研互动、为高校提供外语类人才培养和职业发展 的规划。希望通过与高校之间强强联手,通过立体化的合作模式,为社会培养更多的实用 型翻译人才,为高校学生替身职业化能力,加强毕业生的就业竞争力。校企共建翻译实验 室为学校探索实践教学改革和实验室建设提供了新的思路。 2. 产品介绍 “传神翻译教学实训平台”的宗旨是辅助教师开展翻译教学和实践活动,强化学生的 双语应用能力、熟悉商业项目的运作和处理流程、锻炼基本岗位能力、补充网络化CAT工 具的操作技能、锻炼团队合作能力,全面提高学生从事翻译或相关工作的竞争力;帮助各 大院校和教师培养适应社会需求的准职员,提高学校就业率。适用于MTI、翻译本科、语 言类本科生和研究生的教学和实训活动。 96

解决方案及产品推介 3. 产品特点 3.1. 自主学习 实训平台是符合任务驱动教学模式的教学实践平台,她以情景模拟和角色扮演为具体实 施方式;系统的内置流程和引导系统负责驱动任务;系统的反馈机制将对实训效果进行记录 并及时反馈。 3.2. 角色扮演 师生通过角色扮演完成岗位工作,能够更加深刻地体会商业项目的处理流程和分工。实 训任务能够最大化地激发学生的求知欲望和兴趣,逐步培养学生独立探索、勇于进取的自学 能力。实训过程中,教师将逐渐从知识灌输者转变为学习引导者。 3.3. 数据分析 平台的跟踪机制将自动记录教学和实训的全部过程,包括实训轨迹和各类量化指标。师 生可从不同角度分析实训轨迹的各类指标,全面掌握实训效果以制订更具针对性的实训计 划。自主学习过程中,系统将根据学生的个体特点,推荐实训任务,让学生在自主学习的过 程中获得更加具有针对性、更加有效的锻炼。 3.4. 资源循环 实训平台能够对实训过程中产生的三类教学资源(任务素材、指导信息、实训语料)进 行循环积累和复用,充分挖掘教学资源的价值,简化教学工作,将老师简单的重复劳动中解 放出来,将更多时间投入到创造性工作中。 97

解决方案及产品推介 3.5.校企合作 诞生于企业、应用于校园的实训平台可以无缝连接传神联合信息技术有限公司的商业 项目平台,师生将有机会直接参与真实商业项目并获得行业专家的悉心指导。另外,校企 可联合开展各类课题研究、语料库建设、联合实验室建设等活动。 4. 功能介绍 4.1.教学平台 传神翻译教学平台是辅助教师开展翻译教学,强化学生的双语应用能力、熟悉商业项 目的运作和处理流程、锻炼基本岗位能力、补充网络化CAT工具的操作技能、锻炼团队合 作能力,全面提高学生从事翻译或相关工作的竞争力;帮助各大院校和教师培养适应社会 需求的准职员,提高学校就业率。 课程课时—平台能很方便的进行课程与课时管理,能将某门课程的教学精华与学生提 问自动的集中到讨论区中,老师可以一次性的解决学生所有提问。平台的特色复用课程, 老师可以将老的课程中课时、课件、作业复用到新的课程中。而且可以选择不同届、不同 班级的学生。 课堂教学—完整的课堂教学应用模式。可以将有教学价值的学生翻译公布给全班学 生。能控制学生端的参考译文显示。能很方便的记录这句话的指导。 4.1.1.作业批改 作业批改—平台提供了完整的作业批改流程,包括老师布置作业,作业分发与翻译、 作业校改以及多种的批改方式。 98

解决方案及产品推介 批量批改:快速改完全班学生的作业。 单句批改:对某学生进行通篇批改和单句批改。并可以对译句进行添加评语和记录错 误。 学生批改:将作业派发给另一个学生进行批改,学生在批改的同时自己的翻译能力也 会提高。 4.1.2.成绩统计 成绩统计—平台可对学生的成绩进行统计与分析。 成绩统计图:包括每次作业的最高分、最低分、平均分、中位数等,更多的了解教 学情况;学生成绩走势图:对查看学生历史成绩的走势图,了解每次成绩与平均分的差 别。 作业成绩分布图:对每次作业成绩的饼状分布图,让老师了解该次作业的学生成绩 分布情况。 错误统计—平台支持教师针对错误库进行统计,掌握学生常见错误及优秀翻译情 况,更好的进行教学的把握;而且能很方便的查看每门课程的错误分布图。 4.2.实训平台 为了提高学生的竞争力,让即将从事翻译工作或相关工作的学生快速掌握实战技能, 积累项目经验,需要在学习阶段就采用实训或实习的方式来提高学生的竞争力,努力打造 实践型人才。传神联合信息技术有限公司在“多语工作平台”的基础上,以翻译团队和实 际翻译项目为参考、设计并实现符合“任务驱动模式”,以情景模拟和角色扮演为特点的 “翻译实训平台”。 翻译实训平台以实际翻译项目处理流程和翻译团队成员为参考,针对 翻译教学和实践活动的特点围绕团队的核心成员,设计了简化的实训流程。 99

解决方案及产品推介 通过简化前期的商务环节和后期的辅助环节,翻译实训平台将实训重点定位于翻译活动 的生产及管理环节上。翻译活动中的非核心流程和成员则由系统通过情景模拟和虚拟角色完 成,既保证了实训的针对性又保留了翻译场景的完整性。 4.2.1.团队实训 多人参与的实训方式,提供三类核心翻译成员(项目经理、译员、审校)供师生开展实 训。教师可根据教学目标组织教学和实训活动,例如翻译教学、翻译课题组织实施、师生或 生生的翻译实训活动。学生可组织模拟团队,在平台上开展实训。 4.2.2.个人实训 单人参与的实训方式,专门适用于译员岗位的实训。个人实训提供全程的情景与角色模 拟。除译员角色外,团队中的其他成员由系统虚拟成员完成。个人实训同时开辟了具备帮助 引导功能的“基础练习室”专区。基础练习室采用主动弹出引导的方式,带领学生熟悉项目 的核心流程和 CAT 工具的核心操作。引导系统犹如一位耐心的教师,将手把手地引导学生 走进现代翻译世界,掌握最基本的翻译技能。个人实训适合学生在课前和课后进行个人技能 的训练。 100