翻译教学语料库规模化建设的大数据解决方案
DOI:
作者:
作者单位:

上海外国语大学

作者简介:

通讯作者:

中图分类号:

基金项目:


The Scalability Challenge in Translation Corpus Building and a Big-data Solution from an Interdisciplinary Perspective
Author:
Affiliation:

Shanghai International Studies University

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    翻译教学中基于平行文本的双语平行语料库建设,本质上是译者根据自身需求进行方案设计、语料收集和语料管理的过程。目前,受限于现有翻译技术手段和经济条件,翻译教学中难以规模化建设此类语料库。本文以大数据自动化采集的方式,引入人工智能领域的Python技术与PostgreSQL数据库系统,以此来解决目前建立大规模教学语料库的难题。为了完整呈现规模化建库过程,本文通过政府公文类翻译的真实案例,详细描述了建库方案设计、语料收集和语料管理的操作步骤,分析了各步骤中存在的自动化难题,以及新技术介入的契机。部分技术细节与源代码也在文中公开,希望给大规模建设教学语料库的工作提供一个切实可行的解决方案。

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

1

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-06-14
  • 最后修改日期:2023-06-14
  • 录用日期:2023-11-08
  • 在线发布日期:
  • 出版日期: