主管单位:黑龙江省委宣传部
主办单位:黑龙江文化产业投资控股集团公司
对高维词向量降维,并处理整体偏移,计算出每个词对应中英文词向量的距离,根据距离进行聚类。
--
作者:admin   更新时间:2022-11-22 

 本研究以人工智能手段量化选取文本中对应中英、中俄词语的概念迁移程度,即用AI模拟母语为中文的学习者在学习英语和俄语时感受到的语言概念差异。选取的文本可以理解为就是AI模拟的学习者的“课本”。“课本”的质量对学生的“学习效果”——文本的质量迁移数据的可参考性有着直接且重要的影响。

通过对符合所需要求的文本对比,实验采用了文学类和公文类两种体裁的文本作为语料。文学类文本采用弗拉基米尔·纳博科夫(Набоков В.В.)的小说《洛丽塔》。这是因为这部作品的英、俄版本均出自作者一人之手,是翻译界公认最忠实于原文的翻译范例的经典之作。除了作者在作品中体现出的极高文学造诣和对两种语言的极高掌控力,两部作品的情感内核和文化认知在同一位作者的笔下能做到最大程度的契合。公文类文本采用了联合国9181994号决议(以下简称联合国决议)中、英、俄语平衡语料。这是因为公文类语体,特别是联合国的官方公文用词严谨,所表文意准确无歧义,语种变化引起的语义变化很小,所以概念迁移的距离应该较小且明显偏向正迁移。采用两种体裁两部文本,不仅可以丰富数据量,并且可以互为对照,减少由于体裁不同导致的实验偏差。