
5月8日,必威betway西汉姆“谁语争锋”品牌学术活动暨“文枢探骊・外国语言文学研究前沿”系列讲座顺利举行。本次讲座特邀上海外国语大学语言科学研究院雷蕾教授作题为《现代汉语和古代汉语文本词汇复杂度:测量工具与研究案例》的学术讲座。讲座由必威betway西汉姆姜占好教授主持,线上线下同步进行。
讲座伊始,雷蕾教授从文本复杂度研究的发展脉络切入,指出自20世纪50年代以来,文本复杂度评估在教材编写、语言水平测试、阅读材料分级和语言教学研究等领域具有重要应用价值。语言复杂度不仅有助于揭示文本语言特征的数量、多样性和成熟度,也为语言习得、语言测试、语言教学和语言技术应用提供了可量化的研究路径。
雷蕾教授指出,当前词汇复杂度研究已在英语领域形成较为成熟的指标体系和自动化测量工具,能够系统分析词汇密度、词汇成熟度和词汇多样度等维度,并广泛应用于二语写作、教材评估和语言演变研究。相比之下,汉语尤其是古代汉语文本的词汇复杂度研究仍相对薄弱,相关指标体系和自动化测量工具尚不完善,一定程度上限制了汉语文本难度评估、古代汉语教学资源建设以及大规模历时语言研究的开展。
围绕这一研究空白,雷蕾教授重点介绍了其团队自主研发的汉语词汇复杂度分析工具AlphaLex系列。该系列工具面向现代汉语和古代汉语文本,尝试从词汇密度、词汇成熟度和词汇多样度等维度构建系统化指标体系。其中,针对古代汉语文本开发的AlphaLexClassicalChinese(ALCC)包括三大维度共51项词汇复杂度指标,并结合古代汉语文本特征对底层文本处理、词汇成熟度指标和词汇多样度参数进行了优化重构。相关研究显示,ALCC可用于古代汉语文本难度预测,并在部编版语文课本文言文难度分级实验中取得了较好的整体预测效果,为古代汉语文本难度量化评估提供了新的方法支持。
本次讲座具有重要的学术启发意义。一方面,讲座拓展了师生对“语言复杂度”研究的认识,使大家进一步理解了词汇复杂度指标在文本分析、语言习得和教育测评中的方法论价值。另一方面,AlphaLex系列工具的研发体现了语料库语言学、自然语言处理与语言教育研究的深度融合,为古代和现代汉语文本的自动化、规模化和精细化研究提供了新的技术路径。讲座也启发师生思考如何将量化语言分析工具应用于外语教学、二语写作评价、教材评估和数字人文研究之中。

讲座最后,雷蕾教授与现场师生就汉语复杂度指标构建、汉语自动分词与词性标注、文本难度预测模型、语言复杂度工具在外语教学中的应用等问题进行了深入交流。与会师生表示,本次讲座内容前沿、案例丰富、方法清晰,不仅加深了大家对词汇复杂度研究的理解,也为今后开展跨学科语言研究提供了有益借鉴。
(文/黄知韵 图/杨娜 编辑/王卓文、张婷婷)

