词汇丰富性测量方法及计算机程序开发:回顾与展望
计算机软件的开发和测试方法

计算机软件的开发和测试方法随着计算机技术的快速发展,各行各业对计算机软件的需求也日益增长。
而为了保证计算机软件的质量和稳定性,开发和测试方法显得尤为重要。
本文将介绍计算机软件开发和测试的一些常用方法和技术。
一、需求分析和规划在计算机软件开发过程中,需求分析和规划是至关重要的一步。
通过与客户沟通,明确软件的功能需求和用户需求,制定详细的需求规格说明书。
同时,需要确定项目的开发目标和计划,明确开发和测试的时间节点和任务分配,确保开发过程的有序进行。
二、敏捷开发方法敏捷开发方法在软件开发过程中被广泛采用,它强调迭代和适应性,能够更快地响应需求变化。
敏捷开发将整个开发过程分为短期的迭代周期,并在每个周期内进行需求分析、设计、编码、测试等工作。
通过不断的迭代和反馈,使开发团队能够更好地理解用户需求,及时调整开发方向。
三、结构化设计方法在软件的开发过程中,结构化设计方法是一种重要的工具。
结构化设计方法将系统分解为多个模块,每个模块完成特定的功能,并通过合理的接口进行协调和沟通。
结构化设计方法可以帮助开发人员更好地组织代码,提高软件的可维护性和可扩展性。
四、面向对象开发方法面向对象开发方法是一种将现实世界的概念与软件设计相结合的方法。
通过封装、继承和多态等特性,面向对象开发方法可以更好地模拟实际场景,提高软件的灵活性和可复用性。
同时,面向对象开发方法还能够提高开发效率,减少代码的冗余和重复。
五、测试方法软件测试是软件开发过程中不可或缺的一部分。
常用的测试方法包括单元测试、集成测试和系统测试。
单元测试主要针对软件的最小功能单位进行测试,确保每个单元都能够正常运行。
集成测试则是对多个单元进行组合测试,测试它们的相互协作和接口是否正常。
系统测试是对整个系统进行全面的测试,验证系统是否满足用户需求和设计规范。
六、持续集成和交付为了保证软件的质量和稳定性,持续集成和交付方法被广泛应用。
持续集成指的是将开发人员的代码频繁地合并到共享的代码库中,并通过自动化的测试和构建工具进行集成测试。
计算机科学技术发展现状及前景展望

计算机科学技术发展现状及前景展望如今,计算机科学技术的广泛应用已经成为了我们生活中不可或缺的一部分。
我们随时随地都在与计算机和互联网打交道,这显示出计算机科学技术的重要性。
在技术的不断发展中,计算机科学技术已经取得了非常重要的成就。
不断发展和进步的现状,将为未来提供更加广泛和有益的机遇。
一、计算机科学技术的现状计算机科学技术的现状是一个庞大和复杂的话题,但目前值得关注的一些领域包括人工智能、区块链、云计算、物联网和虚拟现实等。
这些领域每个都各具特色。
人工智能人工智能(AI)是目前最火热的技术领域之一。
AI能够为未来带来巨大的变革,因为它可以模拟人类思维和行动。
目前,人工智能已经在医疗保健、金融、教育和自动驾驶等领域得到广泛应用。
区块链区块链技术能够带来加密货币、智能合约和去中心化应用等功能,因此被广泛认为是一个重要的技术领域。
许多公司和组织已经意识到这一点,并在探索区块链在供应链、数字身份识别和IOE(物联网与经济)等领域的应用。
云计算云计算一直是一个快速发展的领域,它已成为企业普及现代IT架构的标准。
虽然云计算早已普及,但随着新技术和服务的发展,云计算将变得更加重要。
物联网物联网设备正在成为普通设备的一种基本形态。
我们已经看到了智能家居、智能医疗保健和智能城市的兴起,这些设备将更加普及,这意味着对安全、隐私和实施的需要也将更加紧迫。
虚拟现实虚拟现实(VR)技术一直以来都被认为是最具有潜力的技术领域之一。
虽然VR在游戏和娱乐领域使用较多,但在教育、医疗保健和制造等领域的应用也在逐渐出现。
以上只是举几个例子,还有无数的技术领域值得关注,这些技术领域都有一个共同点:随着技术的发展,计算机科学技术将进一步深化和扩展,为人们带来更多方便和创新。
二、计算机科学技术的前景展望对计算机科学技术的前景展望远不止于以上讨论到的一些领域。
下面是计算机科学技术未来的一些趋势:1.人工智能会更加发展和应用随着人们对人工智能的理解加深,我们能够设计更加智能、高效的系统来适应人们的需求和行为模式。
软件测试技术的发展趋势与前景

软件测试技术的发展趋势与前景随着信息技术的快速发展和应用领域的不断扩大,软件测试技术也迎来了广阔的发展空间。
软件测试作为软件开发生命周期的关键环节,其发展趋势与前景备受关注。
本文将从技术的角度探讨软件测试技术的发展趋势与前景,包括自动化测试、云端测试、DevOps测试以及人工智能在软件测试中的应用。
自动化测试是软件测试领域发展的重要方向之一。
传统的手工测试往往耗时耗力,效率低下。
而自动化测试通过利用脚本和工具,可以提高测试效率和准确性,减少人为错误。
自动化测试技术不仅可以应用于功能测试,还可以应用于性能测试、安全测试等各个测试环节。
近年来,随着技术的进步和工具的成熟,自动化测试在软件测试中扮演着越来越重要的角色。
云端测试是另一个备受关注的发展方向。
云计算的快速发展使得软件测试可以在云端进行,而不再受限于本地硬件资源。
云端测试具有弹性、高效、灵活的特点,可以根据测试需求的变化,灵活调整测试环境的规模和配置,提高测试的效率和准确性。
同时,云端测试能够集中管理测试用例、测试数据和测试报告,方便团队协作和持续集成。
可以预见,未来软件测试将越来越倾向于在云端进行。
DevOps测试是当前软件开发和测试领域的一个重要趋势。
DevOps的核心理念是开发和运维之间的紧密协作和沟通,以快速交付高质量的软件。
传统的软件测试往往是在开发完成后才进行,导致问题发现和修复的时间延长,影响软件交付周期。
而DevOps测试将测试纳入开发过程中,实现持续测试和持续反馈,加速问题的发现和修复。
通过团队协作、自动化和快速迭代的方式,提高软件质量和交付效率。
人工智能在软件测试中的应用也是一个备受关注的发展方向。
人工智能技术如机器学习、自然语言处理等的快速发展,为软件测试带来了新的可能性。
人工智能可以辅助测试人员分析测试数据、生成测试用例、进行缺陷预测和自动化测试等工作。
例如,利用机器学习算法可以根据历史测试数据预测缺陷出现的概率和位置,从而有针对性地进行测试。
软件测试技术的新趋势与发展方向

软件测试技术的新趋势与发展方向随着科技的迅猛发展和软件行业的不断壮大,软件测试技术也经历了不断演进和创新。
在这个不断变化的技术时代,了解软件测试技术的新趋势和发展方向至关重要。
本文将探讨几个当前正在兴起的软件测试技术,并展望其未来的发展。
一、自动化测试自动化测试是当今软件测试领域最热门的技术之一。
传统的手动测试存在时间长、成本高和难以复现测试场景的问题,而自动化测试通过脚本编写和自动化工具的使用,可以更快速、高效地执行测试任务。
近年来,随着测试工具和框架的不断更新和完善,自动化测试已经成为软件测试的重要组成部分。
未来,随着人工智能和机器学习的发展,自动化测试将变得更加智能化和自主化,能够实现更精准的测试和更高效的缺陷定位。
二、云端测试随着云计算技术的快速发展,云端测试成为了一种新的测试方式。
云端测试可以通过远程服务器进行测试任务的分发和执行,大大提高了测试的灵活性和效率。
云端测试可以轻松应对不同平台和不同设备上的测试需求,同时还能够利用云端的弹性资源进行大规模并发测试。
未来,云端测试有望成为主流的测试方式,引领软件测试技术的发展。
三、DevOps与敏捷测试DevOps和敏捷测试是近年来兴起的软件开发和测试方法论。
DevOps通过将开发和运维紧密结合,实现持续集成和持续交付,大幅提高了软件交付的速度和质量。
而敏捷测试则强调和开发团队的协作和沟通,以迭代和增量的方式进行测试,更快地获取用户反馈和修复缺陷。
未来,DevOps和敏捷测试将会进一步融合,成为软件测试的主流方法,同时也需要测试人员具备更广泛的技术能力和领域知识。
四、智能化测试智能化测试是指利用人工智能和机器学习等技术来提高测试的智能化和自动化水平。
智能化测试可以通过学习测试历史数据和分析测试结果,自动发现和修复缺陷,提高测试的效率和准确性。
未来,随着人工智能技术的不断发展,智能化测试将会在测试过程中发挥越来越重要的作用,提升测试的质量和效率。
基于词汇特征与语法模式的汉语二语写作质量动态发展研究

基于词汇特征与语法模式的汉语二语写作质量动态发展研究作者:王浩学程勇胡晓清来源:《华文教学与研究》2022年第02期[关键词] 写作质量;词汇多样性;词汇复杂性;语法多样性;语法复杂性;语料库[摘要] 本研究以韩国在华学习者汉语中介语语料库3个年级596名学生共6789条有效作文语料为研究对象,以词汇特征及语法模式为测量指标考察韩国学习者汉语作文水平的动态变化。
词汇特征指标包含词汇多样性、词汇复杂性两个维度,共8个指标;语法模式指标包含语法多样性、语法复杂性两个维度,共12个指标。
本文创新性地将《国际汉语教学通用课程大纲》(修订版)248条各级语法模式转化为正则表达式,使用SPSS等软件对作文语料进行大规模精细考察与分析。
研究结果表明,词汇特征指标中,词汇多样性2(词种数)及词汇复杂性2(高级词种数)与年级分布具有最高的相关性。
语法模式指标中,语法多样性2(语法项种数)和语法复杂性2(高级语法项种数)与年级分布具有最高的相关性。
本文进一步分析了词汇与语法各指标的相关关系,讨论了词汇紧密性与语法松散性的特征及修辞化表达对指标的影响,并对未来汉语二语词汇及语法教学提出反思和建议。
[中图分类号]H195.3 [文献标识码]A [文章编号]1674-8174(2022)02-0020-121. 引言近年来,对于汉语二语写作质量的语言特征定量研究逐渐引起了学者的重视。
作文语言特征的考察指标主要可以分为词汇类指标和句法类指标。
在词汇类指标方面,常用的测量方式有词汇丰富度(lexical richness,LR)、词汇密度(lexical density,LD)、词汇复杂度(lexical sophistication,LS)、词汇独特性(lexical originality,LO)、词汇多样性(lexical variation,LV)、词汇正确性(lexical accuracy,LA)等。
吴继峰(2016)发现词汇变化性、词汇复杂性、词汇密度、词汇错误率四个自变量构成的组合能解释英语母语者二语汉语写作成绩总变异的46.2%。
“以读促写”教学对英语学习者书面语词汇丰富性的影响

科研园地General Serial No.1022019No.5“以读促写”教学对英语学习者书面语词汇丰富性的影响袁玲1(南昌航空大学,江西南昌330063)摘要:本研究通过实验考察“以读促写”教学对英语学习者书面语词汇丰富性的影响。
本研究从词汇密度、词汇复杂性以及词汇多样性三个维度测量了词汇丰富性25项指标,较全面地反映了在“以读促写”教学后英语学习者书面语词汇丰富性的发展。
结果表明,实验班与控制班在这三个维度的25项指标均有显著差异(p<0.05)。
实验班学生写作实词数量和词汇总量均显著增加,写作长度明显更长。
复杂词汇和复杂实词数量均显著增加,尤其是复杂动词数量增幅明显。
同时,实验班学生写作不同词类发展也比控制班有了更大进步。
因此,本研究结果表明,“以读促写”教学对英语学习者书面语词汇丰富性有积极作用。
关键词:词汇丰富性;词汇密度;词汇复杂性;词汇多样性1.文献回顾近年来,英语学习者二语发展研究受到普遍关注。
其中,二语书面语词汇丰富性发展研究成为二语教学和习得研究的重要内容。
国外有关词汇丰富性研究始于20世纪70年代。
国外研究主要集中在对二语词汇丰富性测量维度以及各维度测量方法的探讨和验证。
Laufer和Nation(1995)认为可从词汇多样性、词汇密度、词汇复杂性和词汇独特性四个维度来测量词汇丰富性。
Read(2000)提出学习者语言词汇丰富性由词汇密度、词汇复杂性、词汇多样性和错误数量等四个内在联系的组成要素构成。
Ure(1971)认为词汇密度是文本中不同实词数与总词数的比率。
Laufer和Nation(1995)开发了词频概貌(LFP)(Lexical Frequency Profile)作为测量词汇复杂性的指标。
Jarvis(2002)研究表明,D和Uber index在测量词汇多样性时准确性较高。
Lu (2012)开发出二语词汇丰富性测量工具LCA(Lexical Complexity Analyzer),该测量工具从词汇密度、词汇复杂性和词汇多样性三个维度下的25项测量指标来测量二语词汇丰富性。
_中国英语专业大学生二语写作中的词汇丰富性研究

2.1 研究问题 本研究主要回答以下问题 : (1)词汇多样 性是否随着外语 学习者 学习时间 的变化而 变化 ? 在 不同的学 习阶 段 , 不同水平学习者之间的词汇多样性是否 存在差异 ? (2)词汇复杂 性是否随着外语 学习者 学习时间 的变化而 变化 ? 在 不同的学 习阶 段 , 不同水平学习者之间的词汇复杂性是否 存在差异 ? (3)词汇运用 的正确率是否随 着外语 学习者学习时间的变化而变化 ? 在不同的学 习阶段 , 不同水平学习者之间的词汇运用正 确率是否存在差异 ? 2.2 词汇丰富性测量方法 本研究中词汇丰富性 的测量采用 Read (2000:200)提出的 “词汇评估 ”(assessingvocabulary)模式和桂诗春 、杨惠中 (2003:5)的
表 2 四 、八级作 文的词汇复杂性比较
发展模式 ? 表 1为四校英语专业学生在词汇 多样性指标上的描述性数据分析结果 。 复旦 大学英语专业学生四级作文的 Uber指数最 高 , 八级作文的 Uber指数却出现了退步 。 其 他三校学生作文的词汇多样性都有不同程度 的提高 , 其中上外学生的进步最大 。 一元方 差统计分析表明 , 这些组间差别是显著的 (F =8.798, p= .000;F= 7.915, p=.000)。
表 1 四校学生作文的词汇多样性指标情况
四级作文
八级作 文
平均值 标准 差 平均值 标准差
上理工 复旦
2 0.6 02 2 2.2 99
2.8 32 5.4 19
21.27 9 21.39 0
2.4 89 2.1 88
上师大 上外
1 7.3 71 1 9.8 50
软件测试未来的发展趋势及前景展望

软件测试未来的发展趋势及前景展望随着信息技术的不断进步,现代社会对于软件的应用越来越广泛,不论是机械制造、电子商务、金融银行、医疗保健还是物流配送等各行各业的企业都离不开软件的支持。
然而软件测试的重要性在这个过程中就显得尤为重要,因为确保软件的质量能够在混沌的命运中起到极大的作用。
所以在软件工程发展的路上,软件测试也一直与时俱进,呈现出不断进化的趋势来。
下面就让我们一起来看看,在2023年软件测试未来的发展趋势及前景展望吧。
一、区块链技术在软件测试领域的应用区块链技术可以为软件测试带来许多好处,如数据的安全与隐私保护、信息共享的去中心化、去除黑盒测试、检测代码安全漏洞、测试用例的可追溯性等等。
而区块链技术可以提供的这种不可篡改的安全性和可监控的透明度,对于所有在软件测试过程中涉及到的机密信息的传输和存储都具有突出的优势。
例如,区块链技术可以在软件测试过程中通过分布式存储和加密算法确保测试数据的安全性和可信度,而且可以防止测试成果的泄露和测试结果的人为编辑。
而且在整个测试过程中,区块链还可以检测软件测试中存在的漏洞和问题,并实时进行更新,以保证测试过程中结果的可靠性和准确性。
因此,现在有许多软件测试企业已经深入探讨和实践了区块链技术在软件测试领域的应用,并且已经取得了令人瞩目的成果。
预计到2023年,随着区块链技术的进一步深入发展与完善,其在软件测试领域的应用也将逐步增多,成为软件测试领域未来发展的重要趋势之一。
二、云计算技术和大数据在软件测试领域的应用现在云计算技术和大数据技术已经成为了现代软件工程中的重要组成部分,它们可以极大地提高软件开发和测试的效率和准确度。
利用云端的资源,软件测试团队可以通过云计算技术快速部署测试环境和实现自动化测试,而且还可以很方便地管理和监测整个测试过程。
例如,现在已经有许多软件测试平台可以利用云计算技术提供崭新的服务模式,实现多地协同工作和在线协作,使得软件测试人员可以高效地完成各项测试任务,而且还可以快速建立测试用例、快速批量执行、分布式执行等等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
词汇丰富性测量方法及计算机程序开发:回顾与展望陆芸【摘要】Lexical diversity and lexical sophistication are the two most frequently used indices. Research on measures of lexical richness has been conducted mainly in two dimensions : research on measures of lexical diver- sity and research on measures of lexical sophistication. The paper reviews research on the measures of lexical di- versity and lexical sophistication as well as their computer programs. Problems with these measures are discussed and suggestions are made to improve these measures.%词汇丰富性最常用的测量指标是词汇多样性和词汇复杂度,对词汇丰富性测量方法的研究主要沿这两个方向进行。
通过对词汇多样性测量方法和词汇丰富性测量方法及其计算机程序开发进行回顾,分析以往测量方法的不足之处,并对未来研究提出展望。
【期刊名称】《南京工业大学学报(社会科学版)》【年(卷),期】2012(011)002【总页数】5页(P104-108)【关键词】词汇丰富性;词汇多样性;词汇复杂度;计算机程序【作者】陆芸【作者单位】南京工业大学外国语学院,江苏南京211816【正文语种】中文【中图分类】TP39词汇评估是二语习得研究的一个重要方面。
Read提出了词汇评估的三个维度:一是分离式还是嵌入式,关注词汇知识是作为独立概念进行测量还是作为某一更大概念之下的一个部分进行测量;二是选择型还是综合型,传统的选择型测量方法是由测试者选择一套目标词汇来测量学习者对这套词汇的掌握程度,而综合型词汇测量方法则考虑口语和书面文本中词汇使用的整体情况;三是脱离语境还是依赖语境,脱离语境是指测量词汇时不提供语境,依赖语境是将词汇置于语境中进行测量。
传统语境观为词汇测量提供一个句子作为语境,现代语境规则是将语境拓展到整个文本或语篇[1]。
Read提出的三个维度并不足以涵盖词汇评估的全部模式,却为目前使用的各种各样的评估模式提供了一个基本的评估框架。
最近几十年来,以嵌入式、综合性和语境依赖为特征的词汇测量方法不断被研究者提出,用于测量学习者口语和书面语产出中词汇知识使用的特点。
为了便于测量结果的比较,研究者设计出各种可以从不同角度反映学习者词汇使用情况的指标,为了便于这些指标的计算,研究者编写了各种各样的计算机程序。
由于测量词汇丰富性最常用的指标是词汇多样性和词汇复杂度,因此,本文将从词汇多样性和词汇复杂度两个方面对词汇丰富性测量方法及相应程序进行回顾,并重点介绍较为著名的vocd、LFP和P_Lex测量方法,思考其不足之处,并对未来的研究提出建议。
一、词汇丰富性测量指标词汇丰富性体现了学习者语言产出的多样性和成熟性,是学习者语言发展的重要表征之一[2]。
词汇丰富性广义上包含四个观测变量:词汇复杂度、词汇变化性、词汇密度和词汇独特性,而研究者使用最多的两个观测指标是词汇复杂度和词汇变化性即词汇多样性[3]。
词汇复杂度测量学习者使用复杂词汇的数量,词汇多样性测量学习者使用词汇的范围或种类。
词汇复杂度利用词频表分析文本中使用不同词频词汇的情况,借助了外部标准;词汇多样性考察文本本身词汇种类的情况,不借助外部标准。
Skehan等发现词汇多样性指标和词汇复杂度指标呈中度相关,说明它们之间的关系较为稳定[4]。
Fluency Summer Intern Project的研究表明词汇多样性和词汇复杂度是两个既独立又相关的概念[5]。
总之,词汇评估是多方面的,没有哪一种方法可以测量词汇知识的全部,因此,测量词汇丰富性可以从不同角度,使用不同方法,这些不同的测量方法可以提丰富的信息。
1.词汇多样性测量方法和计算机辅助程序的开发词汇多样性主要是通过类符和形符比(TTR),即文本中不同词汇T(类型)与文本总词数N(词符)的比率来测量。
然而,传统的TTR方法明显受文本长度影响,文本长度越长,TTR的值越小,因此,不能很好地测量不同文本长度下的词汇复杂性[6-7]。
于是,TTR 的各种数学变体被使用以减轻文本长度对词汇多样性的影响。
如Guiraud的根号TTR(T/)[8],Carroll 的修正 TTR(T/)[9]以及 Herdan的对数 TTR(log T/log N)[10]。
这些TTR也可以用一系列语言学分析程序来计算,如Hockey的牛津一致性程序[11]、Miller等的语言转录系统分析[12]和Whinney的计算机语言分析程序[13]。
Vermeer在比较了几种词汇多样性测量方法后发现上述几种用直观数据表达的词汇多样性测量方法的信度和效度并不令人满意[14]。
2000年,McKee等学者提出了与传统TTR不同的另一个数学变体等式TTR=*(1),其中N是标记总数,D是参数[15]。
他们承认将文本截取不同长度样本会产生不同的TTR值,并宣称一个文本的词汇多样性并不是由一个TTR值决定,而是由截取不同长度的样本得到的一系列TTR值决定。
这一系列的TTR值可以由一条曲线来表示,这条曲线从左到右呈下降趋势,曲线的高低由参数D决定。
D的计算原理是:首先,将选取的文本随机截取35个词100次,计算每一次的TTR值,并计算这100次TTR值的平均值;其次,随机截取36个词100次,计算这100次36个词TTR值的平均值,依此类推,一直到随机截取50个词100次,计算100次50个词TTR值的平均值,这样就得到了16个的截取文本的TTR的平均值,据此绘制一条经验曲线。
根据上述公式,我们可以绘制一系列的理论曲线,而其中与经验曲线最为匹配的理论曲线的D值被用来描述文本的词汇多样性。
McKee等据此思想设计了相应的计算机程序vocd。
Meara等在vocd的基础上开发了D_Tools的软件[16]。
D_Tools计算原理和vocd一样,只是D_Tools可以直接使用原始数据,而使用vocd时,数据必须参照CHILDES系统使用的格式进行处理。
相对于之前TTR的各种变体,D测量作为词汇多样性最新测量手段之一,总体上能够很好地控制文本长度对词汇多样性的影响,信度较高[17-19]。
然而,用D测量词汇多样性并不能有助于了解文本中使用了什么样的词,即它未能区分文本中的低频词和高频词,也就不能了解学习者使用词汇的难易程度,于是,研究者提出了词汇复杂度的概念。
2.词汇复杂度测量方法和计算机辅助程序的开发Meara等将词汇丰富性测量分为两种:一种是词汇丰富性的内在测量方法;一种是词汇丰富性的外在测量方法[20]。
上述提到的词汇多样性测量属于词汇丰富性内在测量方法,即仅根据文本本身出现的词汇进行评估,不借助任何外部标准。
而词汇复杂度测量则是借助外部标准即词频表的词汇丰富性外在测量方法。
词汇复杂度是学习者使用复杂词汇的能力。
综观近30年的文献,我们可以发现一系列关于词汇复杂度测量方法和相应的计算机程序的研究,如 Laufer等的词频分布(LFP)[21]、Meara 等的P_Lex、Goethals 的 WordClassifier[22]、Meara 等的V_Size[23],这些研究的共同点在于使用了相同的词频表。
最为著名的词汇复杂度测量方法是LFP和 P_Lex。
LFP计算不同词频水平的单词数在文本中所占的比率。
它可以将文本中不同词频的词汇以标注的形式呈现给使用者;可以根据已有的词频表将输入的英语目的文本中出现的词汇以类型、标记和词簇的形式按词频分布将其总数和百分比陈列出来[24];也可以通过某个词表来了解文本覆盖率的情况,发现不同文本词汇使用的异同,甚至可以根据词频和范围构建词表[25]。
LFP的计算由微机程序 VocabProfile执行。
VocabProfile软件包包含软件本身和三个词表。
输入的文本不须经削尾处理,但须保存为ASCII码格式。
在运行程序前,文本根据以下原则进行修改:不扭曲本来单词面貌的拼写错误被更正,此单词被视为学习者所熟悉;专有名词和错误使用的单词被删除,因为它们不被认为是学习者产出性词汇的一部分。
程序运行后,该程序将文本中的词汇和词表中的词汇进行比较,并提供以类型、标记和词簇的形式呈现的词频概况。
词表的单词分为四个类别:最常用的1 000词、次常用的1 000词、学术词汇以及不在上述词表中的词。
Laufer等根据学习者的语言水平提出词表使用建议,对于较低水平的学习者,使用最常用的1 000词表和次常用1 000词表,对较高水平的学习者,还要使用学术词表来分析词汇复杂度。
LFP对文本长度的最低要求是达到200个词才能获得较为可靠的结果,低于200词的文本测量结果则不可靠。
他们的研究报告了LFP的信度和效度:LFP对同一主体的两篇作文给出相似的稳定结果;LFP能区分不同水平的学习者;LFP和其他独立的词汇测量有较好的相关性。
总之,它是一个有用的诊断工具和敏锐的研究工具。
尽管Laufer等宣称LFP具有其他词汇丰富性测量方法所不具有的优势,它仍然受到了不少批评。
Meara等称LFP测量并没有那么稳定,且由于低水平学习者只能产出极少的低频词,不足以区分词汇复杂度,也就不能很好地区分低水平学习者的产出性词汇。
2005年,通过一系列电脑模拟,Meara提出LFP在测量词汇复杂度方面并没有原作者认为的那样灵敏,只有被比较的组间词汇量差异明显才能获得良好的结果,LFP甚至对词汇量中等程度的差异都无法辨识[26]。
Laufer等回应了Meara对LFP的批评,指出Meara分析中对LFP的各种“曲解”。
尽管LFP存在各种缺陷,但它仍然不失为词汇评估的一个有用工具,尤其不失为一个便捷的学习者产出性词汇的教学诊断工具。
P_Lex是另一测量文本词汇复杂度的探索性工具。
它观察难词在文本中的分布情况,并得出一个表示难词在文本中发生的可能性的指标。
它基于这样的理念:难词在文本中出现的频率较低,而具有较大词汇量的学习者比具有较小词汇量的学习者更有可能使用低频词汇。
P_Lex的工作原理是:它将文本切分为10个单词一段,然后计算包含从0个到10个低频词段落的比例,据此绘制一条经验曲线。
P_Lex认为低频词是偶然发生的,这种情况典型地符合泊松分布原理。