语料精华整理

语料精华整理
语料精华整理

理论

1、关于皮格马利翁效应:

人类本性中最深刻的渴求就是赞美。每个人只要能被热情期待和肯定,就能得到希望的效果。

“皮格马利翁效应”提醒我们:自尊心和自信心是人的精神支柱,是成功的先决条件,所以,不管是家长、老师、管理者,都应该切记:不要视别人的自尊心、自信心为儿戏,因为要想让一个人重建自信,不知比破坏一个人的自信心要难上多少倍

教师对学生的期待,才使教师和学生都产生了一种努力改变自我、完善自我的进步动力。这种企盼将美好的愿望变成现实的心理,在心理学上称为“期待效应”。它表明:每一个人都有可能成功,但是能不能成功,取决于周围的人能不能像对待成功人士那样爱他、期望他、教育他

每个人都希望得到赞美。

﹡欣赏引导成功,抱怨导致失败。

﹡当你有了天才的感觉,你就会成为天才;当你有了英雄的感觉,你就会成为英雄。

﹡不要用怀疑的态度对待孩子的承诺,更不要讽刺挖苦。

﹡鼓励与赞美能使白痴变天才,批评与谩骂会使天才变白痴

﹡赞美就像浇在玫瑰上的水;赞美的话并不费力,却能成大事。

﹡赞美和鼓励是引发一个人体内潜能的最佳方法。

核心理念:期望和赞美能产生奇迹。

应用要诀:维护自尊和自信,多用鼓励和赞美。

2、关于马斯洛需求层次理论

马斯洛需求层次理论是行为科学的理论之一,由美国心理学家亚伯拉罕?马斯洛于1943年在《人类激励理论》论文中所提出,书中将人类需求象阶梯一样从低到高按层次分为五种,分别是:生理需求、安全需求、社交需求、尊重需求和自我实现需求五类,是行为科学理论之一。

人人都希望自己有稳定的社会地位,要求个人的能力和成就得到社会的承认。尊重的需要又可分为内部尊重和外部尊重。内部尊重是指一个人希望在各种不同情境中有实力、能胜任、充满信心、能独立自主。总之,内部尊重就是人的自尊。外部尊重是指一个人希望有地位、有威信,受到别人的尊重、信赖和高度评价。马斯洛认为,尊重需要得到满足,能使人对自己充满信心,对社会满腔热情,体验到自己活着的用处价值

自我实现的需要是最高层次的需要,是指实现个人理想、抱负,发挥个人的能力到最大程度,达到自我实现境界的人,接受自己也接受他人,解决问题能力增强,自觉性提高,善于独立处事,要求不受打扰地独处,完成与自己的能力相称的一切事情的需要。也就是说,人必须干称职的工作,这样才会使他们感到最大的快乐。马斯洛提出,为满足自我实现需要所采取的途径是因人而异的。自我实现的需要是在努力实现自己的潜力,使自己越来越成为自己所期望的人物。

3、罗森塔尔效应:

满怀期望的激励赞美、信任和期待具有一种能量,它能改变人的行为,当一个人获得另一个人的信任、赞美时,他便感觉获得了社会支持,从而增强了自我价值,变得自信、自

尊,获得一种积极向上的动力,并尽力达到对方的期待,以避免对方失望,从而维持这种社会支持的连续性

尊重

1、野蛮产生野蛮,仁爱产生仁爱,这就是真理。待儿童没有同情,他们就变得没有同情;而以应有的友情对待他们就是一个培养他们友情的手段。——(英)斯宾塞《教育论》

2、儿童的心灵是敏感的,它是为着接受一切好的东西而敞开的。如果教师诱导儿童学习好榜样,鼓励仿效一切好的行为,那末,儿童身上的所有缺点就会没有痛苦和创伤地、不觉得难受地逐渐消失。——(前苏联)苏霍姆林斯基《要相信孩子》

3、在每个孩子心中最隐秘的一角,都有一根独特的琴弦,拨动它就会发出特有的音响,要使孩子的心同我讲的话发生共鸣,我自身就需要同孩子的心弦对准音调。

4、我对学生的未来是没有底线地绝对相信,我对于自己每天做的事情是充满渴望的,我对我学生的未来也都充满希望,并且我有坚定的信念,相信我所教出来的学生有一天一定会改变这个国家和世界。

请老师们永远、永远都不要忘记自己是谁。你要记住,老师对于学生来说是他的光芒,是他的英雄,他会一直放在脑海里。

另外,作为一个老师,永远、永远不要停止学习,因为一旦你停止学习了,你就会变成一个无法呼吸的雕塑,而不是一个别人来学习你的人。教师对于学生来说,就是那股可以改变他们人生的力量。我们做老师的拥有这个世界上最棒的工作,因为我们有能力去教学生,有能力去改变世界。——瑞贝卡·米沃奇

5、每一个老师都应该仔细观察学生,而不是猜测这个学生是什么样的人。你还要记下笔记,这样可以避免妄下论断

6、教师是一个在迷失的时候可以去信赖的人。(这也是我认为做教师这项职业应该做的事情,就是让我们成为学生所信任的人,学生给了我们一个很好的礼物就是他们的信任,我们的工作就是要去领着这份信任把他们教好。)

学生特点

1、请记住:没有也不可能有抽象的学生(成绩问题、成长问题)

教师要善于确定:每一个学生在此刻能够做到什么程度,如何使他的智力才能得到进一步的发展。

能否保护和培养每一个学生的自尊感,取决于教师对这个学生在学习上的个人成绩的看法。不要向儿童要求他不可能做到的事。任何一门学科的任何教学大纲知识包含一定水平和一定范围的知识,而没有包含活生生的儿童。

不同的儿童要达到这个只是的水平和范围,所走得道路是各不相同的。有的孩子在一年级时就已经能独立地读出和解出应用题,而另外一些孩子知道二年级末甚至三年级末才能做到这一点。

教师应当善于确定:要通过怎样的途径,要经历什么样的阻碍和困难,才能引导儿童接近教学大纲所规定的水平,以及怎样才能在每一个学生的脑力劳动中具体地实现教学大纲的要求。

教学和教育的技巧和艺术就在于,要使每一个儿童的力量和可能性发挥出来,使他享受到脑力劳动中的成功和乐趣。这就是说,在学习中,无论就脑力劳动的内容(作业的性质),还是就所需的时间来说,都应当采取个别对待的态度。(对不同的学生布置不同的作业)。

在这种做法下,所有的学生都在前进——有的人快一点,另一些人慢一些。儿童完成作业而得到评分时,从评分中看见了自己的劳动和努力,学习给他带来了精神上的满足和有所发现的快乐。在这种情况下,教师和学生的互相关心与相互信任相结合。学生就不会把教师单纯地看成严厉的监督者,也不会把评分当成一种棍棒。他可以坦率地对教师说:某某地方我没有做好,某某地方我不会做。他的良心是纯洁的。

在学习中取得成就——这一点,形象地说,乃是通往儿童心灵中点燃着“想成为一个好人”的火花的那个角落的一条蹊径。教师要爱护这条蹊径和这点火花。

学习困难的学生并不是停止不动、凝固不变的,凡事给人以成功的乐趣的脑力劳动,总是会收到发展学生能力的结果的。

要设法让每一个学生在课堂上都在进行脑力劳动。

2、后进生

儿童的学习越困难,他在学习中遇到的似乎无法刻度的障碍越多,他就应当更多地阅读。阅读能交给他思考,而思考会变成一种激发智力的刺激。书籍和又书记激发起来的活的思想,是防止死记硬背(这是使人智慧迟钝的大敌)的最强有力的手段。学生思考得越多,他在周围世界中看到的不懂的东西越多,他对知识的感受就越敏锐,而你,当教师的人,工作起来就越容易了。

3、不能总是牵着他的手走,而还是要让他独立行走,使他对自己负责,形成自己的生活态度。——(前苏联)苏霍姆林斯基

4、一个学生不应该是一个有待去装满的杯子,而是一盏有待去点亮的灯。教师应该去点亮他们的好奇心,去点亮他们的智慧。

教师应该教会学生如何去学会新鲜事物。我们到底要教些什么?创新、合作以及批判性思维。应该教授那些直到30年以后也是使用的21世纪的新技能。

教师成长

1、教师的时间从哪里来?一昼夜只有24小时

如何备课?每天不断地读书,跟书籍结下终生的友谊。潺潺小溪,每日不断,注入思想的大河。读书不是为了应付明天的课,而是出自内心的需要和对知识的渴求。如果你想有更多的空闲时间,不至于把备课编程单调乏味的死扣教科书,那你就要读学术著作。在你的科学知识的大海里,你所教给学生的教科书里的那点基础知识,应当只是沧海一粟。

时间每过去一年,学校教科书这一滴水,在教师的知识海洋里就变得越来越小。这里的问题还不仅在与教师的理论知识在数量上增长。质变:衬托着教科书的知识背景越宽广,犹如强大的光流照射下的一点小光束,那么为教育技巧打下基础的职业质量的提高就越明显,在课堂上讲解教材时,就能更加自如地分配自己的注意。(学生怎样思考,某些学生在感知、思考、识记方面遇到哪些障碍)他不仅在教书,而且在教书过程中给学生以智力上的训练。

2、能培养独创性和唤起对知识愉悦的,是教师的最高本领。——(德)爱因斯坦

3、如果有人问我,教育孩子需要哪一种资格,我会说那需要异乎寻常的耐心和适量的爱心。

4、一个理想的教师,他应该是个天生不安分、会做梦的教师。教育的每一天都是新的,每一天的内涵与主题都不同只有具有强烈的冲动、愿望、使命感、责任感,才能够提出问题,才会自找“麻烦”,也才能拥有诗意的教育生活。

5、其实学习没有捷径可走,无论用那种方法,最终都会面对复杂的学习任务。作为教师,我们能做的就是用笑声、用激情、用技巧用紧迫感和爱,去实现这一切。教育应该关注每个孩子的独特性。这种辛苦的工作,不会带来财富,甚至不会有人感谢,但是当你看到一个个孩子能熟练阅读,能清晰地表达,能写出一篇优美的小诗你会觉得这一切都是值得的,老师是一些可能性背后的驱动力。——瑞贝卡

1、把基础知识保存在学生的记忆里

我们盖一座漂亮的楼房,可是把墙基打在很不牢固的混凝土上,灰浆不断地剥离,砖头也在脱落;人们每天都忙于消除工程中的毛病,可是始终处于楼房倒塌的威胁之下。

2、知识——既是目的、也是手段(知识与实践)

儿童在学习中遇到困难的原因之一,就是知识在他们那里常常变成了不能活动的“货物”,积累知识好像就是为了“储备”,而不能“进入周转”,知识没有被加以运用从而来获得新的知识。

在教学和教育工作时间中,在许多教师看来,“知识”这个概念就是:会回答提出的问题。这种观点就使教师对学生的脑力劳动和能力做出负面的评价:一旦教师要求,谁能立刻就把储藏在记忆里的知识“倒出来”,谁就是有能力、有知识的学生。

导致结果:知识好像脱离了学生的精神生活,脱离了他的智力兴趣。掌握知识对学生来说变成了一件讨厌的、令人苦恼的事,甚至会让学生想要尽快摆脱它。

3、不好的教师是给学生传授真理,好的教师是使学生找寻真理

第斯多惠

4、学然后知不足,教然后知困。知不足,然后能自反也;知困,然后能自强也。故曰:教学相长也。《兑命》曰:“学学半。”其此之谓乎?——《礼记?学记》

5、疑而后问,问而后知,知之真则信。故疑者,进道之萌芽也。

——明陈献年。摘自清?黄宗羲

6、思想是根基,理想是嫩绿的芽胚,在这上面生长出人类的思想、活动、行为、热情、激情的大树。——苏霍姆林斯基

7、关于获取知识

教给学生能借助已有的知识去获取知识的能力,这是最高的教学技巧所在。

获取知识——这就意味着发现真理、解答疑问。你要尽量使你的学生看到、感觉到、触摸到他们不懂的东西,使他们面前出现疑问。

要做到这一点,并不那么简单,在备课的时候,教师要从这样的角度对教材将进行深思熟虑:找出因果联系正好在那里挂钩的、初看起来不易察觉的那些交接点,因为正是在这些地方会出现疑问。而疑问则能够激发求知的愿望。

1、我把教育定义如下:“所谓教育,是忘却了在校学得的全部内容之后所剩下的本领”。

——(德)爱因斯坦

2、学校的目标始终应当是:青年人在离开学校时,是作为一个和谐的人,而不是作为一个专家。发展独立思考和独立判断的一般能力,应当始终放在首位,而不应当把获得专业学位放在首位。

3、前后不一致是教育中最严重错误之一。——【英】斯宾塞

4、鞭挞或呵斥是应该谨慎地避免的。它只是弥缝了目前,使伤口结上一层皮膜,对于痛楚的核心仍然没有触到。只有出自内心的羞耻心和不愿见恶于人的畏惧心,才是一种真正的约束。——洛克〈教育漫话〉

5、评价不是为了排队,而是为了促进发展。

成绩主要说明学习起点的新状况,而不是提供终结性的结论。应当用发展的眼光看学生,用发展的眼光看教师,用发展的眼光看学校。

多一把衡量的尺子,就会多出一批好学生。

——《素质教育观念学习提要》

6、教育的伟大目标不只是装饰而是训练心灵,使具备有用的能力,而非填塞前人经验的累积。——(美)爱德华兹

7、教育的艺术是使学生喜欢你所教的东西。——(法)卢梭《爱弥儿》

8、百年大计、教育为本;教育大计、教师为本。

9、教育的本质不在于传授,而在激励、唤醒和鼓舞。——惠斯多第

10、教育是心灵之间的对话,是一个灵魂对另一个灵魂的抚摸和唤醒。它需要我们俯下身去,站的跟孩子一般高,从孩子的需要出发,倾听孩子的声音,与孩子一起经历成长,我们只有把自己所从事的职业当做毕生的事业去追求是,才能感受到它的魅力所在,才能成为一名真正意义上的教师。

11、(1)在课堂上,学生的创造力很重要,创造力对于21世纪的课堂来说是及其重要的。

(2)学生一定要通过合作才能创造出一些非常新的,而且非常有意思、了不起的东西。

(3)我们需要合理地运用现有的科学技术去帮助、增强我们的学习,而不是让科技主导我们的生活。

(4)也是最重要的一点,我们要着重的是学生学习的能力,而不是科技来主导我们的生活。

语料库研究的优势及问题的理论解析

语料库语言学的理论解析 摘要:本文试图剖析有关语料库语言学的几个理论问题,以期揭示语料库语言学的本质。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 关键词:语料库语言学;基于语料库的研究方法;理论架构;语料库数据;发展前景 Abstract: This paper attempts to answer some theoretical questions of corpus-based language studies. Three theoretical considerations are addressed to capture the nature of corpus linguistics. 1) Is Corpus Linguistics an independent branch under the umbrella of linguistics? 2) What can corpus data offer to linguists? and 3) What kind of research that Corpus Linguistics should be? Answers to the three theoretical questions will conduce to a fuller understanding of the nature of corpus-based language studies and their development. Key words: Corpus linguistics; corpus-based approach; theoretical construct; corpus data; future directions 1.0 导言 目前利用语料库从事研究的学者主要有两类。一类是计算语言学家。他们主要从事自然语言处理(NLP)的研究,诸如语音合成、语音识别和机器翻译等等。他们的终极目标并非要揭示语言的本质,而是注重技术层面的研究,比方如何改进算法,如何完善词库的建设以实现技术上的突破。另一类就是语言学家,他们则希望借助这一强大的工具去揭示语言的本质这一学科目标,这正是本文所要关注的。 本文缘起于语言研究者中的一种争论,即“语料库语言学”是否配得上这个名称,它是一种新兴的理论视角还是“暴发户造谱牒”?而本文要探讨的正是有关于语料库语言学研究的理论意义。或者说,语言学家从语料库所提供的信息中到底可以获得什么?这是本文试图解决的核心问题。语料库建设、开发和利用在国内外语言学界日渐兴起,在国内也有相当数量介绍性和综述性文献涌现,为语料库语言学在我国的发展奠定了一定的理论基础。此外,一些语言学者和语言教师(包括外语教师和对外汉语教师)也设计、建立了一些自己的语料库以服务于教学科研。 然而真正对语料库的理论问题进行深入探讨的著述却为数不多。本文将试图剖析语料库语言学的几个理论问题,以期对语料库语言学的优势和不足有进一步的认识。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 2.0 语料库语言学是不是独立的新兴学科? 2.1 语料库语言学是一种理论架构 完全赞成语料库语言学是一种理论架构的几乎没有。只是某些学者比较强调语料库语言学的理论意义。比如,Halliday(1991;1992;1993)指出,语料库语言学作为一种理论架构(theoretical construct),将语料收集和理论概括统一了起来,从而使我们对语言的理解产生一种质变。这种新的理论架构有助于考察同时作为系统和实例(instance)的语言的本质。因为在Halliday的语言学思想当中,实际话语是语言系统的实例再现(instantiation)。而语言系统,或者说是语法体系是一种统计概率上(probabilistic)的自然结果。这一思想与所谓

关于汉语中介语语料库建设研究报告

汉语中介语语料库建设研究 沈锐1,黄薇2 (1.红河学院教育技术系2.红河学院国际合作与交流处XX蒙自661100) 【摘要】本文探讨母语非汉语学习者的汉语中介语语料库建设的主要思路以及具体实现方法,重点介绍了汉语中介语语料的加工方法以及语料数据库的设计思路,并阐明了该语料库在对外汉语教学和研究中的应用价值。 【关键词】语料库;中介语;汉语教学 语料库是指按一定的语言学原则收集的语言文本或话语片断而建立的电子资料库。本文所述汉语中介语料库是基于语言学中中介语理论设计与实施的。中介语是心理语言学中第二语言习得的一种研究模式,其将语言学习者置于观察中心,去研究他们如何有意识地向目的语的正确形式迁移的各种动态表现。中介语理论自20世纪60年代末出现并发展至今,虽然时间并不长,但越来越受到语言学家以及一线教师的关注。无论是进行中介语研究还是使用中介语理论进行第二语言教学都需要收集分析大量的语料,因而通过信息化手段收集和整理语料变得十分迫切。在对外汉语教学中,通过建设和使用母语非汉语学习者的汉语中介语语料数据库,可以收集不同背景和不同学习阶段外国学生及少数民族学生的汉语书面语和用文字转写的口语语料,并对语料属性、词汇、语法等单位进行计算机处理,以实现对各种条件和要求下的语料数据进行便捷的机器检索和提取,可以为研究母语非汉语学生学习和习得汉语的规律提供大量的各种单项的或综合的资料和信息。因此,我们提出了建设汉语中介语语料库的课题,由于语料库建设是一项浩大的工程,限于人力物力条件,本文讨论的是中

小规模的语料库。 一、需求分析和框架设计 语料库建设不能盲目进行,首先要进行调研,对语料库的应用需求进行分析。半自动化的语料库构建是目前语料库建设的主流技术,目的是在确保语料库质量的前提下,减少人工参与的比例,增加自动化程度,目标是在较短时间内建设一个有一定规模,质量可靠、可扩充、成本低,能够全面、细致地记录母语非汉语学习者在汉语学习过程中的语言表征和研究他们汉语习得过程的语料库。依照软件工程的方法,建立数据库首先需要进行需求分析,在需求分析过程中要注意汉语中介语语料库主要是服务于对外汉语教学的一线教师,以及辅助母语非汉语学生自学,因此主要注重以上二类服务对象的应用需求,确保建成的语料库能够对第二语言教学、研究以及教材的编写提供持续支持。基于以上要求,在对中介语语料库的建设思路及框架做了总体考虑,基本归纳为以下三个方面: 1、中介语语料库为专门用途语料库,主要目的为研究母语非汉语的学生在学习汉语过程中的中介语现象而设计制作的。 2、中介语现象存在于母语非汉语的学生在学习汉语过程中的书面语料及口语语料中,由于口语语料的收集、分析和标注都较为困难,因此在建库的第一阶段只考虑收录书面语料,这有利于语料库的快速建设与使用。 3、语料标注的加工标准使用中科院计算所汉语词性标记集V3.0。 二、语料收集与加工

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

信息的收集与整理

课型 新授课 课题 信息的收集与整理 教学目标 知识目标 理解信息收集、信息整理过程 能力目标 能通过案例分析,学会如何进行信息收集与整理 情感目标 合作和自主学习 重点 信息的收集信息的整理 难点 引入时,教师要结合信息技术的相关知识给学生讲解,并通过其他例子进行说明;在信息收集中,信息源与信息类型设计学生不容易明白。通过互联网、图书馆等方式进行收集与整理本学习小组设计所需信息。 教学方法 合作学习,自主学习,归纳法 课时安排 1 教具 Powerpoint课件、互联网 板书设计 设计产品需要信息;产品载体携带信息。 信息收集 信息整理 从化二中通用技术必修1教学教案 第三章怎样进行设计 第三节信息的收集与整理 学情及教材分析 学生情况 教学措施 学生通过信息技术课程学习,基本掌握了如何进行信息的收集与整理的方法,但就一特定的设计问题应该收集什么信息,如何进行信息整理,没有形成能力。 该课时安排在电子阅览室或电脑机房上,主要以任务驱动模式进行教学。 教材分析

教学措施 信息收集与整理是制定设计方案的第一步,收集与整理信息,既能合理利用前人的设计成果,避免走设计弯路,又能针对前人的设计缺陷做改进设计,发展学生自己新的想法与构思,使本小组的设计产品具有新颖性与独特性。 引入部分,通过学生自身学习经验,思考问题:设计产品需要信息;产品载体携带信息。信息收集教学中,通过图表,用列举法说明信息收集的方式、方法、内容、要求。在信息整理教学中,通过列举法说明信息整理方式、方法 教学程序 步骤 师生活动 设计意图 及反思 引入 新课 一、 信 息 的 收 集 上两节课我们学习了设计的第一步,发现问题及与此相关的知识点,并通过小组活动,确定了本小组的设计项目。作业完成情况如何? 本节,我们开始学习方案的制定。 设问:我们常用"眼观六路,耳听八方"来形容司机在开车时的专注,我们考试时,保持头脑清楚才能保证考试结果令人满意。请思考一下为何如此专注? 学生活动:思考并回答,须处理大量信息,不专注难以完成。

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

语料库简单dye 第二讲

2008/7/31 语料库简单DIY 第二讲语料库软件初探-- 语料库软件初探--MonoConcPro 2.2 本软件是Athelstan开发小组https://www.360docs.net/doc/494786332.html,/ ,于1996年开发的语料库比较检索工具。目前,我的服务器上提供学术性下载,下载地址: http://vu.flare.hiroshima-u.ac.jp/whistle/corpus/MoconcPro2. 2.rar (本软件为学术交流使用,所有权归本软件开发小组所有,一切商务性盈利目的的违法使用,所带来的连带责任关系与本人及本论坛无关。请慎重下载,小心使用!!!) 功能介绍: 软件主界 面 基本功能: MonoConc Pro 2.2 的软件界面比较简单。适合语料库初学者和初级研究人员使用。 本软件据作者的研究,其内部主核使用UTF-8编码,基本支持欧洲几种主要语言。当然,其主要的应用领域还是针对英语。本软件主要处理的文本素材是以TXT结尾的记事本文件,当然,本软件还可以导入RTF文档和其他格式的操作系统默认文档格式。不过,从DIY的角度来说,我们自己收集到的语料,为了免除格式,字体,行距等等文本要求,最好全部使用TXT文档,方便,省

事!用了都说好!(谁用谁知道) 我们按照自己的研究目的,研究方向,收集我们所需要的语料素材,具体的收集方法因人而异。可以从报纸杂志的电子文文档上直接下载,也可以从网站上直接下载整理好的TXT版本的小说,资料素材等,还可以直接从各大语料库中检索需要的语用素材,然后拷贝粘贴到TXT文本中。由于MonoConc Pro 强大的跨文档处理系统,一次可以同时导入多个TXT文档进行比较处理,所以我们可以把文章或者资料按照自己喜好的分类标准进行分类,然后存成不同的TXT文件名。检索的时候,只需要同时导入这些文件就可以了。(异常强大~)下载好软件,解压缩,然后打开MP22.EXE文件,你就可以看到上图那个简单的主界面了。 之后,选择File→Lord Corpus File(s),找到你需要导入处理的TXT文档,一个或者多个都可以,然后选择[打开]。指定的TXT文件就被全部导入进MonoConc Pro中了。 如果导入了过多的TXT文档,比如您导入了莎士比亚全集+马克思选+恩格斯选+列宁选+毛泽东选+邓小平选.....(不能否认,真的有这样的朋友存在)。那么,为了方便您查询检索结果所出现的文章,你可以选择File→View Corpus File/URL,这样就能看到查询结果所在的文章,还可以删除不需要的文章,或者添加新的文章,非常简单。 *这里的URL,指的是在HTTP或者FTP上,可以直接打开的文字页面的链接。一般朋友们DIY的语料库都是存在本地硬盘上的,所以基本上可以无视这个选项。不过,将来我们的个人语料库要实现点对点,点对多的平台连接。连接后,我们就可以相互查询对方个人语料库中的资料,此时在导入对方语料库中的文档的时候,就要用这个了。(这个目前还很遥远,大家还是踏踏实实做自己的DIY语料库吧!) 当我们要删除所有的文章的时候,这个时候仅仅关闭文章的窗口,是不能实

中介语语料库与汉语教学研究

中介语语料库与汉语教学研究 什么是汉语中介语 早期的和后期的(早期受行为主义影响,语言学家通过对比发现差异,预测可能有的错误,从而指定大纲) 早期对比分析的理论方法存在致命弱点,如果归结为一句话,那就是,人们试图用简单的语言学的方法取解决复杂的心理学的问题。语言习得涉及学习的主体和客体的方方面面,对比分析却仅仅局限于语言系统的对比,忽略了学习者这一主体以及作为学习客体的过程。 早期的中介语理论,首先在理论导向上实现了所谓“教学中心”的观点向“学习中心”的观点的根本转变。 中介语理论把目光转向学习者特有的语言系统,并将其作为一个独立的、与学习者的母语和目的语系统并列的系统来考察。也就是说,中介语研究不仅要考察学习者的母语和目的语系统,还要考察学习者的中介语系统,考察学习者自身及习得过程,这标志着第二语言习得研究方向的根本转变。 目前中介语研究在方法上存在的问题: (1)在研究方法上一个最严重的问题是不能进行重复性的研究;(2)在对第二语言学习者的言语行为进行解释时,没有考虑到足够的相关材料;(3)只在单一的情景运用单一的方法收集中介语语料;(4)收集数据的方法不恰当;(5)在假设检验的研究中满足于对逸闻趣事的材料进行分析,缺乏定量分析;(6)在实验研究中或获得基线数据时,收集数据的手段可靠。 有关中介语的研究 王建勤《历史回眸:早期的中介语理论研究》,《语言教学与研究》2000年第2期。 王建勤《关于中介语研究方法的思考》,《汉语学习》2000年第3期。(中介语研究的理论和方法进行了探讨) 彭利贞《论中介语的语篇层次》,《第五届国际汉语教学讨论会论文选》北京大学出版社1997年。 ----------------------------------- 中介语研究的现状与发展 自上世纪80年代算起,对外汉语教学领域的中介语研究已经有20多年的历史了。20多年来,这一领域的研究发生了很大的变化。 1984年鲁健冀《中介语理论与外国人学习汉语的语音偏误分析》 中介语研究引起了普遍的关注 由于中介语理论的引进不够系统,对外汉语教学界的中介语研究基本上停留在偏误分析的基础上。 近年来中介语研究的进展表现之一是研究的范围进一步扩大。从语篇的角度研究学习者的中介语系统,早在上世纪80年代初就引起了国外学者的关注。在汉语习得研究领域,中介语

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

档案收集与档案整理

第一章档案概论 档案的定义: 档案是机关、组织和个人在社会活动中直接形成的,保存备查的文字、图表、声像及其他各种方式和载体的历史记录。 档案的差不多含义: 1.档案是各种组织和个人在其特定的社会活动中积存而成的。 2.档案是保存备查的历史文件 3.档案信息的记录方式和载体是多种多样的 4.档案是原始的历史记录 档案的形成者的类型:官方性质的种种机关单位,半官方的或非官方性质的社团组织;某些个人。 档案来源于一定的差不多单位,形成于特定的历史活动。复杂的社会实践,决定了档案来源的广泛性和档案内容的丰富性以及一定的来源与内容的档案材料之间具有内在的联系性。 文件转化为档案一般需要具备的条件: 1.办理完毕(或叫处理完毕)的文件才能作为档案。(所谓办理完毕是相对而言的,要紧是指完成了文书处理程序) 2.对日后实际工作和科学研究等活动具有一定查考利用价值的文件,才有必要作为档案保存

3.按照一定的规律保存起来的文件,才能最后成为档案 档案的信息和载体是构成档案的两上差不多因素。 档案是原始的历史记录。这是档案的要紧特点和本质属性 1.档案不同于一般的历史遣物,它是以具体内容反映其形成机 关或人物特定活动的历史记录物,具有专门强的记录性。2.档案不同于一般的信息资料,它是特定的形成者在当时当地 直接使用的原始文件转化物,因而具有原始性的特点。 档案则以兼具原始性和记录性二者于一体的特点,区不于其他资料 档案的一般属性:知识属性和信息属性 1.档案是贮存和传播知识的一种形式 2.档案是一种重要的信息资料 档案是人类认识和改造世界的智慧的结晶,它记载了人们社会实践活动中大量有知识价值的事实、数据、成果和理论 档案不仅有贮存的功能,当它被人们利用时又能够发挥传播知识的功能。 档案信息又具有自身的某些特性,要紧表现为原始性和回溯性信息可分为原始信息和加工信息。对原始信息进行不同的加工处理即成为加工信息。

语料库

关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源; 在语言学中,语料库(Corpus)指大量文本的集合,库中的文本(称为语料)通常经过整理,具有既定的格式与标记,特指计算机存储的数字化语料库。 语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。 分类 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。 除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。目前已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS ) corpus(短消息服务(SMS)语料)等。 特征 语料库有三点特征 1.语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库; 2.语料库是承载语言知识的基础资源,但并不等于语言知识;

商务英语语料库的建设及应用

商务英语语料库的建设及应用初探 【摘要】语料库语言学作为一门新兴的语言学分支,其影响已遍及语言学研究的各领域。将语料库的方法应用于商务英语词汇教学中,发挥其语料真实丰富、计算机程序强大的重新组织语言数据的能力,既能提高学生商务词汇学习的效率和积极性,也能提高商务英语教学质量。本文从商务英语语料库的建设及其应用价值入手,以期语料库语言学为商务英语教学带来更多成果。 【关键词】商务英语语料库地方课程 商务英语(business english)是指商务场景下所应用到的英语,作为特殊目的英语(english for specific purpose)具有很强的专业性。商务英语跟普通英语(english for general purpose)最大区别之一就是专业词汇的大量使用,因此,词汇教学在商务英语教学中的作用不容忽视。语料库(corpus)是语言素材的集合体,能快速准确地提供诸如构词、搭配、语境等多方面的语料及信息。在外语学习中,语料库能够缩小课堂语言与真实语言的差距、培养学习者的语感和学习能力及研究能力,所以用语料库的方法来学习商务英语词汇既可以刺激学生的学习积极性,也可以更加准确、更加有效地掌握商务英语中专业特点较强的词汇。 1 语料库及其发展 语料库可以概述为运用随机抽样的方法,收集自然出现的连续的语言,运用文本或话语片断,并按照一定的语言学原则建成的具有

一定容量的语料体系。 语料库的发展大致经历了三个阶段:第一代语料库以20世纪60年代的brown corpus以及lob corpus为代表,由于是语料库发展的最初时期,所以规模都比较小,这个时期的语料库只能用来考查常用语言现象的频率,无法展现语言的全貌。第二阶段以20世纪80年代的birmingham collection of english language text以及longman/lancaster english为代表,这一时期的语料库建设以电子语料库的兴起为主要特征,语料库的容量不断扩大,种类不断增多。第三阶段从20世纪90年代至今,是语料库建设、研究与应用的迅猛发展阶段,功能更为强大的计算机系统软件的开发与应用致使第二代超大型计算机语料库开始出现,语料库进入了发展的黄金年代。 2 商务英语词汇及其特征 商务英语源于普通英语,并基于普通英语的基本语法、句法结构和词汇语,有普通英语的一些语言学特征。与此同时,作为应用在商务场合的英语,商务英语又是英语语言知识和商务专业知识的综合,因而又具有独有的专业特征。 2.1 在文体风格上,商务英语词汇属于庄重文体(frozen style)。庄重文体,即各体英语中正式程度最高的一种。这种“正式”一是为了在表达上追求准确、专业、标准化的效果,二是为了在思维上追求清晰和条理。许多商务词汇都表现出这一特性。

语料库语言学综合

语料库语言学基础知识 2008-09-11 01:45:34| 分类:学术|举报|字号订阅 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。 语料库建设中涉及的主要问题包括: (1)设计和规划:主要考虑语料库的用途、类型、规模、实现手段、质量保证、可扩展性等。 (2)语料的采集:主要考虑语料获取、数据格式、字符编码、语料分类、文本描述,以及各类语料的比例以保持平衡性等。 (3)语料的加工:包括标注项目(词语单位、词性、句法、语义、语体、篇章结构等)标记集、标注规范和加工方式。 (4)语料管理系统的建设:包括数据维护(语料录入、校对、存储、修改、删除及语料描述信息项目管理)、语料自动加工(分词、标注、文本分割、

语料库的应用(最终)

语料库的应用 语料库方法广泛应用于语言学理论研究、军事等领域。当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。 军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。 【一】、语料库成为语言学理论研究的基础资源 语料库是计算语言学的基础。语料库对应的英文是corpus,复数形式为corpora。这个词既可以指语料也可以表示语料库。英国语言学专家戴维?克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也

可作为验证语言假说的手段。计算机语料库是一大批机器可读文本的结集。各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。 起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。 我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。 目前国外已建成且较有影响的主要为以下的语料库:美国:布朗大学的今日美国英语标准语料库(The Brown University Standard Corpusof Present Day American English)、兰卡斯特一奥斯陆/卑尔根语料库(The Lancast-er-Oslo/Bergen (LOB) Corpus)、英语语库(TheBank of English)、英国国家语料库(The BritishNational Corpus(BNC、伦敦一隆德语料库(Lon-don -Lund Corpus(LLC》、美国传统中介语料(American Heritage Intermediate(AHI) Corpus)以及英语国际语料库(The Intemational Corpus ofEnglish(ICE》等。

语言学常用术语

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学 Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体

网络信息采集与处理

第3章网络信息采集与处理 1、以下哪些说法是错误的?(BC)(多选)p36 A、网络商务信息是指通过计算机网络传递的商务信息。 B、网络商务信息是指关于网络的商务信息。 C、网络商务信息是指通过网络传递的文字信息。 2、关于网络信息收集的说法中正确的是( C ) (1分) P36 A、网络信息的收集没有任何中间环节 B、网络信息的收集,无法保证信息的准确性 C、网络信息的收集,有效保证了信息的准确性 D、网络信息的收集是全免费的 3、以下哪个不是网络商务信息的特点?( A ) (1分) P36 A、收益大 B、便于存储 C、时效性强 D、准确性 高 4、由于网络信息更新及时、传递速度快,只要信息收集者及时发现信息,就可以保证信息的( C )(1分)P36 A、便于存储 B、方便性 C、时效性强 D、准确性高. 5、以下哪些说法是错误的?( CD )(多选) (2分) p36 A、免费商务信息主要是社会公益性的信息。P37 B、尽可能地减少信息流滞后于物流的时间,提高时效性,是网 络商务信息收集的主要目标之一。P37 C、加工筛选难度大,不便于存储是网络商务信息的特点。(查找) D、网络信息的收集,很少部分是通过搜索引擎找到信息发布源获得的。 6、关于网络商务信息,下列哪些说法是正确的?(多选)(BC) (2分)P36 A、使用网络载体,存储起来难度相当大,而且不易查找。 B、网络搜索引擎有效地保证了信息的准确性。 C、只有通过计算机网络传递的商务信息,才属于网络商务信息 的范畴。 D、由于网络信息更新及时、传递速度快,只息的实效性。 时效性 7、以下哪些说法是错误的?(多选)( ABD ) (2分) P36 A、免费商务信息约占信息库数据量的60%左右,是信息服务商 的主要服务范围。网络商务信息大部分属于这一范畴。 B、网络信息的收集,绝大部分是通过搜索引擎找到信息发布源 获得的。在这个过程中,减少了信息传递的中间环节,有效 地保证了信息的便于存储。 C、完整不是收集网络商务信息的基本要求之一。 D、网络商务信息的范畴其实仅仅指的是通过网络传递的商务过 程中买卖双方交流的信息。 8、以下哪些说法是正确的?(多选)( AB ) (2分)p36 A、网络商务信息与一般的商务信息的根本区别在于它们的传递 途径不同。 B、虽然网络系统提供了许多检索方法,但堆积如山的全球范围 各行各业的信息,常常ABD把企业营销人员淹没在信息的海 洋或者说信息垃圾之中。 C、目前通常以其信息量大小为标准,可以将网络商务信息分为 四个等级。以价格水平来看 D、网络信息的收集没有任何中间环节。 9、网络商务信息与一般的商务信息的根本区别不包括(ABD )。(多选)p36 A、它们的作用不同 B、它们的来源不同 C、它们的传递途径不同

相关文档
最新文档