Germanic language stemmers

合集下载

the history of English language英语语言发展历史

the history of English language英语语言发展历史

The industrial revolution
History of the English Language

The history of the English language really started with the arrival of three Germanic tribes who invaded Britain during the 5th century AD. These tribes, the Angles, the Saxons and the Jutes, crossed the North Sea from what today is Denmark and northern Germany. At that time the inhabitants of Britain spoke a Celtic language. But most of the Celtic speakers were pushed west and north by the invaders - mainly into what is now Wales, Scotland and Ireland. The Angles came from Englaland and their language was called Englisc - from which the words England and English are derived. • 英语真正的历史应该从公元5世纪时入侵英国的三个日耳曼部 落说起. 这几个部落分别是, 盎格鲁人, 撒克逊人,和朱特人,他 们从今天的德国北部和丹麦出发,然后横渡北海。那时候英国 的本地居民都说凯尔特语。但由于入侵者的逼迫,他们都被赶 到了西部和北部-主要是现在的威尔士,苏格兰和爱尔兰。盎格 鲁人来自 Englaland 他们的语言称为 Englisc (古英语) - 这两个 词就是现在England和English的前身。

German

German

魅力德语德语(Deutsch)印欧语系日耳曼语族西日耳曼语支下的一门语言。

德语共同标准语的形成可以追溯到马丁·路德的圣经翻译。

德语是1亿多人使用的母语。

它最初在德国、奥地利、瑞士北部、列支敦士登、卢森堡、意大利南提洛尔,比利时的一小部分地区,部分波兰地区和部分法国阿尔萨斯、洛林地区内使用。

另外,在德国的前殖民地内,例如纳米比亚拥有大量的说德语的人口,在东欧的一些国家中,仍有少量的说德语的少数民族。

德语是世界上最常被学习的外语(在欧洲常作为第二外语教学)之一。

在日本,医学的术语是德语,而不是拉丁语。

德语分类德语分为高地德语(Hochdeutsch)和低地德语(Plattdeutsch)。

高地德语是共同语,它采用了低地德语的某些发音规则,低地德语听上去更象英语和荷兰语。

通用的书面语以高地德语为准。

各方言之间的差异很大。

高地德语和低地德语的语言分界线大致从德国西北部的亚琛起,向东经过莱茵河畔的本拉特、卡塞尔、马格德堡直到奥得河畔的浮斯腾堡,这条线以南是高地德语,以北是低地德语。

高地德语(Hochdeutsch)是西日耳曼语(Westgermanisch),主要通用于德国(Deutschland)、奥地利(Oesterreich)、列支敦士登(Lichtenstein)、瑞士(Schweiz)和卢森堡(Luxemburg),也用于一些临近的地区,是现代德语的主体。

高地指阿尔卑斯山(Alpen)和临近的德国南部山区,在瑞士和卢森堡,“高地德语”一词特指标准德语。

低地德语三大体系东低地德语(Ostniederdeutsch),包括柏林(Berlin)、梅伦堡(Mecklenburg)等地区所使用的东、西普鲁士德语(Ost- und Westpreussisch)都是东低地德语的一种。

低地萨克森语(Niedersaechsisch),例如北美宾夕法尼亚州(Pessylvania)的德裔群体所使用的门诺低地德语Mennonite Plautdietsch,不来梅(Bremen)、杜塞尔多夫(Duesseldorf)等地使用的北莱因-威斯特法伦州(Nordrhein-Westfalen)、下萨克森州(Nidersachsen)、石勒苏益格-荷尔施泰因州(Schleswig-Holstein)绝大多数城市、以及荷兰东南部(Suedostniederlande)很多省的一部分。

韦尔伯施拉姆名词解释

韦尔伯施拉姆名词解释

韦尔伯施拉姆名词解释
韦尔伯施拉姆(Weber-施拉姆)名词解释:
韦尔伯施拉姆(Weber-施拉姆)是一种用于测量词汇量的标准化方法,于1924年由德国语言学家韦尔伯(H.Weber)和施拉姆(J.M.施拉姆)共同提出。

该方法基于两个标准,即韦氏词典(W作“单词”、W作“词组”)和汉斯·夏勒-汉斯·施拉姆词典(H作“单词”、H作“词组”)中的词汇量,通过比较两个词典中相同或相似的单词数量来确定一个单词的词汇量。

韦尔伯施拉姆方法的基本步骤如下:
1. 选择词汇量标准:选择两个词汇量标准,通常是常用的英语单词和短语以及常用的德语单词和短语。

2. 确定词汇量范围:根据词汇量标准,确定一个词汇量范围,通常是从0到1,000或500个单词。

3. 编写词汇表:根据词汇量范围和词汇量标准,编写一个词汇表,将所选的单词和词组列举出来。

4. 比较词汇表:将编写好的词汇表与韦氏词典和汉斯·夏勒-汉斯·施拉姆词典中的词汇进行比较,确定哪些单词属于同一词汇量范围。

5. 计算词汇量:根据词汇量标准,计算所选单词的词汇量。

韦尔伯施拉姆方法的优点是简单易行,适用于各种语言和词汇量范围,能够比较准确地测量词汇量。

缺点是词汇量标准不够严格,可能存在一些错误和局限性。

英语单词的起源和历史

英语单词的起源和历史

英语单词的起源和历史英语单词的起源和历史可以追溯到数千年前,经历了多个阶段的发展。

本文将简要介绍英语单词的起源、发展及其历史演变。

1. 盎格鲁-撒克逊时期(公元5-11世纪)英语的最早起源可以追溯到公元5世纪,当时盎格鲁-撒克逊人来到大不列颠岛,带来了他们的语言——古英语。

古英语是一种日耳曼语,与荷兰语、德语等有密切关系。

在这个阶段,英语词汇相对简单,主要涉及日常生活中的事物和自然现象。

2. 诺曼征服时期(公元11世纪)公元11世纪,诺曼人征服了法国北部的诺曼底地区。

他们的语言——古法语,对英语产生了深远的影响。

随着诺曼人征服英国,古法语成为统治阶级的语言,大量法语词汇进入英语,使得英语词汇变得更加丰富。

3. 中世纪英语(公元11-15世纪)在这一阶段,英语逐渐演变为中世纪英语。

随着文学作品的兴起,尤其是莎士比亚戏剧的出现,英语开始变得更加规范。

此外,由于与欧洲其他国家的交流日益密切,英语吸收了大量拉丁语和希腊语词汇。

4. 近代英语(公元16-18世纪)公元16世纪,英语开始进入近代阶段。

这一时期的英语以英王詹姆斯钦定的《圣经》英译本和莎士比亚戏剧为代表。

在此阶段,英语的词汇和语法结构发生了巨大变化,逐渐形成了现代英语的雏形。

5. 现代英语(公元19世纪至今)从19世纪开始,英语的书面语与现在我们所看到的基本上一致。

随着英国殖民地的扩张,英语吸收了来自其他语言的众多词汇,使得英语词汇更加丰富。

此外,科学技术的飞速发展、全球化进程的加速以及互联网的普及,都为英语词汇的拓展创造了条件。

总结:英语单词的起源和历史经历了古英语、中世纪英语、近代英语和现代英语四个阶段。

在这个过程中,英语不断吸收其他语言的词汇,逐步发展成为全球最通用的语言之一。

如今,英语词汇丰富多样,蕴含着世界各地的文化和知识。

了解英语单词的起源和历史,有助于我们更好地学习和使用这一世界语言。

德语第二外语

德语第二外语

德语(第二外语)Germany(Second Foreign Language for English Students)一、基本信息课程代码:(1)2020250课程学分:4面向专业:英语专业本科课程性质:院级选修课开课院系:外国语学院使用教材:主教材:《新编大学德语》,朱建华主编,外语教学与研究出版社,2010参考教材:无先修课程:无二、课程简介第二外语(德语)是为英语专业学生开设的一门院级选修课。

该课程旨在通过讲授德语基础的语音、语法、听说、写等内容,用简明、有趣、实用的学习方法使学员具备德语最基本的听说读写能力,使英语系的学生能掌握德语二外,这对他们今后就业都有帮助。

三、选课建议该课程适合英语系和日语系二年级的学生。

五、课程学习目标语音部分:从基础的语音部分开始讲起,在教授学生发音的过程中,不仅使学生掌握德语发音规则,还将以发音规则为练习,掌握基本的问候用语。

语法部分:在初级阶段要求学生掌握简单句的基本语法变化和使用原则。

听说部分:听说部分以德国的实际生活场景为内容,全面培养学生听力能力和会话表达能力,并与语法部分相结合,做到真正的融会贯通。

两学期后达到《欧洲语言共同参考框架》A1.1的水平。

六、课程内容Einheit 1Teil1 -Teil4:语音部分:从基础的语音部分开始讲起,在教授学生发音的过程中,不仅使学生掌握德语发音规则,还将以发音规则为练习,掌握基本的问候用语。

能力要求:知道,运用。

Einheit 2Text & Grammatik:语法部分:冠词和名词第一格、人称代词第一格、弱变化动词现在时、动词“是”现在时、尊称命令式、句子类型和语序。

课文部分:掌握交际意向“自我介绍与介绍别人”。

能力要求:知道,理解,运用,Einheit 3Text & Grammatik:语法部分:强变化动词现在时、冠词和名词第四格、人称代词第四格、基数词。

课文部分:了解德国的学生生活,交际意向”时间提问和回答”。

英语的发展史(中英文版)

英语的发展史(中英文版)

一种民族语言(包括词汇)的发展与民族的历史密切可关。

要了解英语语汇的发展史,不可避免地跟整个英语的发展史,乃至英国的历史密不可分。

不列颠群岛的最早居民是凯尔特人,又称不列颠人。

公元前55年,罗马人在凯萨大帝的率领下侵入不列颠群岛,凯尔特人被罗马人赶入威尔士和苏格兰的深山之中。

直到公元410年,罗马占领时期才告结束。

随后,来自德国北部平原的三个日耳曼部落盎格鲁人,撒克森人和朱特人开始来到不列颠定居。

英语就是盎格鲁—撒克森人的语言。

语言史学家一般把英语的历史分为三个时期:1、古英语时期,2、中古英语时期,3、现代英语时期。

1、古英语时期(又称盎格鲁-萨克森时期公元450—1100年)日尔曼部落在不列颠定居后,名自占领一些地区。

盎格鲁人占领了泰晤士河以北的英格兰的大部分地区和苏格兰的低地,朱特人占领了肯特郡一带地区,撒克森人占领了泰晤士河以南的大部分地区。

各个部落建立了一些小王国,出现了英国历史上的七国时代。

直到公元830年,阿尔弗雷德大王才统一了整个英格兰地区。

由于全国长期没有统一,所以古英语时期存在着多种方言,主要方言有四种:西萨克森语,肯特语,莫西亚语和北恩布里亚语。

这四种方言都曾一度占主导地位。

西撒克森语保存下来的手搞最多。

其它方言在形成英语的过程中也起过很重要的作用。

古英语的词汇有着浓厚的日尔曼语族的特点。

这主要表现为复合法是重要的构词方法。

复合词在古英语词汇中占有显著的地位。

据统计,在史诗《贝奥武夫》3183行诗句中,竟有1069个复合词。

有些复合词中不重读部分,渐渐失去了独立地位,而演变成了词缀,如for-, in-, -ful 等派生法在古英语中也广泛使用。

共有二十四个名词后缀、十五个形容词后缀,-dom, -hood, -ship, -ness, -the, -ful,- ish 等词缀都可溯源到古英语时期。

古英语时期的诗歌有一种特殊的修辞手法,即头韵(alliteration),由此产生的许多短语一直保留到现在,如night and main, friend or foe, a labour of love。

第二外语(德)课程教学大纲

第二外语(德)课程教学大纲

x3100163第二外语(德)课程教学大纲课程名称:第二外语(德)英文名称:German as the second foreign language for English majors 课程编号:x3100163学时数:192其中实验(实训)学时数: 0 课外学时数:0学分数:12.0适用专业:英语一、课程的性质和任务第二外语(德)课程的教学对象是英语专业(二年级、三年级)本科学生,为学科专业必修课。

本课程的教学任务是教授德语听、说、读、写、译的基本理论和基础知识,重点打好学生的语言基础。

同时兼顾训练各种技能,培养其具有一定的德英对比的语言学习能力。

第二外语教学目的还包括提高学生的文化素养,培养其交际意向的理解及表达,同时重视其跨文化交际素养的培养,以适应社会发展和经济建设的需要。

为其今后获取所需的信息及进一步提高德语水平或参加各类德语考试,打下语言基础。

二、课程教学内容的基本要求、重点和难点第一学期:1.语音部分基本要求:熟练读出单词及简单句子重点与难点:发音、音节、句型、语序2. 熟练掌握:词汇、语法、重点与难点:弱变化动词的变位,名词、人称代词及物主代词的第一和四格3. 熟练掌握:词汇、语法、练习要素重点与难点:强变化动词的变位及名词、代词的第三格4. 熟练掌握:词汇与语法、练习要素重点与难点:命令式及支配三格和四格的介词5. 熟练掌握:词汇、语法、练习要素重点与难点:从句的特征及用法6. 词熟练掌握:词汇、语法、练习要素重点与难点:情态动词的用法7. 熟练掌握:词汇、语法、练习要素重点与难点:情态动词的用法、形容词的变化8. 熟练掌握:词汇、语法、练习要素重点与难点:过去式的构成第二学期:9. 熟练掌握:词汇、语法、练习要素重点与难点:名词和代词的第二格、不带zu的不定式10. 熟练掌握:词汇、语法、练习要素重点与难点:带zu的不定式及ohne … zu, statt…zu结构11. 掌握基础的词汇、语法、练习要素重点与难点:被动态、过程被动态及无人称被动态12. 掌握基础的词汇、语法、练习要素重点与难点:关系代词及关系从句、13. 掌握基础的词汇、语法、练习要素重点与难点:代副词、时间从句及条件从句14. 掌握基础的词汇、语法、练习要素重点与难点:将来时的构成、形容词和副词的升级及用法15. 掌握基础的词汇、语法、练习要素重点与难点:时间、比较、结果从句第三学期:16. 掌握基础的词汇、语法、练习要素重点与难点:时间从句、haben...zu..., scheinen...zu...,sein...zu...结构、动词构成17. 掌握基础的词汇、语法、练习要素重点与难点:让步从句、方式从句、左置和右置定语18. 掌握基础的词汇、语法、练习要素重点与难点:目的从句、情况从句19. 掌握基础的词汇、语法、练习重点与难点:第一分词及第二分词的用法20. 掌握基础的词汇、语法、练习要素重点与难点:第二虚拟式的构成、非现实条件句21. 掌握基础的词汇、语法、练习要素重点与难点:第一虚拟式的构成、间接引语三、教学方式及学时分配第二外语(德)为英语专业高年级学生的专业必修课;共分三个学期授课,总计192学时。

英语概说-英语的起源发展、特征和重要性

英语概说-英语的起源发展、特征和重要性

英语概说
目录
一英语的起源和发展
二英语的特征
三英语的重要性
一英语的起源和发展
英语是盎格鲁-萨克逊人的民族语。

它和德语、瑞典语还有很多其它语言同属于印欧语系(Proto Indo-European, Spoken about 6000 years ago)的日耳曼西部语支(Proto Germanic, Spoken around 500 B.C.E.)。

英语的形成大约是从公元五世纪开始的。

它是在大约1500年的漫长历史过程中世世代代经过口耳相传发展起来的。

期间经历过一些重要的变化。

古英语(Old English)属于日耳曼语族(Germanic Language Family)在公元五世纪和六世纪通过盎格鲁人(Angles)、萨克逊人(Saxons)和朱特人(Jutes)逐步传入不列颠群岛,并逐步演化为盎格鲁-萨克逊语(Anglo-Saxon Language)。

公元8世纪-11世纪,维京人(Viking)入侵不列颠,给古英语融入古北欧语(Old Norse)词汇。

大部分英语单词是在1066年诺曼人(Norman)征服英格兰时传入的。

诺曼人征服了英格兰并成为了统治阶级以后,把大量的法语和拉丁语词汇融入了当地的英语。

所以现代英语与拉丁语衍生(Latin-derived)的罗曼语(Romance Language)比如西班牙语和法语有许多相似的单词。

二英语的特征
英语有三个重要的特征。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Germanic language stemmers
Despite its inflexional complexities, German has quite a simple suffix structure, so that, if one ignores the almost intractable problems of compound words, separable verb prefixes, and prefixed and infixed ge, an algorithmic stemmer can be made quite short. (Infixed zu can be removed algorithmically, but this minor feature is not shown here.) The umlaut in German is a regular feature of plural formation, so its removal is a natural feature of stemming, but this leads to certain false conflations (for example, sch?n, beautiful; schon, already).
By contrast, Dutch is inflexionally simple, but even so, this does not make for any great difference between the stemmers. A feature of Dutch that makes it markedly different from German is that the grammar of the written language has changed, and continues to change, relatively rapidly, and that it has assimilated a large and mixed foreign vocabulary with some of the accompanying foreign suffixes. Foreign words may, or may not, be transliterated into a Dutch style. Naturally these create problems in stemming. The stemmer here is intended for native words of contemporary Dutch.
In a Dutch noun, a vowel may double in the singular form (manen = moons, maan = moon). We attempt to solve this by undoubling the double vowel (Kraaij Pohlman by contrast attempt to double the single vowel). The endings je, tje, pje etc., although extremely common, are not stemmed. They are diminutives and can significantly alter word meaning.
A note on compound words
Famously, German allows for the formation of long compound words, written without spaces. For retrieval purposes, it is useful to be able to search on the parts of such words, as well as the on the complete words themselves. This is not just peculiar to German: Dutch, Danish, Norwegian, Swedish, Icelandic and Finnish have the same property. To split up compound words cannot be done without a dictionary, and the purely algorithmic stemmers presented here do not attempt it.
We would suggest, however, that the need for compound word splitting in these languages has been somewhat overstated. In the case of German:
1) There are many English compounds one would see no advantage in splitting,
blackberry blackboard rainbow coastguard ....
Many German compounds are like this,
Bleistift (pencil) = Blei (lead) + Stift (stick)
Eisenbahn (railway) = Eisen (iron) + Bahn (road)
Unterseeboot (submarine) = under + sea + boat
2) Other compounds correspond to what in English one would want to do by phrase searching, so they are ready made for that purpose,
Gesundheitspflege = ‘health care’
Fachhochschule = ‘technical college’
Kunstmuseum = ‘museum of fine art’
3) In any case, longer compounds, especially involving personal names, are frequently hyphenated,
Heinrich-Heine-Universit?t
4) It is possible to construct participial adjectives of almost any length, but they are little used in contemporary German, and regarded now as poor style. As in English, very long words are not always to be taken too seriously. On the author's last visit to Germany, the longest word he had to struggle with was
Nasenspitzenwurzelentzündung
It means ‘inflammation of the root of the tip of the nose’, and comes from a cautionary tale for children.。

相关文档
最新文档