数字环境下通用概念获取方法

合集下载

数字化环境下提高小学数学课堂教学有效性探究

数字化环境下提高小学数学课堂教学有效性探究

数字化环境下提高小学数学课堂教学有效性探究摘要:在数字化环境下,提高小学数学课堂教学的有效性对于学生的学习成绩和未来发展具有重要意义。

本文从数字化技术的角度出发,探讨了如何利用数字化工具和资源提高小学数学课堂教学的有效性。

在教学中,教师需要对影响课堂有效性的因素进行分析,从而采取针对性措施,重塑课堂教学模式,以此让学生形成终身学习习惯,从而促进学生数学核心素养的发展。

关键词:数字化技术;小学数学;课堂教学;有效性随着科技的不断发展,数字化技术已经深入到各个领域,教育领域也不例外。

数字化技术已经成为老师们在课堂上不可或缺的一种辅助工具,每一门课程的老师们都希望利用网络信息的便利性、丰富性、灵活性和发展性,来对自己的课堂进行优化,让课堂的氛围变得生动起来,激发学生的学习激情,让学生能够在课堂上保持很高的积极性,从而获得更多的收益,提升学生的学习效率[1]。

小学数学作为基础教育的重要学科,对于学生的未来发展具有重要影响。

而数字化技术的应用可以提高小学数学课堂教学的有效性,帮助学生更好地掌握知识和技能。

一、数字化技术的优势(一)增强课堂互动性数字化技术可以增强课堂的互动性。

通过使用数字化工具和资源,教师可以为学生提供更加生动、形象的学习体验,使学生更加积极地参与到课堂中来。

如,利用多媒体课件进行教学,可以让学生更加直观地了解数学知识,同时也可以通过互动游戏等方式增强学生与教师之间的互动[2]。

此外,数字化技术还能支持学生在课堂上进行实时反馈和讨论,从而更好地促进课堂互动。

此外,数字化技术还可以为学生提供更多的自主学习和合作学习机会。

例如,可以让学生通过在线学习平台进行自主学习,还可以通过社交媒体和互动学习软件等工具进行合作学习。

这些机会可以让学生更加主动地参与到学习中来,增强学生的学习积极性和效果。

(二)促进个性化学习每个学生都有不同的学习需求和学习风格,传统的教学方法往往难以满足所有学生的需求。

而数字化技术可以针对学生的不同需求和学习风格进行个性化教学,从而提高学生的学习效果[3]。

网络环境下“复制发行”概念的解释与适用

网络环境下“复制发行”概念的解释与适用

网络环境下“复制发行”概念的解释与适用颜美宁【摘要】《刑法》第二百一十七条“复制发行”的概念应随着技术和时代的发展而不断调整.首先,数字化时代的“复制发行”不应固守印刷术时代“有形载体”的要件;其次,应支持司法解释将“复制发行”理解为“复制、发行或者既复制又发行”的做法;最后,刑法解释具有独立性,将“信息网络传播行为”视为“复制发行”既是实践的需要,也没有超出国民预测可能性.【期刊名称】《天水行政学院学报》【年(卷),期】2019(020)004【总页数】5页(P90-94)【关键词】复制发行;网络传播【作者】颜美宁【作者单位】中南财经政法大学,湖北武汉430073【正文语种】中文【中图分类】D925.2一、提出问题网络技术的更新换代,使相关犯罪也悄然发生变异和升级。

然而,刑事立法、刑法理论形成于传统社会,原本与网络没有任何关系,许多具体概念也难以适用于网络犯罪[1]。

以侵犯著作权罪为例,生成于印刷术时代的“复制发行”概念,在解释网络空间中异化的著作权侵权行为时往往捉襟见肘。

具体而言,有以下三种挑战:第一,BT 下载。

BT 又叫比特流,是一种内容分发协议,其工作方式为:分配器或者文件持有者将文件发送给其中一名用户,再由这名用户转发给其他用户,用户之间相互转发自己所拥有的文件部分,直到每个用户的下载都全部完成。

那么,BT 技术是否可以为“复制发行”行为所容纳呢?第二,深度链接,即绕过被链网站首页直接链接到分页的链接方式是否可以解释为发行行为。

第三,外挂程序。

外挂因改变软件的部分程序为游戏玩家作弊而为大众知悉,如今已渗透于各种直播平台、微信抢红包等领域。

那么,外挂对计算机程序的修改是否属于复制发行行为呢?针对上述著作权侵权行为,学界众说纷纭。

有学者主张对复制发行概念予以扩张解释,从而将新的著作权侵权行为纳入刑法规制[2]。

有学者持谨慎态度,认为“刑罚之运用不可不慎,国家决定某种不法行为应受刑罚制裁,首先考虑制裁所生之害,与不加制裁所生之害,孰轻孰重”[3]。

数字学术环境下大学图书馆信息素养教育研究——以美国大学图书馆数字学术服务为例

数字学术环境下大学图书馆信息素养教育研究——以美国大学图书馆数字学术服务为例

●收稿日期:2022-05-22数字学术环境下大学图书馆信息素养教育研究———以美国大学图书馆数字学术服务为例盛兴军1,徐 滕2(1 上海大学图书馆,上海 200444;2 上海大学文化遗产与信息管理学院,上海 200444)摘 要:随着数字学术环境的变化,信息素养教育亟需变革。

结合《高等教育信息素养框架》内容,以美国10所大学数字学术服务研究机构开展的信息素养教育为典型案例,通过文献调研和网络调查,探讨美国大学图书馆利用数字学术服务开展深度信息素养教育的特点和实践经验,为我国大学图书馆在数字学术环境下的信息素养教育提供借鉴。

关键词:数字学术;大学图书馆;信息素养;数字学术服务中图分类号:G252 文献标识码:A 文章编号:1003-7136(2023)03-0055-08ResearchonInformationLiteracyEducationinUniversityLibrariesunderDigitalScholarshipEnvironment:CaseStudyofDigitalScholarshipServicesinAmericanUniversityLibrariesSHENGXing jun,XUTengAbstract:Withthechangeofdigitalscholarshipenvironment,informationliteracyeducationisinurgentneedofre form BasedonthecontentofFrameworkforInformationLiteracyforHigherEducation,thispapertakestheinfor mationliteracyeducationcarriedoutbydigitalscholarshipservicesinstitutionsintenAmericanuniversitiesasatypicalcase,anddiscussesthecharacteristicsandpracticalexperiencesofAmericanuniversitylibrariesusingdigit alscholarshipservicestocarryoutin depthinformationliteracyeducationthroughliteratureresearchandnetworksurvey,soastoprovidereferencefortheinformationliteracyeducationinthedigitalscholarshipenvironmentofu niversitylibrariesinChinaKeywords:digitalscholarship;universitylibrary;informationliteracy;digitalscholarshipservice1 数字学术环境的形成与信息素养教育新需求大数据时代,信息资源数据化程度日益加深。

数字化学习环境下的教学评价研究

数字化学习环境下的教学评价研究

数字化学习环境下的教学评价研究随着科技的不断发展,数字化技术已经深入到人们的生活中的方方面面,尤其是在教育领域,数字化学习环境已经成为了教学中不可或缺的一部分。

在数字化学习环境下,评价教学效果以及学生学业水平的方式也在发生着变化。

本文将探讨数字化学习环境下的教学评价研究。

一、数字化学习环境的概念数字化学习环境是指利用现代化科技手段,将传统的教学手段与数字技术相结合,使得教育和学习可以在任何时间、任何地点实现的教学环境。

它使得教育可以更加灵活,便利,而且信息的交流速度也得到了大大的提升,阅读、学习的方式也得到很大的扩展。

数字化学习环境的普及,不仅使得学习变得更加便利,更方便了教师教学。

在数字化学习环境下,教师可以更加便利地管理学生的学习档案、安排学生的学习任务、评价学生的学业水平,而且还可以更加快速地获取学生的学习动态,教学方法得到了很大的拓展,为教学评价提供了更多的手段和策略。

二、数字化学习环境下教学评价的意义教学评价是对教师和学生教学过程和结果进行判断、分析和归纳的过程,可以帮助教师更好地掌握教学进度、了解学情,同时也可以及时发现学生存在的问题,以便及时进行针对性的辅导和指导,提高学生的学习成绩。

而在数字化学习环境下,教学评价的方式和方法也随之发生了变化,数字化教学环境下的教学评价,不仅可以更加直观、准确地评价学生的学科水平,而且还可以更加灵活地调整和优化教学过程,满足差异化的教育需求。

三、数字化学习环境下的教学评价模式和方法1.基于数据挖掘技术的评价方法通过教育大数据分析的方法,挖掘出学生的学习过程和模式,对学生在学习中的口头表现、图像、视频和文本信息进行数据分析和挖掘,从而获取学生在学习过程中的不同维度的信息。

这种评价方法可以更好地把握学生的学习情况,发现学生存在的问题,解决学生学习遇到的挑战。

2. 基于人工智能技术的评价方法在数字化学习环境下,人工智能技术在教学领域中的应用越来越广泛,通过基于人工智能技术的评价方法,能更加自然地模拟学生与教师之间的交互过程。

《中国图书馆分类法》(第5版)通用复分表修订评介

《中国图书馆分类法》(第5版)通用复分表修订评介

《中国图书馆分类法》(第5版)通用复分表修订评介周冰【摘要】最近出版的<中国图书馆分类法>(第5版)对通用复分表进行了重大修改:在原"通用时间、地点表"中新增环境表及人员表,加强了分类法对文献信息的分面揭示,但作为独立的、不同的分面,环境表及人员表单独设置更为合适;采用增补新类目、规范类名、增加类目注释、增设参见等方式,对复分表进行了充实和完善.尚存在缺少语种表及人物资料类型表、通用概念类目设置不当的问题,未能解决同一国家文献集中等问题.【期刊名称】《科技与经济》【年(卷),期】2010(023)006【总页数】3页(P94-96)【关键词】复分表;中图法;分类法修订【作者】周冰【作者单位】河海大学图书馆,南京,210098【正文语种】中文10年前出版的《中国图书馆分类法》(以下简称《中图法》)(第4版)曾对通用复分表做过重要修订[1]。

随着信息环境的日益数字化和网络化,与国外的分类法如《杜威十进分类法》(DDC)、《国际十进分类法》(UDC)等相比,《中图法》越来越不能满足网络环境下各种信息分类的需要。

网络环境下的数字信息分类,大多采用主从分类体系、多重分类体系并列的模式,如把按照学科主题划分的分类体系作为主分类体系,把面向对象、区域、资源类型、语种等的分类体系作为辅助,主从结合,交替使用。

通用复分表实质为文献分类法提供了除学科主题外的对象、区域、资源类型等信息内容和表现形式的若干组面,因此,分类法修订中,应把复分表的修订列为传统分类法分面改造是适用于数字环境的一项重要措施[2]。

最近,《中图法》出版了第5版,现对其通用复分表的修订特色与存在的问题予以简要的评介。

1 新复分表的增设《中图法》(第5版)在“通用时间、地点表”中增设了环境类目及人员类目,同时将“通用时间、地点表”改为“通用时间、地点和环境、人员表”。

1.1 新增环境表环境复分表最早是由阮冈纳赞在《冒号分类法》(CC)中提出设置的[3]。

儿童数字概念

儿童数字概念

儿童数字概念数字在我们日常生活中扮演着重要的角色。

对儿童来说,数字是他们认识世界、理解数学和进行计算的基础。

本文将探讨儿童数字概念的发展,并为家长和教育者提供一些建议,以帮助儿童建立牢固的数字概念。

一、数字认知的发展阶段1. 基础数字理解(2-3岁):幼儿开始能够认识一些简单的数字,如1、2、3,并理解它们代表数量。

他们可能会在数数方面有一些困惑,但是他们能够从周围环境中识别数字的存在。

2. 数量概念(4-5岁):幼儿在这个阶段开始学习更多的数字,并能够将它们与实际物体相联系。

他们学会了数数,能够逐渐认识到数字递增的规律,比如1、2、3等。

同时,他们能够进行简单的加法和减法计算。

3. 数字顺序和排序(6-7岁):在这个阶段,儿童能够理解数字的顺序以及数字之间的关系。

他们开始学习数字的大小比较,能够将数字进行排序,并能够通过加法和减法计算更复杂的数学问题。

4. 多位数和运算(8-9岁):随着年龄的增长,儿童开始学习更高位数的数字,并能够进行更复杂的数学运算,如乘法和除法。

他们能够理解和应用数字概念以解决实际问题。

二、帮助儿童建立数字概念的方法1. 创造数字学习环境:在家庭和学习环境中,为儿童提供丰富多样的数字学习资源。

这可以包括数字卡片、玩具计数器、数字拼图等。

通过让儿童与数字相关的材料互动,他们能够更好地理解数字的概念。

2. 玩数字游戏:利用游戏的方式帮助儿童学习数字。

例如,玩掷骰子游戏可以让他们练习数数和识别数字。

数学拼图游戏可以帮助他们理解数字的排序和关系。

3. 实际运用数字:在日常生活中,鼓励儿童进行数字运算。

例如,在购物时让他们帮忙计算物品的价格,或者在做饭时让他们参与食材的计量。

通过与实际情境结合,儿童能够更好地理解数字的实际应用。

4. 赞扬和激励:当儿童在数字学习方面取得进步时,及时给予肯定和鼓励。

这将激发他们的学习兴趣和自信心,并促使他们更积极地参与数字学习。

三、家长和教育者的角色家长和教育者在儿童数字概念的发展中起着关键作用。

数字环境下科学交流模型的分析与评述

数字环境下科学交流模型的分析与评述作者:孙玉伟来源:《大学图书馆学报》2010年第01期摘要详细介绍数字环境下国外具有代表性的几种科学交流模型,包括Hurd模型、Sondergaard模型、SCLC模型、arXiv的路径模型。

在此基础上,从研究角度、研究内容、研究方法、研究的深度和广度方面对4个模型进行对比分析和客观评述,指出4个模型的不同点和共同之处,最后对数字时代科学交流模型的进展做出展望。

关键词数字化科学交流模型开放获取从米哈伊洛夫在1976年出版的《科学交流与情报学》提出科学交流包括正式和非正式交流过程以来,国外一些有代表性的数字化科学交流模型也相继提出。

近年来随着开放获取运动的开展,科学交流的模式也发生了巨大变化,基于开放获取的数字化科学交流模型也在蓬勃发展之中。

1国外几种数字化科学交流模型的介绍1.1Garvey-Griffith模型的数字化改进——Hurd模型20世纪70年代,社会学家William Garvey和Belver Griffith断言:“交流是科学的本质”,并基于心理学领域的研究提出了科学交流模型——Gar-vey-Griffith模型,此模型描述了科学交流从原始的研究到研究成果发布的详细过程,在时间跨度上,不同的学科会有所不同,但本质核心的阶段是通用的。

考虑到数字环境对科学交流带来的变化,美国学者Julie M.Hurd从20世纪90年代针对互联网上出现的电子邮件、列表服务器以及电子出版物等数字化要素,重新对Garvey-Griffith模型提出的科学交流过程进行数字化改进,并于2004年把互联网上出现的自存档和机构库也纳入思考范围,提出了2020的学术交流模型,称为Hurd模型,如图1所示。

Hurd模型将数字信息链中出现的一系列现象纳入了思考范围:Internet上预印本服务器和机构仓储库的增多;集成商在数字图书馆与出版商之间发挥越来越大的作用;电子档案长期保存的需求。

第02课 使用数字设备 (教案)2024-2025学年五年级上册信息技术人教版

第二课使用数字设备一、教学目标1.学生能够清晰地阐述计算机硬件的组成部分(如主机、显示器、键盘、鼠标等)及其主要功能,理解计算机软件的分类(系统软件和应用软件)和作用,熟练掌握计算机的开机、关机、鼠标操作等基本操作。

2.学生能够准确说出平板计算机的特点(如便携性、触摸操作等),熟悉其常用的功能按钮和接口,熟练掌握平板计算机的解锁、屏幕操作、应用程序打开与关闭等基本操作技能。

3.学生能够列举出正确、规范使用数字设备的要点(如保持适当距离、控制使用时间等),辨别常见的不规范使用行为(如过度沉迷、在不安全的网络环境下操作等)及其可能带来的危害(如视力下降、网络诈骗等),并在日常使用中养成良好的习惯,如定期清理设备、注意设备的存放环境等。

4.学生能够根据给定的生活需求(如查询旅游景点信息、寻找学习资料等),选择合适的在线搜索工具(如百度、谷歌等搜索引擎,或特定的专业网站),输入准确有效的关键词,快速获取有用的信息和资源,并能对获取的信息进行初步的筛选和整理。

5.学生能够说出信息的常见来源(如网络、书籍、电视等),理解信息在解决问题、辅助决策、丰富知识等方面的重要作用,提高对信息价值的认识。

二、教学重点与难点教学重点1.详细讲解计算机硬件的各个组成部分及其功能,通过实际操作让学生熟练掌握计算机的基本操作。

2.全面介绍平板计算机的特点和常用操作技能,通过实践让学生能够熟练运用。

3.重点强调正确、规范使用数字设备的重要性和方法,培养学生良好的使用习惯。

教学难点1.以简单易懂的方式帮助学生理解计算机系统软件和应用软件的区别及协同工作原理。

2.引导学生根据不同的生活需求和情境,灵活选择最有效的在线搜索方式和准确的关键词,提高信息获取的效率和质量。

3.如何让学生在长期的使用过程中始终保持规范使用数字设备的意识,并将良好的习惯内化为自觉行为。

三、教学准备1.每个学生一台计算机、一台平板计算机。

2.制作包含计算机软硬件结构、平板计算机操作演示、正确使用数字设备规范、在线搜索技巧及案例等内容的多媒体课件。

《信息化能力建设》填空、选择、判断、简答

1需的密钥和证书管理体系。

P1252病和诊疗过程的病历资料,是以电子化方式管理的有关病患个人健康状态和医疗保健行为的信息,它涉及了病人信息的采集、存储、传输、处理和利用的所有过程信息。

(填空)P2293P1544序地固化于载体的表面,组成密集二维份子罗列,然后与已标记的待测生物样品中的靶份子杂交,通过特定的仪器检测分析,从而得到靶份子的数量。

(填空)P2245分共享的资源集成,其中与教育、教学相关的资源就称之为网络教育资源。

P 2176 Twitter,这是一个成立于2022 年的美国微博网站。

(填空)P2547 (填空)P2708 、P19 、软件及相关数据,使之不因为偶然或者恶意侵犯而遭受破坏、更改及泄露,保证信息系统能够连续、可靠、正常地运行。

(填空)P1021011 P912通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换。

P5713、按工作流程中基本环节分类,信息技术可分为信息获取技术、信息技术、信息存储技术、信息加工技术及信息技术。

(填空)P1314、从产生的角度看,信息化层次包括信息产业化与信息化、产品信息化与企业信息化、信息化和社会生活信息化。

P515、从内容层次看,信息化内容包括层、支撑层、应用层与层等几个方面。

P516 、电子政务安全原则是安全、成本、的权衡。

P14617 、根据多级安全模型,通常将信息的密级由低到高划分为秘密级、级和绝密级。

P12318、根据信息源的差异,采集的信息可分为原始信息和信息。

P8019 、顾名思义,就是物物相连的互联网。

P27020、建设信息系统所需要的人员有两大类:一类是管理人员,另一类是人员。

P7621 、教育信息化包含六个组成要素:、信息网络、信息技术应用、信息技术和产业、信息化人材、信息化政策、法规和标准。

P20922、两化融合是指化与化。

P18523、所谓教育,是指在教育领域全面深入地运用计算机多媒体技术和网络信息技术,以现代信息技术来促进教育的全面改革,使之适应信息化社会对教育发展的新要求,最终实现教育现代化的过程。

三部分数字时代消费者价值观生活方式及消费行为

体成员得出的自我描述,它是社会学、文化人类学等研究的对象。
• 社会认同理论认为:身份的确认和认同,是人的社会存在和作为社会 人的一个重要依据和标志。
• 个体通过社会分类,对自己的群体产生认同,并产生内群体偏好和外 群体偏见。
消费成为阶层身份认同表达的符号和象征
• 理解文化的符号和象征有利于制定有效的营销传播策略:
一、消费者研究的理念和方法
消费者研究,即消费市场研究
指在对市场环境(政治、法律、社会、文化、技术)、人口特征、 生活方式、经济水平等基本特征进行研究的基础上,运用各种市场调 研技术和方法,对消费群体通过认知、态度、动机、选择、决策、购 买、使用等阶段实现自身愿望和需要的研究。
—— 消费者人口统计分析 —— 消费群行为分析:生活态度、价值观 —— 消费者购买动机:对品牌认知(本品牌和竞争品牌)
家庭、家庭决策与营销策略
家庭结构
家庭生命 周期阶段
家庭购买 与决策过程
家庭决策 依据
营销策略
(3) 社会角色和地位
每个人在各群体中的位置可以用角色和地位来确定。 角色是一个人所期望的活动内容,而每一个角色都伴随着 一种地位。
(4) 意见领袖
信息是营销者用以影响消费者行为的基本工具。 虽然信息最终是由个人加工和处理的,但在大多数情况下, 群体内会有人为他人过滤、解释或提供信息。
网络舆论分析: 比如:寻找“网络话语形成与传统媒体信息发布的关联规则”
“网络话语形成与网络意见领袖的关联规则”等
二、影响消费者购买行为的四大因素
1、文化因素 2、社会因素 3、个人因素 4、心理因素
影响消费者购买行为的四大因素(1):文化因素
1) 文化
(Culture )
2) 亚文化 ( Subculture)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概念的获取与分类是知识组织体系构建的重要工 作。例如,叙词表 的 选 词 主 要 由 普 通 名 词 与 专 有 名 词 构成 [1],普通名词 主 要 包 括 具 体 事 物 名 称 和 抽 象 事 物 名称,具体事 物 名 称 例 如 “海 洋 ”,抽 象 事 物 名 称 例 如 “铸造”;专 有 名 词 通 常 为 人 名、地 名、产 品 名 等,例 如 “孙中山”。在本体 构 建 中,概 念 词 汇 与 实 例 词 汇 也 是 本体构建的主要成分[2-3],例如,可以用“城市”代表一 个概念,而“北京 市 ”则 是 一 个 实 例。 在 所 有 这 些 概 念 词汇的研究中,通用概念具有一定的特征和应用价值, 数量上也占 有 一 定 的 份 额。无 论 是 综 合 叙 词 表,还 是 专业叙词表,通常都有一个单独的通用概念范畴,有的 叙词表命名为一般概念,有的叙词表命名为通用词,这 些词例如“研究”、“设计”、“应用”等,是在不同专业都 有应用的泛指词,在概念组配方面有重要价值 。 [4] 在 国内图书馆学、情报学领域相关机构及领域专家的参 与下,中国科学技术信息研究所 2009年启动了《汉语 主题词表》(工程 技 术 版 )的 编 制 与 修 订 工 作,通 用 概
2 基于词频分布人工获取通用概念
首先观察一个具体的例子,“设计”是一个公认的 通用概念,以 “设 计 ”作 为 关 键 词 检 索 万 方 数 据 [9],在 “工业技术”类文献下,检索结果如截图 1所示:
图 1 关键词“设计”在工业技术类文献中的词频分布 从图 1可以看出,“设计”一词作为关键词,出现在 所有工业技术下的二级类目中,而且词频数量巨大,对 应的文献量巨大,有典型的通用概念 特征。使用 “水 库”一词进行 检 索,在 “工 业 技 术 ”类 下 检 索 结 果 如 截 图 2所示:
SomeMethodsofObtainingGeneralConceptsinDigitalEnvironment ChangChun LaiYuangen
InstituteofScientificandTechnicalInformationofChina,Beijing100038
〔Abstract〕Intheconstructionofthesauri,ontologiesandotherknowledgeorganizationsystems,toobtaingeneralconceptsisneeded. Thepaperintroduces3methodstoobtaingeneralconcepts.Thefirstistoreuseoldgeneralconceptsintraditionalknowledgeorganiza tionsystems;Thesecondistoobtaingeneralconceptswithdistributionsofkeywordsintheliterature;andthethirdisbasedonkey wordsfrequencyandstandarddeviationtoobtaingeneralconcepts.Theabovethreemethodshavetheirowncharacteristicsanduseness domain,basedontheprojectsituation;thesemethodscanbeusedaloneorincombination. 〔Keywords〕thesaurus ontology generalconcept standarddeviation keywordsfrequency
表 1 在 16个文献类目均有分布的关键词词频与标准差
词汇有频率 设计 故障排除 故障 可靠性设计 微观结构 统计 参数估计 分散 单片机 可视化 电力系统 变压器
TB TD TE TF TG TH TJ 19 2 5 6 29 24 1 12 16 19 18 13 55 1 5 9 4 4 6 12 1 5 13 21 5 29 10 8 67 29 8 13 46 93 17 308 461 573 311 533 662 66 122 16 22 4 62 234 14 601 697 785 329 931 1745 64 5 9 4 4 41 102 1 113 250 92 133 258 938 33 41 21 7 1 11 120 14 259 13 38 41 328 14 5 14 8 12 9 17 12 1 47 2 17 1 14 30 22 116 13 13 15 28 1 2 150 335 78 29 313 868 70 38 108 34 4 45 98 16 7 9 16 2 1 8 1 12 38 21 24 20 31 2
3 基 于 类 目 间 关 键 词 词 频 标 准 差 大 小 机 器辅助获取
针对以上问题,本文试验了机器辅助获取、消除词 频误差的相对词频与标准差方法,获取通用概念,统计 方法与试验结果如下。 3.1 材料与方法 试 验 材 料 使 用 万 方 数 据 学 术 论 文 库,该 库 基 本 采 用《中国图书馆分类法》的分类体系,文献共分 22个一 级大 类。 一 级 大 类 “工 业 技 术 ”下 分 16个 二 级 大 类[10]。抽取 1987-2009年所有学术论文文献数据,提 取论文的关键词,经过去重、去掉词频为 1的关键词等 数据清洗,得到总量约 300多万个关键词,从这些词中 随机抽取 1万个关键词,用于完成本试验。由于课题 是《汉语主题词表》(工程技术版)的编制,所以抽取的 关键词必须 是 在 一 级 大 类 “工 业 技 术 ”下 的 文 献 中 出 现过的关键词。为了探索一个概念通常情况下出现在 几个类目中,统计了这 1万个关键词在 16个二级类目 文献数据库 中 的 词 频 分 布 情 况。包 括:关 键 词 在 各 二 级类目文献中的词频;在工业技术一级类目下的总词 频;计算了每个关键词以上两项统计值相除后的相对 词频值;使用相对词频值,计算了每个关键词相对词频 值在 16个二级类目间的标准差。 3.2 基于标准差排序获取通用概念 理论上讲,关键词首先应该在 16个二级类目文献 中都有词频,这样的关键词通常是通用概念,从试验数 据中提取的在所有类目文献中都有关键词分布的词汇 见表 1。从表 1数据可以看出,19个关键词基本上都 属于通用概念或是工业技术中的专业通用概念,标准 差比较小的“设计”(0.0697)、“优化”(0.0566)、“调 节”(0.0509)等,都 是 典 型 的 通 用 概 念。 随 着 标 准 差
本文系国家社会科学基金资助项目“网络环境下叙词表的编制模式与应用方式研究”(项目编号:10BTQ048)和国家“十 二五”科技支撑计划“面向外文科技文献信息的知识组织体系建设与应用示范”(项目编号:2011BAH10B00)研究成果之一。 收稿日期:2011-06-13 修回日期:2011-08-09 本文起止页码:22-25 本文责任编辑:徐 健
23
<<专 题
的增大,单个关键词虽然可以应用到所有文献中,但还 的关键词,进行人工判断,选择常见的通用概念。使用
是相对集中地出现在某 一类 文献中,例 如,标准差为 试验数据,选出“解决办法”(0.05)、“尺寸”(0.07)、“降
0.2121的“变压器”,应该属于 TM类(电工技术),标 温”(0.07)等关键词,也是非常典型的通用概念。同样
域专家人工提供,耗时长,过度依赖领域专家个人隐性 知识。虽然提供 的 概 念 本 身 是 符 合 编 制 规 范 的,但 不 同人员可能会提供不同数量的概念,存在概念覆盖面 是否全面的问题。通过统计关键词词频分布获取通用 概念,不仅工作量大,而且同样存在阈值把握问题。例 如,如果词频为 渐变 或等 差数 列式 递减,没有显著差 异,则如何判断?另外,关键词词频与不同类目下文献 数量也有一定关系,假设万方数据中“水利工程”类文 献收集的比较少,可以推断“水库”关键词的词频也不 会如此高,而万方数据各类目下的文献数肯定是不一 样的,所以基于词频会存在误差。
准差为 0.1487的“可视化”应该属于 TP类(自动化技 方法还可以考虑在 14个类目、13个类目等文献中分布
术、计算机技术)。
的关键词,具体考虑到多少个类目为止,需要根据具体
对于在 15个类目中都有分布的关键词,同样可以 数据获取经验值,并在大规模数据中进行验证与评价。
使用标准差分布表,从小到大排序,截取标准差比较小
<<专 题
数字环境下通用概念获取方法
常 春 赖院根
中国科学技术信息研究所 北京 100038
〔摘要〕在叙词表、本体等知识组织体系构建过程中,需要获取通用概念。笔者试验了三种获取通用概念的方法, 一是继承传统知识组织体系通用概念,二是通过关键词在文献中词频分布情况确定通用概念,三是基于关键词总 词频与标准差二维信息获得通用概念。研究结果表明:以上三种方法各有特点及使用范围,在概念获取时可以根 据课题具备条件单独使用或组合使用。 〔关键词〕叙词表 本体 通用概念 标准差 词频 〔分类号〕G254
2 2LIBRARY AND INFORMATION SERVICE
>>
第 55卷 第 22期 2011年 11月
92B形状、尺寸,92C时间、方位等,共收集了 475个通 用概念。作为《汉 表 》修 订 项 目,这 些 词 在 入 选 方 面 应 该占有较大的权重,甚至根据这些词汇的统计数据属 性重新进 行 分 类。 例 如,“计 算 ”一 词,需 要 统 计 在 各 级大类中的词频情况,根据词频大小,确定是继续放到 通用概念下,还是放到 O类(数理科学与化学)或 TP 类(自动化技术、计算机技术)。 另外,还有大 量 的 专 业 叙 词 表,例 如 《农 业 科 学 叙 词表》、《水利水 电 科 技 主 题 词 表 》(以 下 简 称 《水 表 》) 等[8],同样有通用概念。《水表》一级范畴号 20“通用 词”下设 2个 二 级 类 目,20A为 “复 合 通 用 词”,例 如 “安全管理”、“分布规律”等;20B为“一般通用词”,例 如成分、利用、应用等。
相关文档
最新文档