开题报告_朴素贝叶斯分类算法的研究及应用

合集下载

朴素贝叶斯学习报告

朴素贝叶斯学习报告

本次报告主要学习一种基于贝叶斯定理的分类方法-朴素贝叶斯分类。

从一般分类问题,及贝叶斯原理,引出朴素贝叶斯分类原理,然后探讨朴素贝叶斯在文本分类和情感分析领域的应用,最后做了基于朴素贝叶斯分类的处理情感分析的demo程序。

1 朴素贝叶斯分类简介朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某类别的先验概率和对象特征的在该类别下的条件概率计算出类别的后验概率(即该对象属于某一类的概率),然后选择具有最大后验概率的类作为该对象所属的类。

2 分类问题我们可能每天都在依据分类特征进行形形色色的分类,比如把开豪车的人认为很有钱,把东大校园带眼镜的老头认为是教授等,用直白的话讲,就是将一些个体分到特定的类别中。

那这个分类问题有没有一个逻辑上的定义呢?从数学的角度来说,可以定义如下:已知集合:C={y1,y2,…,y n}和 I={x1,x2,…,x m},确定映射规则y=f(x),使得任意x i∈I 有且仅有一个y i∈C使得y i=f(x i)成立。

其中C叫做类别集合,其中每一个元素是一个类别,而I叫做项集合,其中每一个元素是一个待分类项,f叫做分类器。

分类算法的任务就是构造分类器f,使得待分类项可以按照分类器进行相应分类。

例如,医生对病人进行诊断就是一个典型的分类过程,任何一个医生都无法直接看到病人的病情,只能观察病人表现出的症状和各种化验检测数据来推断病情,这时医生就好比一个分类器,病人的病情状况根据医生来分类。

3 贝叶斯定理因为朴素贝叶斯分类是基于贝叶斯定理,于是我们得先谈谈贝叶斯定理。

该定理是关于随机事件A和B的条件概率的一则定理。

P(A|B)=P(B|A)P(A)P(B)其中P(A|B)是在B发生的情况下A发生的可能性。

贝叶斯定理之所以有用,是因为我们在生活中经常遇到这种情况:我们可以很容易直接得出P(A|B),P(B|A)则很难直接得出,但我们更关心P(B|A),贝叶斯定理就为我们打通从P(A|B)获得P(B|A)的道路。

朴素贝叶斯算法在分类任务中的应用

朴素贝叶斯算法在分类任务中的应用

朴素贝叶斯算法在分类任务中的应用朴素贝叶斯算法是一种基于贝叶斯定理的分类算法,它的应用范围非常广泛,包括文本分类、垃圾邮件过滤、情感分析等。

本文将从以下几个方面介绍朴素贝叶斯算法在分类任务中的应用。

一、分类任务的基本流程在介绍朴素贝叶斯算法在分类任务中的应用之前,我们需要了解分类任务的基本流程。

分类任务是指将一个输入对象划分到不同的类别中,其基本流程如下:1. 数据预处理:对输入数据进行清洗、过滤、归一化等操作,使其能够被算法处理。

2. 特征提取:从数据中提取有用的特征。

特征通常是与分类任务相关的属性或变量。

3. 特征选择:在所有特征中选择最具有区分性的特征。

4. 模型训练:使用已有数据对分类模型进行训练,通常使用监督学习算法。

5. 模型评估:使用测试数据集对分类模型进行评估,以衡量其性能。

二、朴素贝叶斯算法的基本原理朴素贝叶斯算法是一种基于贝叶斯定理的概率模型,其基本思想是通过已知样本的特征和类别,推断出未知样本属于某个类别的概率。

具体而言,朴素贝叶斯算法假设每个特征对于分类是独立的,且每个特征的重要程度相同,因此可以直接计算每个特征在某一类别下的条件概率,再根据贝叶斯定理计算出未知样本属于某个类别的后验概率。

三、朴素贝叶斯算法在文本分类中的应用朴素贝叶斯算法在文本分类中的应用非常广泛,例如垃圾邮件分类、情感分析、新闻分类等。

以垃圾邮件分类为例,其分类任务是将邮件划分为垃圾邮件和非垃圾邮件两类。

朴素贝叶斯算法将每个单词出现的频率作为特征,然后通过已知垃圾邮件和非垃圾邮件的样本计算出每个单词在两类邮件中的频率,再根据贝叶斯定理计算出未知邮件属于垃圾邮件或非垃圾邮件的后验概率。

四、朴素贝叶斯算法的优缺点朴素贝叶斯算法有以下优点:1. 简单、高效、易于实现。

2. 对于小规模数据表现良好,同时能处理多分类问题。

3. 对于缺失数据不太敏感。

但朴素贝叶斯算法也有以下缺点:1. 基于样本假设特征相互独立,因此对于特征之间存在关联的数据集表现不佳。

朴素贝叶斯分类算法的设计与分析

朴素贝叶斯分类算法的设计与分析

朴素贝叶斯分类算法的设计与分析朴素贝叶斯分类算法是基于贝叶斯定理和特征条件独立假设的分类算法。

其基本原理是根据给定的训练数据集,通过计算后验概率来进行分类。

具体来说,朴素贝叶斯算法将输入的特征向量表示为一个多维空间中的点,根据训练集中已知分类的特征向量的分布,计算分类的后验概率,然后选择具有最大后验概率的类别作为最终的分类结果。

朴素贝叶斯算法的特点之一是基于特征条件独立假设,即假设每个特征之间是相互独立的,这样可以简化计算过程。

这意味着算法将特征之间的联系简化为特征与类别之间的联系。

虽然这个假设实际上并不一定成立,但在实际应用中,朴素贝叶斯算法仍然表现出良好的性能。

朴素贝叶斯算法的实现流程一般包括以下几个步骤:1. 数据预处理:对输入数据进行预处理,如文本数据的分词和特征提取。

2. 计算先验概率和条件概率:根据训练集计算每个类别的先验概率和每个特征在各个类别下的条件概率。

3. 计算后验概率:对于给定的测试样本,根据贝叶斯定理计算后验概率,并选择具有最大后验概率的类别作为预测结果。

4. 模型评估:使用测试集评估模型的性能,通常使用准确率、精确率、召回率等指标进行评估。

朴素贝叶斯算法的性能分析包括两个方面:算法复杂度和分类性能。

算法复杂度指的是算法运行所需的时间和空间复杂度,朴素贝叶斯算法的计算复杂度较低,因为它只需要计算各个特征的概率,并进行简单的乘法和比较操作。

而分类性能指的是算法在实际应用中的准确度和稳定性。

朴素贝叶斯算法的分类性能一般较好,在一些文本分类等任务中能够取得不错的效果。

朴素贝叶斯分类算法的设计和分析是一个涉及基本原理、特点、实现流程和性能分析等多个方面的任务。

合理地设计和分析朴素贝叶斯算法,可以帮助我们更好地理解和应用这一经典的分类算法。

朴素贝叶斯分类算法的研究与应用

朴素贝叶斯分类算法的研究与应用

朴素贝叶斯分类算法的研究与应用一、引言朴素贝叶斯分类算法作为一种分类算法,常常被广泛应用于自然语言处理、文本分类和垃圾邮件过滤等领域。

本文将从原理、算法流程、应用场景三个方面来介绍朴素贝叶斯分类算法的研究与应用。

二、原理朴素贝叶斯算法的核心思想是利用贝叶斯定理来计算后验概率,从而得到最优结果。

其贝叶斯定理公式如下:P(A|B) = P(B|A) * P(A) / P(B)其中,P(A|B)为条件概率,表示在B事件发生的情况下A事件发生的概率;P(B|A)为已知A事件发生的情况下B事件发生的概率;P(A)和P(B)为先验概率,分别表示A事件和B事件发生的概率。

朴素贝叶斯算法假设每个特征之间相互独立,即特征之间不存在相互影响,这是朴素贝叶斯算法的基本假设。

根据该假设,可以将后验概率的计算公式简化为:P(C|X) = P(X|C) * P(C) / P(X)其中,C为类别,X为特征向量,P(C|X)为某个样本属于C类别的概率(后验概率),P(X|C)为C类别下X特征向量的条件概率,P(C)为先验概率,P(X)为样本的先验概率。

三、算法流程假设训练数据集D={(x1,y1),(x2,y2),...(xm,ym)},其中xi为第i个样本的特征向量,yi为第i个样本的类别,Ck表示所有类别的集合。

朴素贝叶斯算法的算法流程如下:1. 输入样本特征向量X,求出训练数据集D中每个类别的似然概率P(X|Ck)。

2. 计算样本X属于每个类别的后验概率P(Ck|X)=P(X|Ck)*P(Ck) / P(X)。

3. 选择后验概率最大的类别作为样本X的分类结果。

四、应用场景朴素贝叶斯分类算法常用于多分类问题和文本分类问题。

以下是朴素贝叶斯分类算法的应用场景:1. 垃圾邮件过滤:在邮件分类中,对于非垃圾邮件,其内容会包含正常的单词,而对于垃圾邮件,则会包含一些特殊的单词或标点符号,因此可以根据朴素贝叶斯算法的特征独立假设来进行垃圾邮件的分类。

朴素贝叶斯算法的应用

朴素贝叶斯算法的应用

朴素贝叶斯算法的应用导言:朴素贝叶斯算法(Naive Bayes)是一种基于概率统计和特征条件独立性假设的分类算法。

它在实际应用中具有广泛的应用领域,如文本分类、垃圾邮件过滤、情感分析等。

本文将重点介绍朴素贝叶斯算法的应用,并从文本分类和垃圾邮件过滤两个方面进行详细阐述。

一、文本分类1.1 问题描述文本分类是指将一篇给定的文本分到预定义的类别中。

例如,我们可以将一封邮件分类为垃圾邮件或非垃圾邮件,将一篇新闻文章分类为体育、娱乐或政治等类别。

1.2 数据预处理在进行文本分类之前,我们需要对文本进行预处理。

预处理包括去除停用词、分词、词干化等步骤,以便提取出文本的特征。

1.3 特征提取朴素贝叶斯算法将文本表示为特征向量,常用的特征提取方法有词袋模型和TF-IDF模型。

词袋模型将文本表示为一个词汇表中词语的频率向量,而TF-IDF模型则考虑了词语的重要性。

1.4 模型训练与分类在得到特征向量后,我们可以使用朴素贝叶斯算法进行模型训练和分类。

训练阶段,我们统计每个类别中每个特征的频次,并计算类别的先验概率。

分类阶段,我们根据贝叶斯定理计算后验概率,并选择具有最大后验概率的类别作为分类结果。

二、垃圾邮件过滤2.1 问题描述垃圾邮件过滤是指将垃圾邮件从用户的收件箱中过滤出来,从而提高用户的邮件阅读效率和安全性。

2.2 特征提取与文本分类类似,垃圾邮件过滤也需要对邮件进行特征提取。

常用的特征包括邮件的主题、发件人、正文中的关键词等。

2.3 模型训练与分类在垃圾邮件过滤中,我们同样可以使用朴素贝叶斯算法进行模型训练和分类。

训练阶段,我们统计垃圾邮件和非垃圾邮件中每个特征的频次,并计算两者的先验概率。

分类阶段,我们根据贝叶斯定理计算后验概率,并将概率高于阈值的邮件分类为垃圾邮件。

三、朴素贝叶斯算法的优缺点3.1 优点(1)朴素贝叶斯算法具有较高的分类准确性和良好的可解释性;(2)算法简单,计算速度快,适用于大规模数据集;(3)对缺失数据不敏感,能够处理高维特征。

机器学习中的朴素贝叶斯分类算法研究

机器学习中的朴素贝叶斯分类算法研究

机器学习中的朴素贝叶斯分类算法研究机器学习是当前最热门的领域之一,其主要目的是通过计算机算法自动提取数据的模式,并利用这些模式来预测新数据。

其中,朴素贝叶斯分类算法是机器学习中常用的一种方法。

一、朴素贝叶斯分类算法基本原理朴素贝叶斯分类算法基于贝叶斯定理,利用已知的先验概率来推断预测概率。

该算法假定每个特征之间是相互独立的,即特征之间的共现不会影响到预测结果,这就是为什么它被称为“朴素”的原因。

根据贝叶斯定理,可以得到朴素贝叶斯分类算法的基本公式:P(c|x) = P(x|c)P(c) / P(x)其中,c表示类别,x表示数据特征,P(c|x)表示在给定特征x的情况下,预测分类为c的概率,P(x|c)表示在已知分类c的情况下,观测到特征x的概率,P(c)表示分类c的先验概率,P(x)表示特征x的先验概率。

二、朴素贝叶斯分类算法应用场景朴素贝叶斯分类算法是文本分类任务中常用的一种方法。

例如,根据一封电子邮件的内容,判断它是垃圾邮件还是正常邮件。

此外,它还被广泛应用于自然语言处理、搜索引擎、金融预测等领域。

三、朴素贝叶斯分类算法的优缺点优点:1. 朴素贝叶斯分类算法简单易懂,计算速度快。

2. 在少量样本情况下,仍能有效推断和预测。

缺点:1. 特征之间必须相互独立,否则会影响预测结果。

2. 该算法对于数值型数据的处理较为复杂,需要采用离散化方法进行转换。

3. 朴素贝叶斯分类算法在处理大量特征的情况下,容易出现过拟合现象,需要进行参数调整。

四、朴素贝叶斯分类算法改进针对朴素贝叶斯分类算法优缺点,研究者们提出了许多改进算法,包括:1. 半朴素贝叶斯分类算法:它克服了原始朴素贝叶斯分类算法中特征相互独立的限制,将特征之间的关联性考虑在内。

2. 多项式朴素贝叶斯分类算法:该算法适用于多项分布的数据,例如,单词在文档中的出现情况。

3. 高斯朴素贝叶斯分类算法:该算法适用于连续型变量,采用高斯分布模型进行处理。

五、结语朴素贝叶斯分类算法是机器学习中应用广泛的一种算法。

朴素贝叶斯算法的解析与应用

朴素贝叶斯算法的解析与应用

朴素贝叶斯算法的解析与应用朴素贝叶斯算法是一种基于概率统计的机器学习算法。

它最初是由英国数学家托马斯·贝叶斯提出的,用于解决一些关于概率的问题。

随着计算机技术的发展,朴素贝叶斯算法被引入到机器学习的领域,成为了一种非常常用的算法。

朴素贝叶斯算法的基本原理是根据一个事件发生的条件概率和该事件的先验概率来计算该事件的后验概率。

在机器学习中,一般将这个事件指定为某个类别(如文本分类中的某个主题),而条件概率则针对某个样本(如一段文本)和该类别进行计算。

朴素贝叶斯算法的“朴素”指的是它假设样本的各个特征是相互独立的,这种假设在实际应用中可能并不完全准确,但是它的精度在很多场景下已经足够高了。

对于文本分类的任务,朴素贝叶斯算法的应用非常广泛。

在这个任务中,我们需要将一篇文本归类到某个主题下,比如“体育”、“政治”、“科技”等。

朴素贝叶斯算法的基本流程可以归纳为以下几步:1. 根据样本集合计算每个类别的先验概率。

这个过程可以简单地理解为计算该类别在整个样本中的出现概率。

2. 对于每个样本,计算它属于各个类别的条件概率,再根据朴素贝叶斯的独立假设,将各个特征的条件概率相乘。

这个过程可以理解为计算该样本属于某个类别的可能性有多大。

3. 选择最大的后验概率对应的类别,将该样本归类到该类别下。

需要注意的是,朴素贝叶斯算法在计算条件概率时,需要结合样本中各个特征的出现情况来计算,这就要求我们首先对样本进行预处理,将每个特征都转换为数字化的形式,比如词袋模型、TF-IDF等。

除了文本分类外,朴素贝叶斯算法还有很多其他的应用场景。

比如在垃圾邮件识别中,我们可以将某些关键词作为特征,然后利用朴素贝叶斯算法来判断一封邮件是否为垃圾邮件。

在信用评估和风险控制中,我们也可以利用朴素贝叶斯算法对客户的信用风险进行预测和控制。

当然,朴素贝叶斯算法也存在一些问题。

首先,它假设样本的各个特征是相互独立的,但在实际应用中,这种假设并不总是成立,因此可能会影响算法的准确性。

朴素贝叶斯分类算法的应用多元统计实验报告

朴素贝叶斯分类算法的应用多元统计实验报告

2 Ci
其中,给定类Ci的训练样本属性Ak的值,g xk , Ci , Ci 是属
性Ak的高斯密度函数,而 Ci , Ci 分别为平均值和标准差。
(5)为对未知样本X分类,对每个类Ci,计算 P(Xk|Ci)P(Ci)。样本X被指派到类Ci,当且仅当
PX Ci PCi PX C j PC j ,1 j m, j i
P(Ci∣X) > P(Cj∣X), 1<j<m, j≠i
这样,最大化P(Ci∣X)。即假定样本类Ci的概率大于假定其 他类的概率。其中P(Ci I X)最大的类Ci称为最大后验假定。
(3)根据贝叶斯定理得:
PCi
|
X
PX
| Ci PCi PX
(3)由于P(X) 对于所有类为常数,只需要P(X |Ci)P(Ci) 最大即可。如果类的先验概率未知,则通常假定这些类是 等概率的;即,P(C1) = P(C2) = ... = P(Cm)。并据此对 P(Ci | X)最大化。否则,我们最大化P(X |Ci)P(Ci)。注意, 类的先验概率可以用P(Ci) = si /s计算;其中,si是类C 中的训练样本数,而s是训练样本总数。
P(a2>0.8|C=0)=0.2 P(a2<=0.1|C=1)=0.7 P(0.1<a2<0.8|C=1)=0.2 P(a2>0.8|C=1)=0.1 P(a3=0|C=0)=0.2 P(a3=1|C=0)=0.8 P(a3=0|C=1)=0.9 P(a3=1|C=1)=0.1
实例结果分析:
5、使用分类器进行鉴别 下面我们使用上面训练得到的分类器鉴别一个账号,这个 账号使用非真实头像,日志数量与注册天数的比率为0.1, 好友数与注册天数的比率为0.2。即:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[3]邵峰晶等.数据挖掘原理与算法.第二版[M].北京:机械工业出版社,2004.
[4]廖芹,郝志峰,陈志宏.数据挖掘与数学建模[M].国防工业出版社,2010.
[5](美)Richard J.Roiger,Michael W.Geatz.数据挖掘教程.北京:清华大学出版社,2008.
[6]同济大学概率统计教研组.概率同济.第四版[M].上海:同济大学出版社,2009.
[14]周修考.基于朴素贝叶斯算法的中文垃圾邮件过滤器的设计与应用[J].兰州工业高等专科学校学报,2010,17(6):5-7.
[15]程昌品.朴素贝叶斯分类算法在毕业生就业预测方面的研究[J].广东教育学院学报,2007,27(5):79-82.
指导教师意见(对课题设计(研究)内容的深度、广度及设计(研究)方案的意见和对毕业设计(论文)结果的预测等)
五、进度安排
2011年11月1日―2011年11月28日:整理资料、完成开题报告
2011年11月29日―2011年2月20日:完成总体设计
2012年2月21日―2012年4月17日:进行第一阶段的设计,完成工作量的60%
2012年4月18日―2012年5月25日:进行第二阶段的设计,完成毕业设计说明书
[7]王征,李家兴.Sql Server 2005实用教程[M].北京:清华大学出版社,2006.
[8]钱雪忠.数据库原理及应用[M].北京:北京邮电大学出版社,2007.
[9]宋中山,严千钧.JAVA程序设计[M].北京:清华大学出版社,2005.
[10]聂永红.用于全国高校计算机等级考试的贝叶斯分类预测算法设计[J].科技资讯,2006,9:153-154..
[11]陈朝大,梁柱勋,郑士基.一种利用关联规则的改进朴素贝叶斯分类算法[J].计算机系统应用,2010,19(11):106-109.
[12]李艳,刘信杰,胡学钢.数据挖掘中朴素贝叶斯分类器的应用[J].潍坊学院学报,2007,7(4):48-50.
[13]张亚萍,陈得宝,侯俊钦,杨一军.朴素贝叶斯分类算法的改进及应用[J].计算机工程与应用,2011,47(15):134-137.
根据系统功能需求,对所采集的数据需要进行存储,而作为关系型数据库的优秀软件之一的Microsoft SQL Server,可以满足本算法的需求。SQL语言的主要功能就是同各种数据库建立联系,进行沟通。SQL语句可以用来执行各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等。
四、预期成果
从朴素贝叶斯的原理入手,分析贝叶斯的原理及其实用价值,并经行一定的应用,主要是通过一个贝叶斯的实例入手,体现出贝叶斯分类法的作用及在数据挖掘中的作用,并根据实例设计一款小型软件。如果时间允许,再在此基础上对贝叶斯算法进行一定的改进,达到对研究及应用重点体现在对贝叶斯理论原理的分析,主要包括贝叶斯理论和贝叶斯分类模型、基于属性的相关性分析贝叶斯分类模型、贝叶斯分类模型的具体实例应用等主要方面。
贝叶斯理论和贝叶斯分类模型主要从数理统计角度引出贝叶斯分类算法的科学根据,并对其原理展开分析。其中包括概率论方面的知识,例如:条件概率、乘法定理、全概率公式和贝叶斯定理等,以及分类模型的介绍,并介绍其中最简单也是最有效实际运用很成功的分类器,并提出一定的改进。
三、设计方案
本系统的开发环境是Myeclipse开发平台,使用的语言是JAVA语言开发,语言只是本算法设计的一个载体,由于作者本人熟悉JAVA,所以就选择JAVA作为设计语言,设计一款具有可视化界面,能连接数据库,并能充分体现贝叶斯算法优势的软件。
数据挖掘的重点是数据,没有数据挖掘就毫无意义,所以数据的收集、存储就是本设计的一个重要组成部分。
2012届毕业设计(论文)开题报告
题目朴素贝叶斯分类算法的研究及应用
学院计算机工程学院
专业计算机科学与技术
姓名班级08计2W
指导教师
起止日期2011年11月至2012年6月
2011年11月25日
毕业设计(论文)开题报告
(课题目的意义;主要设计(研究)内容;设计(研究)方案;预期成果;进度安排及主要参考文献等)
基于属性的相关性分析贝叶斯分类模型,通过分析属性相关性度量和属性约简,提出基于属性相关性度量的朴素贝叶斯分类模型,并提出属性的约简方法。
贝叶斯分类算法的实例,主要是选取日常生活中案例入手,例如,垃圾邮件的过滤、就业预测方向、等级考试成绩预测等案例,根据实际情况从中选择一个案例,设计预测软件,实现数据挖掘功能。
2012年5月26日―2012年5月30日:准备毕业设计答辩
2012年6月1日―2012年6月12日:毕业设计答辩
六、参考文献
[1]蒋盛益,李霞,郑琪.数据挖掘原理与实践[M].北京:电子工业出版社,2011.
[2]胡可云,田凤占,黄厚宽等.数据挖掘理论与应用[M].北京:清华大学出版社,2008.
该同学从课题的意义、目的,设计内容,设计方案、预期成果等方面对“朴素贝叶斯分类算法的研究及应用”这个题目进行了广泛的思考。分析贝叶斯的原理及其实用价值,并经行一定的应用,通过贝叶斯的实例体现出贝叶斯分类法的作用及在数据挖掘中的作用,设计一款小型软件,其研究深度、广度符合本次毕业设计要求,设计方案可行,进度安排合理。
一、课题的意义与目的
现在是一个信息爆炸的年代,人们需要新的技术来自动、智能和快速地分析海量的原始数据,以使数据得以充分利用,由此引发了一个新的研究方向:数据挖掘与知识发现的理论与技术研究。
数据分类是数据挖掘的基本任务之一,在经济社会等领域有着广泛的应用,朴素贝叶斯算法是一类重要的分类算法,在实际应用中也表想出了优秀的分类特性。本研究旨在自主开发出一套基于贝叶斯理论的分类的算法程序,并结合实际应用,研究算法性能,并解决实际问题.
该同学所做的开题报告符合本次毕业设计的要求,同意其进入正式设计阶段。
指导教师签名:
年月日
系(教研室)审核意见:
系主任签名:
年月日
注:开题报告应在指导教师指导下由学生填写,经指导教师及系审核后生效。
相关文档
最新文档