19款最好用的免费数据挖掘工具大汇总

合集下载

数据分析挖掘工具

数据分析挖掘工具

数据分析挖掘工具随着信息时代的来临和大数据的兴起,数据分析挖掘工具成为了现代企业不可或缺的利器。

数据分析挖掘工具帮助人们处理和分析庞大的数据集,从中挖掘出有用的信息和隐藏的模式。

本文将介绍几种常用的数据分析挖掘工具。

1. R语言R语言是一种免费且开源的统计分析和数据挖掘工具。

它具有丰富的数据分析函数库和强大的绘图功能,可以支持多种数据分析任务,例如线性回归、聚类分析、分类和预测等。

R语言还提供了优秀的可视化工具,使得分析结果更加直观和易于理解。

由于其灵活性和可扩展性,R语言在学术界和工业界都得到了广泛应用。

2. PythonPython是一种通用的编程语言,也被广泛用于数据分析和挖掘。

Python拥有强大的科学计算和数据处理库,如NumPy、Pandas和SciPy,使得数据分析变得更加高效和便捷。

此外,Python还有诸多机器学习和数据挖掘的库和工具,例如Scikit-learn和TensorFlow,可以支持各种复杂的数据挖掘任务。

3. SQLSQL(Structured Query Language)是一种用于管理和操作关系型数据库的语言。

它可以帮助用户从数据库中查询和提取数据,进行数据聚合、分组、排序和连接等操作。

SQL不仅可以进行基本的数据操作,还可以实现一些复杂的数据分析算法,如决策树、关联规则挖掘和聚类分析。

因此,SQL在企业中被广泛应用于数据分析和挖掘。

4. ExcelExcel是一种常见的电子表格软件,也是许多人进行简单数据分析和挖掘的首选工具。

通过Excel的各种函数和工具,用户可以进行数据的筛选、排序、求和和绘图等常见操作。

虽然Excel的功能相对简单,但对于小规模的数据分析和挖掘任务来说已经足够。

5. TableauTableau是一种流行的数据可视化工具,它可以帮助用户轻松地创建交互式的数据图表和报告。

Tableau支持从多种数据源导入数据,并提供了丰富的数据可视化选项和交互式控件,使得数据的可视化呈现更加生动和直观。

款常用的数据挖掘工具推荐

款常用的数据挖掘工具推荐

12款常用的数据挖掘工具推荐数据挖掘工具是使用数据挖掘技术从大型数据集中发现并识别模式的计算机软件。

数据在当今世界中就意味着金钱,但是因为大多数数据都是非结构化的。

因此,拥有数据挖掘工具将成为帮助您获得正确数据的一种方法。

常用的数据挖掘工具1.RR是一套完整的数据处理、计算和制图软件系统。

其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。

2.Oracle数据挖掘(ODM)Oracle Data Mining是Oracle的一个数据挖掘软件。

Oracle数据挖掘是在Oracle 数据库内核中实现的,挖掘模型是第一类数据库对象。

Oracle数据挖掘流程使用Oracle 数据库的内置功能来最大限度地提高可伸缩性并有效利用系统资源。

3.TableauTableau提供了一系列专注于商业智能的交互式数据可视化产品。

Tableau允许通过将数据转化为视觉上吸引人的交互式可视化(称为仪表板)来实现数据的洞察与分析。

这个过程只需要几秒或几分钟,并且通过使用易于使用的拖放界面来实现。

5. ScrapyScrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

6、WekaWeka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

Weka高级用户可以通过Java编程和命令行来调用其分析组件。

同时,Weka也为普通用户提供了图形化界面,称为Weka KnowledgeFlow Environment和Weka Explorer。

和R相比,Weka在统计分析方面较弱,但在机器学习方面要强得多。

大数据查询免费查询

大数据查询免费查询

大数据查询免费查询概述随着互联网的快速发展和智能设备的普及,大数据技术正成为越来越多企业和个人处理海量数据的首选方案。

然而,大数据查询往往需要庞大的计算资源和昂贵的软件许可费用。

在这样的背景下,免费的大数据查询解决方案对于那些资源有限的用户来说显得尤为重要。

本文将介绍一些免费的大数据查询工具和平台,帮助用户快速、高效地进行大数据查询和分析。

1. HadoopHadoop是一个开源的分布式计算系统,由Apache开发和维护。

它能够高效地存储和处理大规模数据,并支持并行计算。

使用Hadoop,用户可以轻松地在集群上进行数据查询和分析操作。

而且,Hadoop的生态系统非常丰富,拥有大量的工具和库可以帮助用户更好地处理大数据。

2. Apache SparkApache Spark是一个快速的大数据处理引擎,也是由Apache开发和维护的开源项目。

它提供了丰富的查询和分析功能,并具有优秀的性能。

Spark支持多种编程语言,如Scala、Java和Python,用户可以根据自己的喜好选择适合的语言进行开发。

此外,Spark还提供了图形化界面和交互式查询工具,帮助用户更加方便地进行数据查询和分析。

3. ElasticSearchElasticSearch是基于Apache Lucene的实时分布式搜索和分析引擎。

它被广泛应用于大数据领域,能够快速地存储、搜索和查询大规模数据。

ElasticSearch具有高度的可扩展性和灵活性,用户可以轻松地通过其丰富的API进行数据查询和分析操作。

此外,ElasticSearch还支持复杂的查询和聚合操作,用户可以根据自己的需求定制查询语句。

4. HiveHive是基于Hadoop的数据仓库和查询工具,由Facebook开发并贡献给Apache基金会。

它使用类似于SQL的查询语言HQL进行数据查询和分析操作。

Hive可以将结构化数据映射到Hadoop文件系统中,通过SQL-like查询语言提供高性能的查询和分析能力。

互联网小工具推荐在线数据分析工具

互联网小工具推荐在线数据分析工具

互联网小工具推荐在线数据分析工具在互联网时代的今天,数据成为了一种重要的资源,对于企业和个人来说,如何快速、准确地进行数据分析,成为了一个亟待解决的问题。

而在线数据分析工具应运而生,为用户提供了便捷、高效的数据分析服务。

本文将推荐几款优秀的在线数据分析工具,希望能够帮助读者们更好地进行数据分析和决策。

一、Google AnalyticsGoogle Analytics是一款由谷歌推出的免费的在线数据分析工具,广泛应用于网站分析领域。

用户只需将Google Analytics的代码嵌入到网站中,便能够获取到关于网站访问量、用户行为、转化率等方面的详细数据报告。

同时,Google Analytics还提供了强大的自定义报告功能,用户可以根据自己的需求对数据进行灵活的筛选和分析,从而更好地了解用户和优化网站。

二、Tableau PublicTableau Public是一款功能强大的在线数据分析工具,它可以将复杂的数据转化为直观的图形和交互式仪表板。

用户可以通过简单的拖放操作,实现数据的可视化呈现。

与传统的数据分析软件相比,Tableau Public更加简单易用,无需编写复杂的代码,甚至不需要具备数据分析的专业知识。

同时,Tableau Public还支持数据的分享和发布,用户可以将制作好的可视化图表与他人进行共享,增加了数据的传播和交流。

三、Zoho AnalyticsZoho Analytics是一款功能全面的在线数据分析和报表工具。

它支持各种数据来源的导入和整合,包括Excel、CSV、数据库等,用户可以实现多个数据源的联合分析。

除了常见的数据分析功能,Zoho Analytics还提供了强大的数据挖掘功能,可以帮助用户发现隐藏在数据中的规律和趋势。

此外,Zoho Analytics还具备自助式报表制作和分享功能,用户无需依赖开发人员即可制作出美观、专业的报表。

四、Power BIPower BI是微软推出的一款业界领先的在线数据分析工具,它提供了丰富的数据连接和数据转化功能,用户可以轻松地将各种数据源导入到Power BI中进行分析。

数据挖掘中的数据挖掘工具与软件

数据挖掘中的数据挖掘工具与软件

数据挖掘中的数据挖掘工具与软件数据挖掘是一种通过分析大量数据来发现隐藏在其中的模式、关联和趋势的过程。

在现代信息时代,数据挖掘已经成为了各行各业的必备工具,帮助企业和组织从海量数据中提取有价值的信息,以支持决策和发展。

数据挖掘过程中,使用各种数据挖掘工具和软件可以提高效率和准确性。

下面将介绍几种常见的数据挖掘工具和软件。

首先是WEKA(Waikato Environment for Knowledge Analysis)工具。

WEKA是一款开源的数据挖掘软件,具有丰富的算法库和用户友好的图形界面。

它支持数据预处理、特征选择、分类、聚类、关联规则挖掘等多种数据挖掘任务。

WEKA的使用简单直观,适合初学者和研究人员使用。

另一个常用的数据挖掘工具是R语言。

R语言是一种广泛应用于统计分析和数据挖掘的编程语言,拥有强大的数据处理和分析能力。

R语言提供了丰富的数据挖掘包,如caret、randomForest、gbm等,可以进行数据可视化、模型建立和评估等工作。

R语言的开源性和活跃的社区使得用户可以方便地获取帮助和分享经验。

此外,Python也是一种流行的数据挖掘工具。

Python具有简洁易读的语法和丰富的第三方库,如NumPy、Pandas、Scikit-learn等,可以支持各种数据挖掘任务。

Python的生态系统庞大,用户可以根据自己的需求选择合适的库和工具进行数据挖掘工作。

同时,Python还可以与其他工具和软件进行无缝集成,提高数据挖掘的灵活性和效率。

除了上述工具,还有一些商业化的数据挖掘软件,如SAS、SPSS和KNIME等。

这些软件提供了更多高级的数据挖掘功能和专业的技术支持,适用于大型企业和研究机构。

它们通常具有更强大的计算能力和更高的性能,可以处理更大规模的数据和更复杂的模型。

然而,无论使用哪种数据挖掘工具和软件,都需要具备一定的数据挖掘技能和知识。

数据挖掘并不仅仅是使用工具和软件,更重要的是理解数据背后的意义和规律。

科学研究中的数据采集工具推荐

科学研究中的数据采集工具推荐

科学研究中的数据采集工具推荐在科学研究中,数据采集是至关重要的一环。

合理选择和使用数据采集工具,不仅可以提升数据采集质量和效率,还能为科学研究提供可靠的数据支持。

本文将介绍几种常见的科学研究数据采集工具,并进行推荐。

一、问卷调查工具问卷调查是一种常见的数据采集方法,通过向被调查者提出一系列问题,获取其观点、经验和态度等信息。

以下是几种常用的问卷调查工具推荐:1. Google FormsGoogle Forms是一款免费且易于使用的在线问卷工具,具有简洁直观的界面和丰富的问卷设计功能。

用户可以根据需求自定义问题类型、添加逻辑跳转和分支等,还可以实时收集和分析数据。

同时,Google Forms还支持问卷结果导出为CSV文件,方便后续数据分析处理。

2. SurveyMonkeySurveyMonkey是一家知名的在线调查平台,提供多样化的问卷模板和设计选项,适用于不同类型的调查研究。

用户可以通过自定义回答选项、设置逻辑问题和匿名调查等功能来收集准确和丰富的数据。

此外,SurveyMonkey还提供实时统计和分析功能,帮助用户更好地理解和利用调查数据。

二、实验数据采集工具实验是科学研究中常用的数据采集方式,以下是几种常见的实验数据采集工具推荐:1. LabVIEWLabVIEW是一种图形化编程环境,主要用于控制和测量硬件设备。

它提供了丰富的数据采集和处理功能,可用于实时数据监测和记录,具有良好的可扩展性和灵活性。

LabVIEW还支持数据的可视化呈现,方便用户分析和展示实验结果。

2. OpenSesameOpenSesame是一个开源的实验控制软件,可以用于构建和运行心理学和认知科学实验。

它提供了多种实验范式和任务跟踪工具,支持实时数据采集和分析。

OpenSesame采用Python语言编写,易于学习和使用。

三、传感器和监测设备对于需要进行环境监测或采集实时数据的科学研究,传感器和监测设备是不可或缺的工具。

数据挖掘的常用工具和技术

数据挖掘的常用工具和技术

数据挖掘的常用工具和技术数据挖掘在当今信息化社会中扮演着重要的角色。

它是一种通过挖掘大量数据来发现隐藏于其中的有用信息的过程。

在进行数据挖掘时,人们借助各种工具和技术来加快和优化挖掘过程,本文将介绍数据挖掘的常用工具和技术。

一、数据采集工具在进行数据挖掘之前,首先需要进行数据采集。

数据采集工具是帮助我们从不同来源获取数据的工具。

常见的数据采集工具包括网络爬虫、API(Application Programming Interface)和传感器等。

1. 网络爬虫网络爬虫是一种自动化获取网页内容的技术。

它可以按照设定好的规则,通过访问网页,并提取所需数据。

常见的网络爬虫工具有Scrapy和BeautifulSoup等。

2. APIAPI是软件应用程序之间进行交流的一种方式。

通过API,我们可以与各种应用、平台和数据库等进行数据交换。

比如,Facebook和Twitter等社交媒体平台提供了API,使得我们可以获取其用户的数据。

3. 传感器传感器是一种能够感知环境并将感知到的数据转换为电信号的设备。

通过安装在各种设备上的传感器,我们可以采集到各种数据,例如温度、湿度、气压等。

二、数据预处理工具在进行数据挖掘之前,通常需要对原始数据进行预处理。

数据预处理工具是帮助我们清洗、处理和转换数据的工具。

常见的数据预处理工具包括Excel、Python和R等。

1. ExcelExcel是一款广泛使用的电子表格软件。

它提供了丰富的函数和工具,可以较方便地进行数据处理、筛选和转换等操作。

2. PythonPython是一种简单易学且功能强大的编程语言。

它提供了许多数据处理和分析库,如Pandas和NumPy,可以帮助我们对数据进行清洗、分析和转换。

3. RR是一种专门用于数据分析和统计的编程语言。

它提供了丰富的数据挖掘和机器学习库,如ggplot2和caret,可以帮助我们进行各种数据处理和分析操作。

三、数据挖掘算法在进行数据挖掘时,我们需要借助各种算法来发现、提取和分析数据中的模式和关系。

数据挖掘软件使用技巧分享

数据挖掘软件使用技巧分享

数据挖掘软件使用技巧分享一、数据挖掘软件的选择与基本知识数据挖掘软件是用于从大量数据中发现和提取有价值信息的工具。

选择适合的数据挖掘软件是进行数据分析的第一步。

常见的数据挖掘软件包括SPSS、SAS、R、Python等。

1. SPSSIBM SPSS Statistics是业界一款广泛使用的数据分析软件,拥有强大的统计分析能力。

其用户友好的界面和丰富的图表展示功能,使其适合初学者和非技术人员使用。

2. SASSAS是一种集成式软件系统,适用于各类数据挖掘与分析任务。

具有高级分析和数据处理能力,同时提供了数据准备、建模、评估和部署的全套解决方案。

3. RR是一种免费且开源的数据分析软件,拥有庞大的用户群体。

它提供了丰富的数据挖掘算法和统计方法,并具备良好的可扩展性。

R的编程语言特性使其成为技术人员的首选。

4. PythonPython是一种通用编程语言,也被广泛应用于数据挖掘。

Python的强大库和工具,如NumPy、Pandas和Scikit-learn,使其成为数据科学家的首选。

其简洁的语法和易用性也吸引了非技术人员的关注。

二、数据挖掘软件的数据准备与清洗数据准备与清洗是进行数据挖掘的重要步骤,它涉及数据的转换、清理和集成。

1. 数据转换数据转换包括对数据进行规范化、离散化、标准化等操作。

例如,对于连续型特征,可以通过离散化将其转换为离散型特征,提高模型的处理效率。

2. 数据清理数据清理是指对数据中的噪声、缺失值和异常值进行处理。

噪声是指无意义或错误的数据,缺失值是指数据集中某些值的缺失,异常值是指与其他数据不一致的值。

通过数据清洗,可以提高数据的质量和准确性。

3. 数据集成数据集成是指将多个数据源的数据合并为一个一致的数据集。

常见的数据集成方法包括纵向合并和横向合并。

纵向合并用于将两个或多个表按行连接,横向合并用于将两个或多个表按列连接。

三、数据挖掘软件的特征选择与降维特征选择是指从原始数据中选择最具有预测能力的特征子集。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据在当今世界意味着金钱。

随着向基于app的世界的过渡,数据呈指数增长。

然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式。

数据挖掘或“数据库中的知识发现”是通过人工智能、机器学习、统计和数据库系统发现大数据集中的模式的过程。

免费的数据挖掘工具包括从完整的模型开发环境如Knime和Orange,到各种用Java、c++编写的库,最常见的是Python。

数据挖掘中通常涉及到四种任务:
分类:将熟悉的结构概括为新数据的任务
聚类:在数据中以某种方式查找组和结构的任务,而不需要在数据中使用已注意的结构。

关联规则学习:查找变量之间的关系
回归:旨在找到一个函数,用最小的错误来模拟数据。

下面列出了用于数据挖掘的免费软件工具
数据挖掘工具
1.Rapid Miner
Rapid Miner,原名YALE又一个学习环境,是一个用于机器学习和数据挖掘实验的环境,用
于研究和实际的数据挖掘任务。

毫无疑问,这是世界领先的数据挖掘开源系统。

该工具以Java编程语言编写,通过基于模板的框架提供高级分析。

它使得实验可以由大量的可任意嵌套的操作符组成,这些操作符在xmxxxxl文件中是详细的,并且是由快速的Miner的图形用户界面完成的。

最好的是用户不需要编写代码。

它已经有许
多模板和其他工具,让我们可以轻松地分析数据。

2. IBM SPSS Modeler
IBM SPSS Modeler工具工作台最适合处理文本分析等大型项目,其可视化界面非常有价值。

它允许您在不编程的情况下生成各种数据挖掘算法。

它也可以用于异常检测、贝叶斯网络、CARMA、Cox回归以及使用多层感知器进行反向传播学习的基本神经网络。

3.Oracle Data Mining
Oracle。

作为“高级分析数据库”选项的一部分,Oracle数据挖掘功能允许其用户发现洞察力,进行预测并利用其Oracle数据。

您可以构建模型来发现客户行为目标客户和开发概要文件。

Oracle Data Miner GUI使数据分析师、业务分析师和数据科学家能够使用相当优雅的拖放解
决方案处理数据库内的数据。

它还可以为整个企业的自动化、调度和部署创建SQL和PL / SQL脚本。

4. Teradata
Teradata认识到,尽管大数据是令人敬畏的,但如果您实际上并不知道如何分析和使用它,
那么它是毫无价值的。

想象一下,有数百万的数据点没有查询的技能。

这就是Teradata所提供的。

它们提供数据仓库,大数据和分析以及市场营销应用程序方面的端到端解决方案和服务。

Teradata还提供一系列的服务,包括实施,业务咨询,培训和支持。

5. frxxxxamed Data
这是一个完全管理的解决方案,这意味着你不需要做任何事情,而是坐下来等待见解。

框架
数据从企业获取数据,并将其转化为可行的见解和决策。

他们在云中训练、优化和存储产品
的电离模型,并通过API提供预测,消除基础架构开销。

他们提供了仪表板和情景分析工具,告诉你哪些公司杠杆是驾驶你关心的指标。

6. Kaggle
Kaggle是全球最大的数据科学社区。

公司和研究人员张贴他们的数据,来自世界各地的统计
人员和数据挖掘者竞相制作最好的模型。

Kaggle是数据科学竞赛的平台。

它帮助您解决难题,招募强大的团队,并扩大您的数据科学人才的力量。

3个步骤的工作:
上传预测问题
提交
评估和交流
7. Weka
WEKA是一个非常复杂的数据挖掘工具。

它向您展示了数据集、集群、预测建模、可视化等方面的各种关系。

您可以应用多种分类器来深入了解数据。

8. Rattle
Rattle代表R分析工具轻松学习。

它提供数据的统计和可视化汇总,将数据转换为可以轻松建模的表单,从数据中构建无监督模型和监督模型,以图形方式呈现模型的性能,并对新数据集进行评分。

它是一个使用Gnome图形界面在统计语言R编写的免费的开源数据挖掘工具包。

它运行在GNU / Linux,Macintosh OS X和MS / Windows下。

9. KNIME
Konstanz信息采集器是一个用户友好、可理解、全面的开源数据集成、处理、分析和探索平台。

它有一个图形用户界面,帮助用户方便地连接节点进行数据处理。

KNIME还通过模块化的数据流水线概念集成了机器学习和数据挖掘的各种组件,并引起了商业智能和财务数据分析的注意。

10. Python
作为一种免费且开放源代码的语言,Python通常与R进行比较,以方便使用。

与R不同的是,Python的学习曲线往往很短,因此成了传奇。

许多用户发现,他们可以开始构建数据集,并在几分钟内完成极其复杂的亲和力分析。

只要您熟悉变量、数据类型、函数、条件和循环
等基本编程概念,最常见的业务用例数据可视化就很简单。

11. Orange
Orange是一个以Python语言编写的基于组件的数据挖掘和机器学习软件套件。

它是一个开放源码的数据可视化和分析的新手和专家。

数据挖掘可以通过可视化编程或Python脚本进行。

它还包含了数据分析、不同的可视化、从散点图、条形图、树、到树图、网络和热图的特征。

12. SAS Data Mining
使用SAS Data Mining商业软件发现数据集模式。

其描述性和预测性建模提供了更好的理解
数据的见解。

他们提供了一个易于使用的GUI。

他们拥有自动化的数据处理工具,集群到
最终可以找到正确决策的最佳结果。

作为一个商业软件,它还包括可升级处理、自动化、强
化算法、建模、数据可视化和勘探等先进工具。

13. Apache Mahout
Apache Mahout是Apache软件基金会(Apache Software Foundation)的一个项目,用于生成主要集中在协作过滤、聚类和分类领域的分布式或其他可伸缩机器学习算法的免费实现。

Apache Mahout主要支持三种用例:建议挖掘采取用户行为,并尝试查找用户可能喜欢的项目。

集群需要文本文档,并将它们分组为局部相关的文档。

分类从现有的分类文档中学习到特定类别的文档是什么样子,并能够将未标记的文档分配给(希望)正确的类别。

14. PSPP
PSPP是对采样数据进行统计分析的程序。

它有一个图形用户界面和传统的命令行界面。

它用C语言编写,使用GNU科学图书馆的数学例程,并绘制UTILS来生成图表。

它是专有程序SPSS(来自IBM)的免费替代品,可以自信地预测接下来会发生什么,以便您可以做出更明智的决策,解决问题并改进结果。

15. jHepWork
jHepWork是一个免费的开放源代码数据分析框架,它是为了使用开放源代码软件包和可理解的用户界面创建一个数据分析环境,并创建一个与商业程序相竞争的工具。

JHepWork显示数据集的交互式2D和3D图,以便更好地分析。

Java中实现了数字科学库和数学函数。

jHepWork基于高级编程语言Jython,但Java编码也可用于调用jHepWork数值库和图形库。

16. R programming Language
为什么R是这个名单上免费数据挖掘工具的超级巨星?它是免费的、开源的,并且很容易为
那些没有编程经验的人挑选。

实际上,有数以千计的库可以集成到R环境中,使其成为一个
强大的数据挖掘环境。

它是一个免费的软件编程语言和软件环境,用于统计计算和图形。

在数据采矿者中广泛使用R语言进行统计软件和数据分析。

近年来,易用性和可扩展性大大
提高了R的知名度。

17. Pentaho
Pentaho为数据集成,业务分析和大数据提供了一个全面的平台。

有了这个商业工具,你可
以轻松地融合任何来源的数据。

深入了解您的业务数据,为未来做出更准确的信息驱动决策。

18. Tanagra
TANAGRA是一个用于学术和研究目的的数据挖掘软件。

有探索性数据分析,统计学习,机器学习和数据库领域的工具。

Tanagra包含一些监督学习,但也包括其他范例,如聚类,因子分析,参数和非参数统计,关联规则,特征选择和构建算法。

19. NLTK
自然语言工具包,是一套用于Python语言的符号和统计自然语言处理(NLP)的库和程序。

它提供了一个语言处理工具库,包括数据挖掘,机器学习,数据报废,情感分析和其他各种语言处理任务。

构建python程序来处理人类语言数据。

相关文档
最新文档