【CN109977151B】一种数据分析方法及系统【专利】
【CN109977399A】一种基于NLP技术的数据分析方法及装置【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910164099.1(22)申请日 2019.03.05(71)申请人 国网青海省电力公司地址 810008 青海省西宁市城西区胜利路89号申请人 北京中电普华信息技术有限公司 国网信息通信产业集团有限公司 国家电网有限公司(72)发明人 钟宪成 段振华 郭英 张相文 张容福 (74)专利代理机构 北京集佳知识产权代理有限公司 11227代理人 王宝筠(51)Int.Cl.G06F 17/27(2006.01)(54)发明名称一种基于NLP技术的数据分析方法及装置(57)摘要本申请提供的一种基于NLP技术的数据分析方法及装置,获取目标文档集合,并对所述目标文档集合中的每个目标文档进行分词处理;利用TF -IDF方法提取分词后每个所述目标文档的关键词以及每个关键词在每个所述目标文档中的词频,生成所述目标文档集合的文档-关键词矩阵,所述文档-关键词矩阵表示每个所述目标文档中每个关键词的词频;将所述文档-关键词矩阵输入文档主题生成模型中进行处理,得到每个主题中每个关键词的概率分布和每个所述目标文档中每个主题的概率分布,实现了对非结构化文本的分析处理。
权利要求书2页 说明书7页 附图2页CN 109977399 A 2019.07.05C N 109977399A权 利 要 求 书1/2页CN 109977399 A1.一种基于NLP技术的数据分析方法,其特征在于,包括:获取目标文档集合,并对所述目标文档集合中的每个目标文档进行分词处理;利用TF-IDF方法提取分词后每个所述目标文档的关键词以及每个关键词在每个所述目标文档中的词频,利用NLP技术生成所述目标文档集合的文档-关键词矩阵,所述文档-关键词矩阵表示每个所述目标文档中每个关键词的词频;将所述文档-关键词矩阵输入文档主题生成模型中进行处理,得到每个主题中每个关键词的概率分布和每个所述目标文档中每个主题的概率分布。
一种大数据分析方法及系统[发明专利]
![一种大数据分析方法及系统[发明专利]](https://img.taocdn.com/s3/m/68a174dfc9d376eeaeaad1f34693daef5ef713e7.png)
专利名称:一种大数据分析方法及系统
专利类型:发明专利
发明人:逯鹰,张毅,王晓青,赵磊,朱晓琳,任保宁,秦超,王腾蛟,陈薇
申请号:CN202210121114.6
申请日:20220209
公开号:CN114492435A
公开日:
20220513
专利内容由知识产权出版社提供
摘要:本发明提供了大数据分析方法及系统,方法包括获取分析单位的历史年报信息;对历史年报信息进行预处理,以得到样本特征;对样本特征进行筛选,以得到筛选特征;根据筛选特征构建模型特征;根据分析算法对模型特征进行训练,得到分析模型;获取分析单位的实时年报信息,将实时年报信息输入至分析模型,以得到分析结果。
该方法采集海量的年报信息,提高数据的覆盖程度和准确性;利用大数据及AI技术对年报信息进行处理分析,提取更加合理、有效的特征;使用多个分析算法训练选择分析模型,利用分析模型生成分析结果,并为分析企业或业务流程提供建设性建议,该方法能够适用于各种复杂的数据分析场景,适应性更广,同时提高了数据分析的工作效率。
申请人:中共青岛市委机构编制委员会办公室,青岛视图信息科技有限公司,北京大学(青岛)计算社会科学研究院
地址:266071 山东省青岛市市南区东海西路7号
国籍:CN
更多信息请下载全文后查看。
一种数据分析方法及系统[发明专利]
![一种数据分析方法及系统[发明专利]](https://img.taocdn.com/s3/m/6554c1fc6bd97f192379e940.png)
专利名称:一种数据分析方法及系统专利类型:发明专利
发明人:陈远翔,马斌
申请号:CN201610570708.X
申请日:20160719
公开号:CN106202953A
公开日:
20161207
专利内容由知识产权出版社提供
摘要:本发明公开了一种数据分析方法及系统,属于测量领域。
该数据分析方法包括:服务器根据用户的心跳间隔数据,获得用户的实时心率;获取用户的心跳间隔数据的功率谱,根据功率谱,获得用户的自律神经平衡性;根据用户的第一身体指标参数、实时心率及实时全部窦性心博间期标准差获得用户的运动风险分析数据;根据实时心率、功率谱、自律神经平衡性及运动负荷指数获得用户的精神状态分析数据;根据用户的第二身体指标参数、实时心率及预设的运动强度模型获取用户的运动效果分析数据。
与现有的移动设备相比,改善了现有的移动设备不能获得与心率相关的其他数据的问题,有效地方便了用户的使用。
申请人:北京心量科技有限公司
地址:100000 北京市海淀区清河安宁庄东路18号20幢4层4051
国籍:CN
代理机构:北京超凡志成知识产权代理事务所(普通合伙)
代理人:赵秀英
更多信息请下载全文后查看。
一种数据分析方法及系统[发明专利]
![一种数据分析方法及系统[发明专利]](https://img.taocdn.com/s3/m/ab4172a42e3f5727a4e9625a.png)
专利名称:一种数据分析方法及系统
专利类型:发明专利
发明人:范莹,姜百宁,李龙,张传文,史汝凯申请号:CN202010467419.3
申请日:20200528
公开号:CN111611236A
公开日:
20200901
专利内容由知识产权出版社提供
摘要:本发明提供一种数据分析方法及系统,获取用户选择的与数据处理链对应的待分析数据表;确定数据处理链中的数据处理组件;其中,数据处理链包括用户选择的至少一个数据处理组件;确定用户为数据处理链指定的数据处理组件的执行顺序;根据数据处理组件的执行顺序和数据处理组件的数据处理方式,对待分析数据表进行数据处理,得到数据处理链的处理结果。
本发明数据处理链中的数据处理组件可以根据用户需要灵活配置,数据处理流程会随着用户选择的处理组件不同或用户指定的数据处理组件的执行顺序不同而发生变化,解决了数据处理流程固定且单一的问题,可以满足更多应用领域中工业数据的分析需求,通用性更强。
申请人:宁波和利时智能科技有限公司,北京和利时智能技术有限公司
地址:315000 浙江省宁波市高新区宁波新材料创新中心东区7幢38号5-7
国籍:CN
代理机构:北京集佳知识产权代理有限公司
代理人:钱娜
更多信息请下载全文后查看。
数据分析系统及方法[发明专利]
![数据分析系统及方法[发明专利]](https://img.taocdn.com/s3/m/46cd51427ed5360cba1aa8114431b90d6c8589f1.png)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201611116673.9(22)申请日 2016.12.07(71)申请人 深圳市小满科技有限公司地址 518000 广东省深圳市南山区深南大道9678号大冲商务中心1栋2号楼14层(72)发明人 童晓林 沙飞 (74)专利代理机构 深圳市鼎言知识产权代理有限公司 44311代理人 张利杰(51)Int.Cl.G06F 17/30(2006.01)G06Q 30/00(2012.01)(54)发明名称数据分析系统及方法(57)摘要一种数据分析系统包括一追踪单元及一分析单元。
所述追踪单元用于获取对应客户的操作记录的操作时间。
所述分析单元用于根据操作记录的操作时间与一计算时间之间的时间间隔计算得到一对应所述客户的第一值。
本发明还提供了一种数据分析方法。
本发明数据分析系统及方法通过分析对应所述客户的操作记录来对所述客户进行分析,如此,在数据分析前已将不必要的噪音进行过滤,在一定程度上有利于提高对分析结果的准确性。
权利要求书2页 说明书6页 附图4页CN 106557595 A 2017.04.05C N 106557595A1.一种数据分析系统,其特征在于,所述系统包括:一追踪单元,用于获取对应客户的操作记录的操作时间;及一分析单元,用于根据操作记录的操作时间与一计算时间之间的时间间隔计算得到一对应所述客户的第一值。
2.如权利要求1所述数据分析系统,其特征在于,所述数据分析系统还包括: 一发送单元,用于向所述客户发送邮件; 所述追踪单元,还用于获取向所述客户发送邮件的发送总数; 所述追踪单元,还用于获取所述客户打开所述邮件的打开总数; 所述分析单元,还用于根据所述打开总数与所述发送总数的比值计算得到一打开率; 所述分析单元,还用于获取至少一个用户访问所述客户的操作记录,并根据访问所述客户的操作记录计算得到一访问值;及 所述分析单元,还用于根据所述打开率及所述访问值计算得到一对应所述客户的第二值。
一种数据分析方法、装置和系统[发明专利]
![一种数据分析方法、装置和系统[发明专利]](https://img.taocdn.com/s3/m/90655af1227916888586d7a0.png)
专利名称:一种数据分析方法、装置和系统专利类型:发明专利
发明人:李伟进,侯会满
申请号:CN201911088890.5
申请日:20191108
公开号:CN112783874A
公开日:
20210511
专利内容由知识产权出版社提供
摘要:本发明公开了一种数据分析方法、装置和系统,涉及计算机技术领域。
该方法的一具体实施方式包括:获取预先为数据分析任务编写的业务逻辑脚本;其中,所述业务逻辑脚本包括数据源参数信息和业务逻辑代码;执行所述业务逻辑代码的数据提取逻辑,以从所述数据源参数信息指定的数据源中获取业务数据;执行所述业务逻辑代码的数据处理逻辑,以调用所述数据处理逻辑中设定的计算器集,对所述业务数据进行数据加工处理。
该方法通过获取包含业务逻辑代码的业务逻辑脚本,从指定的数据源中获取业务数据,之后调用计算器集实现对业务数据的加工处理,使得系统代码可以复用,开发效率高。
申请人:北京沃东天骏信息技术有限公司,北京京东世纪贸易有限公司
地址:100176 北京市北京经济技术开发区科创十一街18号院2号楼4层A402室
国籍:CN
代理机构:中原信达知识产权代理有限责任公司
更多信息请下载全文后查看。
一种数据分析系统和方法[发明专利]
![一种数据分析系统和方法[发明专利]](https://img.taocdn.com/s3/m/dae2129601f69e31423294c8.png)
专利名称:一种数据分析系统和方法专利类型:发明专利
发明人:许圣童,张琪琪
申请号:CN201911346308.0
申请日:20191224
公开号:CN111209506A
公开日:
20200529
专利内容由知识产权出版社提供
摘要:本发明公开了一种数据分析系统,包括:数据处理服务器,适于接收要进行数据分析的第三方页面标识;多个移动终端,每个移动终端中驻留有移动应用,其中移动应用适于在执行时请求访问第三方页面;数据采集服务器,适于将数据采集脚本发送到移动终端,以便移动终端中的移动应用在呈现第三方页面时执行数据采集脚本,将所采集的数据发送到数据采集服务器;其中数据处理服务器对数据采集服务器上的、来自多个移动终端并与第三方页面相关联的数据进行分析,以提供第三方页面的数据分析结果。
本发明还一并公开了一种数据分析方法,一种计算设备和计算机可读存储介质。
申请人:车智互联(北京)科技有限公司
地址:100080 北京市海淀区丹棱街3号B座11层1110、1111室
国籍:CN
代理机构:北京思睿峰知识产权代理有限公司
更多信息请下载全文后查看。
数据分析方法和系统[发明专利]
![数据分析方法和系统[发明专利]](https://img.taocdn.com/s3/m/680c21e4ba1aa8114531d9c4.png)
专利名称:数据分析方法和系统
专利类型:发明专利
发明人:胡云,陈立,龚健,李邱林,唐明辉,陈尚元,贾西贝申请号:CN201910535655.1
申请日:20190618
公开号:CN110377668A
公开日:
20191025
专利内容由知识产权出版社提供
摘要:本发明公开了一种数据分析方法,包括接收获取配置数据请求;根据获取配置数据请求获取数据库中的数据;对数据库的数据进行维度管理和聚合管理,分别形成维度表和聚合表;加载维度表和聚合表,得到包含维度表和聚合表的数据模型,解析并管理所述数据模型得到维度模型,多维数据模型和SQL模型;根据获取配置数据请求返回请求结果。
现有技术中响应报表请求时,数据分析平台在数据源获取数据后,对数据的处理效率低,响应慢。
本发明旨在解决在获取数据源后,对获取的数据进行处理达到提高效率的目的。
申请人:深圳市华傲数据技术有限公司
地址:518000 广东省深圳市龙华新区清祥路清湖工业区宝能科技园7栋B座12楼J、K单位
国籍:CN
代理机构:北京众元弘策知识产权代理事务所(普通合伙)
代理人:宋磊
更多信息请下载全文后查看。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利
(10)授权公告号 (45)授权公告日 (21)申请号 201910245141.2(22)申请日 2019.03.28(65)同一申请的已公布的文献号
申请公布号 CN 109977151 A (43)申请公布日 2019.07.05
(73)专利权人 北京九章云极科技有限公司
地址 100085 北京市海淀区上地西路41号
院1号楼4层E-002(72)发明人 张帆 路明奎
(74)专利代理机构 北京银龙知识产权代理有限
公司 11243
代理人 许静 安利霞(51)Int.Cl.
G06F 16/2458(2019.01)
(56)对比文件
CN 107609147 A ,2018.01.19,说明书第[0021]段-[0089]段.
CN 107609147 A ,2018.01.19,全文.CN 107609147 A ,2018.01.19,说明书第[0021]段-[0089]段.
CN 105302911 A ,2016.02.03,全文.无.“特征工程:特征抽象、特征衍生”.《布布扣-http://www.bubuko/com/infodetail-2964388.html》.2019,文章第1-6页.
审查员 范双燕
(54)发明名称
一种数据分析方法及系统(57)摘要
本发明提供了一种数据分析方法及系统,涉及数据分析领域。
该数据分析方法,包括:基于待分析的业务数据和/或业务场景获取基本特征,并确定特征衍生方式;根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征;根据所述衍生特征创建业务模型,以执行分析处理操作。
上述方案,可以提高业务模型与业务场景和业务需求的契合度,
提高数据分析的准确度。
权利要求书6页 说明书20页 附图3页
CN 109977151 B 2020.02.07
C N 109977151
B
权 利 要 求 书1/6页CN 109977151 B
1.一种数据分析方法,其特征在于,包括:
基于待分析的业务数据和/或业务场景获取基本特征,并确定特征衍生方式;
根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征;
根据所述衍生特征创建业务模型,以执行分析处理操作;
其中,所述特征衍生方式包括下述至少之一:基于业务目标衍生、基于深度学习衍生、基于特征组合衍生、基于时间变量衍生、基于决策树模型衍生及基于数值转换衍生;
所述根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征,包括:
基于所述基本特征之间的关联关系,对一个基本特征衍生多层深度变量,得到衍生特征;或者,基于所述基本特征的兴趣指标利用深度特征合成的方式,生成衍生特征;
其中,所述基于所述基本特征之间的关联关系,对一个基本特征衍生多层深度变量,得到衍生特征,具体包括:基于所述基本特征之间的关联关系,组合使用多种特征衍生方式,对一个基本特征衍生多层深度变量,得到衍生特征;
所述基于所述基本特征的兴趣指标利用深度特征合成的方式,生成衍生特征,具体包括:基于所述基本特征的兴趣指标利用深度特征合成的方式,组合使用多种特征衍生方式,生成衍生特征;
组合使用的多种特征衍生方式的个数基于业务数据和业务场景确定;
其中,业务场景的业务特点包括业务特征和属性特点。
2.根据权利要求1所述的数据分析方法,其特征在于,所述根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征,包括:
基于业务场景和业务目标,获取与所述业务场景对应的业务经验数据;
根据所述业务经验数据,通过所述基本特征构造与所述业务目标相关的特征,得到衍生特征。
3.根据权利要求1所述的数据分析方法,其特征在于,所述根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征,包括:
通过稀疏自编码算法、因子分解机算法和深度交叉神经网络算法中的至少之一,对所述基本特征进行深度学习,获取衍生特征。
4.根据权利要求3所述的数据分析方法,其特征在于,当通过所述稀疏自编码算法对所述基本特征进行深度学习时,所述获取衍生特征,包括:
将所述基本特征输入到稀疏自编码神经网络中,获取所述稀疏自编码神经网络的隐藏层的各单元的激活值组成的向量,将所述向量作为衍生特征。
5.根据权利要求3所述的数据分析方法,其特征在于,当通过所述因子分解机算法对所述基本特征进行深度学习时,所述获取衍生特征,包括:
获取基于运行所述因子分解机算法模型引入的交叉特征,将所述交叉特征确定为衍生特征。
6.根据权利要求3所述的数据分析方法,其特征在于,当通过所述深度交叉神经网络算法对所述基本特征进行深度学习时,所述获取衍生特征,包括:
将所述基本特征输入深度交叉神经网络,分别通过交叉网络和深度网络得到第一输入结果和第二输入结果,将所述第一输入结果和第二输入结果进行组合,得到衍生特征。
7.根据权利要求1所述的数据分析方法,其特征在于,所述根据确定的特征衍生方式对
2。