-
九种常见的数据分析模型
所属栏目:[大数据] 日期:2020-12-26 热度:160
1. 漏斗分析模型 漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。 运营人员可以通过观察不同属性的用户群体(如新注册用户与老客户、不同渠道来源的客户)各环节转化率,各流程步骤转化率的[详细]
-
大数据领域常用技术栈
所属栏目:[大数据] 日期:2020-12-26 热度:119
提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得非常迅速的发[详细]
-
Databricks说的Lakehouse是什么?
所属栏目:[大数据] 日期:2020-12-26 热度:74
? 在过去的几年里,Lakehouse作为一种新的数据管理范式,已独立出现在Databricks的许多用户和应用案例中。在这篇文章中,我们将阐述这种新范式以及它相对于之前方案的优势。 数据仓库在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代末问世以来[详细]
-
《Speed-BI云平台-基于Excel数据源的技巧应用:区域销售收入分析
所属栏目:[大数据] 日期:2020-12-25 热度:66
对于刚接触speed-BI的朋友们,一些看似很简单很琐碎的动作,当没有小窍门和智能化的操作就会使得工作量变大,时间耗起来真要命。本次课就将围绕speed-BI常用的功能进行串讲,还有特别的小技巧一并教授,成为speed-BI的技巧王! ? 课程应用: 本次课程以销售[详细]
-
[bigdata-042]从头搭建 spring+mvc+boot+tomcat
所属栏目:[大数据] 日期:2020-12-25 热度:66
1. 需求 1.1 在spring.io下载一个spring mvc的demo,能运行成功。 1.2 按照自己的理解,重写这个例子,并做适当修改,运行成功。 1.3 将这个例子打包成war包,放到tomcat运行成功。 2. 在spring.ip下载spring mvc并运行 2.1 spring的例子在 http://spring.io[详细]
-
[bigdata-043] tomcat的一些资料和文档试用( 未整理)
所属栏目:[大数据] 日期:2020-12-25 热度:140
1. tomcat的官网在这里 http://tomcat.apache.org/whichversion.html 2. tomcat的版本跟jdk相关。jdk1.8已经广泛使用,选择tomcat 9优先。 3. 下载tomcat 9 3.1 首先要阅读文档 https://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-9/v9.0.0.M17/REA[详细]
-
[bigdata-044] CDH的官方文档部分翻译(未整理且未完成)
所属栏目:[大数据] 日期:2020-12-25 热度:174
1. cloudera官网 http://www.cloudera.com/ 2. cloudera文档 http://www.cloudera.com/documentation.html 3. 文档分为三个部分 ? 3.1 cloudera enterprise: cdh,cloudera manger,search,impala,spark。 ? 3.2 cloudera director: 安装指南,配置,以及使用c[详细]
-
慧眼云:基于云计算和大数据分析的主动防御实践
所属栏目:[大数据] 日期:2020-12-25 热度:153
http://www.csdn.net/article/1970-01-01/2825623 不论IT如何变迁,网络安全始终是不过时的话题。但不同环境的网络安全有不同的内涵,当前全产业转型“互联网+”,云计算、大数据和移动互联网技术的普及应用,极大地改变了IT架构,网络边界越来越模糊,同时[详细]
-
[bigdata-045] redis故障处理 #34;Can#39;t save in backg
所属栏目:[大数据] 日期:2020-12-25 热度:116
发现官网出错了。经过检查,发现连接不到redis。检查redis的log,发现错误 Can't save in background: fork: Cannot allocate memory 搜索相关资料,这里说的比较详细 http://www.cnblogs.com/qq78292959/p/3994341.html http://blog.csdn.net/zqz_zqz/artic[详细]
-
[bigdata-046] eclipse+spring开发web然后部署到tomcat
所属栏目:[大数据] 日期:2020-12-25 热度:83
1. 用eclipse开发spring,需要使用相关的ide 2. spring官网的ide https://spring.io/tools/eclipse 3. spring的tool suite https://spring.io/tools/sts 这个是专用开发spring的。 选择 https://spring.io/tools/sts/all 这里的linux64版本。 4. 在eclipse e[详细]
-
大数据分析与处理
所属栏目:[大数据] 日期:2020-12-25 热度:123
? ? 一、大数据分析与处理 1.文件批处理 ??????以MapReduce、Hive为典型代表,批处理模式解决了传统的数据仓库无法处理海量数据的难题。通过批处理计算引擎,使得海量数据分析成为可能。没有批处理引擎的诞生,也就没有今天风风火火的大数据。 ??????数据通[详细]
-
新飞电器的BI建设案例
所属栏目:[大数据] 日期:2020-12-25 热度:63
一、河南新飞电器简介 河南新飞电器在制造行业内属于领先地位,其信息化程度较高,面对系统多且杂乱的情况,一个集中展示数据的平台就显得尤为重要。使用BI就是为了在一个相对统一的平台展示需要查看的数据,供决策层进行分析查看,从而做出更加有依据的判断[详细]
-
Gartner发布2017年商业智能(BI)魔力象限报告――云商业智能工
所属栏目:[大数据] 日期:2020-12-25 热度:76
对我来说,等待Gartner发布最新一期的Gartner商业智能魔力象限报告,看看有哪些最新的意外总是一件令人兴奋的事情。 今年的魔力象限报告包括几个意外,并且对这个市场的现状以及未来发展方向发表了几点想法。 2017年的魔力象限看起来像这样: Gartner还没有[详细]
-
BigData数据可视化软件及工具
所属栏目:[大数据] 日期:2020-12-25 热度:109
摘要: 大量繁杂的数据在经过可视化工具处理后,就能以图形化的形式展现在用户面前,清晰直观。随着各种数据的增加,这种可视化工具越来越得到开发者们的欢迎。本文向大家推荐30款数据可视化工具。 各个互联网公司通过大量的用户数据、信息进行统计分析,而[详细]
-
ArcGIS Desktop 无法录入数据处理一例
所属栏目:[大数据] 日期:2020-12-25 热度:112
最近,搭建了一个DB2的测试环境,装完系统后,发现有一个美国带的样例数据无法导入,详细环境如下: 桌面:Desktop 10.3.1 DB2: V97 FP8 X64 For NT 从错误信息上得不到任何的提示,继续做测试 导入数据的时候出了空间字段,属性字段全部删除,可以导入进去,[详细]
-
基于大数据分析的安全管理平台技术研究及应用
所属栏目:[大数据] 日期:2020-12-25 热度:83
转自:http://www.36dsj.com/archives/30027 基于大数据分析的安全管理平台技术研究及应用 基于大数据分析的安全管理平台技术研究及应用 Research and Application of Big Data Analysis Based Security Management Platform Last Modified By yepeng @ 2014[详细]
-
BI解决方案资料收集
所属栏目:[大数据] 日期:2020-12-25 热度:71
ETL工具:Kettle(官网,Pentaho公司开源)、?Informatica、Datastage、OWB、微软DTS、Beeload、久其ETL,Oracle GoldenGate等等……开源的工具(16款开源工具,OSchina ETL工具列表),有eclipse的ETL插件: cloveretl 工作流引擎:jBPM,Activiti,H3 BPM,?[详细]
-
文本挖掘:手把手教你分析携程网评论数据
所属栏目:[大数据] 日期:2020-12-25 热度:67
文本分析的应用越来越广泛,这不,我的工作也开始涉及了文本分析,今天就讲讲关于评论数据的那点事。 首先评论数据如何获取? 一般通过 网络爬虫的方式 抓取各大网站的评论数据,本次分析数据就来源于携程网某酒店的评论,在同事的协助下,成功爬取该酒店的[详细]
-
R中文舆情包cnSentimentR
所属栏目:[大数据] 日期:2020-12-25 热度:148
该包使用jiebaR分词,svm[e1071]进行分类; 包括三个函数:cnsr.prepare,cnsr.train,cnsr.predict 目前还在开发中,功能不完整. 请见: https://github.com/leeshuheng/cnSentimentR[详细]
-
工作坊 | 大数据智能分析和挖掘在互联网中的应用实战案例
所属栏目:[大数据] 日期:2020-12-25 热度:130
大数据分析和挖掘在互联网公司中已经得到实质性的推进和应用,典型的应用场景包括搜索引擎的搜索结果和搜索广告排序、电商网站的商品推荐和虚假信息检测、电子邮件服务中垃圾邮件检测、互联网安全公司的病毒和木马检测、视频和新闻分享网站中视频和新闻推荐[详细]
-
内衣大数据分析:透过女生内衣的需求变化,看年轻人的情趣生活
所属栏目:[大数据] 日期:2020-12-24 热度:56
报道大数据企业: 大数据产品、大数据方案、 ? 大数据人物 分享大数据干货: 大数据书籍、大数据报告、 大数据视频 本文系大数据人精选自网络。 欢迎更多优质原创文章投稿给大数据人:admin@bigdata.ren 小编微信:data985 End. 版权声明 : 由“大数据人”[详细]
-
[bigdata-041] python3+re 正则表达式 手机号微信号qq号
所属栏目:[大数据] 日期:2020-12-24 热度:169
import reREGEX_PHONE = re.compile(r'1d{10}',re.IGNORECASE)REGEX_QQ = re.compile(r'[1-9]d{4,10}',re.IGNORECASE)REGEX_WX1 = re.compile(u'微信[w,-]{1,20}'.encode('utf8'),re.IGNORECASE)#正则手机号码def get_all_phone_num(s1): global REGEX_PH[详细]
-
数据挖掘:手把手教你做文本挖掘
所属栏目:[大数据] 日期:2020-12-24 热度:124
1 文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 ? 2 文本挖掘步骤 1)读取数据库或本地外部文本文[详细]
-
蓝桥杯-区间k大数查询
所属栏目:[大数据] 日期:2020-12-24 热度:140
从题目上看,用int类型数据就够了,没必要考虑long这些~~ 在题目中,直接用了Collection工具类中的sort方法,是从小到大排序,据了解,Java自带的排序算法应该是优化过的快速排序,算法可靠。 package 区间k大数查询 ; import java .util .ArrayList ; impor[详细]
-
数据挖掘中的模式发现(五)挖掘多样频繁模式
所属栏目:[大数据] 日期:2020-12-24 热度:106
挖掘多层次的关联规则(Mining Multi-Level Associations) 定义 项经常形成层次。 如图所示 那么我们可以根据项的细化分类得到更多有趣的模式,发现更多细节的特性。 Level-reduced min-support 使用的是Level-reduced min-support方法来设置最低支持度,即,[详细]