-
Bi-shoe and Phi-shoe【lightoj1370】——欧拉数
所属栏目:[大数据] 日期:2021-03-17 热度:114
Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a very popular coach for his success. He needs some bamboos for his students,so he asked his assistant Bi-Shoe to go to the market and buy them. Plenty of B[详细]
-
BI cube的前世今生:商业智能BI为什么需要cube技术
所属栏目:[大数据] 日期:2021-03-16 热度:159
企业中常常会出现这样一幕幕尴尬的场景: 企业的决策人员需要从不同的角度来审视业务,协助他们分析业务,例如分析销售数据,可能会综合时间周期、产品类别、地理分布、客户群类等多种因素来考量。 IT 人员在每一个分析角度上都建了一张报表。然而,决策人员[详细]
-
一共81个,开源大数据处理工具汇总(上)
所属栏目:[大数据] 日期:2021-03-16 热度:178
作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一[详细]
-
一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集
所属栏目:[大数据] 日期:2021-03-16 热度:79
作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设[详细]
-
大数据处理的一些总结和应用(有关舆情监控)
所属栏目:[大数据] 日期:2021-03-16 热度:144
? ? 说到大数据处理可能大家都不会陌生,这是近年来非常火热的话题,各行各业都想借助大数据为自己助力,有了这个工具,就好像在飞机上看农田一般清晰,一目了然,也也就是业内人士常说的大数据提供了一个------上帝视角 大数据的概念: 1、指的是所涉及的资[详细]
-
[BZOJ3110][Zjoi2013]K大数查询(主席数套线段树 )
所属栏目:[大数据] 日期:2021-03-16 热度:88
题目描述 传送门 题解 外层权值线段树,权值线段树的每一个位置都是一棵线段树,线段树用动态开点。 注意pushdown或者查询的时候还有可能要继续开点。 注意最顶端的点的权有可能是炸了int了,因为有可能加入了50000^2个点。 代码 #includealgorithm#includei[详细]
-
余弦相似性:找出相似文章
所属栏目:[大数据] 日期:2021-03-16 热度:59
上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cos[详细]
-
bzoj 3110: [Zjoi2013]K大数查询(树套树,整体二分)
所属栏目:[大数据] 日期:2021-03-16 热度:193
3110: [Zjoi2013]K大数查询 Time Limit:? 20 Sec?? Memory Limit:? 512 MB Submit:? 4020?? Solved:? 1547 [ Submit][ Status][ Discuss] Description 有N个位置,M个操作。操作有两种,每次操作如果是1 a b c的形式表示在第a个位置到第b个位置,每个位置加[详细]
-
数据流和批量大数据分析技术 Apache Apex 提升为 Apache 顶级项
所属栏目:[大数据] 日期:2021-03-16 热度:96
数据流和批量大数据分析技术Apache Apex近日被Apache软件基金会提升为顶级项目。这项技术已被包括第一资本(Capital One)和通用电气(GE)在内的企业组织使用,可以帮助开发人员更快速地创建充分利用实时数据的应用程序。 Apache Spark日益受到关注,表明了[详细]
-
大数加法运算
所属栏目:[大数据] 日期:2021-03-16 热度:52
void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen(a);int lenb = strlen(b);for (int i = lena - 1,j = 0; i = 0; i--)[详细]
-
图像相似性搜索的原理
所属栏目:[大数据] 日期:2021-03-16 热度:199
本文转自: http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html http://www.voidcn.com/article/p-nvcdxgfv-bnx.html http://blog.sina.com.cn/s/blog_b27f71160101gp9c.html http://www.voidcn.com/article/p-ojqegjmq-wy.html[详细]
-
TF-IDF与余弦相似性的应用(二):自动摘要
所属栏目:[大数据] 日期:2021-03-15 热度:72
作者: 阮一峰 日期: 2013年3月26日 有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行的方法。 今天,依然继续这个[详细]
-
【原创】薛存金:面向海洋异常变化的时空关联挖掘模型
所属栏目:[大数据] 日期:2021-03-15 热度:180
此内容为数据派独家内容, 数据派 是清华大数据产业联合会官方微信公众账号,定期发布清华大数据系列讲座信息,分享讲座实录,欢迎个人转发、收藏 。 其他机构或媒体如需转载,请联系 yafei.xue@tsingdata.com 申请授权。 【在 “数据派” 回复 “清华大数据[详细]
-
HDOJ/HDU 1250 Hat#39;s Fibonacci(大数~斐波拉契)
所属栏目:[大数据] 日期:2021-03-15 热度:51
Problem Description A Fibonacci sequence is calculated by adding the previous two members the sequence,with the first two members being both 1. F(1) = 1,F(2) = 1,F(3) = 1,F(4) = 1,F(n4) = F(n - 1) + F(n-2) + F(n-3) + F(n-4) Your task is to[详细]
-
HDOJ/HDU 1133 Buy the Ticket(数论~卡特兰数~大数~)
所属栏目:[大数据] 日期:2021-03-15 热度:183
Problem Description The “Harry Potter and the Goblet of Fire” will be on show in the next few days. As a crazy fan of Harry Potter,you will go to the cinema and have the first sight,won’t you? Suppose the cinema only has one ticket-offi[详细]
-
数据化运营管理_互联网行业(一)(流量篇)
所属栏目:[大数据] 日期:2021-03-15 热度:130
? ? ? ? 现在的工作会接触到很多互联网公司做bi分析的朋友,想就着这个机会,把自己所见到、学到的整理一下与大家分享,同时也希望通过分享来增加与相通兴趣的朋友的交流。文章中存在的各种不足或者错误,欢迎大家评论。 ? ? ? ? 关于数据化管理的文章书籍已[详细]
-
POJ2389大数相乘
所属栏目:[大数据] 日期:2021-03-15 热度:68
Source Code Problem: ?2389 ? User: ?fan1913068672 Memory: ?3040K ? Time: ?1344MS Language: ?Java ? Result: ? Accepted Source Code import java . util . Scanner ; . math . BigDecimal . BigInteger ; public class Main { public static void main[详细]
-
HDOJ3565 Bi-peak Number
所属栏目:[大数据] 日期:2021-03-15 热度:115
题目链接:HDOJ3565 题意:首先定义了一个peak number,是没有前导0的,存在某一个数位,比左右两边的数字都大的数 然后Bi-peak number,是两个peak number的数位相连 分析样例就能够得到这个题的坑点,很友善的题 样例1是只有5个数位,要分成Bi-peak number[详细]
-
HDOJ/HDU 1297 Children’s Queue(推导~大数)
所属栏目:[大数据] 日期:2021-03-15 热度:156
Problem Description There are many students in PHT School. One day,the headmaster whose name is PigHeader wanted all students stand in a line. He prescribed that girl can not be in single. In other words,either no girl in the queue or more[详细]
-
Astar2016-Round2B 1003(杨辉三角,求大数组合)
所属栏目:[大数据] 日期:2021-03-15 热度:190
FROM: 2016"百度之星" - 初赛(Astar Round2B) http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=702pid=1003 Problem Description 有一个无限大的矩形,初始时你在左上角(即第一行第一列),每次你都可以选择一个右下方格子,并瞬移过[详细]
-
Twitter发布新的大数据实时分析系统Heron
所属栏目:[大数据] 日期:2021-03-11 热度:144
Twitter发布新的大数据实时分析系统Heron http://geek.csdn.net/news/detail/33750 Twitter Heron的深入解析(与Storm的比较) http://www.tuicool.com/articles/2mMZver[详细]
-
NMEA-0183之$GPRMC数据处理
所属栏目:[大数据] 日期:2021-03-11 热度:93
NMEA-0183 u?以下为 GPS 芯片串口发出的数据: 201512_15:42:3712,$GPTXT,ANTSTATUS=SHORT*43 201512_15:42:37$GNGGA,074219.000,3021.516740,N,12005.998703,E,1,9,1.09,20.996,M,6.991,*42 201512_15:42:37$GNGLL,A,A*45 201512_15:42:37$GPGSA,3,20,18,25[详细]
-
【工作帮】微盟数据中心招数据分析师,薪资open
所属栏目:[大数据] 日期:2021-03-11 热度:98
坐标:上海 微盟:C轮创业公司,投资方包含腾讯、海航等实力资本,拥有toB和toC的电商业务,广告和理财为蓄力点,发展迅速。 微盟数据中心:承接整个集团的数据,体积大,种类多,想象力丰富 微盟数据中心数据分析师:Growth Hacking的推动者,从数据中发现[详细]
-
使用Zeppelin来实现大数据分析的可视化
所属栏目:[大数据] 日期:2021-03-11 热度:77
Apache Zeppelin是ASF的一个孵化项目,实现了基于web的在线代码编辑与数据可视化。有点类似Spark-Shell的REPL。其结果可以直接用图表来展示,解决了前端白痴的苦逼。 Zeppelin官网 我们可以直接下载 zeppelin-0.5.6-incubating-bin-all.tgz ,然后部署到服务[详细]
-
初识聚类算法:K均值、凝聚层次聚类和DBSCAN
所属栏目:[大数据] 日期:2021-03-11 热度:186
http://blog.sina.com.cn/s/blog_62186b460101ard2.html 聚类分析就仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组 ( 簇 ) 。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组 间差别越大,聚类就越好。[详细]
