[置顶] HIVE表数据量和数据记录数的矛与盾

博客分类：

HIVE
HADOOP

HIVE作为在Hadoop分布式框架下的数据仓库技术，处理大数据量是最基本的诉求，这种海量处理是基于分布式框架，利用分布式存储，分布式计算，利用大集群的资源并行处理海量数据。但是一旦我们不能利用这种分布式并� ...

2012-07-06 09:45
浏览 12127
评论(1)
分类:开源软件

自己学习排序和二次排序的知识整理如下。 1.Hadoop的序列化格式介绍:Writable 2.Hadoop的key排序逻辑 3.全排序 4.如何自定义自己的Writable类型 5.如何实现二次排序 1.Hadoop的序列化格式介绍:Writable 要了解和编写MR实现排序必须要知道的第一个知识点就是Writable相关的接口和类，这些是HADOOP自己的序列化格式。更多的可能是要关注他的Subinterfaces：WritableComparable<T>。他是继承Writable和Comparable<T>接口，继而Writabl ...

2012-04-20 10:38
浏览 17553
评论(1)
分类:开源软件

数据分析之我见(1)-方法论

博客分类：

数据夜谈

数据分析发现问题分析问题解决问题

请关注微信公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要：数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析，以求最大化地开发数据资料的功能，发挥数据的作用。这是比较 ...

2014-03-13 19:57
浏览 1459
评论(0)
分类:互联网

大数据创业与投资(2)-电子商务

博客分类：

数据夜谈

大数据创业投资电子商务

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要：年前比较忙. 这篇开始会对大数据的具体应用场景和产品做个分享。因为笔者所在行业为互联网中的电子商务行业，所以会从电商的数据场景和产品开始。

2014-02-21 17:58
浏览 1036
评论(0)
分类:非技术

大数据创业与投资(1)-发展之路(二)

博客分类：

数据夜谈

大数据创业投资

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要上篇从正面分析了大数据的发展，本篇看一看大数据在发展过程中的泡沫正文作者：�

2014-02-21 17:56
浏览 874
评论(0)
分类:非技术

大数据创业与投资(1)-发展之路(一)

博客分类：

数据夜谈

大数据创业投资

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 作者：宋贵亮(凤超) 摘要：大数据时代的数据是基于多源异构、跨域关联的海量数据分析所产生的决策流程、商业模式、� ...

2014-01-14 18:17
浏览 1045
评论(0)
分类:非技术

互联网思维系列(4)-案例

博客分类：

数据夜谈

互联网思维用户服务迭代极致

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要我们看看一个转型成功的公司是如何利用互联网思维成功的。正文一个以用户为中心而转型的公司如何成功的，这个公司就是使星巴克也有点黯然失色的绿山咖啡。绿山咖啡一直兢兢业业地卖自己的品牌的特制咖啡，在超市、麦当劳、加油站。赚钱很容易，但增长却存在天花板，大型超市进不去，麦当劳和加油站也不可能在大范围推广绿山品牌。然而它的新起步和成功却是从加入和收购Keurig开始的，表面上看，绿山的盈利主要靠：Keurig的保有量；每台机器上K杯的消费

2014-01-09 19:47
浏览 1117
评论(0)
分类:非技术

互联网思维系列(3)-迭代&极致

博客分类：

数据夜谈

互联网思维用户服务迭代极致

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要抓住用户的痛点，专注于自身的产品，迭代地把产品或者服务做到极致，解决用户的痛点，超越用户的期望正文在解决用户核心痛点的情况下，基于用户、市场的需求，分阶段迭代推进，使我们的服务更加精益、完美。为什么需要通过迭代来完成呢？在互联网时代，用户的需求是分散的，个性化的，同时用户意见反馈的成本很低，这样就给了我们试错和逐步完善的机会，在完成核心功能的基础上，通过用户的参与和不断反馈，逐步完善服务。像传统行业，必须给用户一个完善的成品才能推向市场的模式，慢慢就不能适应用户 ...

2014-01-07 19:41
浏览 3077
评论(0)
分类:非技术

互联网思维系列(2)-用户&服务

博客分类：

数据夜谈

互联网思维用户服务迭代极致

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要从传统的经营产品转为经营用户。一切围绕着用户展开，不管是产品、营销、运营、服务，一切的一切都以用户为中心正文所有的企业都会说顾客都是上帝，但以前的企业重视顾客更多是为了兜售产生利润的产品，而互联网思维中重视用户，肯定是为了解决用户某个痛点，后续才是利用大量的用户价值区产生商业价值。如果绕不过这个弯，做什么都不是具有互联网思维。传统的信息不对称，导致市场是由商家主导的，但是互联网消除了信息的不对称，用户不一定比商家知道的少。商家必须从市场定位、产品研发，生产销售 ...

2014-01-02 22:49
浏览 724
评论(0)
分类:非技术

互联网思维系列(1)-总论

博客分类：

数据夜谈

互联网思维用户服务迭代极致

请关注微信公共账号：数据夜谈来往公共账号：数据夜谈一个数据人互相分享的小圈子! 摘要互联网思维的讯息，整理汇集于此，一起看看互联网上如何说互联网思维正文题外话：辞旧迎新的一天，我们开始"数据夜谈"，从13年到14年，我们期望"数据夜谈"能陪伴大家1314 互联网思维就像大数据一样，这几个名词已经被炒成泡沫了。但是确实有很多企业、个人利用不同于传统的思想得到了成功，这个思想可能是互联网思维，也可能是什么思维。之所以不能把他们的成功完全归结于互联网思维，很大程度上，互联网思维这个名词每个人的理解都不一样。 ...

2013-12-31 21:39
浏览 764
评论(0)
分类:非技术

Map使用的代码小记

博客分类：

JAVA

map 遍历排序 java

Map的遍历 Map的排序 Map的遍历 Map<String, Integer> INPUTMAP = new HashMap<String, Integer>() { { put("a", 1); put("c", 3); put("b", 2); put("d", 4); put("e", 5); } }; Iterator it = INPUTMAP.entrySet().iterator(); ...

2013-06-21 16:31
浏览 1021
评论(0)
分类:编程语言

Neo4j-在JAVA中执行Cypher查询

博客分类：

Neo4j

Neo4j 图数据库 Cypher java

在JAVA中使用Cypher涉及到org.neo4j.cypher.javacompat包的两个类. 类名方法名说明 ExecutionEngine public ExecutionResult execute(String query) 执行query返回存储结果集的一个迭代器(ExecutionResult) (用于执行Cypher Query) public ExecutionResult execute(String query, Map<String,Object> params) 执行query返回存储 ...

2013-05-07 08:12
浏览 10475
评论(0)
分类:开源软件

Neo4j-Cypher查询语言-函数

博客分类：

Neo4j

neo4j cypher 图数据库函数

断言函数(Predicate functions) 函数名称函数说明 ALL(identifier in collection WHERE predicate) 判断一个断言(predicate)是否满足集合(collection)里的所有元素 ANY(identifier in collection WHERE predicate) 判断一个断言(predicate)是否至少满足集合(collection)里的一个元素 NONE(identifier in collection WHERE predicate) 如果集合(collection)里的元素不满 ...

2013-04-19 08:32
浏览 8953
评论(0)
分类:开源软件

Neo4j-Cypher查询语言-模式(Patterns)

博客分类：

Neo4j

neo4j cypher 图数据库模式

模式是Cypher非常核心的东西，它在很多地方被用到。利用模式，你可以描述你要找的数据是什么样子。模式是被用在MATCH子句中。路径模式是表达式。Since these expressions are collections, they can also be used as predicates (a non-empty collection signifies true)。他们被用来CREATE/CREATE UNIQUE一个图。所以，理解模式非常重要。当你申明一个模式时，Cypher会指出怎么获取数据。想法是编写查询，指定你想要的模式，你就能够利用这些值创建你想要的结果。模 ...

2013-04-19 08:24
浏览 4935
评论(0)
分类:开源软件

Neo4j-Cypher查询语言-更新图数据库&事务

博客分类：

Neo4j

neo4j cypher 图数据库更新图数据库事务

更新图数据库 Cypher可以用于查询图，同时也可以更新图。更新语句的结构 Quick info 一个Cypher的查询块不能同时匹配和更新任何一个查询块可以读取和匹配图，或者更新图如果你从图中读取数

2013-04-19 08:22
浏览 4372
评论(0)
分类:开源软件

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

[置顶] HIVE表数据量和数据记录数的矛与盾

[置顶] MapReduce的排序和二次排序

数据分析之我见(1)-方法论

大数据创业与投资(2)-电子商务

大数据创业与投资(1)-发展之路(二)

大数据创业与投资(1)-发展之路(一)

互联网思维系列(4)-案例

互联网思维系列(3)-迭代&极致

互联网思维系列(2)-用户&服务

互联网思维系列(1)-总论

Map使用的代码小记

Neo4j-在JAVA中执行Cypher查询

Neo4j-Cypher查询语言-函数

Neo4j-Cypher查询语言-模式(Patterns)

Neo4j-Cypher查询语言-更新图数据库&事务

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>