数据仓库
SQL给一张城市和交易额表,一张城市对应省份表, 取出 省份 总 交易额大于 500 的 省份 的名字
select max(tmp.province_name) from (select bt.city_num, bt.gmv, pt.province_num, pt.province_name from business_table bt left join province_table pt on bt.city_num = pt.city_num) tmpGROUP BY (tmp.province_num) HAVING sum(tmp.gmv) > 500
基于上面1问题, 得出 省份 总 交易额 [0,500 ] , [500,1000 ] , [1000,+oo ] 在以下三个区间的 省份 的 数量select count(case when tmp1.pro_gmv >=0 and tmp1.pro_gmv <500 then tmp1.pro_name else NULL END ) as gmv_0_500,count(case when tmp1.pro_gmv >=500 and tmp1.pro_gmv <1000 then tmp1.pro_name else NULL END ) as gmv_500_1000,count(case when tmp1.pro_gmv >=1000 then tmp1.pro_name else NULL END ) as gmv_1000_from (select max(tmp.province_name) as pro_name , sum(gmv) as pro_gmv from (select bt.city_num, bt.gmv, pt.province_num, pt.province_name from business_table bt left join province_table pt on bt.city_num = pt.city_num) tmpgroup by tmp.province_num) tmp1
还是基于刚才, 按从小到大的顺序得出每个城市的累计交易额,可以用窗口-- group by select city_num, sum(gmv) as c_gmv from business_table bt group by city_num order by c_gmv-- windowselect bt.city_num, bt.c_gmv from (select DISTINCT city_num, sum(gmv) over (PARTITION by city_num) as c_gmv from business_table) bt order by bt.c_gmv
指标指标的价值海盗指标法(AARRR海盗模型)它反映了增长是系统性地贯穿于用户生命周期各个阶段的:用户拉新(Acquisition)、用户激活(Activation)、用户留存(Retention)、商业变现(Revenue)、用户推荐(Referral)
指标如何做到精准选指标常用方法是指标分级方法和OSM模型。
(资料图)
指标分级方法T1 公司战略层面指标T2 业务策略层面指标T3 业务执行层面指标
OSM模型O 业务目标S 业务策略M 业务度量
建模维度建模的模式:
星型模型: 以事实表为中心,所有的维度表直接连在事实表上雪花模式:雪花模式的维度表可以拥有其他的维度表,这种表不易维护,一般不推荐使用星座模型: 基于多张事实表,而且共享维度信息,即事实表之间可以共享某些维度表维度建模步骤:
事实表种类:
事物事实表: 表中的一行对应空间或时间上某点的度量事件周期快照事实表: 单个周期内数据, 每行都带有时间值字段,代表周期累计快照事实表: 由多个周期数据组成,每行汇总了过程开始到结束之间的度量无事实的事实表: 有少量的没有数字化的值但是还很有价值的字段,无事实的事实表就是为这种数据准备的,利用这种事实表可以分析发生了什么。聚集事实表: 原子粒度的数据进行简单的聚合操作,目的就是为了提高查询性能合并事实表: 属于相同粒度,就可以合并为一个事实表维度表技术
维度表结构维度表谨记一条原则,包含单一主键列
跨表钻取使不同的查询能够针对两个或更多的事实表进行查询
上钻(roll-up):上卷是沿着维的层次向上聚集汇总数据。例如,对产品销售数据,沿着时间维上卷,可以求出所有产品在所有地区每月(或季度或年或全部)的销售额。
下钻(drill-down):下钻是上钻的逆操作,它是沿着维的层次向下,查看更详细的数据。
退化维度退化维度就是将维度退回到事实表中。因为有时维度除了主键没有其他内容,虽然也是合法维度键,但是一般都会退回到事实表中,减少关联次数,提高查询性能
多层次维度多数维度包含不止一个自然层次,如日期维度可以从天的层次到周到月到年的层次。所以在有些情况下,在同一维度中存在不同的层次。
维度表空值属性推荐采用描述性字符串代替空值
日历日期维度在日期维度表中,主键的设置不要使用顺序生成的id来表示,可以使用更有意义的数据表示,比如将年月日合并起来表示,即YYYYMMDD,或者更加详细的精度。
数据抽取业务数据 -- Sqoop日志数据 -- Flume其他数据 -- 通用第三方接口
标签:
为您推荐
广告
随机阅读
- 数据仓库
- 奥巴马带着妻女与好莱坞演员汤姆·汉克斯聚餐,两个女儿表现乖巧-天天讯息
- 2将倒戈,再见!皇马被上课,35冠王强势搅局,捡漏曼城,冲欧冠|环球实时
- 每日讯息!阿洛伊西奥_关于阿洛伊西奥的介绍
- 全球热头条丨李家百年史口烧鸡加盟(山东酱卤源食品有限公司招商加盟信息)
- 北京市属公园精准调节票池,倒票“黄牛”列入黑名单
- 突然心动电视剧剧情_突然心动电视剧简介
- realme怎么刷机清除密码(realme怎么开高刷新率)
- 胖东来老板劝家遇变故的网友卖房 先度过眼前难关
- 全球微资讯!大地国际集团(08130)发布年度业绩,股东应占亏损约2.87亿港元,同比扩大21.81%
- 北向资金大调仓,卖出茅台五粮液,对46只股票持股增加超1000万股
- 全方位展现地方文化《兴化文化丛书》第二辑首发 今日热议
- 周鸿祎:大模型不是风口和泡沫 将引领新工业革命
- 广州碳达峰碳中和产业联盟成立 全球动态
- 天天快报!注意!力星股份:多名股东计划减持公司股份
- 华海诚科将于7月10日发放2022年度现金红利 每股派0.2元_全球焦点
- 【全球独家】深圳统计联网直报平台-深圳市统计局直报系统
- “园在城中、人在园中”生态修复让昔日荒山变身“天然氧吧”
- 为什么年年都说苹果不行了,iPhone却年年卖的很好?原因很真实
- 环球动态:高温“烤”验,如何安然度过
广告
财经
- 支持雷军!小米重塑信心!
- 北向资金上半年累计净买入超1800亿元 电子行业持仓市值增逾450亿元
- 华如科技(301302):6月30日北向资金减持4万股
- 当前报道:新余国科(300722):6月30日北向资金减持2.5万股
- 逾万只公募基金“中考”成绩单发布:TOP10收益率均超60%
- 赵子琪我的青春谁做主_我的青春谁做主郁欢结局|当前消息
- 股票行情快报:飞亚达B(200026)6月30日游资资金净买入3.79万元
- 【环球报资讯】随机拯救世界的概率 第二章
- 全球热资讯!满血小屏!垃圾佬最爱的旗舰,杀回来了
- r的平方怎么打出来手机_r的平方怎么打_热门
- 每日热闻!be intended for等于什么_be intend to for 分别是什么意思
- 共享表格时注意!Excel可合并多张表格 当前短讯
- 深科达:公司滚珠丝杠产品尚未在人形机器人领域布局 无人形机器人客户-天天快播
- 情牵苗侗,路通湘黔!靖黎高速建成通车-全球观点
- 当前快报:奇门遁甲(16)财运如何?大禹风水
- 环球观察:美国国脚尤努斯-穆萨vs英格兰【单场集锦】穆萨已...
- 天门山门票是多少(天门山门票多少简介介绍)_环球微头条
- 我不做大哥好多年小说_我不做大哥好多年|世界即时
- 【全球播资讯】反重力装置研究(反重力装置)
- 宗支|焦点讯息