数据仓库简历范文
求职意向
数据仓库 北京 薪资面议 随时到岗
教育背景
2020.x -2020x 锤子简历大学 计算机科学与技术
主要学习内容为数据结构、算法、
C语言、
Java
工作经验
2020.x -2020x 随行付 数据仓库工程师、数据分析师、组负责人
- 基于Hive的数据仓库由 0 到 1 的设计与实现
- 基于Azkaban,Sqoop的数据抽取以及数仓调度配置
- 依托SmartBi的报表以及自主分析功能的实现
- 了解用户端开发逻辑,实现全公司迎接检查系统的数据清洗
- 基于随机森林算法,通过Python的Sklearn库,对客户进行简单流失预测
- 对接业务需求,协助管理
2020.x -2020x 便利蜂-未来购 数据分析师
- 对接商品部各MD,对上新以及促销商品进行销售分析,指导运营
- 对接市场部运营人员,分析各类档期活动情况,对不同类型活动给出销售建议
- 接手咖啡项目,将咖啡的销量由单店单天20杯提升至45杯,其中天津门店渗 透率达到10%
- 完成包括市场部、集装箱便利店、共享打印机、共享充电宝等项目的日常数据提取以及报表开发工作
2020.x -2020x 锤子简历信息技术有限公司 数据开发工程师
- 数据仓库的开发和维护:ETL以及数据模型设计
- 数据报表的需求分析和开发
- 核心切换中的数据迁移部分
项目经验
2020.x -2020x 随行付-协助检查数据包装 负责人
- 与用户,审单组深入合作,梳理其系统前端显示内容与数据库表的映射关系以及逻辑加工规则
- 根据数据校验规则,对全公司客户数据做统一数据清洗以及校正;将数据由生产库同步至检查数据库,用以应对合规检查;共涉及51张表
2020.x -2020x 随行付-数据仓库扩展建设 提供设计和方案,工作由整体团队完成
- SmartBi+Impala+Oracle+Rpt 的方式,实现报表查询;SmartBi+Impala+Dws+Rpt 的方式,实现自主分析(自主提数)
- 实现系统之间数据推送或者调用:比如标签等大规模计算数据推送回业务系统;生成特征变量数据,协助风控系统做涉黑预测;提供Impala查询接口,解决业务系统历史数据查询问题
- 结合业务需求,探索机器学习模型的实际应用;通过分析用户留存时间,首刷时间,二刷时间的间隔分布,确定模型预测周期为14天,90天;通过Hive+Python(随机森林)的方式,对个人用户的流失做出预测;准确率 75%,覆盖率 78%
- 与UI同事配合,采用Oralce+Echart的方式,完成随行付业务数据大屏的开发
2020.x -2020x 随行付-数据仓库基础建设 负责人
- 基于数据调研工作,确认数仓分层:SRC-> ODS-> DWD-> DWS-> RPT;前3层为明细层,采用自下而上的建模方式,生成维度事实矩阵;后2层为汇总层、报表层,通过自上而下的建模方式,根据业务场景建立汇总表,以及退化部分维度
- 确认业务系统到数仓的数据同步方式(离线Kettle+实时Kafka)+Sqoop,制作离线同步配置表,配合开发完成离线任务的配置化上线工作;并通过Azkaban实现各任务之间的依赖调度
- 为避免人为数据变更、Kafka消费问题导致的数据不准确,通过Python+Sql对关键表实现数据监控;记录数据从业务系统到数仓各层的数据量,并对异常进行邮件报警
- 完成95%的DW层逻辑模型、物理模型的设计;50%的模型开发;100%的前期模型上线复核
2020.x -2020x 随行付-数据调研-建立数仓准备工作 负责人
- 为数仓建设做准备,共梳理 260 张数据中心使用到以及可能会使用到的表;明确表结构、各表关联关系、数据质量问题等
- 历时 1 个半月,与 7 个生产系统负责人沟通后,锁定 238 张可用表;基于此制作出ER图
2020.x -2020x 便利蜂-咖啡项目 数据分析师
1.在人货场三个不同的角度,分析历史上所有的咖啡活动,并根据当前最主要的目标:提升PSD,提出了买一送一活动,该活动将PSD由20杯提升至45杯,平均每日新客户数量是原来的4倍,但是毛利只下降20%
2.使用4周购买频率将客户分群,并通过AB测试,研究各类客户群体对不同折扣的优惠券的敏感程度,该分析正在进行中
2020.x -2020x 便利蜂-商品部报表迁移以及优化 负责人
- 确定业务口径,如价格构成、成本组成等,保证各报表数据的一致性;之后该口径作为整个商品部,市场部统一数据输出规范
- 梳理所有商品部报表(总计200左右),将原来由Python执行的报表程序改为Sql执行并配置至邮件系统
- 整合内容相同或者类似报表,并且优化执行时间过长的Sql
2020.x -2020x 哈尔滨银行数据迁移 开发以及流程梳理
- 分析新老系统的不同,通过存储过程实现单支程序,Xshell实现程序调用以及特殊处理,Use调度工具实现总体流程
- 优化关键路径上面程序,缩短单支程序执行时间:
- 查看存储过程详细执行计划,根据执行计划对过大的数据进行分区或者增加Hint
- 更改Sql的写法,将执行时间过长、各表关联混乱的Sql,先执行筛选条件,并配合临时表的方式,将单支程序从1小时优化至3分钟
- 梳理每个任务之间的依赖,进一步分解单个任务,保证任务之间的并发执行,整体时间从8小时优化至3.5小时
2020.x -2020x 哈尔滨银行新数据平台 数据模型设计
- 负责部分源系统到ODS层的ETL工作,多数采用Oracle存储过程,少部分采用Informatica
- 设计EDW数据模型,通过存储过程将源数据分不同主题写入EDW,通过码值加工以及关系的转换,尽可能规避源系统数据变化对集市层模型的影响
自我评价
1
.性格随和,可以较快融入陌生环境,不抗拒短时间高强度加班
2.敢于接受挑战,学习能力较强,一周内可以初步使用陌生语言进行开发
3.思路清理,遇到问题可以理性分析,权衡解决
内容来源说明:本文章来自网络收集,如侵犯了你的权益,请联系QQ:2772182309进行删除。
https://www.100chui.com/article/316022.html