数据仓库简历范文-锤子简历

首页 > 数据分析> 数据仓库简历范文

赞
分享
定制

数据仓库简历范文

作者：锤子简历 2023/09/16

阅读 269

求职意向

数据仓库北京薪资面议随时到岗

教育背景

2020.x -2020x 锤子简历大学计算机科学与技术

主要学习内容为数据结构、算法、 C语言、 Java

工作经验

2020.x -2020x 随行付数据仓库工程师、数据分析师、组负责人

基于Hive的数据仓库由 0 到 1 的设计与实现
基于Azkaban，Sqoop的数据抽取以及数仓调度配置
依托SmartBi的报表以及自主分析功能的实现
了解用户端开发逻辑，实现全公司迎接检查系统的数据清洗
基于随机森林算法，通过Python的Sklearn库，对客户进行简单流失预测
对接业务需求，协助管理

2020.x -2020x 便利蜂-未来购数据分析师

对接商品部各MD，对上新以及促销商品进行销售分析，指导运营
对接市场部运营人员，分析各类档期活动情况，对不同类型活动给出销售建议
接手咖啡项目，将咖啡的销量由单店单天20杯提升至45杯，其中天津门店渗透率达到10%
完成包括市场部、集装箱便利店、共享打印机、共享充电宝等项目的日常数据提取以及报表开发工作

2020.x -2020x 锤子简历信息技术有限公司数据开发工程师

数据仓库的开发和维护：ETL以及数据模型设计
数据报表的需求分析和开发
核心切换中的数据迁移部分

项目经验

2020.x -2020x 随行付-协助检查数据包装负责人

与用户，审单组深入合作，梳理其系统前端显示内容与数据库表的映射关系以及逻辑加工规则
根据数据校验规则，对全公司客户数据做统一数据清洗以及校正；将数据由生产库同步至检查数据库，用以应对合规检查；共涉及51张表

2020.x -2020x 随行付-数据仓库扩展建设提供设计和方案，工作由整体团队完成

SmartBi+Impala+Oracle+Rpt 的方式，实现报表查询；SmartBi+Impala+Dws+Rpt 的方式，实现自主分析（自主提数）
实现系统之间数据推送或者调用：比如标签等大规模计算数据推送回业务系统；生成特征变量数据，协助风控系统做涉黑预测；提供Impala查询接口，解决业务系统历史数据查询问题
结合业务需求，探索机器学习模型的实际应用；通过分析用户留存时间，首刷时间，二刷时间的间隔分布，确定模型预测周期为14天，90天；通过Hive+Python（随机森林）的方式，对个人用户的流失做出预测；准确率 75%，覆盖率 78%
与UI同事配合，采用Oralce+Echart的方式，完成随行付业务数据大屏的开发

2020.x -2020x 随行付-数据仓库基础建设负责人

基于数据调研工作，确认数仓分层：SRC-> ODS-> DWD-> DWS-> RPT；前3层为明细层，采用自下而上的建模方式，生成维度事实矩阵；后2层为汇总层、报表层，通过自上而下的建模方式，根据业务场景建立汇总表，以及退化部分维度
确认业务系统到数仓的数据同步方式（离线Kettle+实时Kafka）+Sqoop，制作离线同步配置表，配合开发完成离线任务的配置化上线工作；并通过Azkaban实现各任务之间的依赖调度
为避免人为数据变更、Kafka消费问题导致的数据不准确，通过Python+Sql对关键表实现数据监控；记录数据从业务系统到数仓各层的数据量，并对异常进行邮件报警
完成95%的DW层逻辑模型、物理模型的设计；50%的模型开发；100%的前期模型上线复核

2020.x -2020x 随行付-数据调研-建立数仓准备工作负责人

为数仓建设做准备，共梳理 260 张数据中心使用到以及可能会使用到的表；明确表结构、各表关联关系、数据质量问题等
历时 1 个半月，与 7 个生产系统负责人沟通后，锁定 238 张可用表；基于此制作出ER图

2020.x -2020x 便利蜂-咖啡项目数据分析师

1.在人货场三个不同的角度，分析历史上所有的咖啡活动，并根据当前最主要的目标：提升PSD，提出了买一送一活动，该活动将PSD由20杯提升至45杯，平均每日新客户数量是原来的4倍，但是毛利只下降20%

2.使用4周购买频率将客户分群，并通过AB测试，研究各类客户群体对不同折扣的优惠券的敏感程度，该分析正在进行中

2020.x -2020x 便利蜂-商品部报表迁移以及优化负责人