锤子简历品牌推广师
搜索算法工程师社招简历范文
作者:锤子简历 2023/09/03 04:50:01
阅读 137

求职意向

算法专家 广东广州 薪资面议 随时到岗

教育背景

2020.x -2020x 锤子简历大学 软件工程

主修课程:JAVA开发、数据库设计、js、数据结构、Android开发、编译原理、操作系统、概率论、离散数学等。

2020.x -2020x 锤子简历大学 金融学(第二专业)

主修课程:微观金融学、宏观金融学、国际金融学、货币银行学、金融市场学、中央银行学、商业银行经营学、保险学等

工作经验

2020.x -2020x 阿里巴巴集团 高级算法工程师

1.负责神马搜索app_sc研发,提升九游app和sdk的下载新增,提升35%

2.负责app卡片意图识别,基于Tensorflow-Bert的游戏意图分类模型,在测试集上指标96.5% 
3.负责阿里互娱通用推荐平台研发,基于游戏行业的通用推荐平台,研发效率提升100%,在biubiu猜你喜欢场景点击ctr提升28% 
4.负责阿里互娱平台业务线相关搜索推荐业务的研发,包含游戏搜索、相关推荐、猜你喜欢等场景,代表app:九游、交易猫及biubiu的游戏搜索。
5.负责阿里互娱搜索QP平台从0-1的搭建研发,包含行业词典构建、行业知识图谱、游戏意图识别分类、搜索Query改写及纠错等算法模型的推动上线。

2020.x -2020x 锤子简历信息技术有限公司 搜索算法研究员-中央研究院

 工作描述:

1.负责搜索ElasticSearch及Solr分布式高可用集群平台的搭建及运维 
2.负责搜索引擎系统、算法引擎端的稳定性及性能吞吐量的策略优化 
3.负责搜索query理解、召回算法、个性化排序算法的研发以及搜索策略的架构设计和迭代优化  
4.负责搜索算法引擎端和serving服务端的研发及上线 
5.负责个性化搜索及语义搜索的研究与实现 
6.熟练掌握常用bagging及boosting算法,熟练掌握Learning to rank排序算法,了解FM、FFM、DFFM等数据稀疏场景算法 
7.了解word2vec,Bert及NER等深度学习相关的文本挖掘算法,对于tensorflow的使用以及模型压缩有一定的了解

2020.x -2020x 锤子简历信息技术有限公司 搜索算法工程师

工作描述:  

1.负责Solr、ElasticSearch的分布式查询、分布式部署以及分布式索引等源码底层工作。 
      代表性工作:1)修改Solr搜索引擎的底层分布式查询架构源码并用于线上,减少节点通信,大大提升了查询效率,发表专利;
      2)修改Solr底层索引重建机制,将库到索引模式改成索引到索引模式,提升索引重建效率 
2.负责公司线上基于Solr及ElasticSearch的搜索项目技术支持,包含搜索方案设计、搜索架构设计及引擎搭建等工作。 支持百亿数据量的查询性能优化,数据抽取的异常处理,搜索排序以及相关度需求处理以及分词算法的问题研究。 
3.负责搜索产品研发 参与公司智能检索平台项目开发,担任全文检索主程序员,并完成搜索召回及排序算法等机器学习模块的开发。
4.熟练掌握Solr、ElasticSearch及lucene等全文检索引擎底层架构及原理,能够对其进行二次开发以及中间件制订。

项目经验

2020.x -2020x 阿里互娱搜索QP平台 高级算法工程师

       通过分析业务搜索痛点,结合算法技术能力,沉淀出一套搜索QP平台,期间完成了阿里互娱搜索QP平台的从0-1的研发及推动上线,包含基于TPP平台的工程部分实现,基于Query字典、Query分词、Query纠错改写、Query扩展、行业知识图谱及意图识别等算法模块的实现。

       最终提升搜索准确率(交易转化提升5.13%),提升扩召回,相对降低无少结果率30%。

2020.x -2020x 神马搜索app_sc项目 高级算法工程师

      期间完成了app_sc的迭代升级,实现基于odps离线和ha3在线模式的神马搜索app卡片研发;

      完成app泛搜榜单模型研发,提升榜单ctr点击;
      完成基于Tensorflow-Bert-NER的app卡片意图识别模型,增加长尾词的命中触发,提升精搜触发率。
      最终提升九游app和sdk的下载新增,总计提升35%。

2020.x -2020x 基于游戏行业通用推荐平台 高级算法工程师

      完成通用推荐平台架构设计;完成通用推荐平台特征工程、召回模块、排序模块等全链路研发;

      完成热门召回、协同过滤召回研发;完成基于LR的精排模型以及DNN精排模型研发;
      研发效率提升100%,在biubiu猜你喜欢场景点击ctr提升28%。

2020.x -2020x 基于BERT-NER及知识图谱的语义搜索 搜索算法研究员

      负责基于付费课程的语义搜索的方案、架构设计及研究实现。      

      结合付费课程以及讲师的属性特征,借助人民日报1000w数据训练基于BERT+BILSTM+CRF的NER模型(命名实体识别)用于提取搜索词query中的课程名以及姓名等主体,模型F1-score达到0.98;借助基于神经网络的高性能依存句法分析器对query进行语法及句法分析,将分析结果构建语义图网络,实现用户query理解及查询改写,最终实现用户意图识别。依托语义图网络进行实体消岐以及谓语消岐解决同名实体带来的查询异常等问题,最后构造基于Neo4J的知识图谱查询,完整实现整套语义搜索,搜索准确率达到95%。
      从0-1的实现基于知识图谱的语义搜索并用于线上,在垂直领域实现一种新颖搜索模式,极大的提升搜索体验及用户留存。

2020.x -2020x 基于BERT+LightGBM的课程搜索排序 搜索算法工程师

       基于用户搜索及课程点击大规模埋点数据的排序任务优化,借助impala进行数据分析,构建训练集并建立倒排索引。召回阶段使用空间向量模型进行召回和粗排,权重模块使用BM25算法进行文档中词的打分进而构建文档向量,最终实验召回率:0.71,验证集MAP:0.29;

      精排阶段构建(q,doc1,doc2)的pairwise的训练集,doc1、doc2为训练数据中搜索词对应的结果列表中doc_list的随机组合作为训练样本,加入到bert中进行分类训练,得到排序结果列表1;提取空间向量模型的权重特征,文本特征以及召回阶段的排序特征进行特征融合构建成特征集合,配合LightGBM的pairwise模式进行训练,得到排序结果列表2;将列表1以及列表2进行融合排序,最终测试集MAP达到0.4;
      整体方案加入BERT以及LightGBM的pairwise模型对于空间向量模型召回的粗排结果进行精排,提升了文档之间的关系比较,最终提高了用户的搜索付费转化。

2020.x -2020x 贵州省&广东省公安厅大数据平台项目 搜索引擎开发工程师

      负责基于Solr的全文检索大集群规划与搭建,集群实例37个,分布式部署在10台大型Linux机器,采用7台zookeeper来统一协调配置,数据量超过百亿级别,查询效果达到毫秒级。

      此外,基于用户特殊查询需求,由于索引集节点数过多,大量的节点间通信请求数致使Solr集群出现效率低下,因此为其开发Solr跨核查询功能,修改Solr搜索引擎的底层分布式查询架构源码,重写其底层分发策略,大大降低了节点间通信,保证查询都在毫秒级。

自我评价

      有5年互联网搜索推荐召回模型及排序模型的算法研发经验;有5年大数据量高可用高并发搜索引擎架构设计及实现经验;有6年java开发经验及4年python开发经验;NLP领域有query理解、纠错、意图识别及语义搜索项目经验;熟悉常用的机器学习机深度学习算法,熟悉tensorflow计算框架。熟悉结构化数据库以及非结构化数据库,对于大数据体系有一定的了解;

     具有很强的沟通能力,与团队相处融洽,与用户沟通和谐; 具有很强的理解能力,能够快速响应各方的需求以及理解用户的心理; 具有很强的执行力,能够对上级安排的任务寻找最好的方法尽快完成;具有很强的探索能力,能够快速探索最新技术,将技术反哺业务,为业务赋能; 具有很强的责任心,能够有始有终的完成一件事,把每一份工作当做自己的事业来完成;
     微信公众号:药老算法
     知乎地址: https://www.zhihu.com/people/hu-qi-ming-31

内容来源说明:本文章来自网络收集,如侵犯了你的权益,请联系QQ:2772182309进行删除。