锤子简历品牌推广师
算法工程师简历范文
作者:锤子简历 2023/05/11 18:40:04
阅读 128

求职意向

算法工程师 湖南长沙 薪资面议 随时到岗

教育背景

2020.x -2020x 锤子简历大学 地球信息科学与技术

相关课程:线性代数、微积分、概率论与统计、复变函数与积分变换、数理方程、计算机基础、 微机原理与汇编语言、C++程序设计、MATLAB程序设计、数字信号处理、地球信息数据处理与反演等

2020.x -2020x 锤子简历大学 地球探测与信息技术

相关课程:数值分析、计算地球物理、地震资料数字处理、地球物理反演等

自学课程:Machine Learning (Andrew Ng)、自然语言处理综论 (冯志伟)、统计学习方法 (李航)、统计自然语言处理基础 (苑春法)、统计自然语言处理 (宗成庆)、Python自然语言处理等

工作经验

2020.x -2020x 锤子简历信息技术有限公司 算法工程师

  • 负责开发文本相关的算法,维护数据质量,为科研数据平台建设和产品服务提供基础
  • 参与开发智汇云科研数据检索和分析功能

2020.x -2020x 锤子简历信息技术有限公司 物探数据工程师

  • 对野外采集的弹性波数据进行信号处理、图像处理、反演(信息预测)等,重现地下三维空间
  • 跟进学习行业前沿新算法,应用于实际生产项目

项目经验

2020.x -2020x 智汇云-科技论文数据服务类产品 负责算法研发

项目描述:开发科技论文数据去重、标注、检索排序算法,建立科研数据检索和分析服务平台

1. 数据去重算法                          独立完成开发
  • 方法: 提取作者、标题、关键词和摘要文本,经过分词、TF-IDF加权、hash计算、合并和降维处理,将文本转换为SimHash代码,通过Hamming distance计算文本相似度, 去除不同采集来源的重复数据
  • 效果: 计算效率26秒/100万条,较原字符级别算法(0.8秒/100万条)提高32倍,准确率94%
2. 机构标注算法                          独立完成开发
  • 方法: 分词、词形还原预处理,提取特征项(学校名、院系名、作者、地址、邮编),统计各学校词典,剔除无用高频词和停用词,使用词袋模型向量化各特征项,基于朴素贝叶斯方法对期刊数据标注学校ID
  • 效果: 在人工维护词表基础上,统计出更多的匹配模式(如英文简写、别名、学校合并前的名称等),大幅提高了机构标注效率和数据量


3. 学者标注算法                         独立完成开发
  • 方法: 归类同姓名学者,基于ElasticSearch引擎快速提取同名侯选集,以同姓名、同学校、同院系的数据为正样本,使用逻辑回归训练模型,对期刊数据标注到学者ID
  • 效果: 结合搜索引擎和逻辑回归算法,大幅提高运算效率 
4. 检索排序算法                          参与开发中
  • 方法: 从搜索引擎的大量日志中挖掘用户点击行为, 构建用户画像,基于Listwise算法排序,为用户返回个性化的检索排序列表

2020.x -2020x 天津石油学会创新创效 - 岩相自动识别技术 负责算法研发、项目汇报

  • 目标:通过弹性波测量得到的地下速度、密度信息,预测地下岩石类型
  • 方法:建立从岩石类型至速度、密度的数学模型关系,以钻井区域的速度、密度和岩石类型为训练数据,通过贝叶斯判别算法预测未钻井区域的岩石类型。同时引入马尔克夫链模型,使岩相预测结果在深度方向连续变化,并且排除了不合理的预测结果
  • 效果:较传统的色标融合方法,该技术的识别效率及准确率得到显著提升, 后期钻井证实预测准确率84%,获得天津石油学会优秀科技成果一等奖

自我评价

  • 理解机器学习的基础理论(降维、回归、分类、聚类、推荐等),熟悉求解算法及参数调优
  • 理解深度学习原理和基本模型(CNN/RNN),熟悉 Tensorflow 深度学习框架
  • 熟悉Spark分布式计算平台,熟悉ElasticSearch分布式检索服务器
  • 掌握Java/Matlab/Python语言,有较强的算法分析和实现能力
  • 学习能力强,能快速阅读中英文文献,较好的语言、书面表达和沟通能力

内容来源说明:本文章来自网络收集,如侵犯了你的权益,请联系QQ:2772182309进行删除。