对于数据挖掘这一技术领域,一份精心设计的简历更是求职者获得面试机会和理想职位的敲门砖,本文是一篇数据挖掘领域的求职简历案例,欢迎大家阅读收藏。
数据挖掘求职简历案例参考:
求职意向
求职类型:全职
意向岗位:数据挖掘
意向城市:广东广州
薪资要求:面议
求职状态:随时到岗
教育背景
时间:201X.9-201X.7
学校名称:锤子简历大学
专业名称:计算机科学与技术
学校描述:2017/5 考取软件设计师资格证书
工作经历
时间:201X.5-至今
公司名称:锤子简历范文案例
职位名称:数据工程师
1、设计和搭建基于数据中台理念的数据架构,确保数据的一致性.可扩展性和高可靠性。
2、负责数据分层架构的设计,将数据按照不同的业务层次进行组织和管理,提升数据的可发现性和可用性。
3、使用Hadoop和Spark技术栈进行大数据处理,优化数据处理流程,减少数据处理时间。
4、设计数据流程,实现数据的提取.转换和加载(ETL),确保数据在不同阶段的准确性和完整性。
5、引入元数据管理工具,建立数据词典和数据血缘关系,提升数据可追溯性和数据治理效率。
6、协助制定数据治理策略,确保数据安全性和合规性,推动数据隐私保护措施的落地。
7、与业务部门和数据科学团队紧密合作,理解需求,提供技术支持,推动数据驱动决策的实现。
时间:201X.10-201X.5
公司名称:锤子简历范文案例
职位名称:数据工程师
1、负责数仓相关工作,清洗处理数据
2、负责部分算法相关项目,包括疾病预警等
3、协助运营相关工作,开发部分API接口
时间:201X.8-201X.10
公司名称:锤子简历范文案例
职位名称:数据工程师
1、负责数仓相关工作,包括数据ETL过程,离线.实时数据处理,数据表结构.分区的设定等
2、负责用户画像建模相关工作
3、负责AI预警模型相关模型开发工作
4、参与用户知识图谱挖掘相关工作
项目经验
时间:201X.5-至今
项目名称:锤子简历xxx项目案例
项目角色:数据开发
1、分析不同数据源的结构和格式,设计了有效的数据抽取策略,确保从多个系统中高效地提取数据。
2、利用Python编程或Kettle处理工具,开发了自动化的数据转换脚本,将数据从原始格式转换为适合数据仓库的标准格式。
3、实施数据清洗和质量控制,识别并处理数据中的异常值.缺失值等问题,以确保数据质量。
4、设计了数据加载流程,将转换后的数据加载到数据仓库中,确保数据在不同层次的一致性和完整性。
5、针对大数据量的情况,优化了数据处理算法,提高了处理效率,缩短了数据处理时间。
6、引入任务调度工具XXJOB,实现了自动化的ETL流程调度和监控。
时间:201X.1-至今
项目名称:锤子简历xxx项目案例
项目角色:数据开发
1、设计了数据中台的整体架构,包括数据湖和数据仓库的结构,以满足不同业务需求的数据存储和访问要求。
2、进行数据分层,根据业务层次和数据类型将数据进行组织和管理,以提升数据的可发现性和可用性。
3、搭建了基于Hadoop的大数据处理平台,用于数据的提取.转换.加载和分析。
4、开发自动化的ETL流程,使用Python或kettle编写了数据转换脚本,确保数据从源系统到数据中台的高效和准确。
5、与业务团队紧密合作,理解需求,协助建立数据模型,并确保数据中台能够满足不断变化的业务需求。
时间:201X.11-201X.1
项目名称:锤子简历xxx项目案例
项目角色:算法开发
该比赛主要基于医疗.医保数据进行算法建模,创新改革常州的医疗。
根据常州提供的医保数据.医疗信息以及相关的患者信息,采用时间序列模型,预测出未2年常州的医保开销,采用logistics算法,预测出脑梗患者未来所需开销
1、收集和清洗了脑梗患者的基本信息.历史病例等在内的多维度信息,为模型训练和评估提供了丰富的数据源。
2、利用Python和机器学习库,开发了一个预测模型,采用logistics算法进行训练,以预测患者未来所需开销
3、进行特征工程,筛选并衍生关键特征,提高了模型的预测准确率和稳定性。
4、利用交叉验证和网格搜索等技术,对模型进行了调优,以获得最佳的超参数配置,并与医学经验结合,验证是否符合逻辑
5、对训练结果进行截图,协助完成报告编写.汇报
时间:201X.10-201X.3
项目名称:锤子简历xxx项目案例
项目角色:数据开发
1、收集来自多个数据源的医生信息,如医生基本信息.资质等,为宽表构建提供全面的数据源。
2、进行数据预处理,对数据进行清洗.去重和转换,确保数据的质量和一致性。
3、设计宽表的结构,根据业务需求和数据关系,将不同数据源的信息整合到一个统一的表结构中。
4、使用SQL和python进行数据转换,将原始数据进行拼接.合并和汇总。
5、引入数据质量控制策略,对转换后的数据进行校验,确保宽表的准确性和完整性。
6、为宽表中的数据添加索引,提高数据查询性能,以满足医疗数据分析的需求。
时间:201X.3-201X.5
项目名称:锤子简历xxx项目案例
项目角色:算法开发
根据瑞金医院提供的胰腺癌患者信息,对术后是否发生胰瘘进行预测。
1、收集了包括患者术前的基本信息,术中操作信息以及术后的检查信息等多维度医疗数据,为预测模型提供了丰富的特征。
2、进行数据清洗和预处理,处理缺失值和异常值,确保数据的准确性和可用性。
3、使用Python编程,选择合适的机器学习算法,算法主要采取xgb.lgb.catboost.logistics.randomforest等算法分别建模
4、进行交叉验证和超参数调优,以获得最佳的模型性能和泛化能力。
5、创建了预测模型,能够根据个体的医疗数据,预测其未来一段时间是否胰瘘的概率。
6、对模型进行了评估和验证,包括准确率.召回率.AUC等指标,以保证模型的有效性和稳定性。
7、提供训练结果截图.预测结果截图 ,协助医生完成报告编写.汇报
时间:201X.5-201X.8
项目名称:锤子简历xxx项目案例
项目角色:算法开发
输入医院简称或常用说法,输出医院标准名称。
难点:医院名称中存在个别字不一样导致医院名称不一致,较难映射。尝试了多种算法进行映射,包括Levenshtein以及词向量计算相似度,效果不好,最后采用提取关键词进行映
时间:201X.8-201X.10
项目名称:锤子简历xxx项目案例
项目角色:后端开发
该项目为计算患者未来治疗所需花费。该后端主要采用Django进行开发,药物经济学相关模型主要根据R语言进行开发。最后采用Docker进行部署。
难点:主要由于对R语言不太熟悉,需研究R语言耗费时间。
时间:201X.10-201X.11
项目名称:锤子简历xxx项目案例
项目角色:api接口开发
开发各种查询接口,协助运营进行决策分析。开发的接口主要包括医院名称地址查询.医院人数统计接口.疾病查询接口.信息提取接口。
信息提取接口主要采用NER算法进行识别。根据医院的医嘱信息,提取出患者的关键信息。
时间:201X.1-201X.4
项目名称:锤子简历xxx项目案例
项目角色:算法开发
1、收集和清洗了包括个人信息.财务状况.信用历史等在内的多维度数据,为模型训练和评估提供了丰富的数据源。
2、利用Python和机器学习库,开发了一个预测模型,采用XGBoost算法进行训练,以识别潜在的高风险借款人。
3、进行特征工程,筛选并衍生关键特征,提高了模型的预测准确率和稳定性。
4、利用交叉验证和网格搜索等技术,对模型进行了调优,以获得最佳的超参数配置。
5、针对模型进行了全面的评估和验证,包括准确率.召回率.ROC曲线等,确保其在不同场景下的稳健性。
自我评价
1、有很强的学习能力.学习习惯和分享精神。
2、具有良好的逻辑思维能力及独立思考能力。
3、注重团队合作,有耐心,责任心。
专业技能
1、熟练掌握大数据处理平台,如Hadoop.Spark和Flink等,能够有效地处理和分析大规模数据。
2、熟悉关系型数据库(如MySQL.PostgreSQL)和NoSQL数据库(如Hive.HBase),能够进行数据建模.查询优化和性能调优。
3、具备数据仓库架构设计的能力,了解维度建模和星型/雪花模型,能够设计适合业务需求的数据结构。
4、熟悉ETL(抽取.转换.加载)流程,能够使用工具(如kettle)或编程语言(如Python)实现数据的清洗.转换和加载。
5、理解数据分层的概念,能够将数据按照业务需求进行合理的分层和组织,提高数据可发现性和可用性。
6、熟悉数据质量控制方法,能够建立数据质量规则.监控和清洗策略,推动数据治理流程。
7、能够分析问题.追踪根因,并提供有效的解决方案,确保数据流程的稳定性和数据质量。
文/锤子简历
精美简历模板,来自锤子简历:www.100chui.com
锤子简历(100chui.com),专业简历制作
著作权归作者所有,转载请联系作者获得授权。
【使用锤子简历小程序制作简历】
零经验实习简历模板
21254人用过
学生求职简历模板
52754人用过
申请研究生简历模板
2324人用过
经典工作简历模板
6254人用过
投行咨询简历模板
12465人用过
产品经理简历模板
7532人用过
程序员简历模板
7457人用过
留学英文简历模板
4554人用过