2022年美国医疗行业规模为4.46万亿美元占GDP的17%,无论是绝对值还是占比均遥遥领先于全球其他国家。
作为全球最大的医药市场,美国Healthcare也提供了较多的数据类就业岗位,今天我们来了解一下这个对DS类学生们来说相对陌生的赛道~
Healthcare行业的公司类型
Healthcare行业有众多不同类型的雇主,比如医疗科技/保险公司、药厂、医疗咨询、医院/非营利组织等等,它们对于数据岗的需求也各不相同。
01.医疗科技/保险公司
比如CVS Aetna和IQVIA等等。Health行业的Big Tech公司,能够应用相当先进的模型,DS/MLE的人才需求比较大,也有了相对成熟和明确的晋升路线。
02.药厂(制药/生物医药公司)
比如辉瑞、拜耳、罗氏、强生、阿斯利康、武田制药等等。这些公司的biostatistician的岗位是刚需(这类岗位更愿意招聘biostats生统的学生);DS和MLE的需求则根据公司tech含量不同,有高有低。譬如,罗氏和强生的DS岗位晋升路线相对来说就更加成熟。
03.咨询公司的医疗组/精品医疗咨询
比如MBB, Analysis Group, Clearview等等。招收的title 以analyst为主。一般不太需要硬核的技术,更需要传统的统计、数据可视化相关的能力。不过,由于近年Machine Learning逐渐普及,咨询公司涉猎Machine Learning Project的情况也在逐渐增多。
04.医院/非盈利机构
以波士顿为例,有Broad Institute, Mayo Clinic, Dana Farber癌症研究所等等。在非盈利机构工作的最大好处是,不需要参与H1B抽签就可以直接拿到美国工签。当然,如果从非盈利机构跳回市场化机构以后,身份的问题还是会继续存在。
05.医疗初创
美国有很多初创企业需要更前沿的技术,相对来说work life balance会较差,工资包里现金占比比较少,股票占比比较多,非常需要挑选公司的眼光和个人的努力。
Healthcare处理的数据
Healthcare行业处理的数据集本质上和其他行业没有太大差距(除了基因组相关数据涉及到的专业领域知识比较多),大致可以分为以下几类:
01.主流数据
医保理赔数据、临床试验数据等。这两类是Health DS接触最多的数据类型,处理的技术从传统的ML模型到更先进的deep learning、llm都会涉及。电子健康记录HER。这类数据类似于business data,更加结构化,需要比较多的preprocessing或feature engineering,最后一般是使用classical ML模型来解决。
02.图像数据
如MRI图像、CT图像等。一般涉及到Computer Vision,需要用tensorflow或者pytorch来进行处理。
03.其他数据比如基因组数据或公共卫生数据等等。
求职Healthcare DS是否需要Health背景
总体回答是No。对于候选人来说,知道手上的数据需要什么样的模型来处理才是最关键的。因此,熟练掌握General Machine Learning/Deep learning/NLP/CV中的一个或者多个技术已经相当足够。
然而,如果处理过healthcare行业相关的数据集(比如我们前面提到的医保数据、临床数据等等),哪怕只是有点沾边,也是一个大大的加分项,可以向recruiter证明你能够快速适应工作中需要处理的数据集。
相比科技行业,医疗行业的recruiting timeline相对比较晚。Health Tech一般在九、十月份开始,十一、十二月也有零星开岗。而药厂、医院可能更多在春季学期的中期(比如二、三、四月份等)才会开始。同时,医疗行业结构化的实习招聘机会更少,根据部门需求临时招收的实习机会更多。
因此,对于学生来说准备时间更充足。学生们可以用更多的时间去打磨简历、练习面试技巧、添加新的project。
结语以上就是关于Healthcare DS岗位的全部介绍~如果你也想进入医疗领域工作记得要收藏本文哦!在留学方面有疑惑的同学欢迎联系传兮留学的老师咨询~