问答:想去做 data scientist,如何选实验室?

本人生物 PhD 第一年,以后想去工业界靠拢 data scientist,因此做了若干计算相关 rotation。目前有三个实验室可选。

  1. Bioinformatics,蛋白结构预测相关,比较注重编程,和 data scientist 最接近。顾虑是老板很 push 难毕业,往届的 PhD 大都 6、7 年才毕业。

  2. 发育相关,Matlab 为主要工具做数学建模,加入的话可能要补许多数学课。老板人 nice。顾虑是老板现在想搞实验部分,怕是我去了会主要做实验。

  3. 化学系 NMR Molecular Dynamics, 主要用 Python 写些脚本以及运用 MD 软件,老板人超 nice,文章也不错。顾虑同上,老板不是专门做计算的而是干湿结合,而且希望我的工作也是干湿结合。

第一眼看起来 3 ~= 2 > 1。

  1. 师兄师姐的今天就是你的明天。第一个实验室不建议去。原因是既然打定主意以后去工业界,就没必要多花时间在学术研究上。同门师兄师姐如果 6、7 年才能毕业,那你的毕业时间的期望值也是 6、7 年,不能抱侥幸心理。

  2. 关键问题只有当事人能够解答。第二、第三个实验室都可能要做湿实验,而你想主攻计算,不知道是否可行。这一不确定性只有导师能够给你解答,别人都帮不了你。所以建议和两位导师再详细谈谈,确认一下到底湿实验在日后实验室工作中占比多少,你自己的博士论文能不能主要放在计算上。

  3. 一切围绕职业发展。不同行业的 data scientist 偏重不同的技能,可以考虑一下以后想去哪个行业,选择一个最接近的实验室。比如有些行业需要良好的数学功底,那么可以选 2。有些数学要求不高,编程能力更重要,那么可以选 3(不用花时间补数学课,而且 Python 应用更广)。另外无论选哪一个,建议早点开始求职准备,根据理想岗位的需求及时调整自己的技能树。