一家快速发展的公司,决心通过向生命科学行业提供其专业领域领先创新者的全面信息,彻底改变该行业,正在寻找一名自然语言处理开发人员。被选中的候选人将负责创建一个特征提取的程序,有效地利用已有的数据。该公司的突破性技术可以有效地发现那些准备招聘和战略投资的研究领域,并加以利用。这将是一个兼职职位。
工作职责:
- 创建一个流程,将几个文本数据集整合在一起,产生研究概况
- 将工作流程所需的AWS资产的时间表和成本估算放在一起
- 与数据分析员合作进行数据预处理和特征提取
- 实施工作流程,建立基准,以衡量进展,如有必要,调整策略
- 确定一个评估研究人员档案准确性的方法
- 以创造性的方式使用数据集信息,以支持通过特征提取进行链接
- 在提出和实施深度学习过程时,给出一些非正统的建议,该过程将优于典型的概率记录链接工作流程
- 创造一种技术来评估每个档案的准确性,并使用大量的文本信息来生成精确的研究人员档案。
- 与负责建立和维护企业数据湖的技术负责人进行互动
- 与负责清理和准备数据的数据分析员紧密合作
工作要求:
- 工程、计算机科学方面的学士/硕士学位(或同等经验)
- 至少有3年以上作为自然语言处理开发人员的相关经验
- 有过记录链接计划的工作经验
- 拥有开发合适的语义相似性算法的知识和专长,包括设定基准和修改策略以应对新发现的信息的能力
- 有记录链接项目的ML和/或深度学习工作流程设计和实施方面的知识
- 具有AWS环境的工作知识
- 曾有开发机制的经验,使用文本数据的深度学习程序评估现有数据集的正确性
- 具备与技术负责人和数据分析师互动和合作的能力和意愿
- 优秀的英语口语和书面沟通能力