雇用机器学习科学家
机器学习是人工智能的一个分支,它使系统能够从数据而不是显式编程中学习。 在将机器学习软件用于预期目的之前,必须先对其进行“训练”。 编程中使用的算法会吸收 机器学习(ML) 科学家提供的训练数据,从而能够利用该数据生成更精确的模型。 由于利用数据输入来训练 ML 算法,因此创建了机器学习模型。 经过训练后,ML 模型会在给定真实数据时提供输出。 因此,远程 ML 科学家的角色对于 IT 和其他行业变得越来越重要。
机器学习科学家采用四种关键方法:监督学习、无监督学习、强化学习和深度学习。 要区分不同的数据集并定义数据中的基本模式和趋势,ML 科学家必须具备强大的数学基础。 在寻找 ML 科学家的工作时,您必须能够开发一个系统,该系统可以采用某种输入并使用复杂的编程方法和算法将其转化为适当的建模输出。
机器学习的发展前景
机器学习在广泛的领域越来越受欢迎,包括银行和金融、信息技术、媒体和娱乐、游戏和汽车行业。 由于 ML 的范围如此之广,学者们正试图在未来的各个领域改变世界。与其他职业领域相比,就工作机会而言,全球 ML 的广度是巨大的。 Gartner 预测,到 2022 年,人工智能和机器学习将雇用 230 万工人。远程 ML 科学家的薪水同样远高于其他工作类别。
据福布斯报道,美国 ML 科学家的平均工资为 99,007 美元。 机器学习领域在收入和工作机会方面有很多优势。 获得机器学习科学家的工作是在机器学习领域追求繁荣事业的一个潜在选择。
机器学习科学家的职责是什么?
ML 科学家在团队中的角色包括许多活动,例如 –
- 研究和改造数据科学原型。
- 需要设计和开发机器学习系统和策略。
- 根据测试结果进行统计分析和微调模型。
- 为了培训目的在互联网上搜索可访问的数据集。
- 根据需要,训练和重新训练 ML 系统和模型。
- 扩展和改进当前的机器学习框架和工具。
- 开发满足消费者和客户需求的机器学习应用程序。
- 调查、测试和实施相关的机器学习技巧和技术。
- 对机器学习算法的问题解决能力和适用性进行评估和排名。
通过研究和可视化数据,我们可以更好地理解和检测数据分布中的差异,这些差异在现实环境中实施时可能会损害模型性能。
除了这些,远程 ML 科学家职位的职责和责任可能包括其他相关活动。 尽管该行业仍处于早期阶段并且存在许多未知数,但每个公司都有自己的一套生产自动化策略。
如何成为一名机器学习科学家?
在选择是攻读学士或硕士学位还是参加在线训练营之前,您应该清楚地了解自己希望从机器学习工作中获得什么。 一些远程 ML 科学家的工作可能需要计算机科学、数学、统计学或类似领域的学士学位,但其他人则需要硕士或博士学位。 其他人将根据您的工作经验和技能的可转移性来评估您的资历。
机器学习科学家与数据科学家有一些相似之处,这使他们有别于典型的软件科学家。 任何有兴趣担任 ML 科学家的人都应该能够收集、清理、优化和查询数据集,以及理解数据模型并将数据科学发现与软件科学家构建块结合起来。
让我们看看成为远程 ML 科学家所需的信息和能力。
成为机器学习科学家必备的技能
机器学习科学家的就业领域是新鲜的,并且发展迅速。 因此,作为一名机器学习科学家不需要一套通用的技能。 根据您的教育背景、技术人才和感兴趣的领域,有多种方法可以进入该行业。 人工智能和机器学习已经在改变 IT、金融科技、医疗保健、教育、交通和其他行业,未来还会有更多。 组织正在专注于 AI 的好处,超越试用阶段并转向 ML 采用。 因此,在不久的将来,远程 ML 科学家的就业将变得更加流行。
如果你想发展成机器学习科学家,以下是你必须具备的七项技能:
计算机编程语言
ML 科学家必须具备的第一个才能是使用各种编程语言的能力。 根据 GitHub 的数据,排名前十的机器学习语言是 Python、C++、JavaScript、Java、C#、Julia、Shell、R、TypeScript 和 Scala。 虽然 Python 是使用最广泛的编程语言,但 Scala 在利基领域越来越受欢迎,例如与 Apache Spark 等大数据框架的接口。
数据收集(ETL)
机器学习系统开发中最重要的阶段之一是预处理和存储它们产生的原始数据。 创建新数据时,ML 科学家必须开发 ETL(提取、转换、加载)管道来处理、清理和存储它,以便其他过程(例如分析和预测)可以访问它。 对于 ML 科学家,数据科学家必须能够检测数据模型并将数据科学解决方案与软件开发概念相关联。
数据审核
对数据集进行实验数据分析以发现数据中的意外模式、定义特定偏差和检验假设的能力是远程 ML 科学家职位的必要技能。 为了增强您生成的 ML 模型,您应该能够为数据集生成汇总统计信息,创建允许简单数据可视化的图形表示,清理和准备建模数据,执行功能开发以从数据集中提取其他信息,等等 上。
机器学习算法
如果你想成为一名成功的 ML 科学家,你必须是机器学习算法方面的专家并了解何时使用它们。 此外,要执行越来越具有挑战性的任务,例如照片分类、物品识别、人脸识别、机器翻译、对话合成等,您需要完全掌握基于人工神经网络的复杂算法。
服务提供者
确定哪种机器学习模型最适合特定问题后,您必须选择是从头开始构建模型还是利用现有服务。 如果您需要开发新的机器学习模型并需要一个完全托管的平台来快速有效地设计、训练它们并将其部署到生产就绪的托管环境中,那么掌握 AWS SageMaker 将会派上用场。
数据安全
机器学习系统的安全管理与任何其他软件解决方案的安全管理一样至关重要。 虽然 ML 模型需要大量的数据准备,但数据访问应仅限于授权员工和应用程序。 数据安全是一项必须不惜一切代价掌握的技能。
项目经验
成为 ML 科学家的另一个重要方面是认识到将您的技术专长应用于实际活动和项目的哪些方面。 从头到尾完成一个 ML 开发项目并将其记录在您的投资组合中,将帮助您向潜在雇主推销您的技能和专业知识,让您获得您一直想要的远程 ML 科学家职位。
怎样找到远程机器学习科学家的工作?
ML 科学家必须努力工作,以了解最新的行业发现,并随着时间的推移提高他们的能力。 为了在他们的行业中有效和一致,公司必须坚持最佳实践。 从这个意义上说,科学家们在前进的过程中应该牢记一些事情。 他们可能需要经验丰富且擅长教授新技能的人的帮助。 此外,作为 ML 科学家,您必须磨练您的分析、编程、人工智能和机器学习能力。
领类提供最出色的远程 ML 科学家职位,可帮助您实现 ML 开发职业目标。 使用尖端技术解决复杂的技术和商业挑战可以帮助您快速扩展。 加入世界上最优秀的科学家网络,获得全职、长期的远程 ML 科学家工作,薪水更高,职业发展更快。
职位描述
工作职责
- 具备基本编码能力和 ML 理解,改进我们当前的机器学习系统
- 完全控制机器学习系统,包括数据管道、特征工程、候选提取、模型训练以及与我们的生产系统的交互
- 使用尖端的机器学习建模方法来预测用户交互及其对公司顶线 KPI 的直接影响
- 为了增加针对性和参与度,设计功能并构建大规模推荐系统
- 确定将机器学习应用于产品各个方面的新可能性,以便为我们的客户增加价值
要求
- 学士、硕士或博士学位 需要计算机科学或相关技术学科(最好是 AI/ML)
- 广泛的专业知识与跨职能团队合作构建可扩展的机器学习系统和数据驱动的解决方案
- 了解 W2V 或 Bert 等 NLP 技术,以及与搜索相关的机器学习基础知识——学习排名、深度学习、基于树的模型、推荐系统、相关性和数据挖掘
- 2 年以上在推荐系统、搜索、用户建模、图形表示学习和自然语言处理等环境中实施机器学习方法的经验
- 需要了解神经网络/深度学习、特征工程、特征选择和优化方法。 具有深入研究实际问题并选择最合适的 ML 策略来解决这些问题的能力
- 需要强大的 Python 编程能力,熟练掌握数据处理(SQL、Spark、Pandas)和机器学习(sci-kit-learn、XGBoost Keras/Tensorflow)工具
- 精通机器学习算法的数学原理
- 能够在 Works 的“协调时间”(周一至周五:太平洋标准时间上午 8 点至下午 12 点)参加会议和进行交流
优先考虑的技能
- 以第一作者身份在 ICML、ICLR、NeurIPS、KDD、SIGIR 和其他相关会议/期刊发表文章
- 在 Kaggle 比赛中取得优异成绩
- 5年以上行业经验或博士学位
- 排名、推荐、广告等相关挑战中具有 3 年以上应用机器学习的行业经验
- 优秀的沟通能力
- 指导大型多工程项目的丰富经验
- 多才多艺、开朗的团队合作者,具有出色的人际交往能力