品途提供了一个全职网站可靠性的机会,加入我们的Exchange SRE团队。这个职位的人员将有运行复杂的地理分布式云计算设置的经验,这些设置为大量的客户连接提供服务,包括临时的和流式的连接。
这个职位需要出色的技术能力,专业精神,扎实的沟通,出色的解决问题的能力,以及热切的态度。
成功的候选人将在建设、运营和发展无差错、低延迟、高容量和吞吐量的下一代加密货币交易所、其匹配引擎或后端软件系统方面发挥关键作用,为数百万客户(零售或机构投资者、B2B2C客户、做市商等)服务。
理想的候选人应该在交易技术领域、基础设施即代码概念、各种协调引擎和容器化技术、监控引擎和堆栈方面有一定的知识,并熟悉高性能计算和网络。
强有力的书面和口头沟通是必须的,因为申请人将经常与业务利益相关者和产品团队互动,以实现品途的战略业务目标。
基本职能/职责
分析业务/产品需求,提出有效和高效的技术解决方案,为品途交易所的基础设施和景观提供变革和创新。
与项目焦点小组(产品工程、产品管理、架构和首席技术官)合作,为给定的交付物编制工作分解结构,并为完成或项目任务提供现实的估计。
设计、构建、维护和改进Pintu的Exchange基础设施和各自的工具。确保基础设施的弹性和自动可扩展性,以提高资源利用的成本效益,同时确保系统的高可用性和容错性。
与其他开发人员、SRE和QA工程师合作,执行全周期的集成、功能和回归测试。拥有并及时有效地解决解决方案代码库中的所有优先缺陷
在所有的环境中,安全和负责任地促进软件的变化,通过开发、暂存环境,以零延迟的方式将更新部署到生产环境中。
在工作期间提供有效的基础设施一级技术支持,偶尔也会在非工作时间根据轮换计划提供支持。设计、建立、维护和改进各自的基础设施监测工具,这对于提高对形势的认识和主动的事件响应至关重要。
参与团队演习,以确定和实施持续改进的领域,并积极主动地把你的想法带过去
在你自己的专业领域和领域知识方面教育和指导你的工程同事,并保持开放的心态和平易近人的态度。
经验要求
5年以上的SRE经验,最好是在亚马逊网络服务和谷歌云环境中工作。MS Azure。
有设计和实施AWS和/或GCP设置的经验,从头开始
有建立和运行跨区域弹性解决方案的经验
有在Kubernetes上架构、构建、部署和运行企业级容器解决方案的经验
在设置和维护消息代理基础设施(Kafka、RocketMQ等)方面有丰富经验
有建立云持久层的经验(AWS Aurora、GCP BigQuery等)。
有通过Istio或其他相关解决方案实现大型服务网格的经验
有建立按需、短期环境的经验(用于调试、分析和负载测试的场景)
有在高技能工程师组成的小型焦点团队工作的经验
必要的技能
对云网络概念(VPC、对等、互连等)有深刻的理解
对云安全原则(VPN、应用防火墙、IAM等)有良好的理解
有操作系统的经验,特别是对Linux操作系统有很好的了解,了解网络架构
对Docker和Kubernetes有深入了解
对Bash、Ansible和Terraform脚本有扎实的了解
精通使用SDLC CI/CD管道,对大规模系统部署进行自动化基础设施管理
优秀的书面和口头沟通能力
有活力、有创意、有自主性的自我创业者
优选/奖励技能