Devops/运维开发工程师-北京

Negotiable
Experience
Unlimited
Job Type
Full Time
Location
China, Beijing
Job Description
团队介绍
AML-Engine(Applied Machine Learning)机器学习引擎团队为字节跳动内部众多业务方向提供统一、高性能、高可靠、大规模的机器学习系统架构和支持内部大量算法工程师的机器学习平台。为字节跳动旗下头条/抖音/等各业务的推荐/广告/搜索 在全球提供高质量的在线服务,和大规模机器学习训练环境;
稳定性方向/运维系统,负责字节跳动跳动机器学习平台的离线训练,在线服务,离在线数据同步相关的 自助&自动化运维,系统稳定性建设,指标建设与分析,问题排查&自动检测与恢复,系统性能优化,资源规划&管理优化;构建&优化 高效、可靠、易用的分布式运维框架。

1、保障大规模机器学习系统的稳定运转;
2、负责核心服务的持续集成和交付,高效和自动化的运维优化,提升服务的稳定性;
3、负责大规模分布式系统的监控与指标建设;
4、负责大规模在离线集群的云平台化、资源优化、SLA保障。
字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书、TikTok、Lark等。业务覆盖150个国家和地区,旗下产品全球月活用户数超19亿。加入我们,和优秀的人,做有挑战的事!