为什么当前国内公有云服务迁移那么难?

idc
azure
aws
阿里云
产品

#1

从2013年开始,中国公有云服务开始进入实质性的落地阶段。在过去的两年间,市场不断有新的公有云服务产品落地,新晋市场参与者层出不穷。除公有云服务的先行者如 阿里云中国电信等以外,国际厂商如微软 Azure 和亚马逊 AWS 也纷纷将其云服务落地到中国。此外,传统数据中心服务商 IDC世纪互联万国数据首都在线等以及互联网公司如 腾讯乐视,创业型公有云 青云UCloud 等也纷至沓来。

公有云服务市场竞争虽然日趋激烈,但随着国际巨头 亚马逊IBM微软等进入中国云计算市场,中国本土 BAT 等服务商对云计算市场的大力投入,以及政府政策的支撑,中国云计算市场得到了快速发展。

但奇怪的是国内云计算市场并没有像国外云计算市场那样呈爆发性增长。虽然我们能够从市场上看到许多互联网公司、尤其是创业团队的部分架构已经迁移到公有云服务,但单个客户的公有云使用规模很难和国外相提并论。这一方面是因为国外的云计算市场已经发展多年,有一定的历史积累;但更重要的原因是国内客户对云服务迁移的复杂度有太多顾虑、羁绊。

如果一个商业市场没有政策管制、技术壁垒,客户还不能放心使用,大多原因有两个:一是产品本身的问题,二是没有好的工具和方案。阿里云 已经耕耘国内市场6年、微软 Azure 项目2012年在中国启动到商用已近3年时间,云平台的技术稳定性、运营流程早已跟世界接轨。产品的稳定性如果得到了市场验证,那么问题就在于第二点:云服务的迁移解决方案。

前不久带着这个问题我们走访了上海地区的多家云服务解决方案厂商。这些厂商的解决方案、实施人员都是伴随着 阿里云、微软云、亚马逊 在中国落地一同成长起来的。他们的上云服务水平已经达到了一定的国际水准,但困挠他们的一样也是不能随着云市场的增长做到规模化。而规模化、效率化是公有云服务最大价值体现。

那么国外云服务市场如何?

这张图是 AWS 近一年股票增长图,价格翻了近一番。背后的原因是什么?在过去三年中 AWS 推出了2300个产品,覆盖35个应用领域,与800个ISV合作。提供了大量的行业解决方案来服务企业客户、合作伙伴。

看到这些情况如果国内云厂商市场销售人员还将客户增长缓慢单单归咎于市场教育程度不够、客户对云服务的安全有抵触未免原因太简单了。

举个例子,云应用监测方面。AWS 之前没有给客户提供监控能力,但很多客户对 AWS 说~监控服务是必须的,尤其是在迁移云服务阶段。在 AWS 的生态系统中,国外已经有提供监控和服务的ISV存在。NewRelic 的产品组合方案在 AWS 平台上提供了很好的监控优化能力,为客户顺利迁移云平台保驾护航。

回到国内,传统国外的企业客户大多会按照欧美业务的IT服务流程,找到国际的 AWS 迁移解决方案商实施。这些有一定技术能力、符合国际标准的服务公司在国内是凤毛麟角且价格昂贵。在 互联网+ 时代新兴互联网创业团队流行 self-serviceITOM 自动化运维经验和能力对于一个创业公司来讲是核心竞争力。一个技术运营团队的实力意味着公司用户和收入的稳定增长。这几年 BAT 的技术分享越来越难获取到想必与这有很大关系(掖着不放)。那国内的互联网企业怎么办?IaaS 基础设施迁移可以找一些相对成熟的服务集成商,但 ITOM 监控服务管理没有太多的经验人才,尤其是 APM 领域。

人才难求那就必须借助于好的工具。既然基础设施托管于 IaaS 平台,监控服务就应尽快 SaaS 化,历史一次次证明对于引领行业的新技术趋势谁接受越快、谁发展就会更快。尤其是行业变革阶段~为快不破!

就如何实施 ITOM 监控方案,我们来介绍下一家生鲜电商在迁移某公有云平台过程中,如何使用 OneAPMAi Bi Ci Ct OneAlert 产品组合来解决 ITOM 监控服务的。这个方案是实施过程中不停迭代改进 总结粗来 的经验,希望能抛砖引玉帮助同样需求的传统企业、互联网创业公司。把这 ITOM 运维不传的秘密大白于天下、造福于苍生 :grinning:

首先,尽可能要求 Freeze 代码,一般服务迁移选在业务淡季。大家都说互联网服务没有淡季旺季,其实不然。比如国内消费类电商:每年 10 月开始预热各种功能、上线测试,双 11 双12 业务量开始极具上涨,圣诞、元旦、春节前后达到到顶点,这期间的广告以及售卖收入有可能占到全年营收的 60%~70%。这段时期是不太可能做平台层面重大更新的。另外,诸如春季的旅游出行服务商、夏季电影 O2O 等等不列举了。

言归正传,具体的实施过程请见下文:

First Week

配置 Cloud Test (CT)可用性监控服务,将所有 API 接口(Web,InternalAPI,OpenAPI,Chat,Batch)全部监控起来。Cloud Test (CT) 产品提供 Dashboard 公告栏功能,可以表单形式来展示服务状态的可用性。并且建议建立子账户功能将部分 OpenAPI 接口状态 expose 给合作伙伴。(云服务时代尤其是 SaaS 服务各家都是互相依赖的。这个措施是有益于告知合作伙伴假如迁移云服务失败,合作伙伴可以及时得到通知,迅速采取应对措施。)


配置 Browser Insight(Bi) 前端监控服务,监控前端服务的关键页面(Seach,Ads,Order,Store,Payment 等)一周的用户访问情况。统计用户访问闲时、确定迁移时间,并为迁移服务前后样本统计对比积累数据。

配置 Cloud Insight(Ci) 中间件监控服务,采样一周关键中间件数据指标(Memcache,Redis,MySQL,MongoDB,Kafka 等),为迁移服务前后样本统计对比积累数据。

准备生产镜像,OneAPMApplication Insight(Ai)Cloud Insight (Ci)easy to useplatform-independence 模式,支持大多数系统并可以封装进 VM 镜像(或者可以直接采用 OneAPM 为公有云市场(例如:阿里云)提供的标准生产镜像,并且 OneAPM 已经能提供 Docker 类型的镜像(灵雀云))。

在云平台小规模部署集成 Application Insight(Ai) 的前端服务( 5 ~ 10 台 VM 左右,包括所有核心功能服务),配置前端负载在同一监控全链路中,其实部分服务已经算开始迁移到云平台。此时 OneAPM 相当于在监控一个混合云(公有云 5~10 台+线下服务)。

Second Week

与产品、运营、研发人员沟通,通过 Browser Insight(Bi)监控的用户数据和运营业务数据的分析用户访问闲时时间段。根据自身业务情况、用户数量确定冗余备份资源,制定迁移策略准备上线。

**题外话:**万事具备,只欠东风,开始上云不 ?No 最好跟云厂商服务人员7个饭,这点非常重要。酒过三巡、菜过五味,打听清楚某区资源是否够用,最近是否有云平台重要更新,IDC 周围有没有挖掘机,你懂得 :joy: 翻翻运维黄历 APP,定一个良辰吉日,准备上线!

首先,重点关注 Cloud Test(Ct) 可用性监控,包括漏洞扫描,DDoS 攻击、网络不稳定告警,CDN 资源加载甚至是公有云宕机崩溃,一旦有异常问题迅速暂停上云过程转为传统线下部署。

如果上云过程顺利(一般会保留 10~20% 线下资源维持一个月稳定期)。开始关注 Browser Insight (Bi)实时监控全域用户真实访问情况。如果有大面积页面缓慢、用户访问异常,运维会及时跟运营人员、研发人员沟通,通过 Application Insight(Ai)分析应用缓慢错误原因、及时修复线上Bug。

有了以上 ITOM 服务实时监控的保证,再配合云厂商的自动化迁移方案。DevOps 工作就会大大简化,即根据实时的运维数据情况做 scale-upscale-down 操作。

另外,再将 Ai Bi Ci Ct 等产品配置到 OneAPM 提供的综合报警平台 OneAlert 。一旦有什么异常情况、告警风暴都会及时有效的传达到位、迅速处理。而且 OneAlert 会支持 HipChatChannel等常见 IM、任务处理系统,能大大简化运维管理工作。

Third Week

上云过程算告一段落,但后续需要持续用 Bi 对比迁移云服务前后终端用户数据,用 Ci 监控中间件的数据差异。一旦发现有很大差异(数据量减少、用户访问减少、页面缓慢),需要使用 Ai Bi 来不断诊断问题,优化服务。而且后期阶段 Ai 对于 APM 优化,提高云服务使用效率会有很大帮助。

最后,还有一点补充,既然上公有云了,就相当于开始租房子过日纸了。此时最大的顾虑就是 安全。推荐一款 OneAPM 专为云服务时代打造的安全产品 OneRASP!

前不久的 Xcode Ghost 事件以及最近发生的百度 WormHole 漏洞,这些安全事件对企业的直接损失不仅仅是机器宕机、性能损耗,更为重要的是大量信息泄漏、声誉上损失、客户的流失,当时 微信 APP 之所以能及时发现自身 Xcode Ghost 漏洞,得益于安全实时的监控。而 OneRASP!正是这样一款能够实时监控 Sql 注入、XSS攻击、异常流量访问的安全产品。尽快用上她吧,给自己的服务买个保险!

当企业一旦拥有有了混合云迁移能力以及全域 ITOM 监控能力,研发运营对于企业发展不会是主要矛盾或发展瓶颈,而是真正可靠的生产力,是商业规模扩大化的助推剂,Technical in Control 才能在 互联网+ 时代激烈的竞争中脱颖而出,飞速发展。

短短一年时间 OneAPM 研发出了一系列 ITOM 监控产品。 OneAPM 产品良好的易用性,平台无关性,无论是对传统的企业服务,私有云部署,还是公有云、混合云实施都能做到良好支持。未来 OneAPM 会联合更多的云平台,解决方案商,SaaS 厂商在 ITOM 领域为企业客户创造最大价值!


#2

学习了! :clap:


#3

学习了 谁的大作 不错


#4

深度好文,对有云迁移需求的企业有很好的借鉴作用~~~


#5

太高深了,先mark了吧··


#6

貌似好屌的样子,,,


#7

有理有据:sunflower: