案例解析 | 高效上云,助力垂直电商降本增效
时间:2023-03-31 19:46:01 | 来源:电子商务
时间:2023-03-31 19:46:01 来源:电子商务
甩开技术包袱,做出业务特色,越发成为垂直电商的生存之道
今天,人们通过天猫、淘宝、苏宁进行网络购物,不仅方便,而且快乐,通过盒马、饿了么享受更加快捷的本地生活服务,与此同时,家电、食品等垂直领域的电商平台,也越来越有特色。
A公司是中国较早的食品领域相关产品和服务供应商,旗下的A1网致力于打造安全的大型食品购物网站。
对食品进行优选,在保质期上严格把关,对食品库存温湿度以及人员健康严格把关的同时,网站不断丰富食品种类,满足不同人群的需求,和其他垂直领域电商平台一样,A1网也决定把更多的精力用在不断提升服务质量和特色,网站本身往云上迁移,借助云计算的优势,不断提升系统响应速度,让购物更加快捷,这已经成为该领域正在发生着的一个显著变化。
把IT基础设施重资产(包括基于IDC建设的服务器、存储设备、网络与安全设备等)转移到云上,实现IT基础设施的虚拟化,根据业务量弹性灵活的使用资源,做到按量使用、按需付费,还有另一个附加好处,增强了经济贸易风险抵御能力。当经济形势触底的时候,对于最坏的情况进行兜底,对于经济形势随着拐点上行的时候,能够轻装前进,支持业务的快速扩张。
本文将以案例说明上云为支撑业务和降低成本带来的转变,以及客户的顾虑如何消除,最后通过什么样的步骤上云。
系统越复杂越需要上云,才能更敏捷的支撑业务
业务的敏捷性要求,对使用传统的IDC部署开源软件运维的方式提出了挑战。
上云之前,网站已经具有了相当的规模,在北京世纪互联主机房有数十个机柜,在同城的备机房也有几个机柜,主要是存放备份、数据库和代码。
图1 云下信息图
使用了万网的DNS服务和第三方的CDN服务,采用7层负载均衡,主机为物理机+kvm+vmware+docker的组合,存储设备在主机房,有着数十TB的数据,使用了开源的漏洞扫描软件,应用服务器采用了Nginx+Apache+Resin+Tomcat的组合,数据库使用了SQLServer+MySql+Oracle等多种产品。
另外还使用了Redis缓存、ZooKeeper、MongoDB、ELK、Docker、K8S以及监控软件和SVN,应用服务器+web前端+缓存+数据库一共有上千台服务器,操作系统则包括了centos和windows的多个版本。
与复杂的系统对应的是一支数十人的运维团队,随着时间的推移,不同厂商的产品越来越错综复杂,而业务的增长进一步为系统的平稳运行带来了更大的挑战,如何减少服务之间的依赖关系,如何打通数据,提高对新业务新需求的响应速度,如何提高运维人机比,这一系列的问题成为需要长期应对的挑战。
而云上通过微服务架构,通过使用企业分布式服务EDAS、消息队列、容器等服务和产品,极大的保障了系统的服务化和异步化,通过云上数据库、中间件、移动和物联网套件以及小程序,可以快速搭建应用试错,快速响应业务需求。
上云后可以大幅度缩减成本
图2 云上架构图
由于电商特色的各种打折促销活动,带来了系统流量的波峰波谷,导致平时服务器的利用率远远不到50%,对于这部分业务,云上可以使用包年包月的服务,性价比足够高,而对于其他波峰的业务在云上则可以使用按量付费的服务,在SLB设置规则当流量达到一定量的时候弹起一台新机器,还可以考虑纵向的弹性扩展,比如提高配置规格,使得总体成本缩减到原来的一半。
上云后,客户需要通过等保三级测评,可以通过我们和合作伙伴的服务帮助客户准备材料,指导客户顺利通过测评,和自建机房相比,成本更低。
存储都通过OSS上云,云下不存放数据,后续根据需要可以增加异地OSS备份,既节省了原来的存储成本,云上三副本的AZ内高可用、同城双AZ容灾和异地三AZ备份,很好的确保了数据可靠性与可用性。
以客户第一的理念消除顾虑
在行业大背景下,以实实在在的业务和技术的痛点为驱动,上云带来的好处为指引,使得今天更多的客户不是谈论什么是云计算,为什么要上云,而是在谈论如何快速高效的上云。与此同时,作为一家专门提供云服务的技术输出公司,我们正以专业的态度服务客户,从而打消一切顾虑,下面列举了一些客户因为顾虑而提出的问题,以及我们的解答。
- 双11阿里会不会先保障天猫、淘宝,由此可能伤害客户?
面对这样尖锐的问题,我们其实想到了前面,早在每年十月份或更早就开始询问客户的增量,提前为客户做好扩容准备,以确保客户的业务为首先要保障的目标。 - 如果要下云的时候会不会像某云计算厂商一样制造阻碍,关掉Redis的相应功能,使得客户不能使用DTS进行不停服迁移?
我们的回答是,绝对不会的,可以通过实际使用来验证我们的承诺。 - 对于A1网而言,由于客服线路等原因,有些数据库迁移不上云,能否云上应用访问云下数据库?
回答是可以的,通过ECC建立云上和IDC之间的高速通道就可以很好的满足业务需要。 - 我们为客户提供的安全合规服务收费吗?
我们提供资料都是免费的,如果需要购买安全产品比如WAF则要按照WAF产品付费。 - 上云后的成本怎么样?
通常比原成本节省30%,可以使用TCO计算器进行成本分析和现有IDC成本对比。 - 部分运维人员担心上云后会不会没有工作?
事实上,上云后运维同学可以解放出来从事云服务管理等更加高级的工作,大数据开发工程师可以做数据分析师和技术支持工作,产生的价值更大,因为业务价值更大。同时,阿里云还提供了从Apsara Clouder、ACA助理工程师、ACP专业工程师到ACE高级工程师的云计算专业技能和资格认证服务,基于云计算、大数据、云安全、人工智能、中间件几大领域,证明技术人员可以基于阿里云产品在对应的技术方向上解决企业的基本业务问题。
上云七步走
图3 上云方案图
网络迁移,是首先要解决的问题。迁移前,了解机房和办公区之间、机房之间的专线情况,包括带宽、类型等;迁移时,建立ECC高速通道。
应用迁移,一般先于数据库进行。迁移前,确定双机房之间是否实现了主从,比如通过Bind服务域名解析配置主从服务器等;迁移时,在云上重新部署,或者使用SMC做应用迁移;技术细节可以参考“服务器迁移最佳实践”。
缓存迁移,包括Redis、MemCache迁移。迁移前,确定存放的是什么数据,比如session,用户登录信息等,确定存放的哪些数据是可以丢弃的,应用重新从数据库更新,确定需要迁移的数据量;迁移时,使用DTS工具进行迁移,且支持增量;应用和Redis之间如果有代理程序,需要先进行失效处理。
数据库迁移,主要是MySQL迁移。迁移前,确定每个业务线对应的实例使用情况,实例共享物理机情况,确定端口是否都使用3306,不同的实例是否都使用不同的域名,MySQL以哪些版本为主,确认云上是否覆盖,统计实例总数,一台物理机多少个实例,每个实例数据量级别,通过POC来熟悉DTS用法;迁移时,使用DTS工具迁移;如果出现异常则可采用回退策略,DTS回流到线下,客户可能做业务改动,比如将IP改成域名,需要提前检查。技术细节可以参考最佳实践
半结构化数据迁移,包括MongoDB迁移。迁移前,需要了解有几个集群,总共多少TB数据,需要做云服务POC验证;迁移时,使用云自建方式,加分片方式迁移,也可以使用云服务方式,通过使用DTS工具从自建迁移过来。
存储迁移,主要指非结构化数据迁移。迁移前,了解现有存储的数据是哪些,含副本数据量和实际数据量,负载情况,读写比例等,需要POC来熟悉产品用法,包括测试使用OSSImport来将IDC文件迁移到OSS;迁移时,历史数据使用闪电立方迁移到OSS,热数据使用OSSImport迁移到OSS云上存储;迁移到OSS需要改应用,需要注意检查避免出错,另外,如果小文件较多,则迁移耗时可能会较长,需要提前做好安排。
如上所述,通过分析需求和关键的技术难点,制定了上云方案,该方案按照标准化的流程对应考虑的技术问题做了规范约定,包括准备工作阶段、迁移方法和风险预案,通过方案的实施,能够有效的帮助客户提高上云的效率,降低风险。查看更多:https://yq.aliyun.com/articles/740083?utm_content=g_1000102637上云就看云栖号:更多云资讯,上云案例,最佳实践,产品入门,访问:https://yqh.aliyun.com/