时间:2023-11-28 03:36:01 | 来源:网站运营
时间:2023-11-28 03:36:01 来源:网站运营
论坛类似淘宝网京东商城这样的网站怎么建设呢,需要多少钱?:我没看错吧?貌似没看错……楼主,就这么说吧,本人在从业这些年的服务过程中,有时候遇到一些新客户会咨询:开个发淘宝或京东这样的网站需要多少钱?感觉不太难,二三十万应该就可以开发了吧。 错! 就拿淘宝做个例子,呈现给大家哈: 比如我们最常用的几个功能: 搜索商品: 对于用户来说,是简单的搜索功能,对于网站来说可不简单, 第一步:要有数据库来储存场频,看看你的商品数是多少,1000、1000 0000、1 0000 00000和100 0000 0000这不同的量级,显然用的数据库是不一样的,就像你的仓库,放1千件的物品和1个亿物品的空间肯定是不一样的。 在网上,商品是放到数据库里的,产品多了,数据库就要增加,数据库的费用就要增加。 第二步:要有搜索殷勤来搜索产品,因为搜索也不可能直接从数据库里来取数据,必然要用到搜索引擎(简单来说搜索引擎更快)。 第三步:那么多的产品,谁家的商品出现在第一页?这里需要用到巨复杂的排序算法。要是再根据你的购买行为做一些个性化的推荐——这够一帮牛叉的算法,一般都需要顶级的工程师来完成的。 商品详情 点击查看商品的页面,这个页面有商品的属性、详细描述、评价、卖家信息等等。这个大家的差距在哪了?就在你的流量上了,如果你做一个网站每天有30个人访问,你丝毫感觉不到服务器的压力,但是30亿,要解决的问题就多了去了。就像你做个活动一样,来的人少,和来的人特别多,那要考虑的问题不在一个层次上的,比如10万和100人,10万你至少要考虑安全的方方面,人的流向等。 在网上首先这些请求不能直接压到数据库上,任何单机或分布式的数据库,承受30亿每天的压力,都将崩溃到完全没有幸福感,这种情况下要用到的技术就是大规模的分布式缓存,所有的卖家信息、评价信息、商品描述都是从缓存里面来取到的,甚至更加极致的一点“商品的浏览量”这个信息,每打开页面一次都要刷新,你猜能够从缓存里面来取吗?淘宝做到了,整个商品的详情都在缓存里面。 商品图片 每个商品有5个图片,商品描述里面有更多图片,你猜淘宝有多少张图片要存储?100亿以上。这么多图片要是在你的硬盘里面,你怎么去查找其中的一张?要是你的同学想拷贝你的图片,你需要他准备多少块硬盘?你需要配置多少大的带宽?你们的网卡是否能够承受?你需要多长时间拷贝给他? 据说双十一当天高峰,淘宝的访问流量最巅峰达到871GB/S。这个数字意味着需要178万个4mb带宽的家庭宽带才能负担的起,也完全有能力拖垮一个中小城市的全部互联网带宽。那么显然,这些访问流量不可能集中在一起。并且大家都知道,不同地区不同网络(电信、联通等)之间互访会非常缓慢,但是你却发现很少发现淘宝网访问缓慢。这便是CDN,Content Delivery Network,即内容分发网络的作用。淘宝在全国各地建立了数十上百个CDN节点,利用一些手段保证你访问的(这里主要指js、css、图片等)地方是离你最近的CDN节点,这样便保证了大流量分散已经在各地访问的加速。 假若一个卖家发布了一个新的宝贝,上传了几张新的宝贝图片,那么淘宝网如何保证全国各地的CDN节点中都会同步的存在这几张图片供用户使用呢?这里边就涉及到了大量的内容分发与同步的相关技术。淘宝开发了分布式文件系统TFS(taobao file system)来处理这类问题。 广告系统 淘宝上有很多广告,只是它的广告做的很人性,彷佛都是为你着想,给你做的推荐。卖家怎么出价去买淘宝的广告位?广告怎么展示?怎么查看广告效果?这又是一套算法精奇的系统。 有时候用户会很好奇,怎么淘宝知道自己喜欢什么,想要买什么了? 这是淘宝还根据你输入的搜索词进行你的购物意图分析。比如没有明确的购物对象和意图,边看边买,用户比较随意和感性,像搜2017年10大香水排行;比如查询型:有一定的购物意图,体现在对属性的要求上,像搜适合爸爸的衬衫;比如确定型:已经做了基本决定,重点考察某个对象,像搜《圣学根之根》不二字字卡。通过对你的购物意图的分析,主搜索会呈现出完全不同的结果来。 你的浏览数据、交易数据以及其它很多很多的数据记录均会被保留下来。使得淘宝存储的历史数据轻而易举的便达到了十数甚至更多个PB(1PB=1024TB=1048576GB)。如此巨大的数据量经过淘宝系统1:120的极限压缩存储在淘宝的数据仓库中。并且通过一个叫做云梯的,由2000多台服务器组成的超大规模数据系统不断的进行分析和挖掘。 从这些数据中淘宝能够知道小到你是谁,你喜欢什么,你的孩子几岁了,你是否在谈恋爱,喜欢玩魔兽世界的人喜欢什么样的饮料等,大到各行各业的零售情况、各类商品的兴衰消亡等等海量的信息。 BOSS系统 淘宝的工作人员怎么去管理这么庞大的一个系统,例如某时刻突然宣布某位作家的作品全部从淘宝消失,从数据库到搜索引擎到广告系统,里面的相关数据在几分钟内全部消失,这又需要一个牛叉的后台支撑系统。 运维体系 支持这么庞大的一个网站,得需要多少台服务器?几千台?那是零头。这么多服务器,上面部署什么操作系统,操作系统的内核能否优化?Java虚拟机能否优化?通信模块有没有榨取性能的空间?软件怎么部署上去?出了问题怎么回滚? 所以,即便是你仅仅访问一次淘宝的首页,所涉及到的技术和系统规模都是你完全无法想象的,是淘宝2000多名顶级的工程师们的心血结晶,其中甚至包括长江学者、国家科学技术最高奖得主等众多大牛。同样,百度、腾讯等的业务系统也绝不比淘宝简单。要知道的是,你每天使用的互联网产品,看似简单易用,背后却凝聚着难以想象的智慧与劳动。大家最简单的知道人家的开发成本办法,就是看看这些上市公司的财报了,每个季度在开发成本上都有几千万到几个亿不等。 看完你还觉得建设一个像淘宝一样的网站,只需要二三十万吗?关键词:建设,论坛,商城