18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 建站知识 > 从url中解析出域名、子域名和有效顶级域名

从url中解析出域名、子域名和有效顶级域名

时间:2023-02-07 08:16:01 | 来源:建站知识

时间:2023-02-07 08:16:01 来源:建站知识

最近有个需求是这样的,做了个cdn分析小工具给运营的同学。他们输入一个 url 之后,我会去 url 上抓取所有的静态文件地址,并分析出这些地址用了哪家的 cdn。

比如 http://zhihu.com 这个地址,解析出来的结果是这样:

如下的域名:


http://onepiece.zhihu.com

http://e589fa51.zhihu.com.safe.cdntip.com

http://dayu.ddos.tc.cdntip.com

http://e589fa51.zhihu.com.safe.cdntip.com 来举例,很容易看出他的子域名是 e589fa51.zhihu.com.safe,域名是 cdntip,顶级域名是 com。

但不是每个域名的顶级域名都像 .net .com 一样只有一段,还会存在 com.cn, http://co.uk 这样的情况。

这时候,我们没法通过简单的正则表达式来切分用户的域名。当然,复杂的正则也做不到。这时候需要一份顶级域名的列表,把域名里面的顶级域名给匹配出来。

这里有一份列表:

https://publicsuffix.org/list/effective_tld_names.dat

----

.http://com.cn 是我们常见的顶级域名,但严格来说,只有 .cn 是顶级域名。

.http://com.cn 其实是 .cn 自主创造出来的顶级域名,由于这样情况非常广泛,所以严格意义的顶级域名很多场景下没法直接使用,我们就创造了一个【有效顶级域名】的概念。


就中国来说,下列中除了最顶部的 .cn ,其余都是不是严格的顶级域名:

// cn : https://en.wikipedia.org/wiki/.cn// Submitted by registry <tanyaling@cnnic.cn>cnac.cncom.cnedu.cngov.cnnet.cnorg.cnmil.cn公司.cn网络.cn網絡.cn// cn geographic namesah.cnbj.cncq.cnfj.cngd.cngs.cngz.cngx.cnha.cnhb.cnhe.cnhi.cnhl.cnhn.cnjl.cnjs.cnjx.cnln.cnnm.cnnx.cnqh.cnsc.cnsd.cnsh.cnsn.cnsx.cntj.cnxj.cnxz.cnyn.cnzj.cnhk.cnmo.cntw.cn----

既然一个国家可以创造自己的顶级域名,有些组织也向这份列表提交了自己定义的有效顶级域名。

比如亚马逊提交了下面这些:

// Amazon Elastic Compute Cloud: https://aws.amazon.com/ec2/// Submitted by Philip Allchin <pallchin@amazon.com>compute.amazonaws.comap-northeast-1.compute.amazonaws.comap-northeast-2.compute.amazonaws.comap-southeast-1.compute.amazonaws.comap-southeast-2.compute.amazonaws.comeu-central-1.compute.amazonaws.comeu-west-1.compute.amazonaws.comsa-east-1.compute.amazonaws.comus-gov-west-1.compute.amazonaws.comus-west-1.compute.amazonaws.comus-west-2.compute.amazonaws.comcompute-1.amazonaws.comz-1.compute-1.amazonaws.comz-2.compute-1.amazonaws.comus-east-1.amazonaws.comcompute.amazonaws.com.cncn-north-1.compute.amazonaws.com.cn

----

Node.js 有个包专门做这事:https://www.npmjs.com/package/parse-domain

关键词:析出

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭