15158846557 在线咨询 在线咨询
15158846557 在线咨询
所在位置: 首页 > 营销资讯 > 网站运营 > HTML实体编码的编码与解码

HTML实体编码的编码与解码

时间:2023-07-23 12:27:02 | 来源:网站运营

时间:2023-07-23 12:27:02 来源:网站运营

HTML实体编码的编码与解码:

记得一个月前尝试用爬虫爬取过自己在校图书馆的借书情况。当时遇到最大的问题就是校图书馆的网页源代码有部分信息不是用文字显示,而是用下面这种形式显示的。当时尝试了各种方法,最后请教了一位大佬才解决问题。

斐波那契数列
最近打算制作一个属于自己的网站,所以也想用这种编码来给自己的网页源代码做个简单的加密,让别人没有那么容易爬取网站的数据。(笑死,网站估计访问都没人来访问)

所以,就想了解一下如何在文字与这种实体编码间转换。结果搜到的方法却异常的简单:

这种编码就是“&#”+文字的ASCII码+“;”

图书馆网的实体编码好像是在ASCII码的基础上转成了十六进制,然后再把前面的0去掉了。

代码实现不难。下面是Python:

编码:

s="斐波那契数列"#编码:def decode(input): ans="" for i in range(len(input)): st=str(hex(ord(input[i]))) ans+="&#"+st[1:len(st)]+";" return ansprint(decode(s))输出结果看看:

这种编码正不正确呢?只要到图书馆网的源代码里ctrl+F搜一搜即可。

解码就是把上面的步骤反着写即可:

#解码def encode(input): ans=input.split(';') result="" for i in ans: if len(i): st=int("0"+i[2:],16) result+=chr(st) return result当然,也可以用以前的方法:

import htmlprint(html.unescape(decode(s)))效果一样:




之后将实体编码直接写在网页源代码就行了。

效果如下:

注:关于我制作一个属于自己的网站,我打算把它整成一个知识分享型的网站,收录我在本站上写过的一些比较满意的文章的链接,方便大家学习。从网页的布局到文章的整理以及注册域名之类的都需要很多时间,预计最快也需要半年时间吧。不过,好的东西也更需要耐心等待。

暂时用腾讯云的静态网站托管上线了一个网站,做的很随意。有需要的读者可以点链接访问。



关键词:编码,解码,实体

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭