18143453325 或

所在位置：首页 > 营销资讯 > 电子商务 > 打造一个蓝奏云网盘搜索引擎

打造一个蓝奏云网盘搜索引擎

时间：2023-03-27 09:48:01 | 来源：电子商务

时间：2023-03-27 09:48:01 来源：电子商务

目前存在的网盘搜索引擎好多，可以归于两类：

1.搜索引擎索引
2.爬虫入库索引

第一种：搜索引擎索引
这种索引方式是目前比较主流的方式，依靠百度，谷歌建立索引链接，当用户进行搜索的时候，网盘搜索引擎会抓取谷歌和百度已经收录的页面然后反馈给用户。

第二种：爬虫入库索引
通过爬虫（python或者其他语言）进行对网盘站点的资源爬取，将资源统一存放到数据库，通过分词将搜索结果展现给用户。

这两种方式各有优缺点，第一种属于间接搜索，如果搜索引擎不收录该站点资源，那么将无从搜索。第二种属于直接搜索，资源准确度较高，但是实时更新速度比不上第一种。

下面进入主题，说说尘心盘搜索的技术搜索模式
地址：https://pan.ischenxin.com/

很早之前就想打造一个蓝奏云的网盘搜索引擎，无奈之前时间一直不充裕，终于有时间可以做开发了。

蓝奏云的优点：不限速速度快。
蓝奏云的缺点：非会员上传限制100M

缺点导致资源不会太大，视频内容肯定就非常少了，但其他类的资源，比如app，音乐，小说肯定非常丰富。

由于蓝奏云的Robots限制了百度对其网页的收录，使用百度高级搜索语法是没有搜索结果的，但是谷歌就可以搜索到。

本身也没有想着使用搜索引擎的方式去做引擎，只是抱着严谨的态度搜索看一看。

废话太多，下面进入主题。

技术架构：
1.前端使用Vue+Element UI ，本身前端不复杂，就没有使用webpack打包
2.后端使用了PHP+Apache+Mysql 经典的后端组合
3.分词引擎使用了国人开源的xunsearch 汉语嘛当然是国人最懂汉语了
4.爬虫使用了基于python的Scrapy 分布式进行资源的爬取

整套系统的复杂点在于分词，因为数据库存储资源后，由于数据的庞大，若使用数据库查询语句 like，效率和吞吐量肯定满足不了。此时分词的重要性就显得非常重要了，将数据库存储标题的字段进行分词，然后建立全文索引链，这样大大提高了搜索速度和吞吐量。

虽然mysql目前是支持中文的全文索引的，但是效率和分词的结果非常不理想，寻找了几个分词引擎，最后选择了xunsearch，百万级搜索速度只有几毫秒，有需要的朋友可以百度xunsearch了解下，使用并不复杂，文档写的有点乱，还是需要认真多分析几遍的。

爬虫还是万年不变的python，使用西瓜皮作为爬虫框架，一共有三台服务器分布式爬取，由于蓝奏的种种限制，目前资源入库的速度还算是理想。这里有一点需要说明，爬虫和分词并不是实时响应的，每爬取一段时间后，服务器会进行分词处理，资源存在一定的滞后，这个后期会在优化这个滞后的时间。

关键词：索引,打造

网站
营销
设计
运营
优化
效率
专注
电商
方案
推广

解决方案&服务

客户&案例

营销资讯

关于我们

解决方案&服务

客户&案例

营销资讯

关于我们

微信公众号

为了最佳展示效果，本站不支持IE9及以下版本的浏览器，建议您使用谷歌Chrome浏览器。点击下载Chrome浏览器

关闭

快捷入口

打造一个蓝奏云网盘搜索引擎

外贸英文网站谷歌SEO排名优化问题汇总

区块链技术及其商业应用研讨会2015成都

B2B还有机会吗为什么阿里系放弃B2B

社会化媒体该怎么运营？

如何快速的做网站？

外贸B2C平台选择速卖通、ebay、亚马逊分析？

从企业营销视频制作的角度谈网络营销应该怎么做

如何通过软文获取高质量外链推广网站

一下科技：依托优质内容拓展用户想象边界

江湖家政O2O系统火爆开启上门服务新篇章

快捷入口

打造一个蓝奏云网盘搜索引擎

推荐文章

微信是不是在用公众号和小程序打造内容电商平台？微信生态的电商价

如何从零打造一款快消品？

社会化媒体时代如何打造个人品牌？

怎么打造一个牛逼的社会化媒体？比如微博、社区达人、知乎达人、微

图灵交互设计丛书:贴心设计·打造高可用性

图灵交互设计丛书:贴心设计·打造高可用性图书

智慧虎超：垂直电商+小程序打造发展新风口？解析小程序运营秘诀

垂直类电商求生路：唯品会疯狂植入，小芒打造兴趣社区

七千猫商城专注打造3C类目垂直电商型平台服务

购出色：打造特色会员制垂直电商平台

外贸英文网站谷歌SEO排名优化问题汇总

区块链技术及其商业应用研讨会2015成都

B2B还有机会吗 为什么阿里系放弃B2B

社会化媒体该怎么运营？

如何快速的做网站？

外贸B2C平台选择速卖通、ebay、亚马逊分析？

从企业营销视频制作的角度谈网络营销应该怎么做

如何通过软文获取高质量外链推广网站

一下科技：依托优质内容 拓展用户想象边界

江湖家政O2O系统火爆开启上门服务新篇章

B2B还有机会吗为什么阿里系放弃B2B

一下科技：依托优质内容拓展用户想象边界