大话搜索引擎 (开篇)
时间:2023-03-20 08:14:02 | 来源:电子商务
时间:2023-03-20 08:14:02 来源:电子商务
浮生一叶草,岁月催人老,不觉间已在搜索行业间混吃了七年有余。每每踌躇满志的想写一系列搜索引擎的文章,最终都被各种原因推到了九霄云外,最后归纳了其实最根本的原因只有一个字----懒!!
一、为什么要写《大话搜索引擎》系列文章? 茶余饭后和朋友们聊天问起我的职业都会有种莫名的尴尬,那场景就似程序员上非诚勿扰想给女嘉宾介绍明白自己的职业一样,没等你说完人家就灭灯了... ...,好不容易有个友情留灯的经常是瞪着大眼睛一脸懵圈的问道:“一个搜索输入框你做了这么多年,看来是真爱啊,这需要什么样的情怀和工匠精神?", 当然有时候如果遇到IT同行大部分又会高估这个行业 认为都是烧脑袋的科学家研究的东西,然后 然后你那还好意思再自卖自夸讲下去了! 当然以后类似问题就简单了,我可以光明正大的说,你去看我写的《大话搜索引擎》吧`(*∩_∩*)′。
我个人2009年由于机缘巧合误打误撞进入这个行业,一直跌跌撞撞走到现在也经历了大大小小几十个搜索系统,主业务也横跨了餐饮、电商、社交、社会化购物等几个垂直行业,语言也经历了中文简体、繁体、英文、西班牙、葡萄牙、俄罗斯、意大利等多国语言。然每每新进一个行业的垂直搜索并没有大家想象中的“老司机”那么轻车熟路,每次都会有好多坑趟,每次都会有新的收获。这也许就是搜索引擎令人着迷之处吧,看似一样而每次又都不一样。每次的如履薄冰也使我期望能将每次趟坑背后的故事留下来,以备后来者及时躲开。
2012年有幸认识了solr中国的药防,曾风风火火和几个小伙伴们一起做solr中国社区,通过YY讲过一些搜索的入门课程大概持续到13年中旬,后续又陆陆续续的做了几次线下交流,到目前solr中国主要的几个官方群加起来人数也有五六千了。然而始终有一个问题困扰着大家,大部分刚入门的初级问题要反反复复回答几百上千遍,入行两三年的又很快会到瓶颈期:搜索引擎搭建好上线了以后就不知道做什么了!大部分因为项目原因可能就离开了这个行业。作为solr中国社区的老党员,每每见此不免黯然伤神,也许这系列的文章大部分源于此,虽道行尚浅,单仍愿抛砖引玉将这几年走过的路以文字形式再现能让后来的兄弟姐妹们少些迷茫、少些坎坷、如此便是极好。
二、搜索引擎的价值到底是什么? 在网络信息大爆炸的今天只要是一个互联网使用者则搜索引擎就像雾霾之于大帝都一样,你想躲也躲不开!海量信息的快速查找和筛选无疑是搜索引擎最显而易见的价值之一,其他的呢? 特别是对于垂直搜索领域(相对于全网搜索 京东、淘宝 这些我们可以理解为垂直搜索引擎)。“我们的搜索不精准”这是我经常被咨询的问题,那么为什么要精准?什么叫不精准?精准了就是好的搜索吗? “我们的搜索排序不好”这也是经常被咨询的问题,什么叫排序不好? 你眼中的好和别人眼中的好是一样的吗?这个搜索词排序好了下个搜索词还会好吗? 其实在我们不清楚搜索之于我们产品本身最核心的价值是什么的时候就好比我们整天去争吵是xx语言好还是yy语言好一样,根本不会有实质性的答案,更像我们要开枪了不知道靶子在什么地方一样 说偏离目标都谈不上!然而不幸的是这样的问题依然源源不断的提来,始终都没有停止过... ...
回归到互联网最大的价值--流量 上来讲,大部分垂直搜索引擎其实是充当了所在产品的流量入口,尤其是电商行业在产品量到一定规模的时候甚至70%以上的交易来源都是来自自身的垂直搜索引擎!那么一个好的搜索价值是什么的?将流量分配到最能产生商业价值的地方并同时平衡好用户、客户、平台的利益。因此再反观我们上面谈到的"搜索不精准”,"搜索排序不好“这类问题根本不需要刻意去解决,这不是搜索的价值目标!比如一个屌丝在搜索iphone的时候引擎根据其消费能力将更适合的小米phone排在前面并产生了交易,这样的搜索结果我们不能说它不好。当然这里例子不一定恰当,真正的生产环境中我们有一套的评测手段将这些客观信息数据化以衡量我们搜索的好坏和产生的价值增减,而非简单根据少数人的相对主观臆断的精不精确,排序好不好来衡量搜索好坏,毕竟大家好才是真的好。
三、《大话搜索引擎》系列文章会以什么方式讲解搜索引擎? 由于我个人不太喜欢单调的教科书模式,所以整个系列的主线会以自己工作经历为主,通俗的说大部分会是些搜索引擎从业的日常趣事和一路跌跌撞撞的经历以期给大家更多的展示一个搜索从业者的真实工作场景。 当然也会考虑技术性过多章节单独和本体系分开以搜索技术系列展示,这样也方便大家快速的获取到自己最关注的内容。另外如果时间充足会考虑视频直播形式形成课程体系。
好了,今天先和大家聊到这里,下一篇我们将正式开始 《大话搜索引擎(一)之初遇搜索》
喜欢的朋友请关注公众号:金沙数据 您将会及时得到最新的文章。
http://weixin.qq.com/r/tDpqctPEN45IrZcR92_m (二维码自动识别)
------------------------------------------------------------------------------------------------------------
作者简介:
solr中国砖家 (风雨)
资深搜索专家、7年搜索从业经验;专注搜索架构、排序算法、产品设计
曾担任孔夫子旧书网、敦煌网、思源科技搜索负责人