搜索引擎:人工派与机器派的竞争

简单的看,搜索引擎可以分成两大阵营:基于人参与的人工派与基于算法的机器派,两者之间的竞争在互联网诞生后就一直在进行着。前者最著名的代表是雅虎目录,后者最著名的代表自然就是Google。

互联网的发明,首先是产生了一种新的进入壁垒很低的媒体。如果你不需要文档之间的hyperlink,其实Notepad编写的文本文件也可以发布成网页。网站和网页数量开始增加后,人们对导航的需求自然便产生。1994年,斯坦福大学博士生杨致远和David Filo为了收集自己看到的优秀网站,创办了网址导航的服务站——雅虎。雅虎网站在走出校园后,雇佣了专业编辑(有趣的是,雅虎内部也将他们称为Surfer)来收集、筛选和分类各种网页,并迅速成为网民冲浪的起点。

随着网页数量爆炸性的增长,编辑的速度开始显得力不从心了。1998年,杨致远和David的两个师弟:Larry Page和Sergey Brin发现了一种PageRank算法,可以将全网收集的网页按照用户查询词进行高效准确的排序,他们基于此创建了Google搜索引擎。虽然Google不是最早的网页搜索引擎,但是它通过一系列的技术革新,普及了网页搜索引擎。于是,算法派逐渐战胜了人工派。2003年,雅虎收购了原来的网页搜索后台服务商Inktomi,正式进入到搜索引擎的机器年代。

Mahalo
然而,人工派的阵营并没有就此湮灭,MahaloCha Cha和本月刚刚发布的Search Wikia都是最有趣的新生力量。在这三者之间,Search Wikia的创办人Jimmy Wales是著名百科站点Wikipedia的奠基者,他所强调的搜索算法的开放性,可惜目前的搜索质量还看不出来优势。Cha Cha的模式则是雇佣编辑来帮助用户搜索信息,可以看作是网络版的114,不过这种服务的可扩展性比较差,服务水准也难以保持一致。Mahalo则希望走出一条不同的道路,创始人Jason Calacanis计划通过编辑对Top Queries进行整理,成为Google和Yahoo的替代搜索引擎。

Hitwise Mahalo Traffic Growth

美国HitWise最新的数据表明,Mahalo的流量增长势头不错,而Cha Cha则不出意外地开始逐步没落。然而,如果我们仔细研究Mahalo的流量来源时,发现Google是重要的贡献者。国外有人研究发现,Mahalo在SEO上面的确进行了精心设计,看来Jason曾信誓旦旦地说“SEO is shit”完全是言不由衷的话。对于一个创新的Start-up站点,流量获取是重要的举措,但是,如果像Google这样的网页搜索引擎根据一贯的不收录SERP(搜索结果页)原则对Mahalo进行了处理,则游戏的规则变得前途莫测了。挑战者将自己的希望寄托在竞争对手的身上,这就是多数网页搜索引擎挑战者面临的困境。

This entry was posted in 互联网 and tagged , , , , . Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>