简介 Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎. 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这
tutorial Requirements Java 1.4.x, either from or on Linux is preferred. Set NUTCH_JAVA_HOM
介绍 Nutch 第一部分:抓取过程详解(2) 通过现在我们有了一些基本的概念了,现在应该接触实际的操作了,因为懂得原理和实践还是有很大差距的。 抓取是一个循环的过程:抓取蜘蛛从
介绍 Nutch 第一部分:抓取 by 01/10/2006 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。可以为什么我们需要建立自己的搜索引擎
Solr 企业级搜索引擎简介 Solr 是一个独立的企业级搜索引擎服务器,并提供类似web-service 的API接口。可以通过http协议把文档以xml格式的方式放入索引库。同
在开发新闻搜索引擎的时候,出现一个问题就是有很多的新闻属于转载的形式,要判断新闻是否转载,经过实验,我发现可以用“平移”算法来实现。 "平移算法"非常简单易
百度公司于1999年底成立于美国硅谷,它的创建者是资深信息检索技术专家、超链分析专利的唯一持有人――百度总裁李彦宏,及其好友――在硅谷有多年商界成功经验的百度执行副总裁徐勇博士。 百度是目前
Yahoo!起源于一个想法,随后变成一种业余爱好,最终成了使人全身心投入的一项事业。Yahoo!的两位创始人大卫·费罗(David Filo) 和杨致远(Jerry Yang),美国斯坦福大学电机工程
Google的使命就是要为您提供网上最好的查询服务,促进全球信息的交流。Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对20 多亿网页进行整理,Google 可为
中国领先的互联网技术公司网易2001年9月20日在京宣布,该公司经营的大型门户网站www.163.com已完成对其搜索引擎的全面升级,即日起正式启用全新搜索引擎服务。 升级后的新引擎在加强与世界领