试用nutch 今天看站点的log,发现有几个搜索的反向链接过来。其实我只是在提了一下这个词,这样的结果肯定让前来的朋友倍感失望。 下面将我对nutch的一些试用公布一下,供有兴趣的朋友参阅
在Google里面搜索了一些Nutch的资料,还真不多。今天画了两个小时搞了一通,把一些心得纪录下来。 我的jdk 是1.5.x ,Tomcat是5.0.x 1 下载0.7.2 版本的包:里面
Nutch 使用之锋芒初试 “工欲善其事,必先利其器。”经过前文的“细解”,我们已经完成了
作者: 是一个基于,类似Google的完整网络搜索引擎解决方案,基于的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。
介绍 Nutch 第一部分:抓取过程详解(2) 通过现在我们有了一些基本的概念了,现在应该接触实际的操作了,因为懂得原理和实践还是有很大差距的。 抓取是一个循环的过程:抓取蜘蛛从
Nutch在Windows中安装之细解 近来Nutch一词在网络中时有所见,但囿于平常工作繁忙而未能潜心细读与研究,只知道Nutch是Apache组织的一个开源项目,利用它用户可以建立自
Nutch 使用之锋芒初试 “工欲善其事,必先利其器。”经过前文的“细解”,我们已经完成了
介绍 Nutch 第一部分:抓取 by 01/10/2006 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。可以为什么我们需要建立自己的搜索引擎
nutch 0.7 plug-ins 详解最近在关注nutch的进展状况,这里有几个重要的消息要和大家分享: 1、nutch 0.7 发布了; 2、nutch 的java源代码包路径改变成了org.a
简介 Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎. 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这