<%
%>
<%@ page language="java" contentType="text/html;charset=UTF-8"%>
<%@ page import="com.qunar.dataservice.quartz.*,com.qunar.dataservice.common.*,com.qunar.dataservice.util.*,java.util.*,java.io.File,com.qunar.dataservice.extract.ImageTool"%>
<%@ page import="org.apache.commo ...
- 17:58
- 浏览 (88)
- 评论 (0)
踏破铁鞋无觅处,得来全不费功夫
费了很多精力都设置不好,今天用最简单的办法搞定。
使用这两个软件 network-manager-pptp network-manager-gnome(用新立得安装就可以,我是用上海交大的源,7.10版本) 。
因为我是校园网,固定IP,一定要nm-applet配置IP地址的选项卡上选中允许漫游模式,然后
1. 单击该图标,选择vpn connections-config vpn-Add
2. 下一步在“选择连接类型”中选择“pptp tunnel”.
3. 下一步在“connecti ...
- 15:54
- 浏览 (362)
- 评论 (0)
简单的用一个10行左右的递归程序实现此功能的,
如果有人愿意打印源代码,还是挺有用的
在开发中小型搜索引擎的过程中,我使用由Java开发的开源软件:jspider,htmlparser,lucence,IKAnalyzer,下面我一一道来。
lucence很著名啦,不必多说,我写的这个引擎就是在它自带的demo基础上重构的。
jspider顾名思义,是一个用Java开发的爬虫。
htmlparser是解析html页面的,因为lucene自带的html解析器不够健壮,所以用了这个。
IKAnalyzer是为lucence定做的中文分词组件,在使用中我发现效果不错。
具体的编码下次再说吧,呵呵
- 浏览: 3844 次
- 性别:

- 来自: 自己输入城市...长春

- 详细资料
搜索本博客
最近加入圈子
最新评论
-
使用开源组件搭建搜索引擎
请说jspider只能是对HTML的url进行检索, 是嘛, 不知道Heritr ...
-- by kin_me -
使用开源组件搭建搜索引擎
这个时候,htmlparser闪亮登场
-- by yuhai.china -
使用开源组件搭建搜索引擎
从源代码可以看到,中文分词已经加进去了, 而索引HTML的关键工作是由 HTML ...
-- by yuhai.china -
使用开源组件搭建搜索引擎
import org.mira.lucene.analysis.MIK_CAna ...
-- by yuhai.china -
使用开源组件搭建搜索引擎
建立索引 我首先分析了 lucene-2.1.0\src\demo\org\ap ...
-- by yuhai.china






评论排行榜