<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
  <channel>
    <title>yuhai.china</title>
    <description></description>
    <link>http://yuhai-china.javaeye.com</link>
    <language>UTF-8</language>
    <copyright>Copyright 2003-2008, JavaEye.com</copyright>
    <docs>http://blogs.law.harvard.edu/tech/rss</docs>
    <generator>JavaEye - 做最棒的软件开发交流社区</generator>
      <item>
        <title>使用watij和xpath实现自动spider(完善中)</title>
        <author>yuhai.china</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://yuhai-china.javaeye.com">yuhai.china</a>&nbsp;
          链接：<a href="http://yuhai-china.javaeye.com/blog/220998" style="color:red;">http://yuhai-china.javaeye.com/blog/220998</a>&nbsp;
          发表时间: 2008年07月29日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          watij本来是用于web测试的，但是我发现利用它来做垂直爬虫，效果也很好
          <br/>
          <span style="color:red;">
            <a href="http://yuhai-china.javaeye.com/blog/220998#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Tue, 29 Jul 2008 11:24:46 +0800</pubDate>
        <link>http://yuhai-china.javaeye.com/blog/220998</link>
        <guid>http://yuhai-china.javaeye.com/blog/220998</guid>
      </item>
      <item>
        <title>volecity使用入门</title>
        <author>yuhai.china</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://yuhai-china.javaeye.com">yuhai.china</a>&nbsp;
          链接：<a href="http://yuhai-china.javaeye.com/blog/220994" style="color:red;">http://yuhai-china.javaeye.com/blog/220994</a>&nbsp;
          发表时间: 2008年07月29日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          $对象.属性<br />就可以把值取出来<br /><br />普通的html文件加入<br />#foreach<br /><br />#end<br />就可以完成很多功能了，<br /><br />volecity支持arraylist
          <br/>
          <span style="color:red;">
            <a href="http://yuhai-china.javaeye.com/blog/220994#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Tue, 29 Jul 2008 11:19:37 +0800</pubDate>
        <link>http://yuhai-china.javaeye.com/blog/220994</link>
        <guid>http://yuhai-china.javaeye.com/blog/220994</guid>
      </item>
      <item>
        <title>java和mysql日期技巧</title>
        <author>yuhai.china</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://yuhai-china.javaeye.com">yuhai.china</a>&nbsp;
          链接：<a href="http://yuhai-china.javaeye.com/blog/220991" style="color:red;">http://yuhai-china.javaeye.com/blog/220991</a>&nbsp;
          发表时间: 2008年07月29日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          DateFormat format = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss"); <br />format.format(new Date(format.parse(str).getTime()))<br /><br />mysql<br />convert( s as datetime)
          <br/>
          <span style="color:red;">
            <a href="http://yuhai-china.javaeye.com/blog/220991#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Tue, 29 Jul 2008 11:16:44 +0800</pubDate>
        <link>http://yuhai-china.javaeye.com/blog/220991</link>
        <guid>http://yuhai-china.javaeye.com/blog/220991</guid>
      </item>
      <item>
        <title>使用FileUpload上传文件</title>
        <author>yuhai.china</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://yuhai-china.javaeye.com">yuhai.china</a>&nbsp;
          链接：<a href="http://yuhai-china.javaeye.com/blog/196208" style="color:red;">http://yuhai-china.javaeye.com/blog/196208</a>&nbsp;
          发表时间: 2008年05月23日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          <pre name="code" class="java">
&lt;%

%>
&lt;%@ page language="java" contentType="text/html;charset=UTF-8"%>
&lt;%@ page import="com.qunar.dataservice.quartz.*,com.qunar.dataservice.common.*,com.qunar.dataservice.util.*,java.util.*,java.io.File,com.qunar.dataservice.extract.ImageTool"%>
&lt;%@ page import="org.apache.commons.fileupload.*,org.apache.commons.fileupload.disk.*"%>
&lt;html>
&lt;head>
&lt;title>保存上传文件&lt;/title>
&lt;/head>
&lt;%
String hotelseq = null;
FileItemFactory factory = new DiskFileItemFactory();
FileUpload fu = new FileUpload(factory);
// 设置允许用户上传文件大小,单位:字节
fu.setSizeMax(100000000);
// maximum size that will be stored in memory?
// 设置最多只允许在内存中存储的数据,单位:字节
//fu.setSizeThreshold(4096);
// 设置一旦文件大小超过getSizeThreshold()的值时数据存放在硬盘的目录
//fu.setRepositoryPath("C:\\TEMP");
//开始读取上传信息
List fileItems = fu.parseRequest(request);
%>
&lt;body bgcolor="#FFFFFF”text="#000000” leftmargin="0”topmargin="40”marginwidth="0” marginheight="0”>
&lt;font size="6”color="blue”>文件列表：&lt;/font>
&lt;center>
&lt;table cellpadding=0 cellspacing=1 border=1 width="100%">
&lt;tr>
&lt;td bgcolor="#008080">文件名&lt;/td>
&lt;td bgcolor="#008080">URL&lt;/td>
&lt;/tr>
&lt;%
// 依次处理每个上传的文件
ArrayList&lt;HashMap&lt;String,String>> list = new ArrayList&lt;HashMap&lt;String,String>> ();
Iterator iter = fileItems.iterator();
while (iter.hasNext()) {
  FileItem item = (FileItem) iter.next();
  //忽略其他不是文件域的所有表单信息
  
  if(item.isFormField()){
  		if(item.getFieldName().equals("hotelseq")){
  			hotelseq = item.getString();
  			System.out.println(hotelseq);
  		}
  
  }
  if (!item.isFormField()) {
   String name = item.getName();
   long size = item.getSize();
   if((name==null||name.equals("")) && size==0)
   continue;

   //保存上传的文件到指定的目录
   int loc = name.lastIndexOf(".");
   long curTime = System.currentTimeMillis();
   name = "" + curTime +  name.substring(loc);
   File f = new File(DataServiceWebConfig.RootPath + "spider/upload" +name);
   item.write(f);

  } 
}
	
%>
&lt;/table>

&lt;br/>&lt;br/>
&lt;a href="index.htm">返回上传页面&lt;/a>
&lt;/center>
&lt;/body>
&lt;/html>
</pre><br /><br /><pre name="code" class="html">
&lt;html>
&lt;head>
&lt;meta http-equiv="content-type" content="text/html; charset=UTF-8">
&lt;script type="text/javascript">
    var i = 1;
	function add(){
		//var tb = document.getElementById("upt");
		var tb = document.getElementById("tbody");
		var tr = document.createElement("tr");
		var td = document.createElement("td");
		var inu = document.createElement("input");
		//inu.type="file";
		//inu.size="40";
		inu.setAttribute("type","file");
		inu.setAttribute("size","40");
		i++;
		//inu.name = "file"+i;
		inu.setAttribute("name","file"+i);
		//td.width="100%";
		//td.colspan = "2";
		td.setAttribute("width","100%");
		td.setAttribute("colspan","2");
		td.appendChild(inu);
		tr.appendChild(td);
		//tb.childNodes[0].appendChild(tr);
		//tb.body.appendChild(tr);
		//var tbody = document.getElementById("tbody");
		tb.appendChild(tr);
		
	}
&lt;/script>
&lt;/head>
&lt;body bgcolor= "#FFFFFF" text= "#000000"  leftmargin= "0" topmargin= "40" marginwidth= "0"  marginheight= "0" >
&lt;center>
&lt;h1>&lt;/h1>

&lt;form name= "uploadform" method= "POST"  action= "save.jsp" ENCTYPE= "multipart/form-data" >
 &lt;table id="upt" border= "1" width= "450" cellpadding= "4"  cellspacing= "2" bordercolor= "#9BD7FF" >
 &lt;tbody id="tbody">
 &lt;tr>&lt;td width= "100%" colspan= "2" >
 &lt;input name= "file1" size= "40" type= "file" >
 &lt;/td>&lt;/tr>
 &lt;tbody>
 &lt;/table>
 &lt;br/>&lt;br/>
  &lt;table>
 &lt;tr>&lt;td align= "center" >&lt;input value= "add file"  type= "button" onclick= "javascript:add()" />&lt;/td>&lt;/tr>
 &lt;/table>
 
 &lt;table>&lt;tr>&lt;td>hotelseq:&lt;input name="hotelseq" type="text"/> &lt;/td>&lt;/tr>&lt;/table>
 &lt;table>
 &lt;tr>&lt;td align= "center" >&lt;input name= "upload"  type= "submit" value= "upload" />&lt;/td>&lt;/tr>
 &lt;/table>
 
&lt;/form>
&lt;/center>
&lt;/body>
&lt;/html>
</pre>
          <br/>
          <span style="color:red;">
            <a href="http://yuhai-china.javaeye.com/blog/196208#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Fri, 23 May 2008 17:58:44 +0800</pubDate>
        <link>http://yuhai-china.javaeye.com/blog/196208</link>
        <guid>http://yuhai-china.javaeye.com/blog/196208</guid>
      </item>
      <item>
        <title>我把lucene2.2的源代码整理到一个文件里了，对阅读代码有点用处</title>
        <author>yuhai.china</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://yuhai-china.javaeye.com">yuhai.china</a>&nbsp;
          链接：<a href="http://yuhai-china.javaeye.com/blog/100497" style="color:red;">http://yuhai-china.javaeye.com/blog/100497</a>&nbsp;
          发表时间: 2007年07月12日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          <font face="Arial">简单的用一个10行左右的递归程序实现此功能的，<br />
如果有人愿意打印源代码，还是挺有用的</font>
          <br/>
          <span style="color:red;">
            <a href="http://yuhai-china.javaeye.com/blog/100497#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Thu, 12 Jul 2007 22:10:10 +0800</pubDate>
        <link>http://yuhai-china.javaeye.com/blog/100497</link>
        <guid>http://yuhai-china.javaeye.com/blog/100497</guid>
      </item>
      <item>
        <title>使用开源组件搭建搜索引擎</title>
        <author>yuhai.china</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://yuhai-china.javaeye.com">yuhai.china</a>&nbsp;
          链接：<a href="http://yuhai-china.javaeye.com/blog/93119" style="color:red;">http://yuhai-china.javaeye.com/blog/93119</a>&nbsp;
          发表时间: 2007年06月22日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          <p><font face="Arial"></font></p>
<p><font face="Arial">在开发中小型搜索引擎的过程中，我使用由Java开发的开源软件：jspider,htmlparser,lucence,IKAnalyzer，下面我一一道来。</font></p>
<p>lucence很著名啦，不必多说，我写的这个引擎就是在它自带的demo基础上重构的。</p>
<p>jspider顾名思义，是一个用Java开发的爬虫。</p>
<p>htmlparser是解析html页面的，因为lucene自带的html解析器不够健壮，所以用了这个。</p>
<p><font face="Arial">&nbsp;IKAnalyzer是为lucence定做的中文分词组件，在使用中我发现效果不错。</font></p>
<p>具体的编码下次再说吧，呵呵</p>
          <br/>
          <span style="color:red;">
            <a href="http://yuhai-china.javaeye.com/blog/93119#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Fri, 22 Jun 2007 13:00:40 +0800</pubDate>
        <link>http://yuhai-china.javaeye.com/blog/93119</link>
        <guid>http://yuhai-china.javaeye.com/blog/93119</guid>
      </item>
  </channel>
</rss>