【Java开源代码栏目提醒】:网学会员为需要Java开源代码的朋友们搜集整理了TextHTMLToXML.java相关资料,希望对各位网友有所帮助!
package com.zf.s12;//创建一个包
import java.io.BufferedInputStream;//引入类
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.PrintWriter;
import java.net.URL;
import org.w3c.tidy.Tidy;
public class TextHTMLToXML {//操作将HTML文件转成XML文件的类
private String url;//HTML网页地址
private String outFileName;//xml文件所在路径
private String errOutFileName;//错误信息文件所在路径
public TextHTMLToXML(String url,String outFileName,String errOutFileName){
this.url=url;
this.outFileName=outFileName;
this.errOutFileName=errOutFileName;
}
public void convert(){//转换方法
URL u;
BufferedInputStream in;
FileOutputStream out;
Tidy tidy=new Tidy();
tidy.setXmlOut(true);//通知Tidy将HTML转成XML
try {
//将错误信息保存到文件中
tidy.setErrout(new PrintWriter(new FileWriter(errOutFileName),true));
u=new URL(url);//根据网址创建URL对象
in=new BufferedInputStream(u.openStream());//创建缓存输入流
out=new FileOutputStream(outFileName);//创建文件输出流
tidy.parse(in,out);//转换文件
in.close();//释放资源
out.close();//释放资源
} catch (Exception e) {
System.out.println(e.getMessage());
}
}
public static void main(String []args){//java程序主入口处
String htmlFile="http://localhost:8080/Demo/index.jsp";
String xmlFile="F:/poem.xml";
String errorFile="F:/error.txt";
TextHTMLToXML htmlToXml=new TextHTMLToXML(htmlFile,xmlFile,errorFile);//带参数实例化对象
htmlToXml.convert();//调用方法进行转换
System.out.println("HTML文件转换成XML文件结束");
}
}