当前位置：文档之家› java html内容生成word文件实现代码

java html内容生成word文件实现代码

https://www.doczj.com/doc/588759992.html, 编辑:kepeer 来源:转载

处理HTML标签我用的是Jsoup组件，生成word文档这方面我用的是Jacob组件。

有兴趣的朋友可以去Google搜索一下这两个组件。大致思路如下：

先利用jsoup将得到的html代码“标准化”（Jsoup.parse(String html)）方法，然后利用FileWiter 将此html内容写到本地的template.doc文件中，此时如果文章中包含图片的话，template.doc 就会依赖你的本地图片文件路径，如果你将图片更改一个名称或者将路径更改，再打开这个template.doc，图片就会显示不出来（出现一个叉叉）。为了解决此问题，利用jsoup组件循环遍历html文档的内容，将img元素替换成${image_自增值}的标识，取出img元素中的src

此时你的html内容会变成如下格式:（举个示例）

代码如下复制代码

测试消息1

${image_1}

测试消息2

${image_2}

测试消息3

保存到本地文件以后，利用MSOfficeGeneratorUtils类（工具类详见下面，基于开源组件Jacob）打开你保存的这个template.doc,调用replaceText2Image,将上面代码的图片标识替换为图片，这样就消除了本地图片路径的问题。然后再调用copy方法，复制整篇文档，关闭template.doc

文件，新建一个doc文件（createDocument），调用paste方法粘贴你刚复制的template.doc 里的内容，保存。基本上就ok了。

关于copy整个word文档的内容，也会出现一个隐式问题。就是当复制的内容太多时，关闭word程序的时候，会谈出一个对话框，问你是否将复制的数据应用于其它的程序。对于这个问题解决方法很简单，你可以在调用quit（退出word程序方法）之前，新建一篇文档，输入一行字，然后调用copy方法，对于复制的数据比较少时，关闭word程序时，它不会提示你的。见如下代码

//复制一个内容比较少的*.doc文档，防止在关闭word程序时提示有大量的copy内容在内存中，是否应用于其它程序对话框,

如何能让Java生成复杂Word文档(1)

先用office2003或者2007编辑好word的样式，然后另存为xml，将xml翻译为FreeMarker 模板，最后用java来解析FreeMarker模板并输出Doc。经测试这样方式生成的word文档完全符合office标准，样式、内容控制非常便利，打印也不会变形，生成的文档和office中编辑文档完全一样。 AD：客户要求用程序生成标准的word文档，要能打印，而且不能变形，以前用过很多解决方案，都在客户严格要求下牺牲的无比惨烈。 POI读word文档还行，写文档实在不敢恭维，复杂的样式很难控制不提，想象一下一个20多页，嵌套很多表格和图像的word文档靠POI来写代码输出，对程序员来说比去山西挖煤还惨，况且文档格式还经常变化。 iText操作Excel还行。对于复杂的大量的word也是噩梦。直接通过JSP输出样式基本不达标，而且要打印出来就更是惨不忍睹。 Word从2003开始支持XML格式，用XML还做就很简单了。大致的思路是先用office2003或者2007编辑好word的样式，然后另存为xml，将xml 翻译为FreeMarker模板，最后用java来解析FreeMarker模板并输出Doc。经测试这样方式生成的word文档完全符合office标准，样式、内容控制非常便利，打印也不会变形，生成的文档和office中编辑文档完全一样。看看实际效果首先用office【版本要2003以上，以下的不支持xml格式】编辑文档的样式，图中红线的部分就是我要输出的部分：

将编辑好的文档另存为XML 再用Firstobject free XML editor将xml中我们需要填数据的地方打上FreeMarker标记

学习Java to Html

JavaToHtml 为了方便在blog中粘贴源代码，特意找了这方面的工具（本来琢磨自己写，可惜能力有限，再次受打击了~~~） JavaToHtml开源，Eclipse Plugin 大家都知道读源代码很累，读乱七八糟的源代码那就想吐了，所以格式化源代码还是很有必要的，不信看看下面的例子。格式化后的漂亮效果： import java.util.Vector; public class Stack { private Vector content; public Stack() { content = new Vector(); } public void push(T t) { content.add(t); } public T peek() { if (content.size() == 0) { return null; } return content.get(content.size() - 1); } public T pop() { if (content.size() == 0) { return null; } return content.remove(content.size() - 1); } public int size() { return content.size(); } public String toString() { return content.toString();

} } 下面是原版的： import java.util.Vector; public class Stack { private Vector content; public Stack() { content = new Vector(); } public void push(T t) { content.add(t); } public T peek() { if (content.size() == 0) { return null; } return content.get(content.size() - 1); } public T pop() { if (content.size() == 0) { return null; } return content.remove(content.size() - 1); } public int size() { return content.size(); } public String toString() { return content.toString(); } } 更有甚者： package com.calculator.base;import java.util.Vector;public class Stack{ private Vectorcontent;public Stack(){content=new Vector();}public void push(T t){content.add(t);}public T peek(){if(content.size()==0){return null;} return content.get(content.size()-1);}public T pop(){if(content.size()==0){

java解析FSN文件

package action; import java.util.ArrayList; import tools.FsnTools; import bean.FsnBody; import bean.FsnModel; public class FsnReaderAction { public final static int intstep=2; //Uint16字节长度 public final static int stringstep=4; //Uint32字节长度 public final static int fsnHeadLengh=32;//fsn文件头字节长度 public final static int fsnPerBodyNoImg=100; //fsn文件体每条记录，不包括图像信息的字节长度 public final static int fsnPerBodyImg=1644; //fsn文件体每条记录，包括图像信息的字节长度 public int filePos=0; //fsn文件字节流当前指针位置 public FsnModel fm; //本实例解析的FsnMedel对象 public String fsnFilePath ;//FSN文件的存储完整路径，包括文件名 public FsnReaderAction(String filePath){ this.fsnFilePath=filePath; } public FsnModel readFsnFile() throws Exception { // FsnModel ret=null; try{ this.fm=new FsnModel(this.fsnFilePath); //hzyimport 把文件转成字节流数组 byte[] fsnbytes =FsnTools.toByteArray(this.fsnFilePath); this.fm.setSize(fsnbytes.length); System.out.println("File Lengh: "+fsnbytes.length); // 读取头文件 setHead(fsnbytes); long counter = this.fm.getCounter(); // 冠字号信息条数// System.out.println("this.fm.getHeadString()[2]="+this.fm.getHeadStr ing()[2]); int size = this.fm.getHeadString()[2] != 0x2D ? fsnPerBodyImg: fsnPerBodyNoImg; // System.out.println("this.fm.getHeadString()[2] ="+this.fm.getHeadString()[2] ); // System.out.println("counter ="+counter); // System.out.println("size="+size); // System.out.println("counter =* size"+counter * size); // System.out.println("fsnHeadLengh="+fsnHeadLengh);

Java生产WORD并下载到本地

1.为你的项目导入freeMarker包我的项目是依靠maven来维护依赖的，所以引入很方便，只需要在pom文件中加入下面这个依赖就好 [html]view plain copy 1. 2.org.freemarker 3.freemarker 4.2.3.23 5. 如果还是比较传统的话，就像那个链接里的项目一样，把jar包导入项目吧 2.依据模板动态生成word文档，首先你得有个模板模板是doc类型就好，注意不是docx，docx没有尝试，doc类型已经满足了我的需求，朋友们如果尝试成功了可以告诉我一下 test.doc,注意“产品品质证明书”是一张图片哦，图片会漂亮的留在生成的新文档中。将变量替换成${xxx}即可，这里只选了两个变量 3.点击文件->另存为将test.doc保存为xml类型，即Word XML文档.xml类型，得到test.xml 4.用notepad或者sublime打开test.xml，你会发现${xxx}会被分割成 ${*********xxx********)的样子，将*******删除，保证它又成了完整的变量标签，像这样

5.将文件已utf-8编码保存，另存为为.ftl，找不到该格式直接改文件后缀名就行，这样得到test.ftl 6.前台触发事件我的项目是基于SpringMVC的，所以前台触发只需要在view层的文件里加个按钮事件即可，直接上代码 [javascript]view plain copy 1.function generateMillCertificate(id) {//点击下载按钮触发的事件 2. window.location.href = '../deliveryOrder/exportMillCertificate?id=' + id; 3. } 7.后台生成文件，并返回给客户的浏览器这里又分为两步 a.controller层接收请求，根据参数拼凑数据，放在map中 [java]view plain copy 1./*** 2. * 导出Word材质单 3. * 4. * @return 5. * @throws Exception 6. */ 7.@RequestMapping(value = "exportMillCertificate", method = RequestMethod. GET) 8.@ResponseBody 9.public void exportMillCertificate(HttpServletRequest request, 10. HttpServletResponse response) throws Exception { 11.//获得数据，系统相关，就不展示了 12. Map map = new HashMap(); 13. map.put("customerShortName",deliveryOrder.getRepositoryName()); 14. map.put("productName",deliveryOrderDetail.getProductName()); 15. WordUtils.exportMillCertificateWord(request,response,map); 16. } b.工具类WordUtils利用传来的map和将要返回给用户的HTTPServletReponse,将map里的数据和模板中${xxx}标签对应的变量值填入，生成新的文档，通过response返回给浏览器并提供用户下载 [java]view plain copy 1.public class WordUtils { 2.//配置信息,代码本身写的还是很可读的,就不过多注解了 3.private static Configuration configuration = null; 4.//这里注意的是利用WordUtils的类加载器动态获得模板文件的位置

将图片转成base64字符串并在JSP页面显示的Java代码

*本事例主要讲了如下几点: * 1:将图片转换为BASE64加密字符串. * 2:将图片流转换为BASE64加密字符串. * 3:将BASE64加密字符串转换为图片. * 4:在jsp文件中以引用的方式和BASE64加密字符串方式展示图片. 首先看工具类: import ; import ; import ; import ; import ; import ; import ; import ; import ; /** * @author IluckySi 1

* @since */ public class ImageUtil { private static BASE64Encoder encoder = new ; private static BASE64Decoder decoder = new ; /** * 将图片转换为BASE64加密字符串. * @param imagePath 图片路径. * @param format 图片格式. * @return */ public String convertImageToByte(String imagePath, String format) { File file = new File(imagePath); BufferedImage bi = null; ByteArrayOutputStream baos = null; String result = null;

try { bi = ImageIO.read(file); baos = new ByteArrayOutputStream(); ImageIO.write(bi, format == null ? "jpg" : format, baos); byte[] bytes = baos.toByteArray(); result = encoder.encodeBuffer(bytes).trim(); "将图片转换为BASE64加密字符串成功！"); } catch (IOException e) { "将图片转换为BASE64加密字符串失败: " + e); } finally { try { if(baos != null) { baos.close(); baos = null; } } catch (Exception e) { "关闭文件流发生异常: " + e); } 3

(完整word版)JAVA代码规范详细版

JAVA代码规范本Java代码规范以SUN的标准Java代码规范为基础，为适应我们公司的实际需要，可能会做一些修改。本文档中没有说明的地方，请参看SUN Java标准代码规范。如果两边有冲突，以SUN Java标准为准。 1. 标识符命名规范 1.1 概述标识符的命名力求做到统一、达意和简洁。 1.1.1 统一统一是指，对于同一个概念，在程序中用同一种表示方法，比如对于供应商，既可以用supplier，也可以用provider，但是我们只能选定一个使用，至少在一个Java项目中保持统一。统一是作为重要的，如果对同一概念有不同的表示方法，会使代码混乱难以理解。即使不能取得好的名称，但是只要统一，阅读起来也不会太困难，因为阅读者只要理解一次。 1.1.2 达意达意是指，标识符能准确的表达出它所代表的意义，比如：newSupplier, OrderPaymentGatewayService等；而supplier1, service2，idtts等则不是好的命名方式。准确有两成含义，一是正确，而是丰富。如果给一个代表供应商的变量起名是order，显然没有正确表达。同样的，supplier1, 远没有targetSupplier意义丰富。 1.1.3 简洁简洁是指，在统一和达意的前提下，用尽量少的标识符。如果不能达意，宁愿不要简洁。比如：theOrderNameOfTheTargetSupplierWhichIsTransfered 太长，transferedTargetSupplierOrderName则较好，但是transTgtSplOrdNm就不好了。省略元音的缩写方式不要使用，我们的英语往往还没有好到看得懂奇怪的缩写。 1.1.4 骆驼法则 Java中，除了包名，静态常量等特殊情况，大部分情况下标识符使用骆驼法则，即单词之间不使用特殊符号分割，而是通过首字母大写来分割。比如: supplierName, addNewContract，而不是supplier_name, add_new_contract。

word域代码转换html丢失解决办法

. Word转html存在域代码丢失。 Aspose ，jacob，poi都无法解决在使用jocob转换成html时域代码会被包裹可以统一提取出来转换成latex ，latex转换成图片，解决word域代码丢失问题 private void processFormula(List nodes) throws UnsupportedEncodingException{ for(int i = nodes.size()-1;i>=0;i--){ Node node =nodes.get(i); if(node instanceof Element){ Element e = (Element)node; processFormula(e.childNodes()); }else if(node instanceof Comment){ String commentText = node.toString(); if(commentText.contains("