当前位置:文档之家› 如何将中国知网CAJ、NH、KDH、PDF格式文件转换成WORD

如何将中国知网CAJ、NH、KDH、PDF格式文件转换成WORD

如何将中国知网CAJ、NH、KDH、PDF格式文件转换成WORD
如何将中国知网CAJ、NH、KDH、PDF格式文件转换成WORD

PDF文件、caj文件、超星文件转化为Word文档

现在网上许多资料都是以CAJ、PDF等文件格式提供的,其中的文本不能被直接编辑。网上提供了许多处理这种情况的软件,但是它们不是效率低,就是只能提取其中部分文本。本文所述利用微软提供的OCR识别技术从CAJ、PDF等文件中提取全部文本的方法,简便快捷,效率很高。

从不同格式的文件中提取文本前需要做好以下准备工作,安装CAJViewer5.5浏览器软件和acrobat 5 专业版浏览器软件安装Office2003,并完全安装Of?鄄fice工具Microsoft Office Document Imaging,然后在打印机里面会增加Microsoft Office Document Image Writer打印机。 Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格。

一、CAJ文件的识别

(一)首先,从网上下载CAJ格式的资料文件保存到本地硬盘上。

(二)然后,启动CAJViewer浏览器程序,并在该程序中打开刚才保存的CAJ格式的文件。浏览文件到最后一页后,不要关闭CAJ浏览器程序。

(三)在CAJ浏览器程序窗口中,选择“文件”→“打印”,并选择打印机为Microsoft Office Document Image Writer打印机,勾选打印到文件选项和确定打印页数。

(四)保存打印文件(*.prn)到适当位置。等待打印完成后,Microsoft Office Document Image 自动打开刚才保存的打印文件。

(五)在Microsoft Office Document Image窗口中,选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用OCR识别文本”提取文本。

(六)选择“工具”下的“将文本发送到word”,最后将把整个CAJ文件识别输出到word文件中。

二、PDF文件的识别

(一)以文本形式保存的PDF文件,用acrobat 5 专业版,识别整个文件。直接打开从网上下载的PDF格式文件另存为RTF文件,或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到Word中即可。

(二)以图片形式保存的PDF文件,将PDF文件打印到Microsoft Office Document Image Writer打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Microsoft Office Document Image打开此文件,然后在Microsoft Office Document Im?鄄age中选择“工具”菜单中的“使用OCR识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整个PDF 文件识别输出到word文件中。

(三)加密的PDF文件先下载解密软件,解密后在参照上述步骤1),2) 进行。(四)繁体PDF文件用上述步骤2)的方法识别到word 后,用word中的“工具”→“语言”→“中文繁简转换”

三、超星文件的识别

(一)全文件识别打印到Microsoft Office Document Image

Writer打印机,然后按上述PDF文件的识别步骤中第二点操作,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到Word中,再合并到一起。打印时要填入打印页码从1到最后一页,不要选择打印全部。在打印选项中,要将页面比例设成真实大小,而不是整宽。注意识别速度比其他格式要慢很多,请保持耐心。一般一本200多页的书,识别需要几分钟的时间。

(二)超星文件识别相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的PDF文件,然后再用上述识别PDF文件的方法转成Word。

四、后记

经过试验,发现Microsoft Office Document Image 存在一些不稳定的问题,如在用CAJ打印到Microsoft Office Document Image Writer时,发现用CAJ5.5版本比较快,而CAJ5.0有时出现假死机。页面显示大时,转化的识别率较高。如果页数多的文件,包括超星,可以分多次转化。由于虚拟打印到Microsoft Office Document Image Writer 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度、C盘和内存空间。建议配置好的机器一次转化不要超过200页,配置差的不要超过100页,同时打印时在任务栏中会出现打印机图标,可以双击,看到打印任务的进度,避免误以为死机。转化完成后请删除c:\windows\temp 目录下的虚拟打印文件,否则C盘很快会被用光

CNKI中国知网免费下载入口

CNKI中国知网下载免费入口,下载期刊接口【搞学术 必看 (2009-12-05 12:38:31) 转载 标签: 杂谈 如何在校外下载期刊全文--应对大家工作后的资料搜寻(转) 马上就要工作了,觉得学校里面图书馆资料很多,并且很有用,都可以在中文CNKI数据库,和西文数据库荷兰DOS中全文下载,但是仅仅限于校内IP用户。到了工作单位上,想进入这些数据库查资料就很不容易了。。。并且要收很高昂的费用。。。离开了学校才知道学校里面这么好的电子图书馆的资源当时没有好好利用。 所以在网上找到了在家里和单位都能下载全文的地方。 下面是几年来收集整理的全文下载地址和心得,都是网友的无私奉献和结晶,我把分散的信息总结出来,希望对大家有用,有些地址和进入方式可能过期了,我没有一一核对,希望多多理解和包涵。 全文期刊: EBSCO/UMI/SDOS三个数据库扫荡一下,这三本都有全文。 硕博论文全文下载 http://202.120.13.45/umi/index.htm ,这是英文的博士论文。 中国期刊网是中文学位论文 图书馆全文无法下载,需要用户卡 图书馆全文下载数据库 PQDD https://www.doczj.com/doc/3b15946615.html, Proquest数据库 cnki硕博论文全文https://www.doczj.com/doc/3b15946615.html,/cdmd.html 学校图书馆的清华中国学术期刊网上没法下载硕博士论文。可以通过中国期刊网在上海交大图书馆的镜像登陆。 网址:https://www.doczj.com/doc/3b15946615.html, 账号:syshjd 密码:shjd 右边数据库列表中选择第二项:中国优秀博硕士学位论文全文数据库(CDMD) 第一项中国期刊全文数据库(CJFD)可以在我们学校的期刊网联接中进入。

【搞学术必看】中国知网CNKI免费下载入口汇总

【搞学术必看】中国知网CNKI免费下载入口汇总 如何在校外下载期刊全文--应对大家工作后的资料搜寻(转) 马上就要工作了,觉得学校里面图书馆资料很多,并且很有用,都可以在中文CNKI数据库,和西文数据库荷兰DOS中全文下载,但是仅仅限于校内IP 用户。到了工作单位上,想进入这些数据库查资料就很不容易了。。。并且要收很高昂的费用。。。离开了学校才知道学校里面这么好的电子图书馆的资源当时没有好好利用。 所以在网上找到了在家里和单位都能下载全文的地方。 下面是几年来收集整理的全文下载地址和心得,都是网友的无私奉献和结晶,我把分散的信息总结出来,希望对大家有用,有些地址和进入方式可能过期了,我没有一一核对,希望多多理解和包涵。 全文期刊: EBSCO/UMI/SDOS三个数据库扫荡一下,这三本都有全文。 硕博论文全文下载 http://202.120.13.45/umi/index.htm ,这是英文的博士论文。 中国期刊网是中文学位论文 图书馆全文无法下载,需要用户卡 图书馆全文下载数据库 PQDD https://www.doczj.com/doc/3b15946615.html,

Proquest数据库 cnki硕博论文全文 https://www.doczj.com/doc/3b15946615.html,/cdmd.html 学校图书馆的清华中国学术期刊网上没法下载硕博士论文。可以通过中国期刊网在上海交大图书馆的镜像登陆。 网址:https://www.doczj.com/doc/3b15946615.html, 账号:syshjd 密码:shjd 右边数据库列表中选择第二项:中国优秀博硕士学位论文全文数据库(CDMD) 第一项中国期刊全文数据库(CJFD)可以在我们学校的期刊网联接中进入。 cnki: syshjd,shjd没有此帐号 图书馆提供:cdmd,cdmd过期 图书馆下载毕业论文全文摘要 https://www.doczj.com/doc/3b15946615.html,/ 202.120.13.45/umi/index.hlm 中国学术期刊全文数据库密码要小写,从东大镜像点上, https://www.doczj.com/doc/3b15946615.html, 用户/密码: NJ0080/njdxts 中国学位论文全文 http://202.199.155.201:85/

中国知网CNKI个人数字图书馆介绍

中国知网(CNKI)个人数字图书馆创建流程 1. 个人数字图书馆说明 中国知网(CNKI)个人数字图书馆开创了个人使用数字资源的新局面。个人用户可按需订制资源、检索平台、功能、情报服务,按需配置显示模板和显示方式,个人馆提供了超越一般的资源订阅方式,为用户提供了个性化、交互式学习研究的空间。 在资源方面,平台支持对数据库专辑、学科专业、整刊资源、以及各种类型单篇文献的定制,使用户可以按不同需要定制网络出版总库的资源,在个人数字图书馆建构个性化资源馆。 个人馆默认包含了功能强大的检索平台。用户可对馆内文献使用多种检索方式进行检索,并通过文献出版统计报表了解馆内各专业文献的出版现状和每日新增文献。用户还可根据自己的需要对检索平台的资源及检索方式做个性化配置。 个人数字图书馆为用户提供了多种个性化服务栏目,用户可定制学者、机构、学术出版物、科研项目、检索式、投稿信息、学术论坛、学术趋势等,个人馆根据用户的定制自动推送一系列相关的情报信息,全面超越传统的web rss定制功能。个人馆也根据用户的需求不断推出更多个性化的服务栏目,全面满足用户学科调研及情报分析的需求。 个人馆中的每个栏目都提供了多种显示方式,用户可根据自身的需求创建不同类型的个人馆并选择个性化的模板,全面满足了用户的个性化需求。 2. 创建个人馆步骤 进入中国知网的首页:https://www.doczj.com/doc/3b15946615.html,,在首页选择创建个人馆的类型(研究型个人馆、中小学读者个人馆、生活型个人馆)

点击创建研究型个人馆,进入介绍研究型个人馆的页面: 点击创建个人馆按钮,进入研究型个人馆创建页面。 2.1填写个人基本信息 在此必须填写的个人基本信息有:用户名、密码、再输一次密码、取回密码需回答的问题、问题答案、您关注的学科领域、真实姓名、工作单位/学校名称、手机号、E-mail、验证码。 这里请填写真实姓名、工作单位、学校名称和您关注的学科领域,我们会根据您提供的信息自动为您的个人馆定制专业馆,推送您发表的文献。

相关主题
文本预览
相关文档 最新文档