如何将蓝光SUP字幕OCR成srt字幕(一)
- 格式:docx
- 大小:766.65 KB
- 文档页数:4
教你一招视频文字识别,瞬间提取视频字幕,效率直接翻倍!哈喽大家好呀!我是每天疯狂赶稿的小小杰~有时我们会在视频里遇到一些比较重要的视频台词、旁白,这个时候如果想要提取视频字幕,也许你会直接进行回放和打字收录。
其实不需要这么麻烦,我们可以利用视频文字识别的工具,直接一键提取出视频里的所有文字,非常方便!1、万能文字识别专业的文字识别工具,采用了OCR识别技术,可以识别图片、视频、音频中的文字,并将其提取出来,非常厉害。
操作非常简单,在软件界面中找到【视频转文字】功能,点击【添加视频】或【添加视频文件】上传视频。
/recognition接着点击【开始识别】按钮,软件就会智能识别,识别好的文字会显示在右侧边框中。
最后点击右下角的【复制】或【导出识别结果】便可按钮将文字导出。
另外,这个软件还有手机端的,除了基础的文字识别功能外,还有生活常用识别、全能翻译、PDF转换处理、最美证件照等实用功能。
大家如果想使用手机进行操作的话,那么可以试一下手机端的万能文字识别工具。
2、网易见外一个音视频处理在线网站,无需下载便能使用。
它提供了视频转写、音频转写、翻译等多种功能,其视频转写功能便可以将视频转写成文字。
进入网站后,选择【视频转写】功能,就会进入转写界面。
上传好音频文件,并设置识别语言、输出类型等,最后点击【提交】按钮,等待系统转写即可。
不过该网站的转写速度有些慢,大家需要耐心等待,而且需要注册登录账号才能使用。
3、PRPR的强大不用我说大家也是知道的吧,它不仅可以轻松制作出精美的视频,而且还可以帮我们将视频中的文字提取出来。
打来PR,导入视频文件,在最上方的功能栏中找到【字幕和图形】功能,点击【转录系列】按钮。
在弹出来的窗口中设置转换的语言,并点击【转录】按钮。
稍等一会,就能看到转换好的字幕内容了,轻松完成视频字幕提取的操作。
好了,今天的分享就到这里了,觉得好用的话,记得分享给身边的小伙伴哦!。
Final Cut Pro导出字幕技巧Final Cut Pro 导出字幕技巧Final Cut Pro 是一款功能强大的视频编辑软件,除了可以处理视频的剪辑、特效和音频,还能支持字幕导入和导出。
本文将重点介绍如何在Final Cut Pro 中导出字幕,以方便用户在其他平台或设备上使用。
1. 在编辑界面中选择字幕在 Final Cut Pro 的编辑界面中,可以选择要导出的字幕。
通过选中对应的字幕轨道,确保你选择的是你想要导出的字幕。
2. 调整字幕显示效果在导出字幕之前,你可能需要对字幕的显示效果进行一些调整。
Final Cut Pro 提供了多种字幕效果和样式选项,你可以根据需要进行自定义。
点击字幕轨道上的字幕图标,即可打开字幕属性面板,进一步调整字幕的字体、大小、颜色和样式等。
3. 导出字幕为 SRT 文件要将字幕导出为 SRT 文件,首先需要选择目标字幕轨道,然后在菜单栏中选择“文件”->“导出”->“字幕为 SRT 文件”。
在弹出的对话框中,选择合适的存储位置和文件名,并点击“导出”按钮即可。
4. 导出字幕为 XML 文件除了导出为 SRT 文件外,Final Cut Pro 还支持导出字幕为 XML 文件。
选择目标字幕轨道后,在菜单栏中选择“文件”->“导出”->“字幕为XML 文件”。
在对话框中选择存储位置和文件名,并点击“导出”按钮。
5. 自定义导出设置Final Cut Pro 提供了一些导出设置选项,你可以根据需求进行自定义。
在导出字幕时,你可以选择导出所有字幕轨道,或只导出特定的轨道。
你还可以选择导出包含时间码或仅导出字幕文本。
这些选项可根据你的具体需求进行调整。
6. 在其他平台上使用导出的字幕导出的字幕文件可以被导入到其他编辑软件或播放器中使用。
例如,在 Adobe Premiere Pro 中,你可以通过导入 XML 文件将字幕轨道导入到你的项目中。
IdxSubOcr使用教程——dert112233于2010年11月22日晚一、引子IdxSubOcr说明:功能:一个专门用来OCR(光学字符识别)Vobsub 格式字幕的软件,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能。
OCR引擎为微软Office所带的Microsoft Office Document Imaging(MODI),支持英文、简体中文、繁体中文、日文。
动机:目前已经有一些免费的字幕OCR软件,英文的可以用Subresync,中文的可以用SubOCR。
但是在使用了这些软件后,我还是决定开发IdxSubOcr,理由如下:希望能够使用方便性方面有所改善。
Subresync自带的OCR引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦;而且还不支持中文字符。
SubOCR实在太庞大,而且在某些机器上运行出错。
在简体中文Office2007下用Micorsoft Office Document Imaging (MODI)做OCR的步骤为:1.先确保MODI已经正常安装。
Office2003的缺省安装是第一次使用MODI时安装,Office2007的缺省安装是不装或第一次使用MODI时安装,如果你已经安装了完整版的office2003或者office2007,但是没有此组件,你就必须添加此组件。
添加如下图:1.1放入office安装光盘(如果是虚拟光驱就是加载光盘镜像文件),因为Micorsoft Office Document Imaging(MODI)组件要从光盘安装。
图11.2进入控制面板点击“添加或删除程序”图21.3选择office2007(如果你的是office2003,同样操作)图31.4选择添加或删除功能,然后点击继续图41.5选择“office工具”>Microsoft Office Document Imaging下面的Microsoft Office Document Imaging Writer,改为从本机运行,然后继续,中途可能会要求你选择指向office光盘,很快安装就能完成。
外挂内封字幕转内嵌字幕教程(DVDBD.SUP字幕转.IDX.SUB提取OCR识别改字体压制)额……朋友们好啊,我图吧老字幕组组长了,最近突然有时间整点二次元的,所以咱就下了一部分21年的番的BDRIP,来源嘛自然是NYAA和36DM之类的BT站,然后也都很规矩的做了种而且上传量远大于下载量编辑切换为居中添加图片注释,不超过 140 字(可选)毕竟咱作为图吧精神领袖天天喷资本家喷吸血雷喷垃圾网盘咱自己可千万不能整吸血这种操作。
下载20G上传170G,滴水之恩当涌泉相报了属于是。
然后这里简单说下情况,就是咱其实作为捡垃圾的自己看番并不多,能下BDRIP深入看番的更少,今年不过也就下了几部,自己真能好好看完甚至反复刷很多次甚至出二创出漫评的也就那么一两个(然而还一直咕着)。
所幸京都动画比较给力,在经历火劫之后居然还能浴火重生,看得出来这和各位的奋斗也有关系,悲剧的发生只会让幸存者变得更强。
不过与其说是悲剧在咱看来不过又是一个神话的破灭罢了,一个人单杀几十人,这就是传说中抗震减灾意识强到爆棚人民素质高到离谱的老京都人的水平,所以从那以后咱再看见谁说日本人安全水平多高咱也就一乐。
添加图片注释,不超过140 字(可选)添加图片注释,不超过140 字(可选)总而言之龙女仆虽然咱在当年看番的时候也不过是在B站看在线(当时也并不需要什么带会员就能看,和普通视频一样只是卡画质而已),而其内部的价值观和背景咱也是我看不懂但我大受震撼,现在经过简单的研究发现其内部的价值观和神话背景之后咱简单能看出一点点要表达的内容了,不过离能出漫评的水平还是很远的。
这里咱还是做一点浅显的工作吧,这里注意看这个ED的CD里面提供了OP的CV合唱版本,这解释了难怪咱看OP的MV的时候原唱怎么一脸孙笑川的表情,原来是合着自己的戏份被抢了,宁能让CV搁这唱干嘛害找我来呢,应该是这么想的罢。
所以咱今天就继续迫害原唱,直接给OP的音频都给你换过来首先咱其实是在想直接给音频编辑一下直接传就完了,字幕,什么字幕?不做了,B站不是支持外挂字幕吗?咱直接提取一波然后再上传就完事了。
字幕制作教程2:字幕格式转换(有兴趣制作字幕或加入CMCT团队的可联系QQ:76846146)四、字幕格式转换1、Idx+sub格式字幕转换成srt格式字幕操作:英文和中文sub格式转换需要用到不同的软件。
中文转换用subocr0.98(下载地址:/software/show.html?id=58&name=SubOCR)英文转换用subrip1.2汉化版本(下载地址:/software/show.html?id=43&name=SubRip)软件里面都自带如何转换的教程。
这里贴出简单教程。
如何简单使用subocr现在能把SUB字幕转成SRT字幕的软件有两个,一个叫SUBOCR,另外一个是SubRip。
两个用下来我还是觉得SUBOCR好用一点,呵呵。
下面就以SUBOCR为例,讲讲具体的操作好了。
1、首先获取SUB的字幕,这里就不多说了,你可以从DVD光碟上提取,有的也可以在网上下载到。
2、打开SUBOCR,点击菜单File里的Open Subtitle Files….选择SUB字幕,点击确定,载入要转换的SUB字幕3、做完第二步后,点击菜单中的Command中的OCR Subtitle Files4、这时会跳出一个窗口,这时你可以选择你相对应的SUB字幕进行转换。
比如你从DVD 上弄下来的SUB字幕是繁体中文的,你就可以选择Tradtional Chinese进行转换,如果你的SUB字幕是简体中文的,你可以选择Simplified Chinese进行转换。
点击OK后,转换开始。
5、耐心等待后,转换完成。
6、由于SUB字幕其实是由图片构成的,所以转换而成的,所以在转换后常常会出现很多错码,如果你用过扫描仪来OCR文字,你就会知道,这样的情况是很正常的,这时候就需要你的耐心和细心了,仔细核对下面的SUB字幕,把错误的地方都改过来。
改过以后的字幕,都会有一个笑脸做为标记,表示改过了。
7、改完以后就得保存(Open Srt Subtitle)就OK了,这样一份SRT的字幕就转换完成了。
一、中文SUB字幕转SRT:需要SubRip和SubToSrt的配合使用。
第一步:打开SubRip→文件→打开Vob文件→打开文件目录→选定sub→语言数据流选你需要转的Track-Chinese→右面操作里选第二个圆圈(字幕图片保存为4bit的BMP文件),将旁边的选项“加时间及尺寸”勾上,如图5所示;第二步:点击开始,选择保存的文件夹(因为图片文件比较多,建议另外建立新的子目录),并给图片命名,点击保存,之后弹出一个对话框,选中颜色标签,把左上角的“Custom Colors and Contrast”勾上,在右下角预设里选上第一个圆圈(I-Author),左边有颜色#1,#2,#3,#4,每一行后面有一个长方块和一个下拉框,如图6所示。
点击某一行前面的长方块,比方说颜色#1,弹出配色对话框,如图7所示,选择基本颜色中的最后一行第一个黑色即可。
接下来,如图8所示,我们发现subrip主窗口下面是一片空白长方条,没有文字,为什么呢?因为颜色选错了。
将颜色#1选回白色(图7基本颜色最后一行最后一个)。
然后再将颜色#2选中黑色,看看主窗口有没有文字显示,不行的话,再选颜色#3,配色正确的话,应该如图8所示,显示的文字应该为实心黑体字,颜色#1#2#3#4只有一行为黑色,其他为白色。
然后点击确定,rip过程进行中。
第三步:rip完成后,点击subrip窗口下文本输出窗口栏的“输出格式”→设置输出格式→Text Formats (SubRip *.srt),如图9所示,之后弹出警告,无视。
然后点击文件→另存为,选择你上一步中保存图片的文件夹,也就是说,保存的srt文件应和你rip后的图片在同一个文件夹,命名也建议命成一样的名字(后缀名是不同的)第四步:打开SubToSrt,文件→打开SRT或SSA文件,选择你上一步中保存的srt文件,打开后如图10所示。
图10左下角有三个设置,第一个空格检测设置可以根据实际调节,当sub字幕以空格来代替逗号断句时,我们可以把它设置得“灵敏”些,当sub字幕以逗号来短句时,可是设置得靠近“忽略”,即我的截图那样设置。
提取DVD里的SUB字幕转SRT,再精确校准时间轴匹配AVI教学用到的软件需要3个。
1:VOBSUB2:Sub Rip3:SubToSrt下面开始具体的步骤一:用VobSub提取DVD的字幕VobSub是个很有力的字幕处理工具,其提供了提取DVD的字幕存为idx+sub字幕文件的方法,如下:安装好VobSub后,点击“开始”-“程序”-“VobSub”-“VobSub Configure”,出现下图所示界面。
点击“Open...”,在“文件类型”里选择“Ifo and Vobs,for creating idx/sub”,然后浏览到DVD文件所在的目录,打开所要提取字幕的影片的ifo文件。
小提示:一般来说我们要提取的是影片正片的字幕,也就是文件最大的那几个文件。
比如《雷蒙·斯尼奇的不幸事件》的DVDR(Lemony.Snickets.A.Series.Of.Unfortunate.Even ts.DVDR-BooZerS)里,正片文件就是从VTS_04_1.VOB 到VTS_04_5.VOB,那么我们打开的就是VTS_04_0.IFO 这个文件。
OK,如下图打开该ifo文件。
而后选择好存放的目的文件夹,比如“桌面”,点击“确定”继续。
出现下图所示界面。
软件自动将所识别的字幕流列在右上方的窗口里,如果我们只需要第一个英文字幕,那么可将其他的通过按钮“<--”点到左边去。
下方的窗口是来选择字幕段,这个我们一般不去动它。
“OK”后即开始生成字幕,如图:这里我要提一点,一般我们需要的是中文字幕,上面选择Chinese,呵呵,继续。
若干分钟后完成,VobSub Configure便自动打开该软idx+sub字幕了,此时大功告成,很简单吧,这样我们就得到一个idx+sub字幕了,这个就是我们要的SUB 字幕!二:SUB转SRT因为对于我们来说SUB字幕很不方便,挂上AVI后不能调整字幕的大小,压制出来的MPG字幕太小的话,不方便观看,呵呵,那么我们需要把SUB转成SRT,以前我使用subocr这个软件,这个软件很累人,要一个一个错别字的改,所以现在弃用了,现在用SubToSrt,好了,下面我们开始介绍这个软件的用途。
在观看1080p或者720p等高品质影音时我们可能面对影片有蓝光原盘字幕格式为xx.sup而播放器却无法外挂加载字幕的窘境,或者SUP字幕可以加载但是时间轴却无法一致。
也许你想把高清片源中封装的sup字幕提取再加工而不可为这里笔者将详细为大家介绍如何提取MKV封装的SUP字幕,并且把SUP字幕转换为方便用windows自带文本编辑的srt字幕的方法,最后所有工具打包附上,。
1.首先使用打开后将要提取sup字幕的MKV文件直接拖入(今天我们以兽组发布的1080p电影The.Cave.2005.Blu-Ray.1080p.2Audio.DTS-HD.MA.5.1.x264-beAst为例)我们可以看到,inputfile为源文件地址,output dir为提取文件保存地址。
2.选中要提取的sup字幕,这里我们选R6对应上译国语简体然后点击,软件就开始自动提取,如下图:3.等进度到100%,sup字幕提取工作就ok了。
当然提取mkv封装的音轨,视频文件也如上操作即可。
这是提取出来的sup字幕文件。
4.ok重头戏来了,如何将sup字幕转换成大家喜闻乐见的srt字幕呢。
打开此软件需安装JA V A环境,如果没有安装直接打开会变成压缩包文件,没有安装的同学请先自行安装JA V A环境安装包如图5.BDSup2Sub的作用是将蓝光字幕转换为DVD常用的xx.idx和xx.sub两个文件,打开软件后界面如下将刚生成好的sup字幕直接拖入,如下:什么都不用动,直接点ok,点了之后直接变下面的样子确保右上output format为sub/idx,然后点击左上File下拉选择Save/Export,点选后出现如下界面Filename就是要保存的文件名,.idx前面的可以随便写Language是语言,可以不理或者手欠改为中文,鄙人就是手欠一族的。
完了之后直接Save,生成速度还是很快的这就是我们新生成的xx.idx和xx.sub字幕6.拿着xx.idx和xx.sub字幕,进入下一步,打开这个软件需要首先安装微软office办公软件,原理是通过调用office的OCR识图接口将DVD的图片字幕直接生成可编辑的srt字幕(xx.idx和xx.sub字幕实际上就是DVD图片字幕,一个是时间轴,一个是字幕图片本身,太复杂了笔者也不懂)。
字幕转文字的方法字幕是一种用以展示视频或影片中对话或音频内容的文本,它对于那些无法听取或理解音频的人来说十分重要。
在字幕中,文字将音频内容转化为可视化的形式,使观众能够读取并理解其中的对话和信息。
字幕转文字是一个将视频或电影字幕转化为纯文本形式的过程,它可以帮助人们更方便地阅读和分享字幕内容。
在这篇文章中,我们将介绍几种常见的字幕转文字的方法。
1. 手动转录方法手动转录是最基础的字幕转文字方法。
它需要人工逐帧地观看视频或影片,并将其转化为文字。
这种方法需要耐心和准确性,因为任何错误或遗漏都可能导致文字内容的不准确。
手动转录适用于较短的视频或影片片段,但对于长时间的内容来说会非常耗时。
2. 语音识别技术语音识别技术是一种将音频转化为文字的方法。
通过使用语音识别软件或工具,用户可以将字幕自动转化为文字形式。
这种方法可以大大减少手动转录的工作量,并提高转录的速度。
然而,语音识别技术仍然存在一定的错误率,尤其是对于口音、背景噪音等因素处理不够完善。
因此,在使用语音识别技术时,我们仍然需要经过一定的校对和修正。
3. 在线字幕转换工具现在有许多在线字幕转换工具可供选择。
这些工具通过上传字幕文件,自动将其转换为可编辑的文本形式。
有些工具甚至可以支持多种格式的字幕文件,如SRT、ASS、VTT等。
使用在线字幕转换工具,用户不需要下载额外的软件或工具,只需在浏览器中打开网页并上传字幕文件即可完成转换。
这种方法方便快捷,适用于各种类型的字幕转录需求。
4. 专业字幕转录服务对于一些需要高质量和准确性的字幕转录工作,专业字幕转录服务可能是一个更好的选择。
这些服务通常由专业的转录团队或个人提供,并且能够根据客户需求提供定制化的服务。
专业字幕转录服务不仅可以减轻工作负担,还可以保证字幕的准确性和流畅度。
然而,由于是付费服务,对于一些简单的字幕转录需求,使用免费或便捷的方法可能更为经济实惠。
无论是通过手动转录、语音识别、在线工具还是专业服务,字幕转文字的过程都需要考虑准确性和效率。
按语:正规的商业片,一般导演会把剧本的台词交给剪辑师,根据台词来制作字幕,虽然导演或演员在拍摄过程中,时常会因某种需要即兴发挥,改变台词,不一定完全按剧本的台词来拍戏,但大体上改动的幅度不会太大。
有些低成本电影,剧本边拍边改,拍到哪里算哪里,最终可能没有完整的台词,剪辑师做完终剪,需要自已根据成片来制作字幕,敲定字幕。
本文以一部正版蓝光DVD的电影片段为例,说说如何根据成片来制作字幕。
1、由于片源是蓝光m2ts格式,可以用tsMuxerGUI工具将里面需要的东西提取出来,当然,也可以用eac3to来提取。
PR可以直接导入m2ts这种封装格式,支持AC3音轨,但不支持DTSHD音轨,也不支持PGS这种类型的字幕,因此,将DTSHD音轨和PGS字幕单独提取出来。
另外,AC3音轨是中文配音,是2.0声道,我们打包时不准备用它,听写字幕时,只作为参考之用。
我们打包时,准备采用DTSHD英文音轨,因为它是5.1声道,质量比AC3更好。
PGS字幕提取后,会得到一个后缀为sup的字幕文件。
2、用SubtitleEdit导入sup格式的字幕文件。
“文件”->“导入/OCR蓝光字幕…”,选中sup字幕,按<打开>3、弹出OCR的窗口。
什么是OCR?通俗来理解,蓝光碟里的字幕,它是以图片的形式,而不是以文本文字的形式来显示,每一行字幕对应于一张图片。
要将蓝光里的字幕提取出来,提取成文本格式,目前只能用OCR这种技术手段。
由于汉字的结构比英文字母复杂得多,用OCR的手段来识别汉字,目前最多只能达到98%左右的识别率、准确率,也就是说,有的汉字可能会识别不出来,或者识别错误。
这时候,需要在OCR的基础上,对OCR识别出来的错误字幕,进行手工修改,还是比较费事。
OCR的好处是,可以将整个片子的所有字幕自动识别出来,不需要手工一行一行地敲入字幕,可以大大提高效率。
由于SubtitleEdit里的OCR功能,对中文简体的支持不大好,识别率不高,所以,暂时放弃OCR的手段,准备用手工的方式录入字幕。
会声会影直接导入SRT文件合成字幕教程
版本要求:会声会影10以上版本
1、打开会声会影标题中的“打开字幕文件”
导入视频音频在时间轨上处理完毕后 (注意,暂不要在字幕轨上加任何字幕)点击上面菜单栏里的“标题” ,然后单击编辑框右下方的“打开字幕文件”
点击“打开字幕”文件后看到它支持的格式是UTF
没关系它和SRT格式通用
点击“打开字幕文件”找到硬盘里的.srt文件
注意:别急着点“打开” 先进行一些字幕属性设置
2、设置字幕属性,导入SRT文件
语言--简体中文
字体--选择你系统里安装的字体
字体大小--注意尽量选相同字号下大一点的字体行间距--任选
字体颜色光晕阴影(同描边)
设置完毕点击“打开”
确定
导入后便可以在编辑里看到标题栏里的字幕显示了
如果时码或者字幕文字大小不合适,可以一一调整。
3、渲染保存
(注:上面的抓图是会声会影12 如果你用的会 11 会10 大体相同)。
SUB字幕转为SRT字幕的两种方法最近,严重浪漫要发布一部纪录片资源,但是该资源配的字幕是SUB字幕(DVD字幕),效果很差,于是我想转换为可编辑的Srt或者Ass字幕。
不试不知道,还真的很麻烦!在这里鄙视一下发明 idx+sub格式字幕的那位先人,你是怎么想的?为什么硬把文字以图片的形式做成字幕,搞的体积庞大、还不能编辑!给后人造成这么大的麻烦!好了,现在开始说SUB字幕转为SRT字幕的两种方法:【A】SubRip + SubToSrt这个方法需要两款软件 SubRip_1.20 、SubToSrt.V3.13中文版的配合使用。
前者把SUB字幕转换为可以容易识别的白底黑字的图片。
后者是用它的有记忆、学习功能的字库来识别图片,转换成文字。
软件下载:SubRip_1.20SubToSrt.V3.13中文版【B】IdxSubOcrIdxSubOcr 号称“最好用的Sub TO Srt工具”,比 SubRip + SubToSrt 简便许多。
目前最新版是1.08。
这个软件是利用微软Office里的OCR功能来识别SUB字幕。
据称比 SubRip + SubToSrt 识别起来更容易。
这个教程里提供了简体中文、繁体中文、日文、韩文的识别引擎的下载,压缩包还提供了视频教程的下载。
【IdxSubOcr使用视频教程及相关工具52norm特别贡献版】下载:【试用报告】:既然有简便的方法,我肯定先用简便的方法【B】。
但是,一步一步对照视频来操作,最后的结果居然一个中文字也没有识别出来。
回过头来找原因,貌似问题就出在安装微软Office里的OCR功能模块时,我安装时看到的有一项,而视频教程里是三项。
我不知道是不是应该重新安装一下Office,到论坛里发了求助帖(帖子地址),目前没有回应。
也请高手看到后指点一下。
然后再试方法【A】,这个倒挺顺利的,一步一步做了下来,最后识别的时候,才知道用这款软件真的是体力活,字库遇到不能识别的图形,就提示你人工输入汉字。
sub中文字幕转srt或ssa格式两步搞定(二)
第二步:用SubToSrt将图片文件转换SRT或SSA格式
1. 下载SubToSrt。
2. 运行SubToSrt.exe->文件->打开SRT或SSA文件->选取刚才保存的srt文件
3. 图片处理->自动裁剪->确定(当图片过大时,推荐使用此步骤,可以使识别更快)
4. 依照字幕调节空格检测设置、空格宽度设置、行高检测设置的灵敏度
5. 识别->开始识别
当遇到不认识的字时,会自动跳出小窗口要求丰富字库,输入该字,按回车即可
当遇到半个字的时候,如图,按扩展(Alt+E),即可显示全字
如果前面一个字打错,可以在小框中修改该字,程序会自动从该字所在行开始识别
6. 识别完毕后,会自动替换已知错误词组。
7. 这时,可以随便看一下字幕,如有需要,可以略做修
改(如:原sub字幕中就是错误的)
8. 文件->保存为SRT或SSA格式->推荐为ssa,自由度比srt更大。
在观看1080p或者720p等高品质影音时我们可能面对影片有蓝光原盘字幕格式为xx.sup而播放器却无法外挂加载字幕的窘境,或者SUP字幕可以加载但是时间轴却无法一致。
也许你想把高清片源中封装的sup字幕提取再加工而不可为这里笔者将详细为大家介绍如何提取MKV封装的SUP字幕,并且把SUP字幕转换为方便用windows自带文本编辑的srt字幕的方法,最后所有工具打包附上,。
1.首先使用打开后将要提取sup字幕的MKV文件直接拖入(今天我们以兽组发布的1080p电影The.Cave.2005.Blu-Ray.1080p.2Audio.DTS-HD.MA.5.1.x264-beAst为例)我们可以看到,inputfile为源文件地址,output dir为提取文件保存地址。
2.选中要提取的sup字幕,这里我们选R6对应上译国语简体然后点击,软件就开始自动提取,如下图:3.等进度到100%,sup字幕提取工作就ok了。
当然提取mkv封装的音轨,视频文件也如上操作即可。
这是提取出来的sup字幕文件。
4.ok重头戏来了,如何将sup字幕转换成大家喜闻乐见的srt字幕呢。
打开此软件需安装JA V A环境,如果没有安装直接打开会变成压缩包文件,没有安装的同学请先自行安装JA V A环境安装包如图5.BDSup2Sub的作用是将蓝光字幕转换为DVD常用的xx.idx和xx.sub两个文件,打开软件后界面如下将刚生成好的sup字幕直接拖入,如下:什么都不用动,直接点ok,点了之后直接变下面的样子确保右上output format为sub/idx,然后点击左上File下拉选择Save/Export,点选后出现如下界面Filename就是要保存的文件名,.idx前面的可以随便写Language是语言,可以不理或者手欠改为中文,鄙人就是手欠一族的。
完了之后直接Save,生成速度还是很快的这就是我们新生成的xx.idx和xx.sub字幕6.拿着xx.idx和xx.sub字幕,进入下一步,打开这个软件需要首先安装微软office办公软件,原理是通过调用office的OCR识图接口将DVD的图片字幕直接生成可编辑的srt字幕(xx.idx和xx.sub字幕实际上就是DVD图片字幕,一个是时间轴,一个是字幕图片本身,太复杂了笔者也不懂)。
本文讲述如何将图片型的蓝光字幕通过OCR(光学字符识别)进行识别,做成文本型的电影字幕。
准备工作1、相关的软件必须安装到位,参见《蓝光字幕OC R相关软件安装指南》一文。
并准备好以下两款工具:2、准备好从蓝光片源中提取的SUP字幕文件(即PGS字幕)1、双击java应用程序,“File”->“Load”,导入sup字幕文件;2、勾选Chan ge framerate,蓝光片源的帧速率一般为23.976p(源帧速率),由于咱们做电影字幕,所以更改为24p (目标帧速率),按<OK>备注:这步很关键,电影字幕在这里一步到位,直接做成24p。
3、为了最大限度提高OCR的识别率,建议将字幕移到下方的黑边处进行识别。
按“Edit”->“Move all captio ns”4、选择Move outsid e bounds(移动字幕到银幕边界,推荐选它),或者选Mov e inside bounds(移动字幕到蓝色画面下方)也可以。
按<Move>5、“File”->“Save/Export”,Langua ge(语言)请选择Chinese(zh),即中文简体,设置好保存路径,按<Save> 【小技巧】选择语言时,在键盘上连按六下C,即可快速定位到Chin ese(zh)。
6、运行里面的IdxSub Ocr.exe文件,按<打开idx文件>,导入刚刚输出的idx文件,严格按下图操作:7、OCR语言,选择“中文(简体)”,按<确定>8、开始OCR,自动识别,稍候片刻……出现“文件已存盘”时,按<确定>9、识别完之后,从第一条字幕开始检查、核对,对照源盘的s up字幕,看看有没有无法识别或识别错误的字,如果有,手工改正过来。
按语:正规的商业片,一般导演会把剧本的台词交给剪辑师,根据台词来制作字幕,虽然导演或演员在拍摄过程中,时常会因某种需要即兴发挥,改变台词,不一定完全按剧本的台词来拍戏,但大体上改动的幅度不会太大.有些低成本电影,剧本边拍边改,拍到哪里算哪里,最终可能没有完整的台词,剪辑师做完终剪,需要自已根据成片来制作字幕,敲定字幕。
本文以一部正版蓝光DVD的电影片段为例,说说如何根据成片来制作字幕。
1、由于片源是蓝光m2ts格式,可以用tsMuxerGUI工具将里面需要的东西提取出来,当然,也可以用eac3to来提取. PR可以直接导入m2ts这种封装格式,支持AC3音轨,但不支持DTSHD音轨,也不支持PGS这种类型的字幕,因此,将DTSHD音轨和PGS字幕单独提取出来。
另外,AC3音轨是中文配音,是2。
0声道,我们打包时不准备用它,听写字幕时,只作为参考之用。
我们打包时,准备采用DTSHD英文音轨,因为它是5。
1声道,质量比AC3更好。
PGS字幕提取后,会得到一个后缀为sup的字幕文件。
2、用SubtitleEdit导入sup格式的字幕文件。
“文件”-〉“导入/OCR蓝光字幕…”,选中sup字幕,按<打开>3、弹出OCR的窗口。
什么是OCR?通俗来理解,蓝光碟里的字幕,它是以图片的形式,而不是以文本文字的形式来显示,每一行字幕对应于一张图片。
要将蓝光里的字幕提取出来,提取成文本格式,目前只能用OCR这种技术手段。
由于汉字的结构比英文字母复杂得多,用OCR的手段来识别汉字,目前最多只能达到98%左右的识别率、准确率,也就是说,有的汉字可能会识别不出来,或者识别错误。
这时候,需要在OCR的基础上,对OCR识别出来的错误字幕,进行手工修改,还是比较费事。
OCR的好处是,可以将整个片子的所有字幕自动识别出来,不需要手工一行一行地敲入字幕,可以大大提高效率。
由于SubtitleEdit里的OCR功能,对中文简体的支持不大好,识别率不高,所以,暂时放弃OCR的手段,准备用手工的方式录入字幕。
眉如黛·鬢如雲編寫idx+sub字幕转换成srt格式几种字幕文件格式的介绍1、srt---纯文本格式,也是网上最为常见的格式,我们给手机视频加载字幕的时候还真少不了它;2、sub---纯文本格式3、ass---纯文本格式4、sub/idx---这两个文件必须同时使用才可以使电脑上的视频外挂上字幕。
这里的*.sub和第2个里面的*.sub是不同的,这里的*.sub是图片格式,用记事本打开的话只会显示乱码。
而与之配合的*.idx负责显示字幕的时间轴,两者缺一不可。
(小知识:Sub格式的字幕其实是一组排好序的图片,按照事先设定的时间依次出现在屏幕上。
它一般由Sub文件和Idx文件两个文件组成,其中Sub文件为字幕的镜像文件,作为字幕元素的图片就是存放在这个文件里的;Idx文件为索引文件,也就是时间标签,它来决定每个字幕元素出现的时间,这两个文件互相协作,最终形成完整的字幕呈现给用户。
而Srt 格式的字幕则是一个纯文本,文件中包含了时间标签和对应的字幕。
一般而言,DVDrip电影自带的字幕文件是*.sub格式,并配合*.idx索引文件一起使用的。
由于*.sub是基于图片形式来存放字幕数据的,所以自身的容量比较大,并且无法编辑,这给我们的字幕翻译和修改工作带来了不便。
相反,*.srt字幕文件是基于文本格式的,所占空间小、可直接用记事本打开编辑,普遍用于字幕的翻译和修改。
)由于网上现在大多是srt格式的字幕文件,所以我们加载字幕也很方便。
但是难免会遇到只有sub/idx字幕的情况。
用sub/idx字幕,一不好加载,二不好修改,三还很可能遇到繁体、简体、英文三个字幕放一块儿占了大半个电影屏幕的现象。
所以,sub/idx格式的字幕转成srt格式还是很有必要的。
用subocr软件转换(这个比较简单,就不详细介绍了)SubOCR使用简介(该方法不适应于win7系统)先自己搜索软件下载安装1:使用文件菜单中的 Open打开 VobSub字幕(.idx,.ifo,.sub)2:从字幕选择框中选择需要进行OCR的字幕语言3:选取 Command菜单中的 OCR subtitle命令来执行识别,程序会弹出对话框来选择识别字幕的颜色,用鼠标点击字幕选择字幕颜色,对双色字幕一般来说应该选取字的“芯”颜色,选取好后可以点击 Try OCR看一下效果,如果能够正确识别出字幕内容就可以点击 OK进行识别。
提取DVD⾥的SUB字幕转SRT校准时间轴教学-风⾬云提取DVD⾥的SUB字幕转SRT,再精确校准时间轴匹配AVI教学⽤到的软件需要3个。
1:VOBSUB2:Sub Rip3:SubToSrt下⾯开始具体的步骤⼀:⽤VobSub提取DVD的字幕VobSub是个很有⼒的字幕处理⼯具,其提供了提取DVD的字幕存为idx+sub字幕⽂件的⽅法,如下:安装好VobSub后,点击“开始”-“程序”-“VobSub”-“VobSub Configure”,出现下图所⽰界⾯。
点击“Open...”,在“⽂件类型”⾥选择“Ifo and Vobs,for creating idx/sub”,然后浏览到DVD⽂件所在的⽬录,打开所要提取字幕的影⽚的ifo⽂件。
⼩提⽰:⼀般来说我们要提取的是影⽚正⽚的字幕,也就是⽂件最⼤的那⼏个⽂件。
⽐如《雷蒙·斯尼奇的不幸事件》的DVDR(Lemony.Snickets.A.Series.Of.Unfortunate.Even ts.DVDR-BooZerS)⾥,正⽚⽂件就是从VTS_04_1.VOB 到VTS_04_5.VOB,那么我们打开的就是VTS_04_0.IFO 这个⽂件。
OK,如下图打开该ifo⽂件。
⽽后选择好存放的⽬的⽂件夹,⽐如“桌⾯”,点击“确定”继续。
出现下图所⽰界⾯。
软件⾃动将所识别的字幕流列在右上⽅的窗⼝⾥,如果我们只需要第⼀个英⽂字幕,那么可将其他的通过按钮“<--”点到左边去。
下⽅的窗⼝是来选择字幕段,这个我们⼀般不去动它。
“OK”后即开始⽣成字幕,如图:这⾥我要提⼀点,⼀般我们需要的是中⽂字幕,上⾯选择Chinese,呵呵,继续。
若⼲分钟后完成,VobSub Configure便⾃动打开该软idx+sub字幕了,此时⼤功告成,很简单吧,这样我们就得到⼀个idx+sub字幕了,这个就是我们要的SUB 字幕!⼆:SUB转SRT因为对于我们来说SUB字幕很不⽅便,挂上AVI后不能调整字幕的⼤⼩,压制出来的MPG字幕太⼩的话,不⽅便观看,呵呵,那么我们需要把SUB转成SRT,以前我使⽤subocr这个软件,这个软件很累⼈,要⼀个⼀个错别字的改,所以现在弃⽤了,现在⽤SubToSrt,好了,下⾯我们开始介绍这个软件的⽤途。
本人使用松下ZS7照相机录制高清视频,在电脑上播放时不显示时间码,究其原因,是播放软件不能自动提取视频中的有效时间码(就是屏幕上显示的录制时间),经过几番研究发现可以用软件将时间码提取,以外挂字幕的形式与视频文件同时播放,实现画面上显示录制时间的目的,同时此方法也可以提取视频文件中的字幕,用以编辑修改,主要步骤如下:将 *.MTS 文件改名为 *.m2ts1.使用tsMuxerGUI提取Sup文件用tsMuxerGUI打开需要提取字幕的m2ts文件,把字幕以外的音视频前的钩去掉,通常就留下标“zho”的中文字幕,0utput选择Demux,选择输出目录。
按Start demuxing开始提取字幕。
2. 使用BDsup2srt将Sup转换成sub+idx格式字幕用BDsup2Sub打开步骤1所获得的sup文件,Conversion Options 不用改任何东西,直接okOutput Format选SUB/IDX,File-Save/Export转换字幕格式。
注意:BDsup2srt是jar文件,打开方式为:java此时使用暴风影音播放时,选择字幕,即可显示视频拍摄时间。
3. 使用IdxSubOcr将sub+idx格式字幕转换为srt字幕在IdxSubOcr界面上点“打开idx文件”选择步骤2所获得的idx文件。
选择“从头开始OCR字幕”。
srt文件的保存位置和文件名也可以更改。
OCR选项窗口选择OCR语言为中文简体,选择文字颜色为白底黑字。
按确定开始OCR识别。
识别完后自动存盘为srt文件。
然后可以进行逐句校对。
校对时选黑白图像可以看得更清楚。
校对完毕选“保存srt文件”保存。
由于使用了微软的MODI引擎,不用学习字库,识别率很高,基本没有什么要改的了。
找到繁体MODI包了,感兴趣的捧个场吧。
按语:正规的商业片,一般导演会把剧本的台词交给剪辑师,根据台词来制作字幕,虽然导演或演员在拍摄过程中,时常会因某种需要即兴发挥,改变台词,不一定完全按剧本的台词来拍戏,但大体上改动的幅度不会太大。
有些低成本电影,剧本边拍边改,拍到哪里算哪里,最终可能没有完整的台词,剪辑师做完终剪,需要自已根据成片来制作字幕,敲定字幕。
本文以一部正版蓝光DVD的电影片段为例,说说如何根据成片来制作字幕。
1、由于片源是蓝光m2ts格式,可以用tsMuxerGUI工具将里面需要的东西提取出来,当然,也可以用eac3to来提取。
PR可以直接导入m2ts这种封装格式,支持AC3音轨,但不支持DTSHD音轨,也不支持PGS这种类型的字幕,因此,将DTSHD音轨和PGS字幕单独提取出来。
另外,AC3音轨是中文配音,是2.0声道,我们打包时不准备用它,听写字幕时,只作为参考之用。
我们打包时,准备采用DTSHD英文音轨,因为它是5.1声道,质量比AC3更好。
PGS字幕提取后,会得到一个后缀为sup的字幕文件。
2、用SubtitleEdit导入sup格式的字幕文件。
“文件”->“导入/OCR蓝光字幕…”,选中sup字幕,按<打开>
3、弹出OCR的窗口。
什么是OCR?
通俗来理解,蓝光碟里的字幕,它是以图片的形式,而不是以文本文字的形式来显示,每一行字幕对应于一张图片。
要将蓝光里的字幕提取出来,提取成文本格式,目前只能用OCR这种技术手段。
由于汉字的结构比英文字母复杂得多,用OCR的手段来识别汉字,目前最多只能达到98%左右的识别率、准确率,也就是说,有的汉字可能会识别不出来,或者识别错误。
这时候,需要在OCR的基础上,对OCR识别出来的错误字幕,进行手工修改,还是比较费事。
OCR的好处是,可以将整个片子的所有字幕自动识别出来,不需要手工一行一行地敲入字幕,可以大大提高效率。
由于SubtitleEdit里的OCR功能,对中文简体的支持不大好,识别率不高,所以,暂时放弃OCR的手段,准备用手工的方
式录入字幕。
OCR如何操作,参见
4、录完了第一行字幕,再用鼠标点击第二行的时间轴(编号为2的时间戳),录入第二行字幕;依此类推,从第一行,一直录到最后一行,所有字幕录完后,从头到尾检查一遍,是否有漏字、错别字现象,检查无误后,按<确定>
5、这是录好的字幕,这个纪录片的片段,一共有129行字幕。
6、然后,按“同步”->“更改帧率”,“到帧率”设为24,转成24p,按<确定>;
7、用“另存为…”的方式,另存为(这个字幕可以用来分卷操作)
8、操作结束。