把HTML网页合成电子书,支持文件排序、替换,智能划分大文件的章节,支持图片下载,txt等常用文件导入到电子书。
1、HTML整理
2、文件分割
3、文本抽取
4、正则表达式
5、OCR
6、HTML-text
7、合并文件
八、段落合并
9 .段落分隔
10、编码转换
11、文本替换