[下载工具] 百度文库下载工具,直接下载DOC格式

为啥不用冰点文库?

主要是因为冰点是先导出pdf,然后扫描出txt,文字识别有可能会错误,还有就是用word打开txt文档还是有字体,颜色等丢失,pdf本身编辑又不方便。还有就是总是要设置我的首页。。。。。

特意做了这样的一个小工具,共享给大家。有很多地方还可以继续优化,可是做的非常累,给大家看看有没有人喜欢,有人喜欢的话,偶就继续再做做。

偶本身不是做界面出身的,因为要给大家使用,还强行去学了一个界面,搞得丑的自己都不想要,大家克服一下吧。

界面逻辑,就一个按钮(实在是不会写界面),空白框里面输入百度文库地址,点击提交。

文档下载到当前目录下的download文件夹里面,无论啥文件,下载号以后都叫test.doc,自己注意重命名,不然会覆盖。 (下个版本加上自动命名吧)

还有就是偶用python做的,不知道为啥python3.7打包出来文件好大好大,要37.6MB,我也很崩溃呀,如果是我自己看到这样的大小,我也以为是病毒呀,可是确实就是这么大,这里面没有任何广告,后门 。。。。。

界面后面故意留了个command窗口,是因为不会做进度条,下载时有信息都是直接输出到command窗口的。大家要是不希望回头我去学怎么做个进度条出来。。。。
    

当前可以做到的是:

1:仅仅支持DOC格式,虽然pdf,txt格式不难,但是还没有时间去做。

2:这个工具可以做到的就是doc文件格式文本下载,字体,颜色,段落基本上都是正确的。

3:目前只能撷取doc文章中的文字部分,图片部分当前还没有完成,已经有思路了,技术上是可行的,回头我再想想怎么整合到代码里面去。

当前实现功能

1:doc格式可以下载,可以识别部分:

1.1:硬回车换行,基本可以正常识别。

1.2:表格中偶尔有硬回车,基本可以识别。

1.3:软回车,基本可以识别

2:文字应该不会有错别字,因为不是用pdf扫描识别做的。

 

链接:https://pan.baidu.com/s/1InaJqkvgdbIO89jLPTpw3A
提取码:tfw0

未经允许不得转载:王刚博客 » [下载工具] 百度文库下载工具,直接下载DOC格式

赞 (0) 打赏

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏