python语音转文字软件_Python 神工具包!翻译、文字识别、语音转文字统统搞定...

原标题:Python 神工具包!翻译、文字识别、语音转文字统统搞定

源 /高级农民工 文 /苏克1900

bcb612c6478b4784abb958e184cb8af3.png

今天给大家介绍一款 Python 制作的实用工具包,包含多种功能:

音频转文字

文字转语音

截图 OCR文字识别

复制翻译

举个例子,比如截图 OCR 文字识别就有很多实用场景。

常会遇到有些 PDF 是扫描版的无法复制(豆丁网上的),有些网页(极客时间)也限制了复制功能。这时候要复制,通常情况下只能手动去打,很浪费时间对吧。当然也可以使用一些 OCR 识别软件,但要么付费要体积很大,不方便。

用这款工具就很容易解决,只要打开软件,点击截图就会自动识别,自动在对话框里输出识别后的文字,然后直接复制就行了,非常方便:

d9694d151db44e71a09acf779996ec3c.png

c82d3bad95f442f5ac449d4ed65eb062.png

实操效果:

080800b2f2e748f59fea9dc6ae78b67c.gif

再比如中英文翻译也是经常会用到的,通常情况的操作是打开百度翻译网页然后复制进去翻译,也不方便。

5346879acc6f41b68668526e0e606d94.png

使用这款工具很轻松就能处理,翻译效果还不错:

309e87e0c6c84963b2b34bf01b9ffeae.png

动图效果:

0dd4198c4412483b9a8f7a86c094b2a4.gif

语音识别也很常用了,比如一些看了一些网课视频想做笔记,不想去手打的话。可以先把视频中的语音抽出来,然后使用该工具直接转换成文字。

这些功能是 Python 实现的,很强大对吧。做起来也不难,两步就能实现。

第一步获取 API 接口。这些功能都是调用百度 AI 的各种功能 API 接口获得的,免费使用次数足够多。

第二步,使用 python 的 pyqt5 GUI 框架制作出可视化界面,pyqt5 需要稍微学下,但也不难,有具体的需求了学起来也更有针对性。

下面简单说下如何获取 API 接口。

以语音识别接口为例,进入百度语音识别网站:

http://ai.baidu.com/tech/speech/asrpro

96ae75cba5c64a179d2c3d90d9c252e2.jpeg

选择创建对应的「文字转语音」和「语音识别」应用,就会给你一串秘钥,重点保存好:API key 和 Secret key.

f70591c123d74478a8c18be6cc18344a.png

07ed5a43e2a244689afa9798c4eeea5a.png

然后把两串字符复制到这款工具中,点击保存,就可以使用语音转文字功能了。

e10e2a42f7c14193954a5f4054925c18.png

其他功能接口获取方法也是同样的,这里给出各功能网址:

截图文字识别:

http://ai.baidu.com/tech/ocr/general

文字转语音:

http://ai.baidu.com/tech/speech/tts

复制翻译:

http://fanyi-api.baidu.com/api/trans/product/index

参考来源 | https://www.52pojie.cn/thread-981080-1-3.html

全新打卡学习模式

每天30分钟

30天学会Python编程

世界正在奖励坚持学习的人!返回搜狐,查看更多

责任编辑:


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部