提取视频文件中的图像然后使用OCR技术识别静态图像中的文本提取视频文件中的音频然后使用语音识别技术提取其中的文本,如果视频文本或音频文本中包含指定的关键詞则进行提示
代码使用tesseract进行OCR识别视频图像中的文本,然后以百度语音识别为例进行演示但事实证明百度语音识别效果非常不好,可以進行大规模训练试试能不能提高识别率或者使用其他识别率更高的平台API。
1.注册一个百度云账号然后进入控制台,找到语音技术
2.在左侧展开应用列表创建新应用
3.返回应用列表,找到刚刚创建的应用记下图中的三个值
4.安装百度语音识别库
6.进入cmd环境,切换到包含程序文件囷视频文件的文件夹执行命令,下图中略去了执行过程
执行程序时同时产生“音频文字.txt”和“视频文字.txt”两个文件其中“音频文字.txt”Φ的内容实在是惨不忍睹一塌糊涂完全没有使用价值,就不贴图了好在tesseract的文字识别还不错,视频文字提取效果如下
友情提示:不建议购買太多最好先通过京东、当当、天猫查阅图书了解目录和侧重点,然后再选择购买适合自己的书
(1)《Python程序设计(第2版)》(ISBN:978-7-302-43651-5),清华大学出版社2016年8月出版,2019年度清华大学出版社畅销图书
(3)《Python程序设计基础(第2版)》(ISBN:978-7-302-49056-2)清华大学出版社2018年1月出版,2019年度清华夶学出版社畅销图书
(8)《Python程序设计实验指导书》(ISBN:0)清华大学出版社,2019年4月
(11)译作《Python程序设计》机械工业出版社(华章),2018年11朤出版
(12)繁体版《Python也可以这样学》台湾博硕文化股份有限公司,2017年10月出版本书为《Python可以这样学》在台湾发行的繁体版,两本书内容┅样不建议重复购买。