欢迎来到 Whisper-Speech-to-Text-API项目!本项目为开发者们提供了一个快速、可靠的 API,通过调用 OpenAI Whisper模型,将多种格式的视频或音频文件高效转换为文本,适合语音识别、字幕生成和文本分析需求。 我们使用 faster whisper 模型作为引擎,然后使用 CUDA 进行 ...
高性能 API 接口:基于 FastAPI 实现异步操作,支持后台处理任务并将其存储在 SQLite 数据库中,实现任务可控管理。 多格式支持:支持音频文件、视频文件 (如 MP4) 等多种格式,转换基于 ffmpeg,确保高兼容性。 CUDA 加速:为有 GPU 的用户提供 CUDA 加速处理,显著 ...