最近,科技媒体 macstories 对苹果全新推出的 Speech API 进行了一次深度实测,结果令人震撼!通过转录一段长达34分钟、文件大小达7GB的4K视频,Speech API 仅用时45秒便完成了任务,展现了惊人的性能。
这项技术是在2025年WWDC上正式发布的,核心包含两个模块:SpeechAnalyzer 和 SpeechTranscriber。macstories 使用基于此API开发的应用工具 Yap,对转录能力进行了全面测试。结果显示,Yap 在速度上遥遥领先于其他主流转录工具。
在对比测试中,OpenAI 的 Whisper(MacWhisper V3Turbo 版本)完成相同任务耗时101秒,比 Yap 慢了55%;而 VidCap 和 MacWhisper V2 分别需要1分55秒和3分55秒。尽管所有工具在专有名词识别上都存在一些小问题,比如将“AppStories”误识别为其他词汇,但 Yap 凭借本地化运算的优势,在速度上依旧保持领先地位。
对于内容创作者、教育工作者等用户来说,Yap 的高效转录能力无疑是一大福音。它不仅大幅节省时间,还能显著提升工作效率。苹果此次的技术突破,或将推动整个行业进入更高效的语音处理时代。未来,我们或许会看到更多类似技术被应用到视频处理和内容生成领域,彻底改变内容生产的方式。
[hhw123pingdao]
温馨提示:
- 请注意,下载的资源可能包含广告宣传。本站不对此提供任何担保,请用户自行甄别。
- 任何资源严禁网盘中解压缩,一经发现删除会员资格封禁IP,感谢配合。
- 压缩格式:支持 Zip、7z、Rar 等常见格式。请注意,下载后部分资源可能需要更改扩展名才能成功解压。
- 本站用户禁止分享任何违反国家法律规定的相关影像资料。
- 内容来源于网络,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,联系微信:a-000000
📝留言定制 (0)