说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

通过语音识别来编程 速度远超键盘

HTML文档下载 WORD文档下载 PDF文档下载
最近网上流传了一段关于语音编程的视频,引起了热烈讨论。视频的主人公因早些年患上重复性劳损,而无法通过敲键盘来编码,便尝试通过语音来编程。视频中展示了他用Emacs Lisp、Python在Emacs中编码的过程。

近日网上流传了着一段2013 Python大会上的演讲视频。该视频展示了语音编码过程,且速度比一般开发者通过键盘编码速度更快。


视频中 Tavis Rudd通过语音识别来编写程序( 点击观看视频)

该视频中的概要内容是:

两年前,我患上了重复性劳损(RSI),十分严重,最后导致我的手开始麻木。我无法工作,无法再敲击键盘。绝望之际,我开始尝试语音识别。起初,通过语音编程慢得让人难受。但毕竟无法打字,我一直忍受着。在以后的几个月里,我不断地进行词汇调整,使用Python和Emacs Lisp进行语音编码,最终我开发了一个系统,它可以帮助我通过语音编程,相比我之前用手编程更快、更高效。

在短暂的现场演示中,我将用Python来创建一个小系统,为了取得更好的效果,我还会用一些其他语言,同时对其进行部署的过程中,不会触碰键盘。通过该演示,我希望让你确信,语音识别不再是残疾人的“拐杖”。现在它是非常高效的工具,所有开发人员可从中获利。

通过该视频,我们可总结出以下几点内容:

  • 他在Windows操作系统中使用 Dragon NaturallySpeaking(Amzon)语音识别软件。(他表示无法使用Linux CMU Sphinx。)(他用的是Mac电脑,显然他是在虚拟机上运行的Windows操作系统。)
  • Dragon利用Python进行编程,于是他学习了Python,同时也学习了 Python语音识别扩展库DragonFly(由Christo Butcher编写)。所以现在他可以定义自己的语音命令(如键入、移动光标到代码中的某个位置……等等)。
  • 他创造了很多短小特殊/独一无二的短语,依靠它们可以做很多事,如返回插入行,变换Emacs缓冲区,启动终端等等。所以,当他语音编程时,你会听到“twip,chirp,slap,derp……”,十分有趣。
  • 他有大约2000个个人命令。
  • 他表示,他的系统是在Vim、Emacs中完成的。(在演示中,好像只使用了Emacs。)
  • 他证明了在他开发的系统中用Emacs Lisp、Python在Emacs中编码的过程。它比普通程序员用键盘编程更快、更高效。
  • 开发该系统,耗时3~6个月。
  • 现在他的重复性劳损已完全康复,但他表示仍在使用他的语音系统进行编程,大约占到总时间的40%~60%。
  • 他表示,将在未来的4个月内发布他的代码。大家可以在Twitter( @tavisrudd)、 GitHub上关注他。

他所推荐使用的麦克风是昂贵的Amzon Audix OM-7 Microphone。

Windows 7中自带有一个语音功能:微软语音识别系统。正常语速下,它可以出色地工作,但无法进行编程。它可以正常工作于普通Windows应用中,尤其是微软的应用程序,如Office,却无法工作于Emacs中。(编译:陈秋歌/责编:夏梦竹)

原文来自:Xah Emacs Blog

备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘