说三道四技术文摘-感悟人生的经典句子
说三道四 > 文档快照

从 BabelCode 到 LingoX: 复旦学生一个关于外语辅助写作的发明

编辑:说三道四文库 发布时间:2018-08-19 08:00
HTML文档下载 WORD文档下载 PDF文档下载
从 BabelCode 到 LingoX: 复旦学生一个关于外语辅助写作的发明


Visual Studio 的启示

会玩点编程的读者对集成开发环境 (IDE,如 Visual Studio) 中一个叫“智能感知”(IntelliSense) 的功能一定不会感到陌生:只要输入一个函数名外加一个左括号,系统就会在光标处提示你这个函数的参数表。这么一个看似再自然不过的东西,有什么说头的呢?

复旦大学计算机系二年级生姚子渊对受限语言 (controlled language) 写作与翻译领域一年多的研究后,终于由于设计方案未能达到起初期望的易用性水准而放弃了所谓的 BabelCode 计划。然而一年来对计算语言学的学习并没有白费,他为研究过程中得到的几个原创思想找到了应用的舞台,于今年 9 月构造出一个可以帮助人们更好地学习和使用外语的发明——LingoX。

简单的说,当用户在 Windows 的任何地方输入外语,LingoX 能自动截取键盘输入,并在当前光标下面显示一个提示窗口,告诉用户他最后输入的单词/短语的“用法公式”。例如,用户输入:I am searching,则提示:

  v. search [n. 搜索地点] [for n. 搜索目标]
  n. search [for n. 搜索目标]  // 这一行可以去掉,因为 searching 的原形不可能是名词

是不是跟编程环境里的“函数参数表提示”功能很类似?事实上,程序语言和自然语言(特别是欧洲语言)有很多相似之处:“中心词”如 "v. search" 相当于计算机程序中的一个“函数”;中心词后跟的各项必要或可选的部分(宾语,间接宾语,介词短语,非限定动词,等等)相当于函数的“参数”;每个部分都注明其“句法要求”(如 n.)、“语义要求”(如“搜索地点”)甚至“词态学要求”(如 adj. dedicated [to doing sth.] 就告诉了用户不要用 dedicated to do sth. 这种实际上(语用角度上)不合法的用法),这就相当于编程语言中每个函数参数都要声明其“数据类型”和“形式参数名”。


进一步讨论

有了这样一个即时提示的东西,最明显的是,你不会再用错一个介词搭配了(英语几乎每个动词、名词、形容词等都有自己习惯性的常用介词短语,以往只能通过记忆来掌握,没有逻辑规律可言),不会再混淆及物动词和非及物动词,也不会再把一个词写到一个语义上“不兼容”的位置。例如很多人对 search 这个动词的理解停留在“意思上跟 find 差不多”的印象上,又如果仅仅知道它是“及物动词”,就往往轻易写出“search 某遗失物”这样的错误用法。如果他即时得知 search 作为及物动词时宾语的语义角色应该是“搜索地点”而非“被搜索物”,这样的“逻辑错误”就可以避免(如 search him 应该是“搜他的身”而非“找他”)。英语作为一种形式主义比较强的语言,要求书写的每一个部分都在句法、语义、词态学乃至语用上都跟“惯例要求”兼容才算地道。这就好像在编程语言里,你要向一个函数传递各参数,你的参数必须在数据类型和逻辑(语义,由形式参数名体现)上都符合函数声明的要求。编译器可以找出数据类型兼容性上的错误,但对类型兼容但逻辑错误的地方无能为力(例如 memcpy() 这个内存拷贝函数的前两个参数类型都是 void*,但分别表示“目标地址”和“源地址”,如果把两个变量调换顺序传给它们必然会带来逻辑错误);类似地,传统的语法检查程序(例如 MS Word 的那个)可以找出浅层次的句法错误(如主谓第三人称单数的一致性),但不敢武断地指出“你的介词选错了”,更不可能告诉你“search him 应该改成 search for him”,因为两者都是句法、语义上正确的用法,计算机并不知道实际语境中作者想表达的是哪种。再如“dedicated to do sth.”这个用法,仅从句法上计算机并不能否定它的合法性,但实际上按惯例 99% 可能是错的,但计算机即使知道这个惯例规则,也不敢确定你是不是因为“艺术的需要”“创造性地这么使用”。而 LingoX 以先发制人的提示手段,把这些以往拼写检查程序很难或不敢判断出的错误在产生以前就避免了。

除了提示“用法公式”,“近义词比较”、“例句”等信息服务也可以纳入提示信息的范围。这些不是创新的核心,在此不予展开。

对英语学习者来说,掌握一个够用的词汇量本身已经是个不小的工作,而学习这些孤立的单词如何与上下文协作共同完成语言表达的作用,则更是需要一定量的阅读,“从句子中总结/提取用法”;然而人们往往不愿意经常到辞典中琢磨一个单词的例句,也不一定能从例句中明确、完整的感应出“用法公式”,以至于可能宁愿自己“发明”不正确的用法,久而久之竟不以为然。作者认为 LingoX 的诞生可以很大的解决后面这个问题。


适用对象、经济意义与社会影响

LingoX 的目标用户群自然是大中小学生和实际工作中与英语打交道的人(留学生和外贸公司业务员)。对学生而言,教师应该鼓励他们用英语写周记(作者本人就从初中时代的英语周记写作中获益不浅),培养一种常常想把自己想到、看到的话翻译成英语的意识,这样对阅读理解自然也有相辅相成的效果;由于 LingoX 能让学生充分享受到一个新词的使用价值并展示了一门外语行文的“机械之美”,自然鼓励了学生探索更多新词、操练更多写作的积极性和成就感;互联网的普及更是带来了一个活学活用英语、拥抱先进文化的环境。对于工作经验不足的外贸公司业务员而言,需要的是如何快速切入实际英语读写工作。在经济全球化时代,一个企业的英语沟通水平(电子邮件等书面表达是否地道)直接影响企业形象和竞争力。“为全世界的英语生产力提供动力 (Powering the World's English Productivity)”应该成为我们的口号。


全世界都在学英语用英语。美国人却在学西班牙语

LingoX 对西班牙语 (及其它欧洲语言) 同样适用。美国有 13% 人口是西班牙裔,是宝贵的消费者群体和社会群体,因此学会西班牙语越来越成为美国学生(尤其是加州、纽约州和与墨西哥接壤的德州)以后找工作的必要条件。另外由于美国、加拿大、墨西哥签订了美洲自由贸易协定,导致越来越多墨西哥人进入美国工作生活,这也助长了 13% 继续上升的趋势。因此,LingoX 在美国也有巨大的市场。


开发进度

目前程序正在开发中(数据采集不是大问题),将在不久以后发布在 www.lingox.com 和其它地方。

“当你建造了空中楼阁,你的努力没有白费,那本来就是它应该处在的地方。现在只要给它补上基础就行了!” —— Henry David Thoreau (1817-1862)
good ,接分
不错的创意!
顶顶 。绝对偶像。我也大二怎么不行
备案号:鲁ICP备13029499号-2 说三道四 www.s3d4.cn 说三道四技术文摘