免费论文
收费论文
发表论文
我要投稿
设为首页 招标网
联系我们
经济学|管理学|法学|计算机|医学|教育|文学|政治|艺术|哲学|更多 经济学|管理学|法律|计算机|医学|教育|文学|政治|艺术|哲学|更多
 论文搜索
  推荐服务: 论文发表 收费论文
期刊论文格式
毕业论文格式
期刊论文范文
毕业论文范文
论文致谢
毕业论文答辩
开题报告
论文选题
英文摘要书写
关于英语语篇结构标注研究综述
作者:陈莉萍  时间:2009/6/17 17:21:00  来源:论文天下论文网
  论文关键词:修辞结构理论 篇章结构 标注
  论文摘要:
语篇结构标注起步较晚,但以修辞结构理论(RST)为指导的篇章修辞结构标注最近取得了令人瞩目的成绩。目前,已经建成并公布的篇章结构标注语料库是由美国南加州大学信息科学学院的一个课题小组完成的,由385篇文章组成,是一个大规模、高质量、高一致性的带多层语言学标注信息的参照篇章语料库。语料库建设的主要成就为:确立了如何将语篇切分为基本语篇单位的理论,扩展了修辞关系集,为RST理论的运用提供了广阔的前景。本文综述该语料库建设的研究成果。
  
  0.概述
  
  随着计算机技术的普及和发展,语料为机器可读成为语料库建设的最基本的要求之一。要达到语料机读化这一目的,关键在于语料的标注。所谓标注,就是对语料库中的原始语料进行加工,把各种表示语言特征的附码标注在相应的语言成分上,以便计算机的识读。
  语料标注的类型主要包括语篇背景信息、词性、词形、句法分析、语义、语篇结构等。从当前的研究现状来看,虽然语篇结构标注起步较晚,但以修辞结构理论(RST)为指导的篇章修辞结构标注最近取得了令人瞩目的成绩。目前,已经建成并已公布的篇章结构标注语料库是由美国南加州大学信息科学学院的一个课题小组完成的,由385篇文章组成,是一个大规模、高质量、高一致性的带多层语言学标注信息的参照篇章语料库。在这基础上研究小组还进行了自动篇章标注算法、自动文摘、机器翻译等具体应用工程方面的研究。
  该参照篇章语料库的建成不但为篇章结构标注建立了理论体系,而且为语篇结构的应用研究开辟了新的领域。本文将综述该参照篇章语料库建设的研究成果。
  
  1.理论支撑的建立
  
  根据Carlson(2001)的介绍,用于话语分析的理论有很多,如Groz和Sidner(1986)Mann和Thompson(1987)等都提出了自己的篇章分析理论,但这些理论主要用于单个的文本分析,往往着眼于语篇的某一个方面,如指代关系、语篇的风格、语篇的多维性以及某一理论在语篇中的体现等,很少被用于大规模的语料分析或语料标注。在建立参照语料库时,Carlson(2001)等研究者将Mann和 Thompson (1987)提出的修辞结构理论(RST)用于大批量的语篇标注和语篇分析。他们认为用修辞结构理论(RST)对语篇进行标注有三点优势:可以同时捕捉到特定文本的交际意图、语义信息和文本本身的特征;先前的研究表明该理论可以使不同的标注者在标注不同的文本时达到一定的统一;用该理论标注的语篇树形图对构建自然语篇生成系统、自动文摘系统、文本测评系统起着关键的作用,也可以用来增强机器翻译的自然性。参照篇章语料库的建成确立了篇章结构标注的理论基础。
  
  2.基本语篇单位的确定
  
  语篇结构标注的另一成就是确定了英语基本语篇单位。在确定基本语篇单位时,不同的研究者往往运用不同的理论。Givon(1983)认为从句应该成为语篇的基本单位,Sacks(1974)认为谈话的话轮应该成为语篇的基本单位,Polanyi(1988)坚持语篇应该以自然句为切分单位,Grosz 和Sindner(1986)认为语篇的基本单位应该从语篇的上下文中获取,它是由一定的符号所反映的信息载体,能反映事物的单个状态或部分状态,最有影响的修辞结构理论认为从句应该是语篇的基本单位,不管从句有没有语法标记或词汇标记。
  然而,在具体标注时,Marcu等研究者对基本语篇单位有了新的规定:所有有词汇或句法标记的起状语作用的从句都属于基本语篇单位,包括起状语作用的非谓语动词词组;充当主语、宾语、补语的从句不属于基本语篇单位;定语从句、后置的名词修饰短语或将其他基本语篇单位割裂开的从句或非谓语动词短语为内置语篇单位;除此而外,还有一定数量的有明显语篇标记的短语作为基本语篇单位,如 由in spite of(尽管),according to(根据)等引导的短语。
  Marcu的切分方法综合了Grosz和Sindner(1986)和Mann(1987)和Thompson(1987)的理论,在确定基本语篇单位时考虑到词汇、句法、语义和在句中的位置等因素。
  
  3.修辞关系的扩展
  
  当初,Mann和Thompson(1987)提出修辞结构理论时只给出20多种修辞关系,但他们明确指出这是一个开放关系集,既然是开放性的,就意味着读者在给定话语的内部可以定义出其他的关系类型。Marcu(2000)根据标注的语料库总结出53种单层核心关系和25种多层核心关系,78种定义关系又分成16个组别,每组都具有相同的修辞功能。
  就如同当初的定义关系集一样,这些关系覆盖了基本语篇单位、语段乃至整个语篇。通过这些关系,不同层级的语言片段被连接起来,构成一定的抽象形式。
  
  4.标注标准和方法的制定
  
  为了建立高质量的前后一致的标注标准和方法,Carlson(2001)等研究者采用人工标注的方法。他们所选用的标注者都是有过标注经历的、从事语篇分析和新闻报道的专业人员。在正式标注之前,他们都接受专门的语篇结构标注培训,培训包括3个阶段。
  在第一阶段,向标注者介绍修辞结构理论和语篇分析工具。在培训的第二阶段,标注者开始探索语篇结构的特征。在培训的最后一个阶段,标注小组谋求在构建语篇总结构图时保持一致,尽量减少分歧。
  最终,标注小组研制出两个基本策略用于文献分析并建立相关的语篇结构图。策略之一是对文本的直接分析,可以在页边空白处标出记号,也可以将文献切分成一定的语段并标出记号,根据这些标注建立语篇结构图。以这种方式建立树型结构图,标注者必须预测到随后的语篇结构。然而,其后语段的修辞关系,尤其是较大的语段,可能不是太明显,这就是为什么这一标注策略更适用于短篇文献的标注。
  另一策略是将文本分析与建立语篇结构两项任务同时进行,很可能是成块地标注而不是循序渐进地一步一步地增加。以这种策略进行标注,标注者一次可以切分很多语篇单位,并为每个自然句建立结构图,然后将相邻的自然句连接起来,构成较大的语段结构树。最终的语篇结构树是通过连接语篇结构中主要语块而建成的。

[1] [2]  下一页

 3000万硕士、博士、期刊论文全文下载  论文发表:快速、低价、优质
提供60万硕士论文、10万博士论文、2700万期刊论文全文下载服务,助您一臂之力! 十年的论文发表经验,快捷的论文发表服务,保证所发表的杂志均为正规合法的期刊,收费同行最低!
[本文关键字] 修辞结构理论 篇章结构 标注
[版权说明]《关于英语语篇结构标注研究综述》论文版权属于作者本人,您可以参考本论文进行论文创作,但不得抄袭、复制!本站免费论文主要来源于用户投稿(投稿网址),如果涉及到侵权问题,请联系lunwentianxia_card@163.com删除。
  推荐期刊投稿
·城市质量监督
·重庆城市管理职业学院学报
·河南工业大学学报(社会科学版)
·新重庆
·中国电力教育
·当代医学
·渤海大学学报(自然科学版)
·世界产品与技术
·生物学杂志
·Journal of Elect
 
·中国统一战线
·秘书
·人民调解
·东北财经大学学报
·青海交通科技
·江汉论坛
·骏马
·中国司法鉴定
·中学生读写(考试)
·家庭教育(中小学生家长)
 
·中国公共卫生
·电机与控制学报
·新疆工学院学报
·腐植酸
·河南理工大学学报(自然科学版)
·物探与化探
·中国老年保健医学
·设计艺术(山东工艺美术学院学报)
·税收征纳
·兽药与饲料添加剂
   免费论文
公共管理 | 法学 | 理学 | 医药学
政治 | 社会学 | 文学 | 艺术 | 哲学
工学 | 计算机 | 文化 | 英语论文
经济学 | 财政 税收 | 证券金融
管理学 | 会计审计 | 工商管理 | 教育
财务管理 | 论文写作指导 | 应用文
   收费论文
马列毛邓 | 哲学宗教 | 社会科学
政治法律 | 军 事 | 经 济
文化科学教育体育 | 语言文字
文学 | 艺术 | 历史地理 | 自然科学
数理化 | 天文 | 生物科学 | 医药卫生
农业科学 | 工业技术 | 交通运输
航空航天 | 环境安全
   浏览历史

联系论文网 | 收费论文 | 发表论文 | 论文翻译 | 友情链接 | 全部分类 | 网站地图 | 期刊导航
版权所有 2008-2018 论文天下 www.lunwentianxia.com 京ICP备08104503号
.4038086