论文天下|会计论文|管理论文|计算机论文|医药学论文|经济学论文|法学论文|社会学论文|文学论文|教育论文|理科论文|工科论文|艺术论文|哲学论文|文化论文|外语论文|格式论文
论文天下
计算机应用论文  计算机理论论文  计算机网络论文  电子商务论文  软件工程论文  操作系统论文  通信技术论文   
基于Web检索的陕北民歌语料库设计

 摘 要:运用语料库语言学的基本观点,探讨陕北民歌语料库构建原则及eb管理系统的设计实现设计了陕北民歌aess语料数据库,其中包含全文语料数据表、句子语料数据表、陕北民歌词表数据表共3个。介绍语料库的在线检索和管理功能,提出字词频统计功能和eb在线检索功能实现的方法,开发基于asp的陕北民歌开放性语料库eb管理系统,用户可以方便地通过ie浏览器进行语料检索、词频统计、语料提取等操作。关键词:语料库; 陕北民歌; 频度统计; eb检索
  中图分类号:tn911-34; tp311 文献标识码:a
  文章编号:1004-373x(2010)22-0038-02
  
  design f flk sng rpus based n eb retrieval
  zhang tng-xuan
   (anageent ffie f suth apus, einan teaher university, einan 714000, hina)
  abstrat: the struturing priniple f flk sng rpus f eb anageent syste is investigated ith the basi features f rpus linguistis. the aess rpus database f flk sngs f nrthern shaanxi prvine is reated, in hih the full-text rpus fr, the sentene rpus fr and the lyri rpus fr are ntained. the nline retrieval and anageent funtins f the rpus are intrdued. the ipleentatin ethd f the rd frequeny statistis funtin and eb nline retrieval funtin is prpsed. the eb anageent syste f the flk sng rpus based n the asp is develped. as a result, users an arry ut the nline retrieval, rd frequeny statistis and rpus extratin thrugh ie brser.keyrds: rpus; flk sng f nrthern shaanxi prvine; frequeny statistis; eb searh
  收稿日期:2010-06-28
  基金项目:渭南师范学院2010专项基金资助项目(10ykz055)
  
  语料库作为基础研究是近年来应用语言学研究的一个重要发展。建立陕北民歌语料库是一个浩大工程,也是陕北民歌研究取得新突破的基础工程。陕北民歌是特定的时代、特定地理环境中的特定产物,是陕北劳动人民抒发感情的最好手段。陕北民歌研究始于20世纪初,到20世纪80年代中后期,在各个方面的研究都取得了不少成绩[1]。不过,传统研究往往着眼于作品的人文及艺术特征,研究者多半依靠自身良好的文化修养与“强闻博记”,凭感悟直接把握作品的内涵,对作品的语言全貌进行横向或纵向的细密分析时,往往显得力不从心[2]。20世纪80年代以来,随着计算机应用技术的不断发展,以语料库为基础的研究在语言学和计算机科学研究中都取得了丰硕的成果。无论是在语言学研究,还是在自然语言处理领域,语料库都已经成为重要的基础资源,发挥了越来越重要的作用。
  1 陕北民歌语料库设计
  1.1 陕北民歌语料库建设原则
  语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语样本汇集而成,用来代表特定语言或语言变体。通过语料库可以观察和把握语言事实,分析和研究语言系统规律。语料库已经成为语言学理论研究和语言工程不可缺少的基础资源,对它的研究已发展成为一个跨世纪、跨学科的语言研究学科。
  陕北民歌语料库是“专用性语料库”(speialized rpus),是为陕北民歌研究服务的。在语料样本的选择上,力求反映陕北民歌语言的真实面貌,以采集到的民歌原始文本作为样本。单个语料样本的大小是由原始文本的篇幅决定的,篇幅较小的原始样本单独成篇,作为一个样本,篇幅较大的(如陕北说书、陕北道情等)则切分成大小相当的片断,每个片断作为一个样本。这样的语料样本提供的上下文语境更为广泛,更加适合进行语篇研究。在语料的代表性上,一是保持口语语料与书面语料的平衡,如实反映陕北民歌的基本面貌,语料库以民间采集的口语文本为主,同时兼顾各种已经汇编出版的陕北民歌著作;二是保持方言语料与普通话语料的平衡,以采集当地原生态民歌(特别是采集年龄大、没有接受过文化教育的老年人唱的土歌)为主,适当采集一些专业歌手的新陕北民歌。

未完...点击下方链接下载完整文档

基于Web检索的陕北民歌语料库设计

摘 要:运用语料库语言学的基本观点,探讨陕北民歌语料库构建原则及eb管理系统的设计实现设计了陕北民歌aess语料数据库,其中包含全文语料数据表、句子语料数据表、陕北民歌词表数据表共3个。介绍语料库的在线检索和管理功能,提出字词频统计功能和eb在线检索功
  • 上一篇:基于直接提取载波技术的平方环设计
  • 下一篇:高速公路机电设备管理系统的研究设计
  • 计算机病毒及防范措施
    加强基层国库业务系统应急机制建
    基于条码技术的库存管理系统设计
    关于电子技术应用专业课改的设想
    高速公路机电设备管理系统的研究
    运用PowerShell计算行×列表χ2
    电子报刊版面设计浅谈
    基于SOA的实验教学管理原型系统
    基于PDM技术的AGC电路设计
    煤矿无人工作面中视频监控系统的
    关于任务驱动式教学方式在计算机
    基于Delphi开发平台的分布
    基于LabVIEW可视化数据采集处理
    计算机在儿童保健系统管理中的作
    基于多智能体的用户偏好系统研究
    浅谈基于ARM7处理器LPC2119的U
    基于数学形态学的心电信号R波
    浅谈基于GIS的通信指挥网上训
    浅析基于IWT和FCM的曲线矢量数
    略论一种基于负载均衡异构分布
    浅谈基于Simulink的自动控制系
    浅析一种基于前缀节点的频繁子
    略一种基于混沌搜索的文化算法
    浅析基于隐马尔可夫模型的热路
    浅谈基于NCC的图像匹配快速算
    | 设为首页 | 加入收藏 | 联系我们 | 论文发表

    Copyright 2006-2020 © 论文天下 All rights reserved 本站所有内容均由SPider自动索引,如有侵权请联系QQ:2486851删除