关于印发《福建语言资源有声数据库建设工作规范(试行)》和《福建语言资源有声数据库建设调查工作技术规范(试行)》的通知

11.06.2014  09:36

各市、县(区)教育局、语委,有关高校:

  2013年7月我省启动了福建语言资源有声数据库建设试点,该数据库是中国语言资源有声数据库的组成部分,按照国家统一的标准,采集我省方言和带有地方文化特点的有声语料,并进行整理加工,永久保存。由福建师大、泉州师院、闽南师大调查团队分别在福清、南安、龙海市开展的试点工作于2014年5月顺利通过了国家语委的验收。按照建设规划,我省将用五年时间完成79个调查点(原则上“一县一点”)的语言调查和数据采集工作,到2018年全面建成该数据库。福建语言资源有声数据库建设是一项重要的文化工程,是我省贯彻落实党中央关于 “建设优秀传统文化传承体系,弘扬中华优秀传统文化”、“科学保护各民族语言文字”战略部署的重要举措,它对保存我省的方言和地方文化,促进闽台语言文化交流具有特殊意义。我委已将此作为贯彻落实《国家中长期语言文字事业改革和发展规划纲要(2012-2020年)》的一项重要工作。

  今年我省将全面开展有声数据库建设工作,为了提高建设工作的规范性和科学性,稳步推进此项工作,我委在总结试点工作经验的基础上,制定了《福建语言资源有声数据库建设工作规范(试行)》和《福建语言资源有声数据库建设调查工作技术规范(试行)》,现印发各地和有关高校,请遵照执行。福建语言资源有声数据库建设具有周期性长,专业性强的特点,希望市、县(区)语委和有关高校按照省语委的工作部署,明确职责分工,密切配合,严格执行工作规范和调查技术规范,按时、高质量地完成福建语言资源有声数据库的建设任务。

  福建省语言文字工作委员会

  2014年6月9日

福建语言资源有声数据库建设工作规范

(试行)

  第一章  总则

  第一条  为了加强福建语言资源有声数据库建设工作的管理,明确职责分工,实现有声数据库建设的科学化、规范化和实用性,确保按时完成建设任务,根据《中国语言资源有声数据库建设工作规范(试行)》,特制定本规范。

  第二条  福建省语言文字工作委员会(以下简称“省语委”)是有声数据库建设的主管部门。

  第三条  福建语言资源有声数据库建设将在国家语委的领导下,按照全国统一的标准,以省语委制定规划,地方语委配合,高校调查团队具体实施的方式进行。

  第四条  福建语言资源有声数据库建设调查资料的知识产权属国家语委、省语委和参加调查的高校所共有。

  第二章  组织机构

  第五条  省语委成立福建语言资源有声数据库建设领导小组(以下简称“领导小组”),负责统筹规划有声数据库的建设工作。领导小组办公室设在省语委办公室。设区市、县(市、区)语委也可成立相应机构,根据省里的统一部署,具体组织实施本地区的有声数据库建设。

  第三章  职责分工

  第六条  领导小组全面负责我省语言资源有声数据库的建设工作,具体负责以下工作:

  (一)制定工作规划,下达科研项目,落实专项经费。

  (二)组建高校调查团队参加我省语言资源有声数据库建设。

  (三)聘请有关专家,对方言调查及数据库建设进行专业指导和人员培训。

  (四)对调查工作进行检查监督,对调查成果进行预验收,按规定将调查资料上报国家语委。

  (五)遴选我省自选语料库建设单位,调查、收集我省口头文化,将来扩建成福建语言文化资源有声数据库。

  第七条  设区市语委负责工作部署和宣传发动,指导所辖县(市、区)语委做好有声数据库建设工作。县(市、区)语委负责公布发音人条件,向社会公开征招发音人,提供录音录像场所,为高校调查团队提供必要的工作条件。

  第八条  高校调查团队在地方语委的协助下,负责遴选、培训发音人,开展方言调查,采集语言数据和整理调查资料等工作,最后确保通过国家语委验收。

  第四章  经费分担

  第九条  省语委承担有声数据库的建设规划、人员培训、资料验收,以及高校调查团队的工作、设备等所需费用,并对承担调查任务的县(市、区)语委予以适当的经费补助。

  第十条  有关县(市、区)语委承担社会宣传、发音人征招、录音录像场所租(借)用,以及会务、接待等费用。

  第十一条  由高校调查团队支付发音人劳务费。

  第五章  工作流程

  第十二条  福建语言资源有声数据库建设工作按照下列流程进行:

  (一)领导小组办公室制定有声数据库建设规划,组建高校调查团队,开展业务培训,部署下达工作任务。

  (二)领导小组办公室印发福建语言资源有声数据库建设工作规范和调查工作技术规范,指导、监督各个调查点的工作。

  (三)县(市、区)语委发布征招发音人的广告,征招发音人供调查团队遴选,提供录音录像场所,并制作“中国语言资源有声数据库 福建省××县调查点”字样的背板。

  (四)调查团队在地方语委的支持和配合下,遴选、培训发音人,确定录音录像场地。

  (五)县(市、区)语委对发音人进行有关保护方言和地方文化的教育,调查团队对发音人进行调查内容、相关要求的培训。

  (六)调查团队按照《中国语言资源有声数据库调查手册》要求,开展纸本调查表记录、音系整理、录音、摄像等工作。

  领导小组办公室对调查团队的纸本调查表记录、音系整理等工作进行检查,符合要求者方可开展录音、摄像。

  (七)调查团队按照《中国语言资源有声数据库调查手册》的要求,在完成调查和语言数据采集后开展调查资料整理、模板表填写、校对、核实、补查等工作,并在规定时间内将整理、校对无误的全部资料交领导小组办公室。

  (八)领导小组办公室组织专家对调查团队上交的资料进行预验收,预验收合格后上报送国家语委验收。

  (九)国家语委选派专家对各调查点资料进行验收,不合格者必须返工,所产生的场地、人员等相关费用由调查团队承担。

  (十)省语委向完成任务的方言和地方普通话发音人颁发证书。

  (十一)省语委向中国语言资源有声数据库建设领导小组办公室报送福建省的调查资料。

  (十二)省语委会同地方语委做好福建自选语料的收集采录工作。

  (十三)领导小组办公室负责全省各调查点资料入库和建库等工作。

  第六章  附则

  第十三条  本规范由福建语言资源有声数据库建设领导小组办公室负责解释。

  第十四条  本规范自发布之日起执行。

  福建语言资源有声数据库建设调查工作技术规范

  (试行)

  第一章  总则

  第一条  为规范福建语言资源有声数据库建设的调查工作,实现有声数据库建设的科学化、规范化和实用性,保证福建语言资源数据库建设的调查工作顺利实施,特制定本规范。

  第二条  本规范依据《中国语言资源有声数据库调查手册》(以下简称《调查手册》)制定。

  第三条  本规范适用于福建语言资源有声数据库建设的调查工作全过程,我省高校调查团队须严格执行,不得擅自更改。

  第二章  调查规范

  第四条  调查地点按照“一县一点”的原则设立,一律以县城为调查点。一县内存在两种区属不同且分布较广的方言,或从清代至今曾经属于两个县,但现在合并为一个县的,可以分设两个点,其中非县城调查点应选择在当地影响较大的地点。所有市辖区或县城城区一般视为一个点,郊区或郊区县可以各视为独立的调查点。

  第五条  每个调查点需要7名调查对象,其中4名方言发音人,3名地方普通话发音人。方言老男和方言青男的年龄差距不得小于25岁,方言老女和方言青女亦同。方言发音人必须在当地出生和长大,且父母、配偶均为当地人,声音清晰洪亮,反应较敏捷。地方普通话发音人的普通话水平依次为“地普1”相当于三甲,“地普2”相当于三乙,“地普3”接近方言。

  方言发音人和地方普通话发音人可以交叉,一人可兼两职。调查对象的名称、性别、出生年限及其调查内容必须依照《调查手册》“表1”执行。

  第六条  调查内容共有6个部分,须依照《调查手册》执行,不允许有任何增删。方言老男的调查内容包括概况、语音、词汇、语法、话语共5个部分;方言青男的调查内容包括概况、语音、话语共3个部分;方言老女、方言青女的调查内容包括概况、话语共2个部分;地普1、地普2、地普3的调查内容包括概况、地普共2个部分。

  第七条  调查中要注意的事项:

  (一)调查开始前,调查团队全体成员要认真学习《调查手册》,参加有关培训,并事先拟出调查计划。

  (二)各调查团队应该在设区市、县(市、区)语委统筹安排下,遴选发音人,确定录音摄像场地。

  (三)在遴选、培训发音人过程中,地方普通话发音人的遴选要防止选出完全使用方言或普通话等级过高的人员,地普发音人可以参加方言发音人的集体备课。

  (四)录音前,方言发音人要集中培训10天左右,可在当地找1名文化程度较高,熟悉方言的人协助培训。正式采录前,应进行规定故事、自选话题、多人对话的模拟预演。

  (五)每个调查团队必须按照规定的时间完成全部的方言调查和采录工作,并将所有音像资料刻盘报送省语委办预验收,检查不合格的须重新组织录音和摄像。

  (六)每个调查团队所采集的语料经过国家语委验收合格,才算完成该调查点的工作任务。

  第八条  调查方法除要符合《调查手册》的要求外,还要注意以下事项:

  (一)发音人可以由县(市、区)语委推荐,也可以面向社会公开招募。但必须符合各项条件,不能放宽或调整。

  (二)调查时,拍摄现场要有“中国语言资源有声数据库 福建省××县调查点”字样的背板。

  (三)开展调查工作要分三步进行,先赴调查点做好纸本调查表的记录工作;将纸本调查表送熟悉该方言的权威专家审查;审查合格后方可开展录音录像工作。

  (四)每一个调查点都要由一个团队去负责调查。每个团队须安排1-2名熟悉调查技术规范的方言专家,1名普通话水平测试员,1名录音录像的技术人员,其他成员视调查需要确定。

  第九条  录音除需要符合《调查手册》的要求外,还要注意以下事项:

  (一)录音录像的环境要光线明亮,隔音效果好,没有外界杂音干扰,室内底噪小于36分贝,场地大小适合3-5人对话需要,杜绝回声现象,避免衣服、纸笔、杯盘等产生噪音,建议借用当地电视台的录音录像场所。

  (二)录音前要做好现场设备的位置安排,并严格按照工作程序进行设备组装。组装时,除关键技术人员之外,其他人员一律不得进入现场。

  (三)采录时,工作人员要密切关注发音人的现场状态,避免发音人消极发音、离题讨论、消极暗示、以读带说等现象发生。尽量同时采录多份样本,一般每个音需采录3个样本。可以两套设备同时录,避免返工。

  (四)每次采录可以分为多个阶段进行,每个阶段结束时,技术人员要当场查验音档文件,并做好场记工作,及时发现问题并解决问题。

  (五)采录数据和设备务必由专人随身携带,尤其是硬盘和话筒,并注意设备的随时维护。

  (六)录音文件的归档和命名按照《调查手册》“表8”和“表9”执行。

  第十条  摄像包括4位方言发音人的全部“话语”内容,并且要与录音同步进行。摄像器材、要求及视频文件的编辑整理依照《调查手册》有关规定执行。视频文件的归档和命名按照《调查手册》“表8”和“表11”执行。

  照相内容包括每一位发音人、调查工作场景以及具有地方特色的事物和现象。相片数目不限,所使用的数码相机型号不限。照片文件的命名和归档按照《调查手册》“表8”和“表12”执行。

  第十一条  记音工作一般要在调查录音工作结束后1个月内完成。记音采用国际音标,一律使用IpaPanNew国际音标字体。记音的格式、要求等严格按照《调查手册》规定执行。

  第十二条  调查用字一律使用现行规范汉字,方言用字要使用本字。同一个语素要使用同一个字形。同源不同形的方言用字,要统一为一种写法,应首选在方言中使用范围相对广泛的字形。本字、俗字、训读字、表音字、同音字、合音字、有音无字的调查用字以及字体、格式一律严格按照《调查手册》规定执行。

  第十三条  资料整理要在每个调查点的记录和录音工作全部结束之后进行。包括填写模板表、校对和文件归档,一律严格按照《调查手册》执行,周期约1个月,最后要上交全部资料的电子文本,上交文件按照《调查手册》“表7”执行。

  第三章  调查表

  第十四条  调查表中所有字词句前面的四位阿拉伯数字编码全国统一,不得改变。

  第十五条  每个“调查点”的概况只记录一遍,一律填写方言老男的信息。“方言老男”、“方言青男”、“方言老女”、“方言青女”和“地普1”、“地普2”、“地普3”依照各发音人真实情况填写。

  第十六条  “单字”、“词汇”中标有小字的,须在小字限定条件下进行调查和记录,不要修改或增删。小字中“注意声”是提示该字声母可能有特殊读音,“注意韵”是提示该字韵母可能有特殊读音,“注意调”是提示该字声调可能有特殊读音,“注意声调”是提示该字声母和声调可能有特殊读音。

  调查前,要将“单字”和“词汇”提前交给各方言发音人,以方便他们逐字、逐词地一一做好发音准备,按照“原汁原味”的说法,读出地道的方言口语发音。准备时,每位方言发音人可以采用自己明白的方式在《调查手册》相应位置上做出记录和提示。

  “词汇”中的一些避讳词语需要发音人的理解和配合,并按照规定要求发音。

  第十七条  调查“语法”时,要方言老男根据例句内容提供方言里的各种说法,优先选择方言中可说又与例句意义和用法相当、结构相同或相近的用例。要注意记出“一句多说”现象,并按照常用性和自然度递减的顺序依次记录各种说法。

  第十八条  “讲述”中的规定故事不是朗读,是发音人按照自己的理解,根据自己方言的说法讲故事,正式开讲之前不要温习或背诵。

  自选话题数目不限,应优先选择《调查手册》中的第1—5个话题。

  规定故事和自选话题总时长需达到20分钟或以上。

  第十九条  “对话”需要4位方言发音人共同进行,从《调查手册》“伍 话语”的自选话题第3—10里选择若干话题,围绕选定的话题进行对话和讨论,总时长要达到40分钟或以上。

  第二十条  地方普通话的“朗读”文章可以提前交给发音人,让地普发音人熟悉一下内容,但不允许查字典,有疑难问题可以讨论。

  第四章  附则

  第二十一条  本规范由福建语言资源有声数据库建设领导小组办公室负责解释。

  第二十二条  本规范自发布之日起执行。