標準解讀
《GB/T 36472-2018 信息處理用藏語短語分類與標記規(guī)范》是一項國家標準,旨在為藏語文本的信息處理提供一套統(tǒng)一的短語分類和標記方法。該標準適用于藏文自然語言處理、機器翻譯、信息檢索等多個領(lǐng)域,通過定義一系列術(shù)語和規(guī)則來增強不同系統(tǒng)之間的互操作性。
根據(jù)標準內(nèi)容,它首先界定了“短語”的概念,并將其按照功能劃分為名詞性短語、動詞性短語等不同類型。每種類型的短語都有其特定的結(jié)構(gòu)特征及組成部分說明。此外,《GB/T 36472-2018》還詳細規(guī)定了如何對這些短語進行標注,包括但不限于使用何種符號作為分隔符、如何表示層次關(guān)系等技術(shù)細節(jié)。對于特殊情況下可能出現(xiàn)的問題,如歧義性表達或非典型結(jié)構(gòu),則提供了相應(yīng)的解決方案或建議處理方式。
如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標準文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2018-06-07 頒布
- 2019-01-01 實施





文檔簡介
ICS3524001
L70..
中華人民共和國國家標準
GB/T36472—2018
信息處理用藏語短語分類與標記規(guī)范
SpecificationonTibetanphraseclassificationandtagging
forinformationprocessing
2018-06-07發(fā)布2019-01-01實施
國家市場監(jiān)督管理總局發(fā)布
中國國家標準化管理委員會
GB/T36472—2018
目次
前言
…………………………Ⅰ
引言
…………………………Ⅱ
范圍
1………………………1
術(shù)語和定義
2………………1
總則
3………………………1
短語類別的劃分及標記代碼
4……………1
附錄規(guī)范性附錄信息處理用藏語短語分類及標記代碼表
A()………7
參考文獻
……………………11
GB/T36472—2018
前言
本標準按照給出的規(guī)則起草
GB/T1.1—2009。
請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機構(gòu)不承擔(dān)識別這些專利的責(zé)任
。。
本標準由全國信息技術(shù)標準化技術(shù)委員會提出并歸口
(SAC/TC28)。
本標準起草單位中國電子技術(shù)標準化研究院青海師范大學(xué)西藏自治區(qū)藏語文工作委員會辦公
:、、
室中國藏學(xué)研究中心青海民族大學(xué)西藏大學(xué)中國科學(xué)院軟件研究所西北民族大學(xué)
、、、、、。
本標準主要起草人才讓加吉太加熊濤華卻才讓扎洛才藏太才智杰頭旦才讓周毛先
:、、、、、、、、。
Ⅰ
GB/T36472—2018
引言
本標準依據(jù)藏語傳統(tǒng)語法分類體系根據(jù)藏語信息處理的特點和要求按照語法功能和便于計算機
,,
自動分析和處理的原則劃分藏語短語詞類并規(guī)定了藏語短語標記代碼
,。
Ⅱ
GB/T36472—2018
信息處理用藏語短語分類與標記規(guī)范
1范圍
本標準規(guī)定了信息處理中藏語短語的類別劃分和標記代碼
。
本標準適用于藏文信息處理各領(lǐng)域其他行業(yè)和有關(guān)學(xué)科可參照使用
,。
2術(shù)語和定義
下列術(shù)語和定義適用于本文件
。
21
.
藏文信息處理TibetanInformationProcessingTIP
;
用計算機對藏文的音形義等信息進行處理
、、。
22
.
短語類別phrasecategories
短語的語法分類主要是根據(jù)語法功能劃分出來的類
,。
23
.
標記tag
對文本中短語類別進行標注的代碼
。
3總則
31短語的基本范圍
.
本標準的類別特指信息處理用藏語短語類別如名詞性短語動詞性短語形容詞性短
,(NP)、(VP)、
語等
(AP)。
32短語類別劃分的原則
.
本標準針對藏語信息處理的特點和要求依據(jù)藏語傳統(tǒng)語法分類體系并參考漢語短語分類研究成
,,
果見參考文獻確定了藏文短語類別劃分原則短語大類之間不應(yīng)出現(xiàn)交叉包括標注形式層和語義
(),。,
層小類間允許出現(xiàn)標注形式層交叉但不應(yīng)出現(xiàn)語義層的交叉
;,。
33標記代碼的制定原則
.
依據(jù)國際通常做法標記代碼主要采用英文術(shù)語的字母例如名詞短語采用數(shù)詞采
,。,“”,NP;“”,
用作為標記代碼藏語獨有的或使用英文術(shù)語字母標記不便的依據(jù)國內(nèi)通常做法標記代碼采
MP。,,,
用漢語拼音字母如判斷性短語采用漢語拼音的首字母作為標記代碼
。,“”,PP。
4短語類別的劃分及標記代碼
41短語類別的劃分
.
本標準將藏語短語劃分為名詞性
溫馨提示
- 1. 本站所提供的標準文本僅供個人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
- 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
- 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。
最新文檔
- 先進工業(yè)設(shè)備融資租賃與生產(chǎn)線智能化升級合同
- 智能港口集裝箱無人集卡租賃與智能化運輸管理協(xié)議
- 綠色建筑補貼資金審計與合規(guī)合同
- 股票賬戶資產(chǎn)分配與新材料研發(fā)投資合作協(xié)議
- 旅行社與景區(qū)聯(lián)合打造國際旅游品牌合同
- 多學(xué)科生物實驗動物倫理審查合作協(xié)議
- 環(huán)保型工業(yè)廢氣處理設(shè)施設(shè)計、施工及運營合同
- 硼硅玻璃管制瓶在疫苗生產(chǎn)環(huán)節(jié)的定制設(shè)計與生產(chǎn)合同
- 拼多多果園果品電商平臺用戶增長與留存策略合同
- DB42-T 2037.2-2023 梨形環(huán)棱螺養(yǎng)殖技術(shù)規(guī)程 第2部分:稻田養(yǎng)殖
- 2025年中國電子產(chǎn)品租賃行業(yè)市場占有率及投資前景預(yù)測分析報告
- 2025年中國亮白防蛀固齒牙膏市場調(diào)查研究報告
- (二模)2025年深圳市高三年級第二次調(diào)研考試物理試卷(含標準答案)
- 湖北省武漢市2025屆高中畢業(yè)生四月調(diào)研考試物理試題及答案(武漢四調(diào))
- 珠寶并購策略優(yōu)化-全面剖析
- 人教PEP版英語五年級下冊 Unit 4 單元練習(xí)卷
- 廣東省廣州市越秀區(qū)2025年中考一模歷史模擬試題(含答案)
- 普通高校本科招生專業(yè)選考科目要求指引(通用版)
- GB/T 19582.1-2008基于Modbus協(xié)議的工業(yè)自動化網(wǎng)絡(luò)規(guī)范第1部分:Modbus應(yīng)用協(xié)議
- GB 16663-1996醇基液體燃料
- 銀行票據(jù)業(yè)務(wù)知識課件資料
評論
0/150
提交評論