標準解讀

《GB/T 35890-2018 高通量測序數(shù)據序列格式規(guī)范》是由中國國家標準化管理委員會發(fā)布的一項國家標準,主要針對高通量測序技術產生的大量生物信息數(shù)據如何進行有效管理和存儲提出了一系列規(guī)定。該標準適用于基于DNA或RNA的高通量測序數(shù)據分析、處理以及交換過程中的數(shù)據格式要求。

標準首先明確了適用范圍,指出其適用于所有使用高通量測序技術的研究領域,包括但不限于醫(yī)學研究、農業(yè)科學、環(huán)境監(jiān)測等。接著定義了一些關鍵術語,如“讀段”、“質控標簽”等,為后續(xù)內容的理解奠定基礎。

在數(shù)據表示方面,《GB/T 35890-2018》詳細描述了FASTQ文件格式作為推薦使用的標準格式之一,用于存儲原始測序數(shù)據及其質量評分。此外,還介紹了SAM/BAM格式用于比對結果的數(shù)據存儲,并且討論了VCF格式對于變異檢測結果的重要性。每種格式的具體結構、字段含義及編碼方式都被逐一說明,確保了不同平臺間數(shù)據的一致性和可互操作性。

為了保證數(shù)據的質量與完整性,《GB/T 35890-2018》還提出了關于元數(shù)據記錄的要求,建議包含實驗設計、樣本信息、儀器型號、軟件版本等多個方面的詳細描述。這樣不僅有助于后續(xù)分析時能夠準確理解數(shù)據來源,也有利于長期保存和重復利用這些寶貴的信息資源。


如需獲取更多詳盡信息,請直接參考下方經官方授權發(fā)布的權威標準文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2018-02-06 頒布
  • 2018-09-01 實施
?正版授權
GB/T 35890-2018高通量測序數(shù)據序列格式規(guī)范_第1頁
GB/T 35890-2018高通量測序數(shù)據序列格式規(guī)范_第2頁
GB/T 35890-2018高通量測序數(shù)據序列格式規(guī)范_第3頁
免費預覽已結束,剩余13頁可下載查看

下載本文檔

GB/T 35890-2018高通量測序數(shù)據序列格式規(guī)范-免費下載試讀頁

文檔簡介

ICS07080

A40.

中華人民共和國國家標準

GB/T35890—2018

高通量測序數(shù)據序列格式規(guī)范

Technicalspecificationofhighthroughputsequencingdataformat

2018-02-06發(fā)布2018-09-01實施

中華人民共和國國家質量監(jiān)督檢驗檢疫總局發(fā)布

中國國家標準化管理委員會

GB/T35890—2018

前言

本標準按照給出的規(guī)則起草

GB/T1.1—2009。

本標準由全國生化檢測標準化技術委員會提出并歸口

(SAC/TC387)。

本標準起草單位深圳華大基因研究院中國計量科學研究院

:、。

本標準主要起草人梁鑫明劉心蔣慧杜佳婷謝強李倩一李岱怡王晶

:、、、、、、、。

GB/T35890—2018

高通量測序數(shù)據序列格式規(guī)范

1范圍

本標準規(guī)定了高通量測序數(shù)據的序列格式包括序列描述格式規(guī)范和高通量測序數(shù)據整體格式

,

規(guī)范

。

本標準適用于規(guī)范生物體高通量測序數(shù)據序列格式

DNA。

2規(guī)范性引用文件

下列文件對于本文件的應用是必不可少的凡是注日期的引用文件僅注日期的版本適用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改單適用于本文件

。,()。

高通量基因測序技術規(guī)程

GB/T30989

信息技術信息交換七位編碼字集

ISO/IEC646ISO(Informationtechnology—ISO7-bitcoded

charactersetforinformationinterchange)

3術語和定義

下列術語和定義適用于本文件

。

31

.

高通量測序high-throughputsequencing

以一次并行幾十萬到幾百萬條核酸分子序列測定和一般讀長較短等為標志適用于的測序

,DNA

技術

。

注改寫定義

:GB/T30989—2014,3.1.9。

32

.

測序片段reads

高通量測序平臺產生的含有堿基序列和質量值的序列片段

。

33

.

雙末端測序paired-endsequencing

對模板鏈和互補鏈分別測序并得到兩條鏈成對測序片段的測序技術

DNA,。

34

.

插入片段長度insertsize

雙末端測序中從模板鏈測序的測序片段左端到互補鏈測序的測序片段右端的距離

,。

35

.

測序片段識別碼readsidentifier

用以識別一段測序片段的具有唯一性的字符串

。

36

.

堿基序列basesequence

測序片段中記錄堿基排列的字符串堿基序列中的每個堿基應使用大寫字母和或

,(A、T、C、GN)

小寫字母和其中字母和表示腺嘌呤字母和表示胸腺嘧啶字母和表示胞

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經授權,嚴禁復制、發(fā)行、匯編、翻譯或網絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。

評論

0/150

提交評論