GenBank數(shù)據(jù)庫檢索

上傳人:san****019 文檔編號:20501138 上傳時間:2021-03-24 格式:PPT 頁數(shù):67 大?。?.74MB
收藏 版權(quán)申訴 舉報 下載
GenBank數(shù)據(jù)庫檢索_第1頁
第1頁 / 共67頁
GenBank數(shù)據(jù)庫檢索_第2頁
第2頁 / 共67頁
GenBank數(shù)據(jù)庫檢索_第3頁
第3頁 / 共67頁

下載文檔到電腦,查找使用更方便

14.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《GenBank數(shù)據(jù)庫檢索》由會員分享,可在線閱讀,更多相關(guān)《GenBank數(shù)據(jù)庫檢索(67頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、GenBank數(shù)據(jù)庫檢索及其應(yīng) 用 Entrez檢索功能 NCBI網(wǎng)站網(wǎng)址: http:/www.ncbi.nlm.nih.gov 簡介 檢索入口 基本檢索功能 特征欄輔助檢索 檢索結(jié)果的顯示 GenBank數(shù)據(jù)庫是由美國國立生物技術(shù)信息 中心( NCBI)維護(hù)的一級核酸序列數(shù)據(jù)庫。 GenBank數(shù)據(jù)庫的數(shù)據(jù)來源有三種: 1、直接來源于測序工作者提交的序列; 2、與其它數(shù)據(jù)機(jī)構(gòu)協(xié)作交換的數(shù)據(jù); 3、美國專利局提供的專利數(shù)據(jù)。 簡介 檢索界面 簡介 1、基本檢索界面 Nucleotide 數(shù)據(jù)庫分為三個子數(shù)據(jù)庫: EST :表達(dá)序列標(biāo)記數(shù) 據(jù)庫 GSS :基因組測序序列 數(shù)據(jù)庫 CoreNuc

2、leotide :包含所 有未被以上兩個子數(shù)據(jù) 庫收錄的核苷酸序列 檢索界面 簡介 1、基本檢索界面 2、跨庫檢索界面 簡介 檢索界面 基本檢索功能 (一)字段限制檢索、強(qiáng)制短語檢索 (二)特殊標(biāo)志符檢索 (四)范圍檢索 (三)序列長度檢索 簡介 檢索界面 基本檢索功能 (一)字段限制檢索、強(qiáng)制短語檢索 rasGENE 檢索限定詞: 1、基因名稱的檢索限定詞: GENE or GENE NAME 2、生物體名稱的檢索限定詞: ORGN or ORGANISM 3、作者姓名的檢索限定詞: AUTH or AUTHOR 獲取所需要的基因序列 顯示方式 序列號 物種信息 作者信息 選擇顯示模式為 F

3、ASTA 序列信息 保存序列信息 點(diǎn)擊 send選擇 file, 格式為 FASTA 選擇顯示方式為 Graphics 編碼蛋白質(zhì)的序列信息 點(diǎn)擊顯示蛋白質(zhì)編 碼序列 蛋白質(zhì)氨基酸序列 簡介 檢索界面 基本檢索功能 (二)特殊標(biāo)志符檢索 (一)字段限制檢索、強(qiáng)制短語檢索 特殊標(biāo)志符的格式 (核酸序列 ): 2、 GenBank/EMBL/DDBJ序列接受號: (1) 1個字母 +5個阿拉伯?dāng)?shù)字 e.g.: U12345 (2) 2個字母 +6個阿拉伯?dāng)?shù)字 e.g.: AY123456, Af123456 1、序列辨認(rèn)號 (GI):一串阿拉伯?dāng)?shù)字 e.g.: 19440733 ( 1) mRNA

4、 記錄( NM_*) : e.g.: NM_000492 ( 2)基因組的 DNA重疊群( NT_*) : e.g.: NT_000347 ( 3)完整的基因組或染色體( NC_*) : e.g.: NC_000907 ( 4)基因組的局部區(qū)域( NG_*) : e.g.: NG_000019 ( 5)從人類基因組注釋、加工得到的序列模型( XM, XP, or XR_*): e.g.: XM_000483 特殊標(biāo)志符的格式 (核酸序列): 3、 RefSeq( Reference Sequence) 序列接受號 : 特殊標(biāo)志符的格式 (核酸序列): 4 、 PDB序列接受號:個阿拉伯?dāng)?shù)字個字

5、母 e.g.: TUP 序列接受號的檢索限定詞為 ACCN or ACCESSION 簡介 檢索界面 基本檢索功能 (一)字段限制檢索、強(qiáng)制短語檢索 (二)特殊標(biāo)志符檢索 (三)序列長度檢索 序列長度的檢索限定詞: SLEN 簡介 檢索界面 基本檢索功能 (一)字段限制檢索、強(qiáng)制短語檢索 (二)特殊標(biāo)志符檢索 (四)范圍檢索 (三)序列長度檢索 范圍檢索:中間用冒號連接 1、序列接受號范圍檢索: AF114696:AF114714ACCN 2、序列長度范圍檢索: 3000: 4000SLEN 3、日期范圍檢索: 2005/01: 2006/09/26MDATorPDAT 簡介 檢索界面 基本檢

6、索功能 特征欄輔助檢索 限制檢索 ( Limits) 高級檢索( Advanced Search) 檢索史管理 ( History) 剪貼板管理 ( Clipboard) 詳細(xì)匹配過程 ( Details) 限制檢索 高級檢索 簡介 檢索界面 基本檢索功能 特征欄輔助檢索 限制檢索 ( Limits) 排除某種類型 的序列 限制分子類型 限制基因位點(diǎn) 限制序列片段的顯示 限制數(shù)據(jù)來源 限制數(shù)據(jù)發(fā)布日期 限制數(shù)據(jù)修訂日期 簡介 檢索界面 基本檢索功能 特征欄輔助檢索 限制檢索 ( Limits) 高級檢索( Advanced Search) 預(yù)檢索輸入框 添加檢索詞 索引檢索 預(yù)檢索結(jié)果 簡介

7、檢索界面 基本檢索功能 特征欄輔助檢索 限制檢索 ( Limits) 高級檢索( Advanced Search) 檢索史管理 ( History) 簡介 檢索界面 基本檢索功能 特征欄輔助檢索 限制檢索 ( Limits) 高級檢索( Advanced Search) 檢索史管理 ( History) 剪貼板管理 ( Clipboard) 簡介 檢索界面 基本檢索功能 特征欄輔助檢索 限制檢索 ( Limits) 高級檢索( Advanced Search) 檢索史管理 ( History) 詳細(xì)匹配過程 ( Details) 剪貼板管理 ( Clipboard) 簡介 檢索入口 基本檢索功

8、能 特征欄輔助檢索 檢索結(jié)果的顯示 序列相似性搜索 啟動相似性搜索 輸入序列號 選擇搜索的數(shù)據(jù)集 點(diǎn)擊開始搜索 相似性序列信息 GenBank記錄中特性表中的主要關(guān)鍵詞 : 關(guān)鍵詞 解 釋 關(guān)鍵詞 解 釋 misc_feature 生物學(xué)特性無法用特性表 關(guān)鍵詞描述的序列 promoter 轉(zhuǎn)錄起始區(qū) misc_difference 序列特性無法用特性表關(guān) 鍵詞描述的序列 CAAT_signal 真核啟動子上游的 CAAT 盒 ,與 RNA結(jié)合相關(guān) conflict 同一序列在不同的研究中 在位點(diǎn)或區(qū)域上有差異 TATA_signal 真核啟動子的 TATA盒 unsure 序列不能確定的區(qū)域

9、 -35_signal 原核啟動子中的 -35框 old_sequence 該序列對以前的版本做過 修訂 -10_signal 原核啟動子的 Pribow盒 variation 包含穩(wěn)定突變的序列 GC_signal 真核啟動子的 GC盒 modified_base 修飾過的核苷酸 RBS 核糖體結(jié)合位點(diǎn) gene 已識別為基因或已命名的 序列區(qū)域 polyA_signal RNA轉(zhuǎn)錄本的剪切識別 位點(diǎn) misc_signal 無法用信號特性關(guān)鍵詞描 述的信號序列 enhancer 增強(qiáng)子 關(guān)鍵詞 解 釋 關(guān)鍵詞 解 釋 attenuator 與轉(zhuǎn)錄終止有關(guān)的序列 CDS 蛋白質(zhì)編碼序列 te

10、rminator 轉(zhuǎn)錄終止序列 sig_peptide 編碼信號肽的序列 rep_origin 雙鏈 DNA復(fù)制起始區(qū) transit_peptide 轉(zhuǎn)運(yùn)蛋白編碼序列 misc_RNA 無法用 RNA關(guān)鍵詞描述 的轉(zhuǎn)錄物或 RNA產(chǎn)物 mat_peptide 編碼成熟肽的序列 prim_transcript 初始轉(zhuǎn)錄本 intron 內(nèi)含子 precursor_RNA 前體 RNA polyA_site RNA轉(zhuǎn)錄本的多聚腺苷 酸化位點(diǎn) mRNA 信使 RNA rRNA 核糖體 RNA 5clip 前體轉(zhuǎn)錄本中被剪切掉 的 5端序列 tRNA 轉(zhuǎn)運(yùn) RNA 3 clip 前體轉(zhuǎn)錄本中被剪切掉

11、 的 3端序列 scRNA 小細(xì)胞質(zhì) RNA 5UTR 5非翻譯區(qū) snRNA 小核 RNA 3UTR exon 3非翻譯區(qū) 外顯子 snoRNA 加工和修飾 rRNA的小 核 RNA 關(guān)鍵詞 解 釋 關(guān)鍵詞 解 釋 immunoglobulin _related repeat_unit 單個的重復(fù)元件 C_region 免疫相關(guān)蛋白上的不變區(qū) LTR 長末端重復(fù)序列 D_segment 免疫球蛋白重鏈的可變區(qū), T細(xì)胞受體 鏈 Satellite 衛(wèi)星重復(fù)序列 J_ segment 免疫球蛋白重鏈、輕鏈以及 T細(xì)胞 、 、 的結(jié)合鏈 misc_binding 無法描述的核酸序列結(jié) 合位點(diǎn) N

12、_ region 插入重排免疫球蛋白片段間 的核苷酸 primer_bind 復(fù)制、轉(zhuǎn)錄的引物結(jié)合 位點(diǎn) S_ region 免疫球蛋白重鏈的開關(guān)區(qū) protein_bind 蛋白質(zhì)結(jié)合區(qū) V_ region 編碼免疫球蛋白的可變區(qū) N 末端的序列 STS 測序標(biāo)簽位點(diǎn) V_ segment 編碼免疫球蛋白的可變區(qū)的 序列 misc_recomb 無法用重組特性關(guān)鍵詞 描述的重組事件 repeat_region 基因組中所包含的重復(fù)序列 iDNA 通過重組所消除的 DNA 關(guān)鍵詞 解 釋 關(guān)鍵詞 解 釋 misc_structure 無法用結(jié)構(gòu)關(guān)鍵詞描述的核 酸序列高級結(jié)構(gòu)或構(gòu)型 stem_l

13、oop 發(fā)夾結(jié)構(gòu) D_loop 線粒體中 DNA中的取代環(huán) GenBank記錄中特性表中的限定詞 : 限定詞 含 義 限定詞 含 義 /allele= 給定基因的等位基因 /codon_start= 相對于序列第一個堿基, 編碼序列密碼子的偏移量 /bound_moiety= 嵌合范圍 /country= DNA樣本的來源國 /cell_type= 獲得序列的細(xì)胞類型 /db_xref= 其他數(shù)據(jù)庫信息的交叉索 引號 /citation= 已被引用的參考文獻(xiàn)數(shù) /direction= DNA復(fù)制方向 /clone_lib= 獲得序列的克隆文庫 /environmental _sample= 序

14、列直接從環(huán)境材料中獲 得而沒有指明來源物種 限定詞 含 義 限定詞 含 義 /exception= 指明 DNA序列未按通常的生 物學(xué)規(guī)律翻譯,如 RNA編輯 /PCR_conditi- ons= 描述 PCR的反應(yīng)條件 /frequency= 在種群中發(fā)生變異的頻率 /pop_variant= 獲得序列的群體變異種 名稱 /germline 如果序列是 DNA并來源于免 疫球蛋白家族,則表示該 序列來源于未重排 DNA /product= 序列編碼產(chǎn)物的名稱 /insertion_seq= 序列來源于某種插入元件 /anticodon= tRNA反義密碼子的位置 及它所編碼的氨基酸 /iso

15、late= 序列來源的生物個體 /cell_line= 獲得序列的細(xì)胞系 /lab_host= 為擴(kuò)增序列來源物種所用 的實(shí)驗(yàn)室宿主 /chromosome= 獲得序列的染色體 /macronuclear 指明 DNA來源于染色體分化 的大核期 /clone= 獲得序列的克隆子 /note= 評論及附加信息 /codon= 指出與參考密碼子不同 的密碼子 /organelle= 獲得序列的細(xì)胞器 /EC_number= 序列產(chǎn)物的酶學(xué)編號 限定詞 含 義 限定詞 含 義 /cons_splice= 區(qū)分內(nèi)含子剪切位點(diǎn)和 “ 5-GT.AG-3”剪切位點(diǎn) /map= 相關(guān)特性在基因圖譜上的 位置

16、 /cultivar= 所獲序列植物的栽培變種 /mod_base= 被修飾堿基的簡寫 /dev_stage= 序列來源于某種生物的特 定發(fā)育階段 /number= 從 53 注明遺傳元件的順 序 /evidence= 序列特性來源于實(shí)驗(yàn)還是 推理 /organism= 提供測序用遺傳物質(zhì)的物 種的科學(xué)名稱 /focus 指出在記錄中的來源特性 在其他物種中還有不同的 來源特性 /phenotype= 序列特性所導(dǎo)致的表型 /function= 序列所代表的功能 /plasmid= 獲得序列的質(zhì)粒名稱 /haplotype= 序列來源于某種物種的單 倍體 /protein_id= 蛋白質(zhì)的檢索

17、號 /isolation_sou- rce= 描述序列來源物種的生理、 環(huán)境和地理信息 /proviral 整合在基因組中的前病毒 /label= 序列特性的俗名 /rearranged 如果序列是 DNA并來源于免 疫球蛋白家族,則表示該 序列來源于重排 DNA 限定詞 含 義 限定詞 含 義 /rpt_family= 重復(fù)序列 /transposon= 轉(zhuǎn)座子 /rpt_unit= 指明重復(fù)區(qū)域的重復(fù)元件構(gòu) 成 /variety= 獲得序列的生物變種 /serotype= 同一物種的不同血清學(xué)特征 /pseudo 假基因 /sex= 獲得序列的物種性別 /replace= 表明特性間的間隔

18、序 列已被替換 /specimen_vou- cher= 指明來源物種保存于什么地 方 /rpt_type= 重復(fù)序列的組織方式 /strain= 獲得序列的菌珠 /sequenced_m- ol= 獲得序列的分子類型 /sub_species= 獲得序列的來源物種的亞種 /serovar= 同一原核生物的血清 學(xué)特征 /tissue_lib= 獲得序列組織庫 /specific_host= 獲得序列的天然宿主 /transgenic 指明物種的來源特性是否是 轉(zhuǎn)基因受體 /standard- name= 特性的通用名稱 /transl_except= 標(biāo)明序列中未按指定密碼子 表翻譯的氨基酸

19、的位置 /sub_clone= 獲得序列的亞克隆 限定詞 含 義 限定詞 含 義 /sub_strain= 獲得序列的來源微生物亞種 /tissue_type= 獲得序列組織類型 /translation= 按通用或指定的密碼子表翻 譯的氨基酸序列 /transl_table= 描述在翻譯中與通用密碼表 不同的密碼表 /usedin= 表明該特性在其他檢索中也 被使用 /virion 病毒顆粒 GenBank和 PubMed(序列數(shù)據(jù) )檢索的比較: 1、 GenBank的檢索結(jié)果是序列及其注釋信息; PubMed的檢索結(jié)果是與序列數(shù)據(jù)相關(guān)的文獻(xiàn)信息。 2、 GenBank數(shù)據(jù)更新早于 PubMed, GenBank數(shù)據(jù)庫的檢 全率高于 PubMed。 3、 GenBank可對序列數(shù)據(jù)進(jìn)行限制檢索,而 PubMed只能 對文獻(xiàn)、雜志、作者等進(jìn)行限制檢索,因而 GenBank數(shù)據(jù) 庫的檢準(zhǔn)率也高于 PubMed。 課后練習(xí) 用 GenBank 數(shù)據(jù)庫搜索 ”SARS coronavirus BJ01” 的全基因組序列信息并下載保存,查詢該 基因所產(chǎn)生的蛋白質(zhì)序列信息。 用 BLAST模塊對該基因序列進(jìn)行相似性搜索。 謝 謝!

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!