《NCBI數(shù)據(jù)庫(kù)檢索PPT課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《NCBI數(shù)據(jù)庫(kù)檢索PPT課件(120頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、National Center of Biotechnology Information NCBI簡(jiǎn)介http:/www.ncbi.nlm.nih.gov NCBI就是美國(guó)國(guó)家生物技術(shù)信息中心(National Center of Biotechnology Information) NLM是美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館(National Library of Medicine) NIH是美國(guó)國(guó)立衛(wèi)生研究院 (National Institutes of Health) NCBI中通過(guò)Entrez可互查的數(shù)據(jù)庫(kù) NCBI數(shù)據(jù)庫(kù)Nucleotide:DNA序列數(shù)據(jù)庫(kù)Protein:蛋白質(zhì)序列數(shù)據(jù)庫(kù)Geno
2、me:基因組序列數(shù)據(jù)庫(kù)Structure:分子結(jié)構(gòu)模型數(shù)據(jù)庫(kù)Popset:種群、種系發(fā)生或突變序列數(shù)據(jù)庫(kù)Taxonomy:微生物類(lèi)別數(shù)據(jù)庫(kù)OMIM:人類(lèi)孟德?tīng)栠z傳學(xué)在線數(shù)據(jù)庫(kù)。 一. Nucleotide(GenBank) 該 數(shù) 據(jù) 庫(kù) 由 國(guó) 際 核 苷 酸 序 列 數(shù) 據(jù) 庫(kù) 成 員 美 國(guó) 國(guó) 立 衛(wèi) 生 研 究 院GenBank、 日 本 D N A 數(shù)據(jù)庫(kù)(DDBJ)和英國(guó)Hinxton Hall的歐洲分子生物學(xué)實(shí)驗(yàn)室數(shù)據(jù)庫(kù)(EMBL)三部分?jǐn)?shù)據(jù)組成。 二 . Genome 即基因組數(shù)據(jù)庫(kù),提供了多種基因組、完全染色體、臨近序列圖譜以及一體化基因物理圖譜。 三. Structure
3、s 即結(jié)構(gòu)數(shù)據(jù)庫(kù)或稱(chēng)分子模型數(shù)據(jù)庫(kù)(MMDB),包含來(lái)自X線晶體學(xué)和三維結(jié)構(gòu)的實(shí)驗(yàn)數(shù)據(jù)。MMDB的數(shù)據(jù)從PDB(Protein Data Bank)獲得。 四. Taxonomy 即 生 物 學(xué) 門(mén) 類(lèi) 數(shù) 據(jù) 庫(kù) , 可 以 按 生 物 學(xué) 門(mén) 類(lèi) 進(jìn) 行 檢 索 或 瀏 覽 其 核 苷 酸 序 列 、 蛋 白質(zhì)序列、結(jié)構(gòu)等。 五. PopSet 包含研究一個(gè)人群、一個(gè)種系發(fā)生或描述人群變化的一組組聯(lián)合序列。PopSet既包含核酸序列數(shù)據(jù)又包含蛋白質(zhì)序列數(shù)據(jù)。 六. OMIM 孟德?tīng)栠z傳學(xué)(OMIM)數(shù)據(jù)庫(kù)是人類(lèi)基因和基因疾病的目錄數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包括原文信息、圖片和參考信息,同時(shí)還可以鏈接
4、到Entrez系統(tǒng)MEDLINE數(shù)據(jù)庫(kù)中相關(guān)文獻(xiàn)和序列信息。 一、PubMed數(shù) 據(jù) 庫(kù) 簡(jiǎn)介 PubMed是美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館(NLM)下屬的國(guó)家生物技術(shù)信息中心(NCBI)開(kāi)發(fā)的、基于WWW的醫(yī)學(xué)數(shù)據(jù)庫(kù)查詢系統(tǒng)。PubMed的網(wǎng)址:http:/www.ncbi.nlm.nih.gov/pubmedhttp:/www.ncbi.nlm.nih.gov/entrez/query.fcgi PubMed數(shù) 據(jù) 類(lèi) 型 : 期 刊 論 文 、 綜 述 、 以 及 與 其 他 數(shù) 據(jù)資 源 鏈 接 。特 點(diǎn) :1.免 費(fèi) 提 供 題 錄 和 文 摘2.可 與 提 供 原 文 的 網(wǎng) 址 鏈 接 (部
5、 分 免 費(fèi) 獲 取 ) 3. 操 作 簡(jiǎn) 便 、 快 捷 期刊來(lái)源地理分布 北美 (31%) 歐洲和中東 (52%) 非洲 (1%)中南美洲 (2%)ASIAN, Australia (14%) MEDLINE 2919 獨(dú)有 BIOSIS 30712043 sharedBIOSIS 與 MEDLINE的覆蓋范圍MEDLINE: 聯(lián) 機(jī) 醫(yī) 學(xué) 文 獻(xiàn) 分 析和 檢 索 系 統(tǒng) BIOSIS (Biosciences Information Service,美國(guó)生物科學(xué)信息服務(wù)社) 4,400 Employees11,500 Employees 2,800 Employees9,900 Em
6、ployees Intl Legal 2. 初步的功能分析:細(xì)胞周期,caspase酶的抑制因子,等等。 NM_001168.2:Survivin Human Survivin! 獲取蛋白質(zhì)的序列信息 Survivin:142aa 結(jié) 論2 人的Sur vivin蛋白質(zhì)包含142個(gè)氨基酸,序列標(biāo)識(shí)符為:NP_001159.2 獲取FASTA序列 FASTA格式的序列 PHI-BLAST: find domain 填入蛋白質(zhì)的FASTA序列 BIR domain 結(jié) 論3 Sur vivin具有保守的功能結(jié)構(gòu)域BIRu如何進(jìn)行Survivin功能分析。如:亞細(xì)胞定位,活性中心位點(diǎn),3D結(jié)構(gòu)。ht
7、tp:/www.expasy.org/ UniProt: 蛋白質(zhì)數(shù)據(jù)庫(kù) 在人中做BLAST搜索 Survivin:O15392 Survivin的蛋白質(zhì)信息 功能注釋 結(jié)論4:功能分析 1. 在瘤形成過(guò)程中可能起一定作用; 2. 阻礙G2/M期的細(xì)胞編程性凋亡; 3. Chromosomal passenger complex (CPC)的成員之一。 細(xì)胞亞定位:胞質(zhì),核。 PDB:三級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù) Survivin的三級(jí)結(jié)構(gòu)信息 Raswin: 三級(jí)結(jié)構(gòu)顯示 Raswin: 三級(jí)結(jié)構(gòu)顯示 總 結(jié)1. 該基因?yàn)槿说腟urvivin基因,染色體定位:17號(hào)染色體,73721872-73733311
8、;基因標(biāo)識(shí)符:NM_001168.2; 2. 人的Survivin蛋白質(zhì)包含142個(gè)氨基酸,序列標(biāo)識(shí)符為:NP_001159.2 3. Survivin具有保守的功能結(jié)構(gòu)域BIR 4. Survivin的細(xì)胞亞定位:胞質(zhì),核,其功能有: (1) 在瘤形成過(guò)程中可能起一定作用; (2) 阻礙G2/M期的細(xì)胞編程性凋亡; (3) Chromosomal passenger complex (CPC)的成員之一。等等。 6. Survivin的三級(jí)結(jié)構(gòu)已知,在PDB中的標(biāo)識(shí)符為1E31。 謝謝各位認(rèn)真聽(tīng)講! NCBI中通過(guò)Entrez可互查的數(shù)據(jù)庫(kù) 期刊來(lái)源地理分布 北美 (31%) 歐洲和中東 (
9、52%) 非洲 (1%)中南美洲 (2%)ASIAN, Australia (14%) PubMed頁(yè)面的結(jié)構(gòu) 三、PubMed頁(yè)面的結(jié)構(gòu) 側(cè)欄提供其他檢索如期刊數(shù)據(jù)庫(kù)檢索、規(guī)范詞數(shù)據(jù)庫(kù)檢索、特定文獻(xiàn)檢索執(zhí)行檢索基本檢索輸入框 四、PubMed的基本檢索功能(五)5、短語(yǔ)檢索 PubMed首先將鍵入的檢索詞(詞組)視為合理的短語(yǔ)在短語(yǔ)索引中進(jìn)行查找。如: single cell ,PubMed將其視為詞組進(jìn)行查找。當(dāng)PubMed沒(méi)有找到該詞組時(shí),系統(tǒng)將自動(dòng)把兩個(gè)詞分開(kāi)進(jìn)行檢索; 如 果 不 希 望 系 統(tǒng) 將 兩 詞 分 開(kāi) , 則 需 要 用 “ ” 把 檢 索 詞 括 起 來(lái) , 即 強(qiáng) 迫PubMed進(jìn)行詞組檢索。如“single cell”。 當(dāng)用雙引號(hào)括起詞語(yǔ)時(shí),PubMed將不執(zhí)行自動(dòng)詞語(yǔ)匹配功能。 Megablast: 找基因序列 輸入序列