《實驗二常用分子生物學數(shù)據(jù)庫檢索方法及數(shù)據(jù)格式.ppt》由會員分享,可在線閱讀,更多相關《實驗二常用分子生物學數(shù)據(jù)庫檢索方法及數(shù)據(jù)格式.ppt(32頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、生物信息學實驗課件,邢晉祎 生命科學學院 Copyright,實驗二 常用分子生物學數(shù)據(jù)庫檢索方法及數(shù)據(jù)格式,實驗目的,1. 了解ncbi所提供的在線entrez檢索方法。 2.了解EBI所提供的SRS檢索方法。 3.熟悉查詢swiss-prot蛋白質序列數(shù)據(jù)庫的查詢。 4.詳細了解三大核酸序列數(shù)據(jù)庫之一的GenBank數(shù)據(jù)庫平面文件Flat file。 5.詳細了解蛋白質結構數(shù)據(jù)庫PDB數(shù)據(jù)庫中的pdb文件。,實驗材料,計算機,網(wǎng)絡。,實驗過程,1. Entrez檢索方法 NCBI All database Entrez 查詢某一關鍵詞(eg. Helicase,insulin,topois
2、omerase,gyrase,hemoglobin。) 依次點擊各個數(shù)據(jù)庫查看,,,,,,實驗過程,,,,,GenPept文件下載,平面文件獲得 查詢某一條核酸序列 獲得平面文件 保存或者下載 用寫字板(記事本)打開,實驗過程,2. SRS檢索方法。 EBI SRSEBI choice database 查詢某一關鍵詞(eg. Helicase,insulin,topoisomerase,gyrase,hemoglobin。),,,,,實驗過程,3. Swiss-prot查詢方法。 Swiss-prot SRSEBI choice database 查詢某一關鍵詞(eg. Helicase,i
3、nsulin,topoisomerase,gyrase,hemoglobin)。,,,,,,,,,4.GenBank flatfile(GBFF)內容。 是GenBank數(shù)據(jù)庫的基本信息單位,也是最廣泛地用以表示生物序列的格式之一。 GenPept文件 GBFF可以分成三個部分,頭部包含關于整個記錄的信息(描述符)。 第二部分包含了注釋這一記錄的特性, 第三部分是核苷酸序列自身。 所有的核苷酸數(shù)據(jù)庫記錄(DDBJ/ EMBL/ GenBank)都在最后一行以 // 結尾。,,,,,實驗過程,5. PDB 文件的獲得 進入PDB數(shù)據(jù)庫 查詢某蛋白質的結構(eg:1d3y) 下載結構到本地電腦 用寫字板(記事本)打開,,,源自PDB結構記錄的內容,PDB記錄包括兩個序列信息備份:隱性序列和顯性序列。 顯性序列在PDB文件中以關鍵詞SEQRES打頭逐行存儲。 隱性序列蘊涵在由PDB文件中的ATOM記錄及相應(X,Y,Z)位置坐標構成的化學立體結構中。 實踐中,許多PDB文件瀏覽器,如Rasmol,僅用隱性序列重構PDB記錄蛋白質的化學圖象,而忽略由SEQRES引導的顯性序列信息。,文件頭部,,顯性序列,,,,隱性序列,,作業(yè):格式同實驗一,1.寫出Genbank flatfile的詳細結構組成。 2.寫出PDB文件的詳細組成。,