《查找啟動子區(qū)[優(yōu)質(zhì)分析]》由會員分享,可在線閱讀,更多相關(guān)《查找啟動子區(qū)[優(yōu)質(zhì)分析](47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、如何判斷序列的正反向 NCBI里的序列,mRNA,CDS序列等等,都標(biāo)注的很清楚,只是有的基因序列給的是反向互補的序列,需要大家在primer5等軟件里轉(zhuǎn)換一下。 具體看是不是反向互補的序列,辦法就是看在第一個CDS區(qū)的前三個堿基是不是是不是ATGATG,如果是ATG,那么這個序列就是你要的了,如果不是,那八成就是你要得序列的反向互補序列了。1嚴(yán)選文書目的: 尋找promoter區(qū)域預(yù)測核心啟動子區(qū)2嚴(yán)選文書尋找promoter區(qū)域1.用NCBI:http:/www.ncbi.nlm.nih.gov/ 2.用UCSC:http:/www.genome.ucsc.edu/3.用Ensembl:h
2、ttp:/www.ensembl.org/index.html4.用公司信息(只包含公司擁有promoter clones的信息): http:/ (*種類比較少)5.用SIB-EPD: http:/www.epd.isb-sib.ch/ (可直接提供TSS,但是庫容較小,很多基因查不到)6.預(yù)測核心啟動子區(qū)3嚴(yán)選文書NCBI數(shù)據(jù)庫4嚴(yán)選文書尋找promoter區(qū)域NCBI http:/www.ncbi.nlm.nih.gov/pubmed/選擇Gene, 輸入ankh,點擊search選擇第一項,以人類Homo sapiens的ANKH為例;Chromosome 5 location 147
3、04909-14871887, complement(反義鏈)即-14871887 到 -14704909為基因范圍此例中選取-14873887 到-14871887 約2000bp核苷酸序列作為啟動子區(qū)域5嚴(yán)選文書選擇Ensembl或者HGNC_,進入ensembl分析尋找promoter區(qū)域6嚴(yán)選文書尋找promoter區(qū)域圖形顯示FASTA格式顯示的核苷酸序列輸入序列可以查詢?nèi)旧w位置ANKH gene在反義鏈上,所以用負(fù)數(shù)表示可以查詢具體核苷酸序列Genomic context 點擊Graphics-Tools-Sequece Text View7嚴(yán)選文書尋找promoter區(qū)域點擊G
4、o To Position, 輸入-14873887,點擊Prev Page找到具體位置復(fù)制白底黑色區(qū)域即為promoter區(qū)域。白底黑字為啟動子區(qū)域紫底黑字為基因區(qū)域粉底黑字為編碼區(qū),ATG為啟示密碼子8嚴(yán)選文書尋找promoter區(qū)域在前兩張幻燈片中選擇FASTA在右邊Change region shown輸入14871887到14873887Display options選擇Show reverse complement可以直接得到FASTA格式的promoter核苷酸序列(似乎有一個bp的差距,可以輸入14871887到14873886 )可以選擇展示反向互補序列9嚴(yán)選文書1. 選擇基
5、因示意圖:1).向下查看“Genomic regions, transcripts and products”2). 將鼠標(biāo)放在Genes的”NR_”示意圖上,3). 在彈出的窗口中點擊2. 點擊”FASTA View,序列范圍表示NR_的位置。出現(xiàn)該基因的實際序列,第一個序列的位置表示“起始位置”3. 調(diào)整顯示位置:將起始位點先前排1000bp,向后排1000bp。更改后的位置認(rèn)為是啟動子區(qū)。10嚴(yán)選文書UCSC數(shù)據(jù)庫11嚴(yán)選文書尋找promoter區(qū)域UCSC http:/www.genome.ucsc.edu/ 選擇左側(cè)邊欄的“Table Browser”在clade選擇Mammal,g
6、enome選擇Human,assmebly選擇最新的數(shù)據(jù)庫,在position后面的搜索框內(nèi)寫入待查的基因名稱,如actin。點擊get output。方法一12嚴(yán)選文書尋找promoter區(qū)域出現(xiàn)一系列候選序列。當(dāng)搜索用詞不特異的時候會出來太多的結(jié)果,只顯示500條。13嚴(yán)選文書尋找promoter區(qū)域點擊自己目的基因的結(jié)果鏈接,會出現(xiàn)該基因在染色體上的位置 (有時候會直接跳到選擇genome,protein,mRNA那一頁面,可能是在搜索詞比較特異的情況寫),繼續(xù) getout put選擇 genome14嚴(yán)選文書尋找promoter區(qū)域選擇Promoter/Upstream by 200
7、0 basesExons in upper case, everything else in lower case:外顯子大寫,其他小寫15嚴(yán)選文書尋找promoter區(qū)域小寫字母為promoter區(qū)域大寫字母為基因區(qū)域,與NCBI結(jié)果相同ATG為CDS區(qū)起始密碼子16嚴(yán)選文書尋找promoter區(qū)域promoter/upstream前面的框中打勾,一般的啟動子長度大約為2kb左右,這個數(shù)字可以修改。為便于觀察,可繼續(xù)修改下面的幾個選項。這里選擇CDS大寫。點擊get sequence即可得到結(jié)果。17嚴(yán)選文書尋找promoter區(qū)域UTR和upstream是分開的,CDS是大寫的,可以看到起
8、始碼。Copy ATG以前的序列進行啟動子分析。PCR以genome為模板。18嚴(yán)選文書尋找promoter區(qū)域UCSC http:/www.genome.ucsc.edu/,點擊左側(cè)邊欄的“Genome Browser”方法二19嚴(yán)選文書尋找promoter區(qū)域以大鼠(rattus orvegicus)的結(jié)締組織生長因子(CTGF)為例,在OrganismOrganism的下拉菜單中選擇Rat,在assemblyassembly的下拉菜單中選擇最新日期最新日期Nov.2004,在positionposition框中鍵入CTGF,image widthimage width選擇默認(rèn)即可,如下圖
9、所示:點擊 Submit20嚴(yán)選文書尋找promoter區(qū)域結(jié)果顯示該基因的已知序列和相關(guān)mRNA序列,點擊“Known Gene”中的第一個序列,21嚴(yán)選文書尋找promoter區(qū)域出現(xiàn)包含這序列的圖解概要為了獲得這個區(qū)域更清晰的圖像,可以點擊緊靠zoom out的1.5X按鈕,如下圖:對于Known Genes(已知基因)和預(yù)測的基因路徑來說,一般的慣例是以一個高的垂直線或塊狀表示每個編碼外顯子,以短的垂直線或塊狀表示5端和3端非翻譯區(qū)。起連接作用的內(nèi)含子以非常細(xì)的線條表示。翻譯的方向由沿著細(xì)線的箭頭指示。22嚴(yán)選文書尋找promoter區(qū)域本例的搜尋目的來說,默認(rèn)設(shè)置不是理想的設(shè)置。按照
10、視圖利用頁面底部的Track Controls按鈕,將一些路徑設(shè)置為hide模式(即不顯示),其他設(shè)置為dense模式(所有資料密集在一條直線上);另一些路徑設(shè)置為full模式(每個特征有一個分開的線條,最多達300)。23嚴(yán)選文書尋找promoter區(qū)域Ensembl基因通過許多方法來預(yù)測,包括與已知mRNA和蛋白質(zhì)進行同源性比較。若查詢啟動子區(qū)域,我們需要將將Ensembl Genes選擇為選擇為dense 或或full模式模式,點擊Refresh,即刷新,出現(xiàn)下圖:圖中多出了Ensembl Genes的預(yù)測路徑,我們在紅框中圈出。點擊用于表達該序列的任何方塊出現(xiàn)以下頁面:24嚴(yán)選文書尋找
11、promoter區(qū)域點擊紅框中的條形深色方塊(不是(不是Ensembl Genes文字)文字),25嚴(yán)選文書尋找promoter區(qū)域選擇并點擊Link to sequence中的Genomic Sequence,即顯示基因組序列26嚴(yán)選文書尋找promoter區(qū)域?qū)romoter改為2000bp,具體多少bp合適,可根據(jù)文獻資料和實驗?zāi)康墨@取,有的基因可能在其上游戲幾百bp就可以了,其他的幾個選項分別為5端非編碼區(qū),編碼區(qū)外顯子,3端非編碼區(qū),內(nèi)含子(內(nèi)含子用綠框圈了起來)等。Sequence Formatting Options序列顯示方式,選擇上圖紅框里的內(nèi)容,即外顯子大寫,即外顯子大寫
12、,其余的小寫,也就是說,其余的小寫,也就是說mRNA的外顯子大寫,其余上下游非編碼區(qū)以及內(nèi)含子均為的外顯子大寫,其余上下游非編碼區(qū)以及內(nèi)含子均為小寫。小寫。27嚴(yán)選文書尋找promoter區(qū)域第一個大寫字母以后就是第一個大寫字母以后就是mRNA序列,之序列,之前的小寫字母序列即為啟動子區(qū)域了。前的小寫字母序列即為啟動子區(qū)域了。28嚴(yán)選文書第一個大寫字母以后就是mRNA序列,但該序列包含外顯子和內(nèi)含子,是未經(jīng)剪切修飾的mRNA, 圖中兩段大寫字母中間的小寫字母便為內(nèi)含了序列。尋找promoter區(qū)域29嚴(yán)選文書Ensemble數(shù)據(jù)庫30嚴(yán)選文書尋找promoter區(qū)域Ensembl:http:/
13、www.ensembl.org/index.html 選擇human 輸入 ankh選擇Gene,點擊 GeneID ENSG00000154122點擊左邊的Export data 方法一31嚴(yán)選文書尋找promoter區(qū)域5 Flanking sequence 輸入2000Options for FASTA sequence中Genomic選5 Flanking sequence,deselect all點擊Next(不管正反此法都適用)32嚴(yán)選文書尋找promoter區(qū)域得到2000 bases 的核苷酸序列33嚴(yán)選文書尋找promoter區(qū)域Ensembl:http:/www.ensem
14、bl.org/index.html在“Search Ensembl“標(biāo)題下search后的下拉框中選中物種名homo sapiens(人),for框中輸入基因名ankh,點擊Go方法二34嚴(yán)選文書尋找promoter區(qū)域找到所需要的gene,點擊出來2個結(jié)果。本例中貌似是同一個。點擊相應(yīng)鏈接進入新頁面。35嚴(yán)選文書尋找promoter區(qū)域貌似有2個不同的轉(zhuǎn)錄本。點擊Exon Info。36嚴(yán)選文書尋找promoter區(qū)域新頁面中即可看到5 upstream sequence??梢栽贔lanking sequence at either end of transcript后面的框中修改期望顯示的
15、序列長度。一般啟動子最好選2kb。然后copy所顯示的上游序列進行分析。 37嚴(yán)選文書Genecopoeia公司38嚴(yán)選文書尋找promoter區(qū)域http:/ product, 選擇promoter clones,因為沒有ANKH的信息,此處輸入FIBRONECTIN 選擇目的基因39嚴(yán)選文書尋找promoter區(qū)域點擊click here to view the promoter sequence得到promoter信息40嚴(yán)選文書EPD數(shù)據(jù)庫41嚴(yán)選文書尋找promoter區(qū)域SIB-EPD 網(wǎng)址:http:/www.epd.isb-sib.ch/ 具體使用方法大同小異,就是輸入物種名、
16、基因名,限定啟動子序列區(qū)域 42嚴(yán)選文書預(yù)測 核心啟動子區(qū)43嚴(yán)選文書Transcript start site (TSS) 附近-60bp到+40bp是核心啟動子區(qū)核心啟動子區(qū),是精確轉(zhuǎn)錄必須的最小單元。CpG島島是一段200 bp 或更長的DNA 序列,核苷酸G+C 的含量較高,并且CpG雙核苷酸的出現(xiàn)頻率占G+ C 含量的50%以上。許多脊椎動物的啟動子區(qū)都與CpG島的位置重合。44嚴(yán)選文書常見的在線預(yù)測工具有:真核啟動子真核啟動子數(shù)據(jù)庫第數(shù)據(jù)庫第85版版(The Eukaryotic Promoter Database Current Release 85 ,EPD,http:/www
17、.epd.isb-sib.ch/ )http:/epd.vital-it.ch/ 轉(zhuǎn)錄起始位點數(shù)據(jù)庫轉(zhuǎn)錄起始位點數(shù)據(jù)庫:http:/dbtss.hgc.jp/ 該數(shù)據(jù)庫主要包括人,小鼠等常見生物的基因轉(zhuǎn)錄起始位點及該基因啟動子的可能情況。Promoter scan (http:/bimas.dcrt.nih.gov/molbio/proscan/ ), Promoter2.0 Prediction Server (http:/www.cbs.dtu.dk/services/promoter/ ) 神經(jīng)網(wǎng)絡(luò)啟動子預(yù)測器 NNPP(http:/www.fruitfly.org/seq_tools/
18、promoter.html )Soft Berry (http:/ )Dragon Promoter Finder (http:/research.i2r.a-star.edu.sg/promoter )(好像不能用了?)45嚴(yán)選文書FirstEF (http:/rulai.cshl.edu/tools/FirstEF/ ) UROGENE (http:/www.urogene.org/methprimer/ ),可用于位點甲基化的預(yù)測CpGPlot/CpGReport/Isochore (http:/www.ebi.ac.uk/emboss/cpgplot/)CpGProD (http:/p
19、bil.univ-lyon1.fr/software/cpgprod_query.html)CpG Island Searcher (http:/ Prediction (http:/www.ualberta.ca/stothard/jaascript/cpg_islands.html)/ CpGCpG島預(yù)測軟件島預(yù)測軟件46嚴(yán)選文書1、獲取目的基因的mRNA序列,并且在NCBI的數(shù)據(jù)庫中查獲轉(zhuǎn)錄起始點;2、截取轉(zhuǎn)錄起始點為中心,上下約各1000bp,若在此范圍內(nèi)出現(xiàn)CDS,可到翻譯起始點終止;3、利用在線軟件進行分析;PromoterInspectorhttp:/www.genomatix.
20、de/software_services/online_access/free_accounts.htmlPromoterScanhttp:/bimas.dcrt.nih.gov/molbio/proscanPromoter 2.0http:/www.cbs.dtu.dk/services/PromoterNNPPhttp:/www.fruitfly.org/seq_tools/promoter.htmlEMBOSS Cpgplothttp:/www.ebi.ac.uk/servicestmp/95441066796504.htmlCpGCpG Islands Islands PredictionPredictionhttp:/www.ualberta.ca/%7Estothard/javascript/cpg_island.html本人是采取多種軟件結(jié)合的方法,由于proscan和promoter 2.0的假陽性率較高,僅作為參考,而promoter inspector的特異性較高,結(jié)果比較可信。同時,利用CpG島預(yù)測,作為輔助參考4、最后,可以找到小鼠的同源區(qū),進行同源性比較,啟動子區(qū)域一定是高保守區(qū)!5、到此,可以初步預(yù)測啟動子區(qū)域的范圍了。47嚴(yán)選文書