国产精品自在线一区,美女作爱全过程免费观看国产,国产自偷在线拍精品热

<strong id="cg4jc"><track id="cg4jc"></track></strong>

    <em id="cg4jc"><strike id="cg4jc"><u id="cg4jc"></u></strike></em>
      <button id="cg4jc"><object id="cg4jc"></object></button>

      IPA案例三: 深度挖掘二代測序NGS與基因表達實驗數據的價值

      2015-12-02 16:24:02 來源:源資科技市場部

      新聞摘要:對比IPA和免費開源的生物信息學工具,IPA不僅僅在基因表達譜數據分析所耗時間上先進免費工具,分析功能上也有明顯優勢。計算結果顯示IPA在每組數據分析時比免費工具能節約超過30個小時。同時Ingenuity知識庫與IPA分析功能的有效結合,研究者能夠對實驗系統和模型有更深入的理解; 科學家使用IPA時能夠得到更多、更深入的生物學細節,更快的獲取相關細節的背景文獻信息,相同時間里能進行更多的分析,而在后續的研究中能夠產生更有用的判斷和分析目標。


      簡介:
            現代生物研究中的高通量技術如microarray、蛋白質組學或NGS能夠讓科學家們檢測到幾乎所有的mRNA,蛋白質或DNA序列的變異,從而獲得成千上萬的數據。分析數據結果的復雜程度和所需要的時間也隨之直線上升,科學家們往往會陷入如何從海量的實驗數據中挖掘到該體系到底發生了什么的泥潭中。想充分挖掘實驗數據中的價值,需要科學家多方面的知識和技能,既要從生物學角度去闡釋整個實驗系統,又要理解系統變化的原因和效應等??茖W家們通常只去尋找實驗數據中發生差異表達的基因的上游調控子,如轉錄因子或調控的microRNA。但要完全理解實驗結果的效應,科學家們必須進一步分析差異基因所調控的分子通路,生物學功能,已知的毒理學效應并對某些特定的關鍵分子進行進一步的全面調研(i.e. 后續靶標或生物標志物)。
            以前科學家們可以依賴于個人的生物學專業知識并輔以檢索最新文獻來進行簡單的數據分析。但隨著文獻的研究領域分類更加細化,知識的積累和文獻的調研變得不再那么簡單?,F在,科學家們開始使用基于互聯網的軟件工具,包括專業的網站(i.e. PubMed)和一些免費的或商業化的分析工具(i.e. DAVID, Ingenuity-IPA)來幫助收集并分析數據。常規的高通量數據的分析和進一步的實驗假設,一般均從閱讀盡可能多的相關文獻并調研實驗結果中變化最大的基因開始。然而這樣的分析策略往往會大量遺漏關鍵的信息,很多時候是因為相關的分子數據庫和實驗數據相關的文獻量非常大,以至于科學家們無法面面俱到。而二代測序(NGS,如RNA-sequencing)的數據相當于為microarray實驗提供了更加精確的轉錄本和同源基因信息,使獲得信息變得更加復雜。因此,能夠深度挖掘實驗數據、將各種來源的背景信息整合在一起并提供靈活易用的工具進行查詢的軟件對理解實驗結果變的日益重要。
            在本文中,我們比較了商業化軟件IPA和數種免費的常用組學數據分析軟件在高通量數據分析的速度和效果。為了比較得出不同軟件的分析能力和效率,我們設計了三類代表性的分析任務:1. 查詢一個不熟悉的基因,建立實驗結果的生物學假設;2. 分析基因表達譜數據(轉錄因子,通路和生物學效應);3. 鑒別被microRNA所調控的靶標基因。


      實驗一:查詢一個不熟悉的基因,建立實驗結果的生物學假設
           
      本實驗中,我們以四個有潛在治療意義的靶基因為例進行搜索:膜聯蛋白2(annexin2 ANXA2),瘦素受體(leptin receptor LEPR),基質淋巴細胞生成素(TSLP)和白介素13(IL-13)。對比了三個工具:IPA,NCBI(Entrez),Pubmed在做這幾個基因搜索時所用的時間。其中,IPA的搜索速度快速,獲得的信息最為全面和精確。Pubmed所需時間比IPA略長,NCBI Entrez搜索最慢。對ANXA2的搜索結果均不太精確,IPA耗時約1.3小時,而NCBI Entrez則需要8小時之久。對于在肥胖和心血管研究中被受關注的LEPR,IPA大約需要3.24小時,而NCBI Entrez需要86.3小時。獲取信息的方便程度由搜索目標的格式不同而不同(圖一)。

       

      圖一:尋找一個基因所需的時間。計算時間的方法是根據每個搜索中找到的文獻和其他信息的數量而定的(閱讀資料所需的時間)。在同義詞搜索時由于用不同的搜索關鍵詞而產生了多種搜索結果。圖中。坐標最大值為40個小時,超出這個范圍的數據直接標記在圖中。


      實驗二:使用成熟的分析軟件分析生物芯片和RNA-SEQ基因表達數據的數據
           
      本實驗將用分析一個例子所需的時間作為衡量的標準,將從數據上傳開始計時一直到獲得一個確定的結果比如信號通路或生物學作用為止定義為初級結果時間(TTFR)。我們對比了Cytoscape,DAVID,GenMAPP,IPA和Path Visio幾個成熟分析軟件對表達譜芯片數據分析出潛在的轉錄因子,生物通路和生物學作用等結果所需要的時間。
            幾種工具的準備工作所需要的時間各不相同,DAVID,IPA和Path Visio幾乎不用什么時間準備,GenMaPP需要預先下載好相應的基因注釋數據庫,而Cytoscape需要預先下載一個插件,并且要人工導入生物通路和相互作用數據庫(比如使用插件調用PathwayCommons的數據)。

      表一為使用這幾種方式分析高通量數據時所需要的時間。++代表了獲得了可視化的結果和預測了可能的影響。+只能給出基本的基因通路,無針對性。+/-表明只能給出不完全的結果。N/A表示不能完成類似的工作。

       

        本實驗中,我們主要對比了DAVID和IPA在分析數據上的差別。IPA上傳數據非常靈活,可以由用戶自定義數據的類型和需要分析的數據列。IPA和DAVID分析得到初級結果的時間(TTFR)差不多,都是30分鐘左右。只是IPA是由上傳的實驗數據為根據分析其中差異顯著的基因的生物通路和生物學作用,而DAVID給出的生物通路與上傳數據中顯著差異基因完全沒關系。
            IPA在短短的30分鐘內就能從表達芯片數據中差異顯著的基因根據預定的8種對比條件下挖掘出其生物學通路,生物作用,轉錄調節因子,以及相應的文獻支持等分析結果(表一,圖二)。而DAVID雖然也是30分鐘能完成初級分析,但是其一次只能分析一種對比條件。不同的條件均要分別輸入分析,這樣就很難直接對比不同條件的下的分析結果(表一,圖二)。

       

      圖二:基于不同組病人基因表達值用IPA預測生物學作用。由z-score做出的熱圖是基于基因表達顯著差異和實驗中基因的預期效果所確定的。A)對治療有應答的病人基因表達顯示參與炎癥反應的基因都下調了,而細胞凋亡的基因有些上調有些下調。B)對治療無應答的病人基因表達中,參與細胞凋亡的基因都上調了。C)表格中顯示參與嗜酸性細胞的遷徙的基因表達有上升趨勢(z=1.683)

       

      圖三:由DAVID做出的分析結果。A)根據InterPro和GO定義出的功能注釋柱狀圖。B)KEGG中脂肪酸代謝的通路圖(部分)紅色的星表示出該基因來自上傳的數據,綠色的填充色表示小鼠同源體。


      實驗三:對MicroRNA-mRNA靶向作用的關系預測
           
      對microRNA調節基因表達的研究近些年來非常熱門。由之產生的出來一些列的數據庫和工具用于分析和預測microRNA的靶向,比如TargetScan和PicTar。但是由于一條microRNA可以由于所處的組織,疾病,通路的不同能夠靶向上千條目標基因。于是,對其靶向的精確分析將為之后的驗證試驗節約大量成本。
            我們使用在一個在膠質瘤中表達最高的microRNA hsa-mir-325為例搜索。IPA只用了不到一分鐘就得到了查詢結果,而miRBase花了14分鐘。IPA產生的結果來源于多種數據庫,并且將靶向mRNA列表易于下載,并給出相應的文獻支持。而miRBase卻不能將搜索結果直接導出,只能手工摘取需要的信息(表二)。
            不單單是搜索,我們也將膠質瘤的microRNA數據直接進行分析,希望能從中提取出來針對該疾病的有用的通路信息。DIANA-miRPath和IPA都預測了這些數據中會有的潛在的靶向基因和參與的通路。IPA花了大約10分鐘完成了數據上傳,靶向mRNA挖掘,并且直接提供了microRNA-mRNA之間的上調下調的預測結果。DIANA-miRPath不能直接上傳數據,就只是人文的提供了一個microRNA的名單,因此,只有10個microRNA被分析了,并且耗時需要二十多分鐘。其提供的結果是從不同的通路數據庫中無篩選直接提取的。很難找出具有特異性的結果,增加了從中甄選有用信息的時間(表二)。 

      表一:顯示查找并分析microRNA所需要的時間,計算了得到最初結果所需要的時間。

       



      討論:
            本文的主要目的之一是將microarray或RNA-Seq實驗的基因表達數據同時采用商業化和免費分析工具進行數據分析時所用時間進行定量比較。投資回報ROI值可以基于各個工具的分析時間計算得出。ROI由凈收益除以軟件花費計算得出。作為商業通路分析工具的先進供應商,IPA的用戶數據分析平均量在2011年有20個左右。平均每個用戶使用IPA進行數據分析的總時間數為62個小時。在本次測試中,IPA相對于其他軟件綜合起來(DAVID,PATHVISIO,Pubmed)大約每個課題節約了30個小時的研究時間(圖四),相對于每人每個課題節約了約60%的分析時間。如果使用頻率較高的話,相對于軟件投資成本來說,節約的分析時間和提高的分析效率更加值得考慮。
            另外,為了最大化高通量基因表達實驗的價值,研究者必須將實驗數據和生物學問題關聯起來考慮。IPA幫助科學家們快速了解實驗數據和生物學問題間的關系,并幫助他們快速產生有價值的推斷和假設。我們總結了5個最有價值,最幫助IPA提高其ROI的因素。另外,IPA潛在價值在于能夠幫助您更深入的了 解實驗系統和模型背后的生物學意義,更好的評估實驗結果的可信度,更好的幫助研究者篩選目標分子及做出判斷,更能夠在整個研究課題組中更好的分享結果,進行創新。
      對數據分析重要的5個關鍵因素為:


            1. 分析:闡釋基因表達量發生變化的原因及其生物學效應;能夠預測導致基因表達發生變化的上游調節子(轉錄因子、microRNA及其他分子)的活性狀態是更好的理解生物系統和實驗的影響的關鍵。
            2. 分析:提供網絡探索的系統生物學方法;采用迭代的探索方法幫助您 更深入的理解研究對象的生物學特性。 分析 工具同樣需要具有多組學平臺數據如轉錄組、蛋白質組、代謝組、microRNA等的聯合分析能力。從而,科學家們可以使用工具進行相互作用網絡生成,以及進一步的研究數據相關的生物學問題,如構建第二信使級聯反應,鑒定臨床可用的生物標志物或檢測哪些信號通路發生了顯著失調等。
            3. 平臺:支持前沿的研究。在NGS技術等的推動下,相關的研究領域進展突飛猛進,良好的分析工具是能夠緊緊關聯前沿的技術和知識,幫助分析復雜研究的數據。完整的分析工具應該可以同時幫助研究者分析RNA-Seq技術得到實驗結果中的同源基因信息,并提供可視化的特定生物學功能與可變剪切及蛋白質功能域之間的相關性。另外,完整的分析工具應該也同時具有鑒定和篩選microRNA-mRNA配對情況,并篩選其中與目標通路和疾病相關聯的具有生物學意義的結果
            4. 整合:所有數據結果間的整合是非常耗時的。如果你在進行不同類型的分析時采用不同的軟件,那樣會花費您多的多的時間去進行數據整合和分析。而大多數軟件往往也只具備某一類型的分析功能,而不是設計來回答您所有可能的問題。
            5. 內容:需要完整全面、高時效性、高質量的數據庫內容來輔助數據分析。對于分析軟件來說,背景數據庫的高時效性和內容高準確性是極其重要的。另外,背景知識是如何人工閱讀提取和組織的同樣對于數據庫

       

      圖四:IPA與免費數據分析軟件的工作流程比較。A) 保守估計IPA數據分析加文獻調研的時間約為20.87 小時,包括獨有的生物學效應預測和轉錄因子調控網絡預測B) 免費軟件同樣的工作流程需要用到3種不同的軟件,包括功能和通路分析,通路查看和數據對接,人工文獻調研等。該分析流程沒有IPA所具有的上游轉錄因子調控狀態預測,microRNA-mRNA功能及通路相關性篩選和下游生物學效應預測。


      結論:
            科學家們投入了大量的金錢和經歷在高通量儀器設備上產出海量的數據,但是如果缺乏高效的數據分析手段的話,那么這些投資往往會高投入低產出。對于大數據平臺如microarray或RNA-Seq,生物學解釋工具如IPA是幫助科學家們快速篩選相關有意義信息和在統一的生物學背景中闡釋數據意義的關鍵。在一個提供完整的上下游分子信息、分子相互作用網絡,上游轉錄因子調控網絡,下游生物學效應的軟件環境中分析解釋RNA-Seq或microarray數據集能夠幫助您快速、可靠的找到復雜數據中的關鍵信息。采用如IPA這樣的商業化軟件可以使每個項目的分析時間節約超過30個小時,這樣可以更快更好地優化后續的實驗和建立假設模型。當您考慮選擇一個更高回報率的分析策略是,最需要考慮的因素是如何最大化實驗結果中的有價值信息,從而充分利用儀器設備和試劑的巨額投資。本文系統的描述和計算了microarray或RNA-Seq數據分析時三個關鍵步驟所需要耗費的時間及其投資回報,當使用IPA時,其分析效率和回報明顯優于其它免費工具。另外,我們總結了五個在數據分析時需要關注的關鍵性因素,幫助您判斷是否需要在數據分析時選擇優質的工具。


      【責任編輯:(Top) 返回頁面頂端
      Copyright ? 2008 - 2022 Tri-ibiotech.com All Right Reserved. | 備案許可證: 滬ICP備11020704-5.
      国产精品自在线一区,美女作爱全过程免费观看国产,国产自偷在线拍精品热