當我們資源不足時,自然會想要找一些省錢的辦法來發(fā)文章,窮則思變嘛。生信是個好辦法,
可是有些醫(yī)生朋友還是覺得不太熟悉,別說后邊的分析方法了,就連開始找數據都不好找。
研究腫瘤的比較有福,腫瘤的數據zui豐富了,像大名鼎鼎的 TCGA、Ocomine 等??裳芯科?/span>
他疾病的怎么辦,有沒有疾病特異性數據庫呢?
資源上哪找
隨著研究成果的積累,大大小小的數據庫們就冒了出來,駐扎在互聯網的各個角落,現在已
1218經有了上千個。
找數據比較權wei的資源集中站,是牛津大學出版社的 Nucleic Acids Research(NAR)雜志。從
1994 年開始,NAR 每年都要出版分子生物學數據庫特輯(database issue),收錄新增的數據
庫、盤點舊數據庫的更新狀況、移除失效鏈接等,做個總結。目前版是第 24 版,即 2017
版。
而所有收錄的數據庫可以在 NAR 的網站上找到,下面是一個按字母排序的列表
不過找起來更方便的可能是按功能分類查找:
NAR 把數據庫分為 15 個類別(有些數據庫會同時被分到好幾個類別):
1219有些分類下邊還有子類別,可以跟據自己的目的逐級點開,找到相應的資源。比如想找個特
定的疾病,就點開 Human Genes and Diseases,下邊還有 4 個子分類,其中癌癥基因數據庫
是單*個子類(Cancer gene databases),其他的疾病可以點開 Gene-, system- or disease
specific databases,就可看到具體數據庫列表。
1220這當然只是一部分啦~
圖中可看到注意力缺陷多動障礙(ADHDgene),自身免疫性淋巴細胞增生綜合征(ALPSbase),
阿茲海默?。?/span>AlzGene)等等。
點進去會有數據庫的描述說明,或詳或略。并附有數據庫網站鏈接,點進去就是了。
注意數據庫的質量
數據庫這么多,也有大小之分,當然不是隨便一個數據庫拿來就用,用了就能得到非常牢靠
的研究成果。
一個成功的數據庫背后,要有良好的管理維護工作。大數據庫為什么著名、好用,是因為有
一個大集團在運營。比較著名的機構有美國國家生物技術信息中心(NCBI)、歐洲分子生物
學實驗室-歐洲生物信息學研究所(EMBL-EBI)、瑞士生物信息學研究所(SIB)、日本國立遺
傳學研究所(NIG)、華大基因(BGI)等。
而一些小團隊為自己特定的研究領域創(chuàng)建的數據庫,質量就參差不齊了,上邊提到的疾病特
異性數據庫大多屬于此類。
1221雖然小團隊不容易跟大佬競爭,而且有時候同一個領域會有好幾個相似的數據庫,NAR 也不
介意都收錄,只要它們符合一定質量條件,且還在運營、維護、為研究者提供服。因為 NAR
鼓勵良性競爭,讓那些數據庫經歷時間的考驗證明自己。像研究 G 蛋白耦聯受體的 GPCRdb
和研究碳水化合物活性酶的 CAZy 就是小團隊的成功范例。
對于用戶來說,采用一個數據庫做研究之前要多留心,要了解好它的數據來源和運營維護情
況,是否有及時回應用戶的反饋,是否有版本控制;還要多檢索文獻,看看這個數據庫的使
用情況,大家利用它做出了哪些成果,反饋如何等等。必要時可多找?guī)讉€相關的數據庫互相
佐證。
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯系,否則視為放棄相關權利。