Gen ontolojisi

Vikipedi, özgür ansiklopedi
Gezinti kısmına atla Arama kısmına atla

Gen ontolojisi, ya da GO, gen ve gen ürünü vasıflarının bütün türler kapsamında temsilini birleştirmek için büyük bir biyoenformatik girişimidir.[1] Proje özellikle şunları hedeflemektedir:

  1. Gen ve gen ürünü vasıflarına dair sahip olduğu denetli söz dağarcığının sürdürülmesi ve geliştirilmesi;
  2. Gen ve gen ürünlerinin notlaması, not verilerinin özümsenmesi ve dağıtılması;
  3. Projenin sağladığı verinin bütün boyutlarına kolayca erişilmesi için ve deneysel verilerin GO kullanarak (zenginleşim analizi gibi yollarla) işlevsel yorumlanabilmesi için araçlar sağlanması.

GO daha geniş bir sınıflandırma çabası olan Açık Biyomedikal Ontolojiler'in (Open Biomedical Ontologies - OBO) bir parçasıdır.[2]

GO terimleri ve ontolojisi[değiştir | kaynağı değiştir]

Pratik bir bakışla ontoloji, bilgi sahibi olduğumuz bir şeyin temsilidir. "Ontolojiler" tespit edilebilir ya da doğrudan gözlemlenebilir şeylerin ve bu şeyler arasındaki ilişkilerin temsilinden oluşur. Biyoloji ve ilişkili sahalarda evrensel bir standart terminoloji bulunmamaktadır, belirli bir türe özgü, araştırma alanına özgü, hatta belirli bir araştırma grubuna özgü terim kullanımları olabilmektedir. Bu da verilere dair iletişim ve paylaşımı daha zor kılmaktadır. Gen Ontolojisi projesi gen ürünü özelliklerini temsil eden tanımlı terimlerin bir ontolojisini sağlar. Ontoloji üç sahayı kapsar:

  • hücresel bileşen, bir hücrenin ya da hücredışı ortamının parçaları;
  • moleküler işlev, bir gen ürününün moleküler düzeydeki bağlanma ya da enzim katalizi gibi öğesel faaliyetleri;
  • biyolojik süreç, entegre yaşam birimlerinin (hücrelerin, dokuların, organların ve organizmaların) işleyişiyle ilgili, tanımlı bir başlangıcı ve sonu olan işlemler veya moleküler olay kümeleri.

Ontoloji dahilindeki her bir GO teriminin bir terim adı vardır, bu ad şunlardan birisi olabilir: bir sözcük ya da sözcük dizisi; eşsiz bir alfanumerik belirteç; atıflar yapan bir tanımlama; ait olduğu sahayı belirten bir ad-uzamı. Terimlere ait eş-anlamlılar olabilir: bunlar terime tam eşdeğer olarak, daha geniş ya da dar kapsamlı olarak, veya terimle ilişkili olarak sınıflanırlar. Yine terimlere ait, başka veritabanlarındaki eşdeğer kavramlara atıflar; terim anlamı ya da kullanımı üzerine yorumlar olabilir. GO ontolojisi bir yönlü-çevrimsiz-çizge olarak yapılanmıştır, ve her bir terim, aynı sahaya ait (bazen başka sahalara da ait) bir ya da daha fazla başka terim ile tanımlı ilişkilere sahiptir. GO söz dağarcığı tür-tarafsız olarak tasarlanmıştır, ve prokaryotlara, ökaryotlara, tek ya da çok hücreli organizmalara uygulanabilir terimler içermektedir.

GO sabit değildir, ve ekleme, düzeltme ve değiştirme önerileri hem araştırma ve notlama topluluğu üyelerinden hem de doğrudan GO projesine dahil olan kişilerden gelir ve yine bu kişilerden istenir. Örneğin, bir notlayıcı bir metabolik patikayı temsil edecek özgül bir terim talep edebilir, ya da ontolojinin bir kısmı topluluk uzmanlarının yardımıyla gözden geçirilebilir (örn.[3]). Önerilen düzenlemeler ontoloji editörleri tarafından değerlendirilir ve uygun olduklarında yürürlüğe geçirilir.

GO ontoloji dosyası GO websitesinden [4] farklı dosya biçimleriyle ücretsiz olarak edinilebilir, ya da GO tarayıcısını kullanarak çevrimiçi erişilebilir AmiGO. Gen Ontolojisi projesi ayrıca terimlerinin başka sınıflandırma sistemleriyle eşleştirme dosyalarını da sağlamaktadır.

Örnek GO terimi[değiştir | kaynağı değiştir]

id:         GO:0000016
name:       lactase activity
namespace:  molecular_function
def:        "Catalysis of the reaction: lactose + H2O = D-glucose + D-galactose." [EC:3.2.1.108]
synonym:    "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
synonym:    "lactose galactohydrolase activity" EXACT [EC:3.2.1.108]
xref:       EC:3.2.1.108
xref:       MetaCyc:LACTASE-RXN
xref:       Reactome:20536
is_a:       GO:0004553 ! hydrolase activity, hydrolyzing O-glycosyl compounds

Veri kaynağı:[5]

Notlama[değiştir | kaynağı değiştir]

Genom notlaması bir gen ürününe dair veri yakalama pratiğidir ve GO notlamaları bunun için GO ontolojisindeki terimleri kullanır. GO Konsorsiyumunun üyeleri kendi notlamalarını entegrasyon ve dağıtım için GO websitesine gönderirler, notlamalar bu sitede doğrudan indirilebilirler ya da AmiGO kullanarak çevrimiçi görüntülenebilirler. Gen ürünü belirteci ve ilgili GO terimine ek olarak, GO notlamalarında şu veriler bulunur:

  • Notlamayı yapmakta kullanılan atıf (örn. bir dergi makalesi)
  • Notlamanın dayandırıldığı kanıt tipini belirten bir kanıt kodu
  • Notlamanın tarihi ve yaratıcısı

Kanıt kodu, hem manüel hem otomatik notlama yöntemlerini kapsayan bir denetli söz dağarcığı olan Kanıt Kodu Ontolojisinden gelir. Örneğin, İzlenebilen Yazar Beyanı (Traceable Author Statement - TAS) bir küratörün yayınlanmış bir bilimsel makaleyi okumuş olduğu ve bu notlamadaki üstverinin bu makaleden bir alıntı taşıdığı anlamına gelir; Dizi Benzerliğinden Çıkarım (Inferred from Sequence Similarity - ISS) bir küratörün bir dizi benzerliği aramasına ait çıktıyı değerlendirmiş ve biyolojik anlam taşıdığını geçerlemiş olduğu anlamına gelir. Otomatik süreçlerden (örn. başka bir notlama söz dağarcığı kullanarak yaratılmış notlamaların yeniden eşleştirilmesi) gelen notlamalara Elektronik Notlamadan Çıkarım (Inferred from Electronic Annotation - IEA) kodu verilir. 1 Nisan 2010 itibarıyla bütün GO notlamalarının %98'den fazlası hesaplamalı olarak çıkarsanmıştı, küratörler tarafından değil.[6] Bu notlamalar bir insanın muayenesinden geçmemiş olduğundan, GO Konsorsiyumu bunları daha az güvenilir görmektedir ve AmiGO'da çevrimiçi olarak sunulan verilere bunların yalnızca bir altkümesini dahil etmektedir. Tam notlama veri kümeleri GO websitesinden indirilebilir. Notlamanın gelişimini desteklemek için, GO Konsorsiyumu yeni geliştirici gruplara çalışma kampları ve mentorlar sağlamaktadır.

Örnek notlama[değiştir | kaynağı değiştir]

Gen ürünü:  Actin, alpha cardiac muscle 1, UniProtKB:P68032
GO terimi:  heart contraction ; GO:0060047 (biyolojik süreç)
Kanıt kodu: Mutant Fenotipinden Çıkarım (Inferred from Mutant Phenotype - IMP)
Atıf:       PMID 17611253
Atayan:     UniProtKB, 6 Haziran 2008

Veri kaynağı:[7]

Araçlar[değiştir | kaynağı değiştir]

GO projesinin sağladığı verileri kullanan, hem çevrimiçi hem de indirerek kullanılabilecek çok sayıda araç bulunmaktadır[8]. Bunların muazzam çoğunluğu üçüncü taraflardan gelir; GO Konsorsiyumu araçlardan iki tanesini geliştirip desteklemektedir, AmiGO ve OBO-Edit.

AmiGO[9], kullanıcıların ontolojileri ve gen ürünü notlama verilerini sorgulamasına, taramasına ve görselleştirmesine olanak veren web-tabanlı bir uygulamadır. Ayrıca, bir BLAST aracı,[10] daha büyük veri kümelerinin analizine olanak veren araçları,[11][12] ve GO veritabanını doğrudan sorgulamak için bir arayüzü de bulunur.[13]

AmiGO GO Konsorsiyumunun sağladığı verilere erişmek için GO websitesinde çevrimiçi olarak kullanılabilir, ya da GO veritabanı şemasına uygun herhangi bir veritabanı üzerinde yerel kullanım için indirilerek kurulum yapılabilir (örn.[14]). Özgür bir açık kaynaklı yazılımdır ve go-dev yazılım dağıtımının bir parçası olarak sunulmaktadır.[15]

OBO-Edit[16], Gen Ontolojisi Konsorsiyumu tarafından geliştirilip sürdürülen, açık kaynaklı, platformdan-bağımsız ontoloji düzenleyicisidir. Java'da yazılmıştır ve ontolojilerin görüntülenmesi ve düzenlenmesinde çizge-yönelimli bir yaklaşım kullanır. OBO-Edit kapsamlı bir arama ve süzme arayüzü, ve terimlerin görsel olarak ayırt edilmesi için altkümeleri çizdirme seçeneği içermektedir; kullanıcı arayüzünü kullanıcı tercihlerine göre özelleştirilmesi de mümkündür. OBO-Edit'te ayrıca açıkça beyan edilmemiş bağlantıları mevcut ilişkilerine ve özelliklerine dayalı olarak çıkarsayabilen bir semantik akıl yürütücü de bulunmaktadır. Biyomedikal ontolojiler için geliştirilmiş olsa da, OBO-Edit herhangi bir ontolojiyi görüntülemek, aramak ve düzenlemek için kullanılabilir. Ücretsiz olarak indirilebilmektedir.[15]

GO Konsorsiyumu[değiştir | kaynağı değiştir]

GO Konsorsiyumu GO projesine etkin olarak dahil olan biyolojik veritabanlarının ve araştırma gruplarının kümesidir.[17] Bunlar, çeşitli model organizma veritabanlarını, çok-türlü protein veritabanlarını, yazılım geliştirme gruplarını, ve tahsis edilmiş editoryal bir büroyu içerir.

Tarih[değiştir | kaynağı değiştir]

Gen ontolojisi başlangıçta üç model organizmanın (Drosophila melanogaster (meyve sineği), Mus musculus (fare), ve Saccharomyces cerevisiae (bira ya da ekmek mayası)) genomunu çalışan araştırmacıların bir konsorsiyumu tarafından 1998'de inşa edildi.[18] Birçok diğer model organizma veritabanları Gen Ontolojisi konsorsiyumuna katılarak, hem notlama verisine katkı yaptılar, hem de verilerin görüntülenmesi ve uygulanması için ontoloji ve araçların geliştirilmesine katkı yaptılar. Şimdiye dek, bitki, hayvan ve mikroorganizmalara ait başlıca veritabanlarının çoğu projeye yönelik katkıda bulundular. Ocak 2008 itibarıyla GO, geniş bir çeşitlilikteki biyolojik organizmalara uygulanabilen 24,500'den fazla terim içermektedir. GO'nun gelişimi ve kullanımı üzerine belirgin bir literatür vücut bulmuştur, ve biyoenformatik cephaneliğinde standart bir araç olmuştur. Hedeflerinin üç boyutu vardır: gen ontolojisi oluşturulması, genlere/gen ürünlerine ontoloji ataması yapılması ve bu iki hedefe dönük yazılım ve veritabanları geliştirilmesi.

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ The Gene Ontology Consortium (January 2008). "The Gene Ontology project in 2008". Nucleic Acids Res. 36 (Database issue), s. D440–4. doi:10.1093/nar/gkm883. PMC 2238979 $2. PMID 17984083. 
  2. ^ Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Ireland A, Mungall CJ, Leontis N, Rocca-Serra P, Ruttenberg A, Sansone SA, Scheuermann RH, Shah N, Whetzel PL, Lewis S (November 2007). "The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration". Nat. Biotechnol. 25 (11), s. 1251–5. doi:10.1038/nbt1346. PMC 2814061 $2. PMID 17989687. 
  3. ^ Diehl AD, Lee JA, Scheuermann RH, Blake JA (April 2007). "Ontology development for biological systems: immunology". Bioinformatics. 23 (7), s. 913–5. doi:10.1093/bioinformatics/btm029. PMID 17267433. 
  4. ^ "Gen Ontolojisi Veritabanı". Gen Ontolojisi Konsorsiyumu. 9 Ocak 2014 tarihinde kaynağından arşivlendi. 
  5. ^ GO Konsorsiyumu (2009-03-16). "gene_ontology.1_2.obo". 6 Ekim 2015 tarihinde kaynağından (OBO 1.2 düz dosya) arşivlendi. Erişim tarihi: 2009-03-16. 
  6. ^ "The what, where, how and why of gene ontology—a primer for bioinformaticians — Brief Bioinform". doi:10.1093/bib/bbr002. 
  7. ^ GO Konsorsiyumu (2009-03-16). "AmiGO: P68032 Associations". 5 Kasım 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 2009-03-16. 
  8. ^ Mosquera JL, Sánchez-Pla A (July 2008). "SerbGO: searching for the best GO tool". Nucleic Acids Res. 36 (Web Server issue), s. W368–71. doi:10.1093/nar/gkn256. PMC 2447766 $2. PMID 18480123. 
  9. ^ DOI:10.1093/bioinformatics/btn615
    Bu alıntı, sonraki birkaç dakika içinde otomatik olarak tamamlanacaktır. Siz de kuyruğun önüne geçebilir ya da elle açıklayabilirsiniz
  10. ^ AmiGO BLAST aracı
  11. ^ AmiGO Terim Zenginleşim aracı; bir notlama kümesinde paylaşılan belirgin GO terimlerini bulur
  12. ^ AmiGO İnceltici; granüler notlamaları üst-düzey terimlere kadar eşleştirir
  13. ^ GOOSE, GO Çevrimiçi SQL Ortamı; GO veritabanına dönük doğrudan SQL sorgulamasına olanak verir
  14. ^ Bitki Ontolojisi Konsorsiyumu (2009-03-16). "Bitki Ontolojisi Konsorsiyumu". 18 Ekim 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 2009-03-16. 
  15. ^ a b "SourceForge'da Gen Ontolojisi dosyaları". 8 Mayıs 2009 tarihinde kaynağından arşivlendi. Erişim tarihi: 2009-03-16. 
  16. ^ DOI:10.1093/bioinformatics/btm112
    Bu alıntı, sonraki birkaç dakika içinde otomatik olarak tamamlanacaktır. Siz de kuyruğun önüne geçebilir ya da elle açıklayabilirsiniz
  17. ^ "GO Konsorsiyumu". 2 Temmuz 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 2009-03-16. 
  18. ^ Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, Sherlock G (May 2000). "Gene ontology: tool for the unification of biology. The Gene Ontology Consortium". Nat. Genet. 25 (1), s. 25–9. doi:10.1038/75556. PMC 3037419 $2. PMID 10802651. 

Dış bağlantılar[değiştir | kaynağı değiştir]

  • Gen Ontolojisi Konsorsiyumu — Ontolojilere erişim sağlar, yazılım araçları, notlanmış gen ürünü listeleri, GO'yu ve kullanımlarını tarif eden kaynak belgeler bulunur.
  • GO Terimi Zenginleşimi proteinler ve GO notlamaları arasında paylaşılan çağrışımların teşhis edilmesinde kullanılan yaygın bir istatistiksel yöntemdir.
  • GONUTS Wiki — üçüncü taraf GO terimi belgelendirmesi, birçok başlıca model organizma veritabanındaki GO notlamalarına bağlantılar içerir.
  • GOCat — Biyomedikal Metinlerin İşlevsel Notlamasına yardımcı Otomatik GO Kategorileyici/Tarayıcı; yüksek-hacimli deneylerce üretilen protein ve gen isim listelerini işlevsel olarak karakterize etmekte kullanışlıdır
  • Protein Ontolojisi Projesi — Protein Ontolojisi (PO), PO ve kullanımlarını tarif eden kaynak belgeler.
  • EAGLi — MEDLINE için terminolojiye-dayalı (Gen Ontolojisi, Swiss-Prot anahtar sözcükleri, vb.) bir biyomedikal soru yanıtlama motoru
  • PubOnto — Gen Ontolojisi ve diğer ontolojilere dayanan Medline Dolaşılması.
  • WikiProfessional — muğlaksızlama, bilgi üretimi ve işbirlikçi zeka.
  • SimCT — bir ontolojiye notlanmış biyolojik nesneler arasındaki ilişkilerin bir öbekleme ağacı biçiminde görüntülenmesi için web-tabanlı araç.
  • SerbGO — farklı programların yeteneklerini karşılaştıran, ortak özelliklerini ve farklarını gösteren, kullanıcının özgül olarak gereksindiği yeteneklere hangi araçların (eğer varsa) sahip olduğunu gösteren bir GO aracı
  • Saha-merkezli Gen Ontolojisi — işlevler, fenotipler, hastalıklar ve dahası üzerine saha-merkezli ontolojilerin veritabanı
  • GO2PUB — gen ontolojisi terimlerinin semantik genişletilmesi ile PubMed'in sorgulanması