Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Glikan Aracılı Protein Etkileşimlerinin İncelenmesi için Biyoinformatik Kaynakları

Published: January 20, 2022 doi: 10.3791/63356

Summary

Bu protokol, insan protein glislerinin çevrimiçi kaynaklarla nasıl keşfedileceğini, karşılaştırılacağını ve yorumlanacağını göstermektedir.

Abstract

Glyco@Expasy girişimi, glikobiyolojideki bilginin çeşitli yönlerini kapsayan birbirine bağlı veritabanları ve araçların bir koleksiyonu olarak başlatıldı. Özellikle, glikoproteinler (hücre yüzey reseptörleri gibi) ve glikanların aracılık ettiği karbonhidrat bağlayıcı proteinler arasındaki etkileşimleri vurgulamayı amaçlamaktadır. Burada, koleksiyonun ana kaynakları, insan Prostat Spesifik Antijeninin (PSA) N-glifili ve insan serum proteinlerinin O-glibrimi üzerine odaklanan iki açıklayıcı örnekle tanıtılmaktadır. Farklı veritabanı sorguları aracılığıyla ve görselleştirme araçlarının yardımıyla, bu makalede, dağınık bilgi parçalarını toplamak ve ilişkilendirmek için bir süreklilikteki içeriğin nasıl keşfedileceği ve karşılaştırılacağı gösterilmektedir. Toplanan veriler, glikan fonksiyonunun daha ayrıntılı senaryolarını beslemeye yöneliktir. Bu nedenle, burada tanıtılan glicoinformatikler, belirli bir bağlamda bir protein glibrifinin özgüllüğü hakkındaki varsayımları güçlendirmek, şekillendirmek veya çürütmek için bir araç olarak önerilmektedir.

Introduction

Glikanlar, bağlı oldukları proteinler (glikoproteinler) ve bağlandıkları proteinler (lektinler veya karbonhidrat bağlayıcı proteinler) hücre yüzeyindeki ana moleküler aktörlerdir1. Hücre-hücre iletişimindeki bu merkezi role rağmen, glikomik, glikoproteomik veya glikan-interaktomik veriler de dahil olmak üzere büyük ölçekli çalışmalar, genomik ve proteomikteki muadillerine kıyasla hala azdır.

Yakın zamana kadar, hala taşıyıcı proteine konjuge edilirken karmaşık karbonhidratların dallanma yapılarını karakterize etmek için yöntemler geliştirilmemişti. Glikoproteinlerin biyosentezi, monosakkarit donörlerinin, kabul eden glikoprotein substratlarının ve glikoziltransferazların ve glikozidazların etkileşimli bir rol oynadığı şablon güdümlü olmayan bir süreçtir. Ortaya çıkan glikoproteinler, her bir monosakkarit bileşeninin doğada bulunan çeşitli tiplerden biri olabileceği çoklu dallanma noktalarına sahip karmaşık yapılar taşıyabilir1. Şablon güdümlü olmayan süreç, oligosakkarit yapısal verileri üretmek için tek seçenek olarak biyokimyasal analizi empoze eder. Doğal bir proteine bağlı glikan yapılarının analitik süreci, monosakkarit bileşimini, bağlantılarını ve dallanma dizilerini2 belirlemek için hassas, kantitatif ve sağlam teknolojiler gerektirdiğinden genellikle zordur.

Bu bağlamda kütle spektrometresi (MS) glikomik ve glikoproteomik deneylerde en yaygın kullanılan tekniktir. Zaman geçtikçe, bunlar daha yüksek aktarım hızı ayarlarında gerçekleştirilir ve veriler artık veritabanlarında birikmektedir. Çeşitli formatlardaki glikan yapıları3, glikan'ın tanımlandığı hassasiyet düzeyine bakılmaksızın her yapının kararlı bir tanımlayıcı ile ilişkilendirildiği evrensel glikan veri deposu GlyTouCan4'ü doldurur (örneğin, muhtemelen eksik bağlantı tipi veya belirsiz bileşim). Çok benzer yapılar toplanmış, ancak küçük farklılıkları açıkça bildirilmiştir. Glikoproteinler, birbirine çapraz referans veren iki veritabanı olan GlyConnect5 ve GlyGen6'da tanımlanmakta ve küratörlüğünü yapmaktadır. Yapısal kanıt parçalarını destekleyen MS verileri, GlycoPOST7'de giderek daha fazla depolanmaktadır. Çevrimiçi kaynakların daha geniş bir kapsamı için, referans el kitabının 52. bölümü, Glikobiyolojinin Temelleri, glikoinformatik8'e adanmıştır. İlginçtir ki, glikopeptid tanımlama yazılımı son yıllarda çoğalmıştır9,10 ancak tekrarlanabilirliğin yararına değildir. İkinci endişe, HUPO GlycoProteomics Initiative'in (HGI) liderlerini 2019'da bir yazılım mücadelesi oluşturmaya itti. N- ve O-glikozile insan serum proteinlerinin karmaşık karışımlarının CID, ETD ve EThcD parçalanma modlarında işlenmesinden elde edilen MS verileri, yazılım kullanıcıları veya geliştiriciler olsun, rakiplerin kullanımına sunulmuştur. Bu meydan okumanın sonuçlarıyla ilgili raporun tamamı11 yalnızca burada özetlenmiştir. Başlangıç olarak, tanımlamaların yayılması gözlendi. Temel olarak, arama motorlarında uygulanan yöntemlerin, ayarlarının çeşitliliğinden ve çıktıların nasıl filtrelendiğinden ve peptidin "sayıldığından" kaynaklandığı şeklinde yorumlandı. Deneysel tasarım ayrıca bazı yazılım ve yaklaşımları bir dezavantaja (dezavantaj) koymuş olabilir. Daha da önemlisi, aynı yazılımı kullanan katılımcılar tutarsız sonuçlar bildirdiler ve böylece ciddi tekrarlanabilirlik sorunlarını vurguladılar. Farklı gönderimler karşılaştırılarak bazı yazılım çözümlerinin diğerlerinden daha iyi performans gösterdiği ve bazı arama stratejilerinin daha iyi sonuçlar verdiği sonucuna varılmıştır. Bu geri bildirimin otomatik glikopeptid veri analizi yöntemlerinin geliştirilmesine rehberlik etmesi ve dolayısıyla veritabanı içeriğini etkilemesi muhtemeldir.

Glikoinformatiğin genişlemesi, bilgi sağlayan ve birden fazla benzer veya tamamlayıcı kaynağa erişim sağlayan web portalları oluşturmaya yol açtı. En yeni ve güncel olanlar, Kapsamlı Glikobilim kitap serisinin bir bölümünde açıklanmıştır12 ve işbirliği yoluyla, açık erişim modunda veri paylaşımı ve bilgi alışverişine bir çözüm sunulmaktadır. Başlangıçta Glycomics@ExPASy 13 olarak adlandırılan ve Glyco@Expasy olarak yeniden adlandırılan böyle bir portal geliştirildi, Expasy platformunun14 büyük revizyonunu takiben, onlarca yıldır çeşitli -omiklerde kullanılan geniş bir araç ve veritabanı koleksiyonuna ev sahipliği yaptı, en popüler öğe UniProt15-evrensel protein bilgi bankası. Glyco@Expasy, görsel bir kategorizasyona ve karşılıklı bağımlılıklarının görüntülenmesine dayanarak, veritabanlarının ve araçların amacının ve kullanımının didaktik bir keşfini sunar. Aşağıdaki protokol, glikoproteomik ve glikan-interaktomik arasındaki bağlantıyı glikomikler yoluyla açıkça ortaya koyan bu portaldan bir dizi kaynakla glikomik ve glikoproteomik verileri keşfetme prosedürlerini göstermektedir. Olduğu gibi, glikomik deneyler, monosakaritlerin tam olarak tanımlandığı ve bağlantıların kısmen veya tamamen belirlendiği yapılar üretir, ancak protein bölgesi bağlanmaları, eğer varsa, zayıf bir şekilde karakterize edilir. Buna karşılık, glikoproteomik deneyler kesin bölge bağlanma bilgisi üretir, ancak genellikle monosakkarit bileşimleriyle sınırlı glikan yapılarının zayıf çözünürlüğü ile. Bu bilgiler GlyConnect veritabanında bir araya getirilir. Ayrıca, GlyConnect'teki arama araçları, glikanlar aracılığıyla GlyConnect'e bağlanan UniLectin16'da onları tanıyan proteinlerle birlikte tanımlanan potansiyel glikan ligandlarını tespit etmek için kullanılabilir. Burada sunulan protokol, N'ye bağlı ve O'ya bağlı glikanlara ve glikoproteinlere özgü soruları kapsayacak şekilde iki bölüme ayrılmıştır.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOT: İnternet bağlantısı olan bir cihaz (daha büyük ekran tercih edilir) ve Chrome veya Firefox gibi güncel bir Web tarayıcısı gereklidir. Safari veya Edge'i kullanmak o kadar güvenilir olmayabilir.

1. GlyConnect'teki bir protein N-glicome'den UniLectin'in bir lektinine

  1. Glyco@Expasy'dan kaynaklara erişme
    NOT: Burada açıklanan prosedür GlyConnect'e erişmektir, ancak platformda kayıtlı herhangi bir kaynağa erişmek için uygulanabilir.
    1. https://glycoproteome.expasy.org/glycomics-expasy gidin ve sağdaki Glikokonjugatlar veya Glikan Bağlama gibi farklı kategorileri gösteren kabarcık grafiğini düşünün. Kabarcıklardaki kategorileri yansıtan en soldaki menüde, sağdaki kabarcık grafiğinin o kategoriyle eşleşen kabarcığı hemen yakınlaştırması için Glikoproteinler kutusunu işaretleyin.
      NOT: Yeşil kabarcıklar araçlardır ve sarı kabarcıklar veritabanlarıdır. Bunlardan birine tıklamak, kaynakla ilgili ayrıntıları sağlamak için tekrar yakınlaştırır. Bunu yapmadan önce, kullanıcı bu kaynağın başkalarına olan bağımlılıklarını anlamak isteyebilir.
    2. Bağımlılıklar hakkında bilgi almak için, Kaynak Tematik Sınıflandırması sekmesinden Kaynak Bağımlılık Çarkı sekmesine geçin. Diğer kaynaklarla entegrasyon düzeyini kontrol etmek için fareyi tekerleğin GlyConnect'in üzerine getirin (Şekil 1).
    3. Adım 1.1.1'de olduğu gibi GlyConnect baloncuğuna ulaşmak için Kaynak Tematik Sınıflandırması sekmesine geri dönün ve GlyConnect ana sayfasını, veritabanının en son sürümündeki içeriğin istatistiklerini gösteren yeni bir sekmede görüntülemek için üzerine tıklayın (Ek Şekil 1).
      NOT: Tablo 1'de ayrıntılı olarak açıklanan renk düzeni, veritabanında depolanan farklı bilgi türleriyle eşleşir. Bu renk kodu, GlyConnect'teki tüm varlık sayfalarında geçerlidir ve tüm süreç boyunca tutarlıdır. Ana sayfa ayrıca, Sars-Cov-2 spike proteininin (COVID-19) glikozilasyonunu tanımlayan veya insan sütü oligosakkaritlerini (HMO) kapsamlı bir şekilde detaylandıran veriler gibi odaklanmış veri kümelerine adanmış dört bölüm göstermektedir. Bunlar bu protokolde araştırılmayacaktır.
  2. Bir protein N-glibrinin bağlamsal bilgisini keşfetmek
    NOT: GlyConnect'teki tüm glikan yapıları üç alternatif ve yaygın olarak kullanılan formatta görüntülenir: (1) Glikanlar İçin Sembol İsimlendirmesi (SNFG)17 (2) IUPAC yoğunlaştırılmış18ve (3) Oxford19. Buna karşılık, glikan bileşimini ifade etmek için standart bir gösterim yoktur. GlyConnect'te aşağıdaki kod kullanılır: Heksoz için Hex, N-Asetilpekzozamin için HexNAc, fukoz için dHex ve sialik asitler için NeuAc. Basitlik uğruna, görselleştirme araçları yoğunlaştırılmış bir gösterime dayanır: Heksoz için H, N-Asetilhekzosamin için N, fukoz için F ve sialik asitler için S. Ek olarak, küçük harfler asetilasyon için "a", fosforilasyon için "p" ve sülfasyon için "s" gibi modifikasyonları belirtir, bu sözde ikamelerin en sık kullanılanı için.
    1. İnsan Prostat Spesifik Antijeninin (PSA) N-gliferini görüntülemek ve keşfetmek için, GlyConnect ana sayfasından aşağıdaki gibi devam edin.
      NOT: İnsan PSA'sının glikozilasyonu, özellikle prostat kanseri bağlamında, yıllar boyunca incelenmiştir. GlyConnect veritabanı, glikomik ve glikoproteomik verileri birleştiren üç referansı20,21,22 depolar. Burada sağlanan sonuçların GlyConnect'in Eylül 2021 sürümüyle elde edildiğini unutmayın. Veritabanının gizli kullanımı, sık sık veri güncellemeleri nedeniyle biraz farklı istatistikler verebilir.
    2. Veritabanının protein görünümünü açmak için PROTEİN düğmesini seçin. Protein görünümü sayfasında, arama penceresine prostat yazın. Farklı pI değerlerine sahip iki PSA izoformunu ayırt eden çıktıda listelenen iki girişi arayın. PSA'nın ortak izoformuna karşılık gelen 790'a (Id sütunu) tıklayın.
      NOT: Yukarıda ayrıntılı olarak açıklanan şemada yayınlanan çalışmadan çıkarılan özet bilgileri gösteren üstteki çok renkli çubuğu arayın. Aşağıda açıklandığı gibi navigasyon için çeşitli seçenekler mümkündür.
    3. Üst çok renkli çubukta, yayınlanan verilerin işlendiği örnek türlerini görüntülemek için yeşil renkli KAYNAK düğmesine tıklayın: İdrar ve Seminal Sıvı. Bu bilgilere daha fazla göz atmak için, bu örnek türlerden birini tıklatın. Aynısı, renkli bir düğmeye tıklandığında görünen herhangi bir öğe için de geçerlidir.
    4. Veritabanının sağlıkla ilgili içeriğini kontrol etmek için, biri GlyConnect'teki ilgili özel hastalık sayfasına bağlanan Prostat Kanseri olan iki öğe içeren HASTALIK düğmesine tıklayın. Bu sayfanın özeti, üç büyük ölçekli çalışmanın, 308 insan proteininde bulunan 1.087 bölgede 319 bileşim bildirdiğini göstermektedir.
    5. Glikomik verilerden PSA ile ilişkili 135 yapının tam listesini görüntülemek için YAPI düğmesine tıklayın. Glikoproteomik deneylerle belirlenen ilişkili 78 bileşim için BİLEŞİM düğmesine tıklayın. Daha fazla ayrıntı elde etmek için herhangi bir yapıya veya kompozisyona tıklayın.
      NOT: Belirli bir yapıyı taşıyan alternatif proteinlerin listesi veya bileşimle eşleşen yapıların listesi gibi detaylar elde edilebilir. PSA'nın Asn-69'da sadece bir N-glikozilasyon bölgesine sahip olduğu bilinmektedir (kahverengi SITE düğmesi için sadece bir madde sayılmıştır).
    6. Kompozisyonların belirsizliğini azaltmak için, seçilen bir kompozisyonun altındaki ÖNERİLEN YAPILANDIR'a tıklayın (örneğin, Hex:6 HexNAc:3 NeuAc:1). Monosakkarit sayısı yukarıda listelenen bir yapınınkiyle her çakıştığında bir öneride bulunulur (Şekil 2).
      NOT: Bir glikoproteomik deney tarafından üretilen Hex:6 HexNAc:3 NeuAc:1 bileşimi, glikomik verilerden elde edilen dört yüksek çözünürlüklü yapıyla eşleştirilir. PSA durumunda, sadece Asn-69 glikozile edildiğinden çözülmesi gereken bir yer belirsizliği yoktur.
    7. Protein sayfasını tam olarak keşfetmek için, sayfanın sağ tarafında daha fazla ayrıntı görüntüleyin (Şekil 3).
      1. Her monomere bağlı iki karmaşık glikanla gösterilen PSA için varsayılan 3QUM PDB (Protein Veri Bankası23) girişini (Şekil 3) veya bağlı bir karbonhidrat nedeniyle de kullanılabilen alternatif 2ZCK girişini görüntüleyin. İkinci giriş tek bir zinciri gösterir.
        NOT: Her iki giriş de PDB-RCSB'de benimsenen SNFG-3D gösteriminde glikanları görüntüleyen 3D LiteMol eklentisi24 ile görselleştirilir.
      2. UniProt gibi büyük proteomik veritabanlarından ilgili fonksiyonel bilgileri keşfetmek için diğer çapraz referansların ilgili bağlantılarına tıklayın (Şekil 3).
  3. Bir protein N-glibrifinin bağlamsal bilgisini görselleştirmek ve ilişkilendirmek
    NOT: Önceki bölümde görüldüğü gibi, uzun yapı veya kompozisyon listelerinin bir bütün olarak kavranması zor olabilir ve GlyConnect, temel bilgileri görselleştirmek için iki farklı araca güvenir: GlyConnect Ahtapot ve GlyConnect Compozitor (birincisi, renkli düğmelerde yakalanan özet bilgileri genişletir ve ikincisi, bir yapı/kompozisyonun bir diğerinde bulunması açısından yapısal bağımlılıkları ortaya çıkarır). Aşağıda gösterildiği gibi, GlyConnect Octopus, veritabanı içeriğinin bir yansıması olarak birden fazla veya tek bağlantıyı vurgulayarak veritabanında depolanan çeşitli varlıklar arasındaki ilişkileri araştırır.
    1. Aşağıda açıklandığı gibi, PSA'ya bağlı glikanların çeşitliliğinde hibrit çekirdek yapıları ve oldukça sık görülen sialik asit içeren yapılar gibi ortak yapısal özelliklerin varlığını doğrulamak için bir GlyConnect Ahtapot araması yapın.
    2. Ahtapot ana sayfasına git https://glyconnect.expasy.org/octopus/. N bağlantılı sekmesini varsayılan olarak seçili tutun. Çekirdekler alt sekmesine gidin ve Hibrit simgesine tıklayın. Özellikler alt sekmesine gidin ve Sialylated simgesine tıklayın. Aşağıdaki yeşil Ara düğmesine tıklayın.
      NOT: Arama sonuçları, üç öğe kategorisi arasındaki ilişkiler olarak grafiksel olarak görüntülenir. Varsayılan olarak, merkez liste bileşimler için sorguyla eşleşir, sol koleksiyon ilgili proteinleri kapsar ve sağ liste ilgili glikanları kapsar.
    3. Görüntülenen ilişki grafiğinde, altı proteine ve üç yapıya olan bağlantıları vurgulamak için fareyi H6N4F1S1'in üzerine getirin. PSA'nın iki izoformunu (her ikisi de UniProt ID: KLK3_HUMAN olarak adlandırılır) ve bir yapıyı (ID: 10996) ayıran H6N4F2S1'in üzerine gelerek bunu karşılaştırın. SNFG gösterimini göstermek için yapı kimliğinin üzerine gelin ve ilgili sayfayı açmak için üzerine tıklayın (Ek Şekil 2).
    4. Ahtapotun düğümlerini, glikozilasyon bağlamını açıklayan başka bir konuyla değiştirin. Renk kodu daha önce açıklananla aynı kalır (bkz. Tablo 1).
      1. Grafiğin ortasında çoğu vücut sıvısı olan 15 seçenek görüntülemek için Merkez Düğümler'i Dokular olarak değiştirin. Doku bilgisine bağlı olarak sorguyla eşleşen proteinler ve glikanlar arasındaki tüm ilişkileri arayın. Farklı ilişkilendirmeleri görüntülemek için imleci grafiğin ortasındaki İdrar veya Seminal Sıvı üzerine getirin (Şekil 4A, B).
      2. Biri Prostat Kanseri olan 13 seçeneği görüntülemek için Merkez Düğümleri Hastalık olarak değiştirin. İlişkili tek protein PSA'dır (KLK3_HUMAN) (Ek Şekil 3).
        NOT: Protein sayfasında gösterilen PSA N-glibrimine daha yakından bakıldığında, NeuAc(a?-?) terminalinin çok yüksek frekansını ortaya koymaktadır. Gal(b?-?) GlcNAc altyapısı birçok durumda iki veya üç antenli yapılarda. Başka bir Ahtapot, aşağıda açıklandığı gibi bu temelde üretilebilir.
    5. Aramayı yenilemek için Temizle düğmesine tıklayın. Özellikler alt sekmesine gidin ve Çift anten simgesine tıklayın. Determinantlar alt sekmesine gidin ve 3-Sialil-LN (tip 2) simgesine tıklayın. Aşağıdaki yeşil Ara düğmesine tıklayın.
    6. Ahtapot tarafından alınan ilişkileri, terminal 3-Sialil-LN (tip 2) motifi içeren çift antenli glikanlarla kontrol edin, yani NeuAc(a1-3)Gal(b1-4)GlcNAc. Daha kolay okuma için Merkez Düğümleri Dokular olarak değiştirin ve Seminal Sıvıyı PSA ortak izoformu ve yedi yapıya doğrudan bağlamak için KLK3_HUMAN üzerine gelin (Ek Şekil 4).
      NOT: İkinci görselleştirme aracı olan GlyConnect Compozitor, bir listedeki her bir kompozisyon arasındaki potansiyel ilişkilerin taramasını gerçekleştirir (aşağıya bakın). Bir ilişki, iki bileşim arasındaki sadece bir monosakaritten farklı olarak tanımlanır. Bir grafikte çizilen bu tanımlanmış ilişkiler, bir glikomun sürekliliğini (sürekliliğini) ortaya çıkarır.
    7. PSA durumunda aşağıda gösterildiği gibi, bir listedeki her bir kompozisyon arasındaki potansiyel ilişkilerin taramasını gerçekleştirmek için GlyConnect Compozitor kullanın.
      NOT: GlyConnect Compozitor kompozisyonları bir bağlamla ilişkili olarak işler. GlyConnect'i sorgulamak için farklı sekmeler sunar, örneğin, bir bağlamı nitelemek için kendi kendini açıklayıcı olan Proteinler, Kaynaklar, Hücre Çizgileri, Hastalıklar . Bu, burada PSA ile aşağıdaki gibi gösterilmiştir.
    8. PSA'nın protein sayfasına geri dönün: https://glyconnect.expasy.org/browser/proteins/790. PSA giriş sayfasının sağ tarafında, Compozitor bağlantısına tıklayın. Compozitor arama alanlarının Protein sekmesindeki Id 790 girişinin ayrıntılarıyla önceden doldurulduğundan emin olun (Protein: Prostata özgü Antijen, Tür: Homo sapiens ve Glikan Tipi: N-bağlantılı).
    9. Veritabanından veri almak ve bağlı kompozisyonların grafiğini görüntülemek için Seçime Ekle düğmesine tıklayın. Sanal Düğümleri Dahil Et seçeneğinin işaretini kaldırın. PSA N-glikomunu temsil eden iyi bağlanmış 78 kompozisyon kümesini gösteren bir grafik ve glikanların temel özelliklerini gösteren bir çubuk grafiği görüntülemek için Hesaplama Grafiği düğmesine tıklayın.
    10. Çubuk grafiğindeki mor çubuğun üzerine gelin, bu çubuk grafikteki tüm sialile edilmiş yapıları konumlandırarak sialile yapılara doğru gözlemlenebilir bir önyargı ortaya çıkarır.
    11. Ana Protein sekmesinde kalın ve Protein (isim) alanında Prostat spesifik antijen - yüksek Pi izoformu (psah) seçin.
      NOT: Glikan Türü ve Glikan Sitesi alanları otomatik olarak doldurulur.
    12. Veritabanından 57 kompozisyona kadar veri almak için Seçime Ekle düğmesine tıklayın. Her iki izoformun üst üste bindirilmiş grafiklerini oluşturmak ve iki PSA izoformunun gliyformlarındaki farklılıkları değerlendirmek için Hesaplama Grafiği düğmesine tıklayın. Kompozisyonlara/etiketlere karşılık gelen yapıların sayısının görüntülenmesini istemek için düğüm etiketlerinin üzerine gelin (Şekil 5).
  4. UniLectin'de glikan bağlayıcı bilgiler
    NOT: Ahtapotta test edilen ve NeuAc(a2-3)Gal(b1-4) olarak tanımlanan determinantı hatırlayın. Tanım olarak, bir glikan yapısının yerleşik bir bağlayıcı parçasıdır ve bu nedenle UniLectin3D veritabanında aranabilir25.
    1. https://www.unilectin.eu/ gidin ve UniLectin3D düğmesine tıklayın. Alternatif olarak, doğrudan sayfaya gidin: Bu sayfayı açmak için Glikan Arama düğmesine https://www.unilectin.eu/unilectin3D/.Click: https://www.unilectin.eu/unilectin3D/glycan_search (Ek Şekil 6).
    2. Bir sialik asidi temsil eden mor elmasa tıklayın, bu da veritabanında depolanan bir sialik asitle biten tüm glikan bağlayıcı motiflerin görüntülenmesini sağlar. Bu motif koleksiyonunun üst kısmı, daha önce araştırılan NeuAc(a2-3)Gal(b1-4)GlcNAc motifini içermektedir (Ek Şekil 7).
    3. NeuAc(a2-3)Gal(b1-4)GlcNAc ile etkileşimi doğrulayan bir 3D yapının bilindiği tüm lektinlerin görüntülenmesini istemek için NeuAc(a2-3)Gal(b1-4)GlcNAc motifine tıklayın. Sonuç varsayılan olarak tüm türlerdeki lektinleri gösterir. Görünümü insan merkezli bilgilerle sınırlamak için Alana Göre Ara seçeneğini kullanın.
    4. Alana Göre Ara seçeneğine tıklayın. Türler alanında, Homo sapiens yazın. Orijinal listeyi filtrelemek için X-ışını Yapılarını Keşfet düğmesine tıklayın. Sadece bir giriş kalmıştır, yani insan galektin-8. NeuAc(a2-3)Gal(b1-4)GlcNAc ile etkileşime giren insan galektin-8'in ayrıntılı bilgilerini görüntülemek için listelenen öğenin sağ üst köşesindeki 3B Yapı ve Bilgileri Görüntüle düğmesine tıklayın.
    5. Sayfada görüntülenen insan galektini-8 hakkındaki yapısal bilgilere iki farklı görüntüleyiciyle erişin.
      1. Molekülü döndürmek için fareyi basılı tutun ve lektin 3D yapısını göstermek için entegre edilmiş Litemol yazılımı26 ile ligandı ön plana çıkarın. Fareyi soldaki listelenen etkileşimlerden birinin üzerine getirerek sağdaki görünümü güncelleyin ve lektin ile ligand arasındaki atomik etkileşimleri detaylandırmak için entegre edilmiş PLIP yazılımı27 ile bu etkileşimin yapıda nerede hareket ettiğini bulun (Şekil 6).
    6. Bu çapraz referansları keşfetmek için UniProt, PDB (Avrupa veya Amerikan siteleri) ve GlyConnect'teki ilgili girişlere bağlanan herhangi bir yeşil düğmeye tıklayın.

2. GlyConnect'te O-glibrisleri keşfetmek ve karşılaştırmak

  1. HGI sınama yüksek güvenilirlikli veri kümesine göz atma
    NOT: Girişte bahsedilen HGI veri kümesi GlyConnect veritabanında depolanır. Yüksek güven listesi olarak kabul edilen 37 glikoproteinde bulunan 163 N ve 23 O-glikopeptid içerir. GlyConnect Compozitor28 , glicome veri tutarlılığını değerlendirmenin anahtarıdır. Önemli olarak, Compozitor izole düğümleri bağlamak için yalnızca bir ara adım gerektiğinde sanal düğümlere (gri renkte gösterilir) izin verir. Bu şekilde, sanal düğümler grafiği sıkılaştırır ve deneysel sonuçlarda potansiyel olarak kaçırılan yapılar olarak yorumlanabilir.
    1. Doğrudan makalenin referans sayfasına giderek GlyConnect ana sayfasından HGI veri kümesine göz atın: https://glyconnect.expasy.org/browser/references/2943.
      NOT: Renkli düğmelerdeki özet, makalede verilen rakamları kısmen yansıtır. Yine de, sadece 69 benzersiz peptit listelenmişse, bu peptitler ve bölgeler veya yapılar arasındaki çoklu ilişkileri yansıtır. Makalede, bir glikopeptid, bir peptid ve bir bileşimin benzersiz bir kombinasyonu olarak tanımlanmaktadır. GlyConnect'te, glikozitler ilk önce göz önünde bulundurulur ve bir peptidin yapılarla kombinasyonu olarak tanımlanırlar. Bu, GlyConnect ve yukarıdaki alıntı arasındaki rakamlardaki tutarsızlığı açıklar.
    2. 1 peptidde 1 bölgede tanımlanan çoğu O-bağlantılı bileşimin sık görülen benzersizliğinin aksine, 43 peptidde 42 bölgede tanımlanan Hex:5 HexNAc:4 NeuAc:2 gibi N-bağlantılı bileşimlerin yüksek oluşum sıklığını kontrol edin.
    3. Veri kümesinin tutarlılığını değerlendirmek için başvuru giriş sayfasının sağ tarafındaki Compozitor bağlantısına tıklayın. Compozitor aracının başvurunun DOI'sini doğrudan işlediğinden ve aracın Gelişmiş sekmesindeki arama alanını reference=10.1101/2021.03.14.435332 ile doldurduğundan emin olun. DOI numarasından sonra &glycan_type=O-linked yazın, böylece sorgu şu hale gelir:referans=10.1101/2021.03.14.435332&glycan_
      type=O-bağlantılı
    4. Veritabanından veri almak için Seçime Ekle düğmesine tıklayın (20 O'ya bağlı kompozisyon vardır). Sanal Düğümleri Dahil Et seçeneğini seçili tutun. Bağlı kompozisyonların grafiğini görüntülemek için Hesaplama Grafiği düğmesine tıklayın. Bu sonuç, grafiği tamamlamak için gereken dokuz sanal düğümle glikan biyosentezinin beklenen sürekliliğindeki birkaç boşluğu vurgulamaktadır (Şekil 7).
  2. GlyConnect'te seçilen bir serum proteininin O-glikomu ile karşılaştırma
    NOT: Boşlukların GlyConnect'te depolanan verilerle doldurulup doldurulamayacağını değerlendirmek için, referansla birlikte listelenen 37 proteinden bir O-glikozile protein seçildi. Veri setinde, inter-alfa-tripsin inhibitörü ağır zincir H4'ün (Q14624) Thr-725 üzerinde bir O-glikozile olduğu bildirilmiştir.
    1. GlyConnect Compozitor'un Protein sekmesine gidin (bkz. adım 2.1.3). Protein listesinden, Inter-alfa-tripsin inhibitörü ağır zincir H4'ü seçin. Tür seçiminin varsayılan olarak Homo sapiens olduğundan emin olun. Glikan Türü'nde N-bağlantılı seçimini kaldırın. Tüm sitelerin seçimini kaldırmak için önce Sitenin solundaki eksi işaretine tıklayarak ve ardından listeden yalnızca Thr-725'i seçerek Site listesinden yalnızca Thr-725'i seçin.
    2. Seçime Ekle düğmesine tıklayın (altı kompozisyonun Thr-725 ile ilişkili olduğunu unutmayın). Bağlı kompozisyonların grafiğini görüntülemek için Hesaplama Grafiği düğmesine tıklayın (Ek Şekil 8).
    3. Makale veri kümesinin O'ya bağlı 20 kompozisyonundan 17'sini mavi renkte ve veritabanındaki altı benzersiz kompozisyondan üçünü kırmızı olarak gösteren görüntülenen grafiği gözlemleyin. Başka bir deyişle, iki kaynak arasındaki örtüşme, macenta ile temsil edilen üç bileşimde mevcuttur. Grafiğin 45° dönüşünün otomatik olarak oluşturulduğunu unutmayın.
      NOT: Sanal düğümlerin sayısı bir azalır. Görünüşe göre, makale veri kümesinin 20 O-bağlantılı bileşiminde eksik olan ve sanal bir düğüm olarak temsil edilen H2N2S1, şimdi veritabanındaki Inter-alfa-tripsin inhibitörü ağır zincir H4'ün Thr-725'i ile ilişkili ek bir bileşimle doldurulmuştur. Bu, grafiğin topolojisini basitleştirir, çünkü diğer iki sanal düğüm, H1N2S1 ve H2N2S2 arasındaki boşluğu doldurmak için alternatif seçenekler oldukları için işe yaramaz hale getirilir. Yine de, veritabanından içe aktarılan ikinci bir kompozisyon, iki yeni alternatif sanal düğüm H2N2F1S1 ve H1N2F2S1'in oluşturulması için değilse izole edilecektir.
    4. Sanal düğümleri anlamlandırmak için, karşılık gelen bileşimlerin GlyConnect'te mevcut olup olmadığını kontrol edin. Bunu yapmak için, grafiğin altındaki Dışa Aktar düğmesine tıklayın. Diğer tüm seçeneklerin seçimini kaldırarak Yalnızca Sanal'ı seçin. 8 kompozisyonun seçimini kopyalamak için pano simgesine tıklayın.
    5. Seçimi, Compozitor'un Özel sekmesinin sorgu penceresine yapıştırın. Glikan Türü alanında O-bağlantılı öğesini seçin. Kompozisyonlar alanındaki Seçim Etiketini, örneğin 8 kompozisyon listesini adlandırmak için VN olarak ayarlayın. Seçime Ekle düğmesine ve ardından İşlem Grafiği düğmesine tıklayın. Tüm sanal düğümler artık yeşil düğümler olarak görüntülenir (Şekil 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Protokolün ilk bölümü (bölüm 1), GlyConnect platformunu kullanarak insan Prostat Spesifik Antijeninin (PSA) Asn-69'una bağlı N-glikanların özgüllüğünün veya ortaklığının nasıl araştırılacağını gösterdi. Dokuya bağımlı (idrar ve seminal sıvı) ve glikan ekspresyonundaki izoforma bağımlı (normal ve yüksek pI) varyasyonlar, iki görselleştirme aracı kullanılarak vurgulanmıştır (Şekil 4 ve Şekil 5).

İlk olarak, veritabanında depolanan varlıklar arasındaki ilişkileri görüntüleyen GlyConnect Octopus , (1 ) Ahtapot'ta gösterilecek farklı varlıkları seçerek ve (2) ilgili girişleri incelemek için bağlantılara tıklayarak bağlamsal bilgileri keşfetme fırsatı sağladı. Sonuç, dokuya bağlı olarak ayırt edici ilişkilerdi.

İkincisi, başlangıçta glikopeptid tanımlaması için bir kompozisyon dosyasını tanımlamak / rafine etmek için tasarlanmış olan GlyConnect Compozitor, bilinen iki PSA izoformunda (normal ve yüksek pI) glikan ekspresyonunu değerlendirmek için kullanılmıştır. Her izoform glipin karşılaştırılması, ikisi yüksek pI izoformunun karakteristiği olan dört düğümü (bileşimleri) ayıran iyi bağlanmış bir grafik üretti. Glycome örtüşmesi anlamlı olsa da, glikan özellik çubuğu grafiği ortaktan yüksek pI izoformuna bir sialilasyon düşüşü göstermiştir (Ek Şekil 5).

Ayrıca, UniLectin3D'nin keşfi, PSA glibritinin olası bir okuyucusu olarak galektin-8'i seçmektedir, çünkü ikincisi NeuAc (a2-3) Gal (b1-4) GlcNAc terminal epitopu ile birçok yapı içermektedir. Bu, takip edilmesi gereken bir yol göstericidir ve nihai kanıt olarak kabul edilemez. Bununla birlikte, PSA ve galektinlerin prostat kanserinde önemli bir rol oynadığı bilinmektedir29 ve Galectin-8'in spesifik rolü yakın zamanda vurgulanmıştır30. Protokolün ilk kısmı, glikanların aracılık ettiği protein-protein etkileşimleri için olası bir senaryo oluşturmak için yapısal (glikoproteomik) ve fonksiyonel (bağlayıcı) verileri ilişkilendirir.

Protokolün ikinci bölümünde (bölüm 2), belirli bir doku (insan serumu) ile ilişkili yüksek kaliteli bir O-glikan bileşimleri seti incelenmiş ve GlyConnect veritabanı içeriğiyle karşılaştırılmış, böylece glikopeptidlerin rafine edilmiş tanımlanması için bir glikan kompozisyon dosyasını özelleştirme seçeneği sunulmuştur (Şekil 7 ve Şekil 8) ). Bir veri kümesinden elde edilebilecek minimum 20 kompozisyon kümesine (HGI sınama sonuçları) güvenebilir veya kümenin tutarlılığını güçlendirmek için GlyConnect'te rasyonel olarak toplanan 23 ila 26 öğeyle geliştirilebilir.

kırmızı açık turuncu yeşil açık mavi mor pembe Lacivert kahverengi koyu turuncu
tür protein doku kaynağı yapı kompozisyon hastalık referans glikozit peptit

Tablo 1: GlyConnect veritabanının her bir varlığıyla ilişkili ve tüm süreç boyunca geçerli olan renk şeması.

Figure 1
Şekil 1: GlyConnect için örneği oluşturulan Glyco@Expasy bağımlılık tekerleği. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 2
Şekil 2: Seçilen bir glikan bileşimi için önerilen glikan yapısı. Aynı glikoproteini hedefleyen bir glikoproteomik deneyin glikan bileşimi için bir glikomik deneyden önerilen glikan yapısı, burada PSA için GlyConnect sayfasında önerildiği gibi insan Prostat Spesifik Antijeni (PSA) (ID: 790). Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 3
Şekil 3: PSA için GlyConnect sayfasının sağ yan menüsü. Diğer büyük veritabanlarına tıklanabilir çapraz referanslar ve PDB'deki mevcut 3D yapının LiteMol glikan eklentisi ile görüntüleme. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 4
Şekil 4: Proteinler ve glikanlar arasındaki dokuya bağımlı ilişkileri gösteren GlyConnect Ahtapot'un çıktısı. Hybrid AND Sialylated sorgusu, bu kriterlere uyan tüm bileşimleri döndürmüştür ve her bileşim, veritabanında kaydedilen proteinler ve glikanlar hakkındaki ilişkili bilgileri birbirine bağlar. Varsayılan olarak Türler'in Homo sapiens olarak ayarlandığını, ancak bu seçeneğin değiştirilebileceğini unutmayın. Burada, GlyConnect Ahtapot, melez ve sialile glikan yapıları (sağ düğümler) taşıyan tüm insan proteinlerini (sol düğümler) ifade edildikleri dokularla (merkez düğümler) görüntüler. (A) İdrar ile olan ilişkiler iki protein göstererek vurgulanır: dağınık (heterojen) glikan yapılarına bağlı koryogonadotropin (GLHA_HUMAN) ve PSA ortak izoformu (KLK3_HUMAN). (B) Seminal sıvı ile olan ilişkiler, gruplandırılmış (benzer) glikan yapılarına bağlı PSA'nın (KLK3_HUMAN) iki protein izoformunu gösteren vurgulanır. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 5
Şekil 5: PSA'nın iki izoformunun üst üste binmiş N-glisiperlerini gösteren GlyConnect Compozitor'un çıktısı. Yoğunlaştırılmış gösterimdeki bileşimler her düğümü etiketler. Ortak izoform ile ilişkili glikanlar mavi düğümler ve yüksek pI izoformunkiler kırmızı düğümler olarak temsil edilir. Glycomes arasındaki örtüşme macenta düğümleri olarak gösterilir. Düğümlerin içindeki sayılar, PSA ile ilgili GlyConnect veritabanının içeriğine göre etiketli bileşimle eşleşen glikan yapılarının sayısını temsil eder. Gösterilen Compozitor grafiği, D3.js kütüphanesi tarafından oluşturulan ağı çözmek için ham çıktıdan biraz değiştirilmiştir. Herhangi bir düğüm, tarayıcı penceresi alanında bir kullanıcının istediği yere sürüklenebildiği ve böylece yollar kısaltılabildiği veya uzatılabildiği için bunu yapmak kolaydır. Kullanıcı, grafiği ilgili düğümde yakınlaştırmak ve ortalamak için sağ üst köşedeki Yakınlaştırma alanına belirli bir kompozisyon yazabilir. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 6
Şekil 6: İnsan galektin-8'in NeuAc(a2-3)Gal(b1-4)GlcNAc bağlanma detayları ile özet girişi. Yeşil renkli 3B Yapı ve Bilgileri Görüntüle düğmesine (kırmızı bir elipsle gösterilir) tıklandığında, PLIP uygulamasıyla (kırmızı okla gösterilir) kalıntı etkileşimleri hakkında yakın çekimin görüntülendiği yeni bir sayfa açılır. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 7
Şekil 7: HGI mücadelesinin insan serumu yüksek güven veri kümesinin O-glistromini gösteren GlyConnect Compozitor'un çıktısı. Sanal düğümler olmadan (metne bakın), bu grafiğin bağlantısı düşüktür. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Figure 8
Şekil 8: GlyConnect Compozitor'un, GlyConnect veritabanı içeriğini kullanarak HGI mücadelesinin insan serumu yüksek güven veri kümesinin O-glistrominin tamamlanma olasılığını gösteren çıktısı. Compozitor'un Özel sekmesini kullanarak tüm GlyConnect veritabanının içeriğine erişmek, sanal düğümlere karşılık gelen kompozisyonların, düğüm etiketlerinde vurgulandığı gibi mevcut tanımlı yapılarla eşlendiğini ortaya çıkarır. Düğüm boyutu, veritabanında depolanan ve ilgili kompozisyonu raporlayan referansların sayısını temsil eder. Düğümlerin sayısal etiketi, GlyConnect'te depolanan karşılık gelen yapıların sayısını gösterir. Seçilen kompozisyonların veritabanında sıfır ila on sekiz olası eşleşmesi var gibi görünüyor. Aslında, bu düğümler yalnızca deneysel veri kümelerinin içeriğinin bir yansıması olarak sanaldır. Bu ek düğümlerin gerçekçiliğini test etmek için grafikteki bilgilerin iyileştirilmesi önerilir. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.

Ek Şekil 1: Glyco@Expasy ana sayfasının kabarcık grafiği. Glikoprotein kategorisine odaklanmak için Glyco@Expasy ana sayfasının kabarcık grafiğini yakınlaştırmak. Yeşil kabarcıklar halinde gösterilen yazılımlar ve sarı kabarcıklar halinde veritabanları. Herhangi bir kabarcığa tıklamak, kaynağın amacını özetler. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 2: Kompozisyona bağlı olarak sorguyla eşleşen ahtapot tarafından alınan ilişkilendirmeler. Varsayılan GlyConnect Ahtapot, melez ve sialile glikan yapıları (sağ düğümler) taşıyan insan proteinlerinin (sol düğümler) eşleşen bileşimlerle (merkez düğümler) görüntülenmesi. H6N4F12S1 bileşimi her iki PSA izoformuna da özgü görünmektedir (KLK3_HUMAN). Benzersiz yapı kimliğine (10996) tıklamak, iki izoformun gerçekten de bu özel glikanı taşıyan tek protein olduğunu gösteren ayrıntılarla ilgili sayfayı açar. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 3: Hastalığa bağlı olarak sorguyla eşleşen ahtapot tarafından alınan ilişkiler. GlyConnect Ahtapot, melez ve sialile glikan yapıları (sağ düğümler) taşıyan tüm insan proteinlerinin (sol düğümler) eksprese edildikleri hastalıklarla (merkez düğümler) birlikte gösterilmesidir. Prostat kanseri ile olan ilişkiler, PSA'nın ortak izoformunu (KLK3_HUMAN) göstererek vurgulanmıştır. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 4: Doku bilgilerine bağlı olarak sorguyla eşleşen ahtapot tarafından alınan çağrışımlar. GlyConnect Ahtapot, NeuAc (a1-3) Gal (b1-4) GlcNAc motifi (sağ düğümler) dahil olmak üzere bi-antenli glikan yapıları taşıyan tüm insan proteinlerinin (sol düğümler) eksprese edildikleri dokularla (merkez düğümler) görüntülenmesi. Seminal sıvı ile olan ilişkiler, sadece PSA'nın (KLK3_HUMAN) ortak izoformunu ve yedi yapıyı göstererek vurgulanmıştır. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 5: PSA'nın iki izoformunun üst üste binmiş N-glisiyumlarını gösteren GlyConnect Compozitor'un çıktısı. Yoğunlaştırılmış gösterimdeki bileşimler her düğümü etiketler. Ortak izoform ile ilişkili glikanlar mavi düğümler ve yüksek pI izoformunkiler kırmızı düğümler olarak temsil edilir. Glycomes arasındaki örtüşme macenta düğümleri olarak gösterilir. Düğümlerin içindeki sayılar, PSA ile ilgili GlyConnect veritabanının içeriğine göre etiketli bileşimle eşleşen glikan yapılarının sayısını temsil eder. Glikan özelliklerinin çubuk grafiği üzerinde gezinmek, frekans ve düğümler arasındaki yazışmaları turuncu kabarcıklar olarak gösterir. Neredeyse tüm PSA ortak izoform düğümleri kapsanmaktadır. Bu frekans yüksek pI izoformunda düşer. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 6: UniLectin3D'de glikan arama arayüzü. Siyalik asit SNFG sembolüne (kırmızı daire içine alınmış) tıklamak, UniLectin3D'de depolanan NeuAc içeren tüm ligandları aramayı başlatır. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 7: NeuAc içeren tüm ligandlar için yapılan aramanın çıktısından alıntı. NeuAc(a2-3)Gal(b1- 4)GlcNAc motifi kırmızı ile daire içine alınmıştır. Bu Dosyayı indirmek için lütfen tıklayınız.

Ek Şekil 8: GlyConnect Compozitor'un çıktısı, GlyConnect'teki veri kümesiyle üst üste binen HGI veri kümesinin O-glycome'unu göstermektedir. HGI mücadelesinin insan serumu yüksek güven veri kümesinin O-glistromini mavi renkte gösteren GlyConnect Compozitor'un çıktısı, referansla listelenen 37'den bir O-glikozile proteinin O-glistromi ile üst üste bindirilmiştir, yani, GlyConnect'te bulunan ek bilgilerle inter-alfa-tripsin inhibitörü ağır zincir H4. Bu, grafiğin bağlantısını geliştirir. Bu Dosyayı indirmek için lütfen tıklayınız.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Beklenmedik korelasyonları ortaya çıkarmak için bir araç olarak GlyConnect Octopus
GlyConnect Octopus başlangıçta veritabanını gevşek bir glikan tanımıyla sorgulamak için tasarlanmıştır. Gerçekten de, literatür genellikle glikanların fukozile edilmiş veya sialile edilmiş, iki veya daha fazla antenden yapılmış olması gibi bir glifardaki temel özelliklerini bildirmektedir. Ayrıca, N- veya O-bağlantılı glikanlar, yayınlanmış makalelerde de sıklıkla atıfta bulunulan Glikobiyolojinin Temelleri1 referans el kitabında ayrıntılı olarak açıklandığı gibi, çekirdeklerde sınıflandırılır. Son olarak, kan grubu antijenleri gibi glikan epitopları, yapılarda aranan ve potansiyel olarak bir glikan yazmak için seçilen başka bir özelliktir. Sonunda, belirli bir dokuda veya seçilen türlerde ifade edilen bir gliynin ortak veya farklı özelliklerini aramak uygun olabilir. Bu anlamda, toplanan bilgiler, benzersiz gerçeklerin aksine yeni varsayımların kaynağı olarak kullanılmalıdır.

GlyConnect Compozitor glikan kompozisyon setini şekillendirmek için bir araç olarak
Bir protein sayfasında açıklandığı gibi yapısal bilgilere göz atmanın sınırlamaları vardır, çünkü listeler ayrıntılı yapılar arasındaki ilişkilerin yanı sıra bileşimler arasındaki ilişkileri gizleme eğilimindedir. GlyConnect Octopus birincisine ve GlyConnect Compozitor ikincisine katılır. Çoğu GlyConnect girişinde listelenen yapılara dikkatli bir bakış, ortak alt yapıların varlığını ortaya koymaktadır. Yine de bu bilgiyi, özel bir izleyicinin yardımı olmadan görsel olarak kavramak kolay değildir.

Glikopepit tanımlama yazılımının anahtar bir parametresi olarak glikan moiety'nin tanımlanmasını destekleyen glikan kompozisyon dosyasının içeriği, HGI mücadelesinin sonuçları analiz edilerek oluşturulmuştur. Çoğu klasik proteomik arama motoru, veritabanlarında / depolarda veya literatürde toplanan verilerden türetilen bir koleksiyondan gliko bazlı modifikasyonların seçimini içerir. Diğer glikoproteomik özel araçlar glikan biyosentezi bilgisini kullanır. Bu şekilde, kompozisyon dosyası teorik olarak beklenen enzimatik aktivitenin sonucu olarak tanımlanır. Sonunda, arama motorları olduğu kadar çok kompozisyon dosyası vardır ve aralarındaki örtüşme oldukça değişkendir. Bununla birlikte, proteomikteki geçmiş deneyimlerden öğrenmek, özellikle de çeviri sonrası değişiklikler hesaba katıldığında, arama motorlarının performansının arama alanını sınırlamakla ilişkili olduğunu ortaya koymaktadır31. Benzer gözlemler glikoproteomikte de yapılmıştır ve GlyConnect Compozitor, önemi daha önce tartışılan eğitimli kompozisyon veri seçimini desteklemek için tasarlanmıştır32.

Bu aracın kullanımı, özellikle API (Uygulama Programlama Arayüzü) aracılığıyla GlyConnect'e programlı erişimi doğrudan başlatan sorguların ifade edilebileceği Gelişmiş sekmesi ile ilgili protokolde eksik bir şekilde gösterilmiştir. Örneğin, Gelişmiş sekmesinin sorgu penceresine taksonomi=homo sapiens&glycanType=N-bağlantılı&doku=idrar&hastalık=prostat kanseri yazmak, Kaynak sekmesindeki ilgili alanları doldurmaya (Türlerde Homo sapiens, Dokuda İdrar ve Glikan Türünde N-bağlı) ve Hastalık sekmesine (Türlerde Homo sapiens'i seçmek, Hastalıkta prostat kanseri ve Glikan Türünde N-bağlantılı). Başka bir deyişle, bir adımda birkaç seçim gerektiren bir sonuç sağlar.

Son olarak, sanal düğümlerin oluşturulması protokolde açıklanırken, potansiyel yedeklilik ek bir yoruma ihtiyaç duyar. İki eşzamanlı seçenek ayırt edilemez olabilir, çünkü grafikteki enzimlerin simüle edilmiş etkisi, enzim aktivitelerinin kronolojisini hesaba katmaz. Bu nedenle Compozitor, monosakkarit sayımlarına karşılık gelen iki bağlantısız düğümü iki farkla köprülemek için iki sanal düğümden iki yol önerir. Yeni verilerin dahil edilmesi genellikle eksik bağlantılar sağlar. Kullanıcı, Sanal Düğümleri Dahil Et kutusunun işaretini kaldırarak sanal düğümleri dikkate almakta veya kapatmakta her zaman özgürdür.

Bilinen veritabanları ve yazılım sınırlamaları
Genel olarak, Web'deki herhangi bir gezintide olduğu gibi, yukarıda açıklanan protokoller, genellikle bir sitenin güncellenmesi veya iki site arasındaki güncellemelerin çakışması nedeniyle, zaman zaman var olmayan bir sayfaya yol açar. Bu durumda ve aslında, navigasyonun akmadığı tüm durumlarda, en kolay olanı, verimliliği portalın son 28 yıldaki başarısına önemli ölçüde katkıda bulunan Expasy yardım masasına bir not göndermektir.

GlyConnect'in içeriği, literatürdeki mevcut dengesizliklerin bir yansıması olarak önyargılıdır. Yayınların çoğunluğu memelilerde N-glikozilasyon bildirmektedir ve veri tabanı insan N-glikoproteinleri bakımından daha zengindir. Bununla birlikte, geçmişte daha az yaygın veri kümeleri eklememiz ve tavsiye ve öneriler almaya tamamen açık olmamız istendi.

Ayrıca, Compozitor şu anda üç kompozisyon veri kümesinin karşılaştırılmasıyla sınırlıdır. Ahtapottaki Determinant alt sekmesinin büyük bir revizyonu planlanmaktadır. Glyco@Expasy kaynakları düzenli güncellemelere ihtiyaç duyar ve bazıları zamanında gerçekleştirilemeyebilir; bununla birlikte, böyle bir durum olduğunda uyarılar ve / veya duyurular yayınlanır.

GlyGen (https://www.glygen.org) ve GlyCosmos (https://www.glycosmos.org) olarak bilinen iş ortağı portalları farklı seçenekler ve araçlar sağlar. Nihayetinde, seçeneklerden herhangi biriyle ilgili bilgilere göz atmak ve aramak, yüksek düzeyde öznellik gerektirir ve büyük ölçüde kullanıcıların alışkanlıklarına ve endişelerine bağlıdır. Sadece çözümümüzün toplumun bir kısmına uygun olmasını umabiliriz.

Yaşam bilimleri projelerinde glikobilimin girdileri artmakta ve glikanların sağlık konularındaki rolünü ortaya koyan çalışmalar sürekli olarak üretilmektedir. Son zamanlarda Sars-Cov-2'ye odaklanmak, özellikle yapısal yaklaşımlarda glikozile proteinlerin önemini bir kez daha ortaya koymuştur33. Glycoinformatics, glikobilimcileri günlük veri analizi ve yorumlama görevlerinde destekler.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarlar çıkar çatışması olmadığını beyan ederler.

Acknowledgments

Yazar, bu eğitimde kullanılan kaynakların geliştirilmesinde yer alan Proteome Bilişim Grubu'nun geçmiş ve şimdiki üyelerini, özellikle GlyConnect için Julien Mariethoz ve Catherine Hayes, UniLectin için François Bonnardel, Ahtapot için Davide Alocci ve Frederic Nikitin ve Compozitor için Thibault Robin ve Ahtapot'a son dokunuşu sıcak bir şekilde kabul ediyor.

glyco@Expasy projesinin geliştirilmesi, İsviçre Federal Hükümeti tarafından Eğitim, Araştırma ve İnovasyon Devlet Sekreterliği (SERI) aracılığıyla desteklenmektedir ve şu anda İsviçre Ulusal Bilim Vakfı (SNSF: 31003A_179249) tarafından tamamlanmaktadır. ExPASy, İsviçre Biyoinformatik Enstitüsü tarafından sürdürülmekte ve Vital-IT Yetkinlik Merkezi'nde barındırılmaktadır. Yazar ayrıca Anne Imberty'ye ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003) tarafından ortaklaşa desteklenen UniLectin platformunda olağanüstü işbirliği için teşekkür ediyor.

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biyoloji Sayı 179
Glikan Aracılı Protein Etkileşimlerinin İncelenmesi için Biyoinformatik Kaynakları
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter