Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

CorrelationCalculator ve Telkari: Metabolomik Verilerin Veriye Dayalı Ağ Analizi için Araçlar

Published: November 10, 2023 doi: 10.3791/65512

Summary

Veriye dayalı ağ oluşturma ve metabolomik verilerin analizi için iki araç olan CorrelationCalculator ve Telkari'yi sunuyoruz. CorrelationCalculator, ifade verilerine dayalı olarak metabolitlerden oluşan tek bir etkileşim ağı oluşturmayı desteklerken, Telkari diferansiyel bir ağ oluşturmaya, ardından ağ kümeleme ve zenginleştirme analizine izin verir.

Abstract

Omik verilerin analizinde önemli bir zorluk, eyleme geçirilebilir biyolojik bilginin çıkarılmasıdır. Metabolomik bir istisna değildir. Bireysel metabolitlerin seviyelerindeki değişiklikleri spesifik biyolojik süreçlerle ilişkilendirme konusundaki genel sorun, hedeflenmemiş sıvı kromatografisi-kütle spektrometrisi (LC-MS) çalışmalarında bulunan çok sayıda bilinmeyen metabolit ile birleşmektedir. Ayrıca, ikincil metabolizma ve lipid metabolizması, mevcut yol veritabanlarında zayıf bir şekilde temsil edilmektedir. Bu sınırlamaların üstesinden gelmek için grubumuz, veriye dayalı ağ oluşturma ve analizi için çeşitli araçlar geliştirmiştir. Bunlara CorrelationCalculator ve Telkari dahildir. Her iki araç da, metabolitlerin sayısı numune sayısını aştığında, kullanıcıların deneysel metabolomik verilerden kısmi korelasyon tabanlı ağlar oluşturmasına olanak tanır. CorrelationCalculator, tek bir ağın oluşturulmasını desteklerken, Telkari, iki örnek grubundan elde edilen verileri kullanarak diferansiyel bir ağ oluşturmaya ve ardından ağ kümeleme ve zenginleştirme analizine izin verir. Gerçek hayattaki metabolomik verilerin analizi için her iki aracın faydasını ve uygulamasını açıklayacağız.

Introduction

Son on yılda, Gaz Kromatografisi-Kütle Spektrometresi (GC-MS) ve Sıvı Kromatografisi-Kütle Spektrometresi (LC-MS) gibi analitik teknolojilerdeki ilerlemeler nedeniyle metabolomik, bir omik bilimi olarak ortaya çıkmıştır. Bu teknikler, yüzlerce ila binlerce küçük molekül metabolitinin aynı anda ölçülmesine izin vererek karmaşık çok boyutlu veri kümeleri oluşturur. Metabolomik deneyler hedefli veya hedefsiz modlarda gerçekleştirilebilir. Hedeflenen metabolomik deneyler, belirli metabolit sınıflarını ölçer. Genellikle hipotez odaklıdırlar, hedefsiz yaklaşımlar ise mümkün olduğu kadar çok metaboliti ölçmeye çalışır ve doğası gereği hipotez oluşturur. Hedeflenen tahliller genellikle iç standartları içerir ve bu nedenle ilgilenilen metabolitlerin mutlak miktar tayinine izin verir. Buna karşılık, hedeflenmemiş tahliller nispi miktar tayinine izin verir ve birçok bilinmeyen metaboliti içerir1.

Metabolomik verilerin analizi, birçok özel yazılım aracından yararlanan çok adımlı bir süreçtir1. Aşağıdaki üç ana adıma ayrılabilir: (1) veri işleme ve kalite kontrol, (2) istatistiksel analiz ve (3) biyolojik veri yorumlama. Burada açıklanan araçlar, analizin ikinci adımını etkinleştirmek için tasarlanmıştır.

Metabolomik verileri yorumlamanın sezgisel ve popüler bir yolu, deneysel ölçümleri metabolik yollara haritalamaktır. Bu 2,3,4,5'i başarmak için grup 6 tarafından geliştirilen Metscape de dahil olmak üzere çok sayıda araç tasarlanmıştır. Yol haritalama genellikle en önemli yollarınbelirlenmesine yardımcı olan zenginleştirme analizi ile birleştirilir 7,8. Bu teknikler ilk olarak gen ekspresyon verilerinin analizinde önem kazanmış ve proteomik ve epigenomik verilerin analizi için başarıyla uygulanmıştır 9,10,11,12,13. Bununla birlikte, metabolomik verilerin analizi, bilgiye dayalı yaklaşımlar için bir takım zorluklar ortaya koymaktadır. İlk olarak, endojen metabolitlere ek olarak, metabolomik tahliller, beslenme ve diğer çevresel kaynaklardan gelenler de dahil olmak üzere eksojen bileşikleri ölçer. Bu bileşikler ve bakteriler tarafından üretilen metabolitler, diğer ökaryotik organizmaların insan veya metabolik yollarına eşlenemez. Ayrıca, ikincil metabolizma ve lipid metabolizmasının yol kapsamı şu anda verilerin biyolojik yorumunu kolayca destekleyecek düzeyde yüksek çözünürlüklü haritalamaya izin vermemektedir14,15.

Veriye dayalı ağ analizi teknikleri, bu zorlukların üstesinden gelmeye yardımcı olabilir. Örneğin, korelasyon tabanlı ağlar, hem bilinen hem de bilinmeyen metabolitler arasındaki ilişkilerin türetilmesine yardımcı olabilir ve bilinmeyenlerin açıklanmasını kolaylaştırabilir16. Pearson'ın korelasyon katsayılarını hesaplamak, metabolitler arasındaki doğrusal ilişkileri kurmak için en basit yaklaşım olsa da, dezavantajı hem doğrudan hem de dolaylı ilişkileri yakalamasıdır17,18,19. Bir alternatif, doğrudan ve dolaylı ilişkileri ayırt edebilen kısmi korelasyon katsayılarını hesaplamaktır. Gauss grafik modellemesi (GGM), kısmi korelasyon ağlarını tahmin etmek için kullanılabilir. Bununla birlikte, GGM, örneklem büyüklüğünün ve özellik sayısının karşılaştırılabilir olmasını gerektirir. Bu durum, binlerce metabolik özellik için ölçümler içeren hedeflenmemiş LC-MS verilerinde nadiren karşılanır. Bu sınırlamanın üstesinden gelmek için düzenleme tekniklerinden yararlanılabilir. Grafiksel kement (Glasso) ve düğümsel regresyon, kısmi korelasyon ağının düzenli tahmini için popüler yöntemlerdir16,20.

Burada sunulan biyoinformatik araçlarından ilki olan CorrelationCalculator16, önyargısız seyrek kısmi korelasyon (DSPC) algoritmasına dayanmaktadır. DSPC, seyrekleştirilmiş grafik kement modellemesine dayanır. Algoritmanın altında yatan varsayım, metabolitler arasındaki bağlantı sayısının numune sayısından önemli ölçüde daha küçük olduğu, yani metabolitlerin kısmi korelasyon ağının seyrek olduğudur. Bu varsayım, DSPC'nin düzenli regresyon tekniklerinden yararlanarak daha az örnek kullanarak çok sayıda metabolit arasındaki bağlantıyı keşfetmesine olanak tanır. Ayrıca, düzenli regresyon tahminleri için bir önyargı giderme adımı kullanarak, güven aralıkları oluşturmak ve ilgilenilen hipotezleri test etmek için kullanılabilecek kenar parametreleri için örnekleme dağılımları elde eder (örneğin, tek veya bir kenar grubunun varlığı/yokluğu). Kısmi korelasyon ağında bir kenarın varlığı veya yokluğu, hesaplanan p değerleri kullanılarak resmi olarak test edilebilir.

CorrelationCalculator'ın tek grup analizi için çok yararlı olduğu kanıtlandı16; Bununla birlikte, birçok metabolomik deneyin amacı, iki veya daha fazla koşulun diferansiyel analizidir. CorrelationCalculator, her koşul için kısmi korelasyon ağları oluşturmak üzere grupların her birinde ayrı ayrı kullanılabilirken, bu yaklaşım ağ oluşturma için kullanılabilecek örnek sayısını sınırlar. Yeterince büyük bir örneklem boyutu, veriye dayalı analizde en büyük hususlardan biri olduğundan, ağlar oluşturmak için verilerdeki mevcut tüm örneklerden yararlanabilen yöntemler oldukça arzu edilir. Bu yaklaşım, burada sunulan Telkari21 adlı ikinci araçta uygulanmaktadır. Telkari, daha önce yayınlanmış Diferansiyel Ağ Zenginleştirme Analizi (DNEA) algoritmasınadayanmaktadır 22. Tablo 1 , her iki aracın uygulamalarını ve iş akışını göstermektedir.

Deney koşullarının sayısı (k) k = 1 k = 2
Yazılım aracı Korelasyon Hesaplayıcı Telkari
Giriş verileri • Metabolitler x Numuneler veri matrisi • Metabolitler x Numuneler veri matrisi
• Deney grupları
İş Akışı
• Ön arıtma
• Ağ tahmini
• Ağ kümeleme
• Zenginleştirme analizi

• Günlük dönüşümü; Otomatik ölçeklendirme
• DSPC (DSPC)
• Harici uygulamalar aracılığıyla
•Hayır

• Günlük dönüşümü; Otomatik ölçeklendirme
• Ortak ağ tahmini
• Konsensüs kümeleme
• NetGSA (Ağ GSA)
Veri görselleştirme Harici uygulama aracılığıyla, örneğin Cytoscape Harici uygulama aracılığıyla, örneğin Cytoscape
İlgilenilen sonuçla ilişkilendirme için metabolik modüllerin test edilmesi (isteğe bağlı) Harici uygulamalar aracılığıyla Harici uygulamalar aracılığıyla

Tablo 1: CorrelationCalculator ve Telkari'nin uygulama kapsamı ve iş akışı.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Korelasyon Hesaplayıcı

  1. http://metscape.med.umich.edu/kora_data_240.csv'de deneysel ölçümlerle metabolitlerin bir listesini içeren virgülle ayrılmış örnek bir giriş dosyası indirin.
  2. İndirilen örnek dosyayı açmak için çift tıklayın.
    1. Dosyanın hem numuneler hem de metabolitler için etiketler içerdiğinden emin olun.
    2. Örnekler satırlar halinde olduğundan, ilk sütunun örnek adları ve ilk satırın metabolit adları olduğunu onaylayın.
  3. CorrelationCalculator Java uygulamasını (http://metscape.med.umich.edu/calculator.html) indirin. Uygulamayı başlatmak için indirilen .jar dosyasına çift tıklayın.
  4. Giriş sekmesinde, giriş dosyasını yüklemek için Araştır düğmesine tıklayın.
  5. Dosya Biçimini Belirtin altında, uygun giriş dosyası biçimini seçmek için açılır oku kullanın. Satırlardaki örnekleri seçin (Ek Şekil 1).
  6. Pencerenin sağ alt kısmındaki Sonraki >> düğmesine tıklayarak Veri Normalleştirme sekmesine gidin.
  7. Yöntem Seç altında, Log2-Transform Data'nın yanındaki kutuyu işaretleyin. Verileri Otomatik Ölçeklendirme'nin yanındaki kutuyu işaretleyin.
  8. Verileri Normalleştir altında, Çalıştır düğmesine tıklayın.
    NOT: Normalleştirme tamamlandıktan sonra, Verileri Normalleştir altında bulunan Normalleştirilmiş Verileri Görüntüle düğmesini tıklatın ve güncelleştirilmiş veri kümesini gözden geçirin (Ek Şekil 2).
  9. Verileri Normalleştir altında, Kaydet düğmesini tıklatın ve yeni veri dosyasını kaydedin.
  10. Pencerenin sağ alt kısmındaki Sonraki >> düğmesine tıklayarak Veri Analizi sekmesine gidin.
  11. Calculate Pearson's Correlation (Pearson'ın Bağıntısını Hesapla) altında, Run (Çalıştır) düğmesini tıklatın. Veriler için en iyi Pearson Korelasyon aralığını belirleyin.
    1. Histogramı Görüntüle düğmesini tıklayın. Özellik başına maksimum Pearson korelasyon puanlarının sıklığını gözden geçirin.
    2. Isı Haritasını Görüntüle düğmesini tıklayın. Pearson korelasyon matrisinin gösterimini gözden geçirin.
  12. Pearson's Correlations'a Göre Filtrele'nin altında, 0,00 ile 1,00 arasında bir aralığa göre filtrelemek için varsayılan sayıları bırakın
    NOT: Filtreyi değiştirmek için sağ uçtaki küçük mavi oku 1'den ve soldaki küçük mavi oku 0'dan kaydırın. Metin kutularına belirli sayılar girmek de bir seçenektir.
  13. Kısmi Bağıntı Yöntemini Seç altında, istediğiniz yöntemi (DSPC Yöntemi) seçin.
    NOT: Metabolit sayısı veri setindeki örnek sayısından küçükse, yalnızca DSPC yöntemi kullanılabilir.
  14. Kısmi Bağıntıları Hesapla altında, Çalıştır düğmesini tıklatın (Ek Şekil 3).
  15. CSV Dosyasını Görüntüle'yi tıklayın ve sonuçları görüntüleyin. Kaydet düğmesine tıklayın ve sonuçları kaydedin.
  16. Etkileşimli bir korelasyon ağı başlatmak için MetScape'te Görüntüle düğmesine tıklayın.
    MetScape kullanımı hakkında daha fazla bilgi için Karnovsky, A. et al.6'ya bakın.
    NOT: MetScape, korelasyon ağlarının oluşturulmasına ve keşfedilmesine izin veren bir Cytoscape uygulamasıdır.

2. Telkari

  1. http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv'de metabolit ölçümlerini içeren virgülle ayrılmış örnek bir giriş dosyası indirin.
  2. İndirilen örnek dosyayı açmak için çift tıklayın.
    1. Dosyanın 1. sütunda örnek adlar ve 2. sütunda grup atamaları içerdiğinden emin olun. Kalan sütunların metabolitler/lipitler içerdiğini onaylayın.
    2. Her satırın bir örneği temsil ettiğinden emin olun.
      NOT: Metabolit ölçümleri, özellik toplama gerçekleştirilmediği sürece log-dönüştürülmeli ve otomatik olarak ölçeklendirilmelidir, bu durumda ölçümler yalnızca log-transforme edilmelidir.
  3. Telkari Java uygulamasını indirin (http://metscape.med.umich.edu/filigree.html).
    NOT: Ayrıntılı bir kullanım kılavuzu http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf'da mevcuttur.
  4. Uygulamayı başlatmak için indirilen .jar dosyasına çift tıklayın.
  5. Veri sekmesinde, giriş dosyasını yüklemek için Araştır düğmesine tıklayın.
  6. Sütunları/Satırları Belirtin altında, giriş dosyasından ilgili sütun/satır adını seçmek için Örnek Kimliği'nin yanındaki açılır oka tıklayın. Örnek'i seçin.
  7. Sütunları/Satırları Belirtin altında, giriş dosyasından ilgili sütunu/satırı seçmek için "Grup"un yanındaki açılır oka tıklayın. Grup'u seçin.
  8. Örnek Grupları Belirtin altında, giriş dosyasından ilgili grup sütununu seçmek için her Grubun yanındaki açılır oklara tıklayın. Grup 1 için Diyabetik'i seçin. Grup 2 için Diyabetik Olmayan'ı seçin.
  9. Özellik Gruplandırma altında, istediğiniz yöntemin yanındaki kutuyu işaretleyin, Özellik Gruplarını Hesapla.
  10. Isı Haritalarını Görüntüle düğmesini tıklayın. Isı haritasını görüntüleyin ve istenen azaltma yüzdesini belirleyin.
  11. Özelliklerin istenen azaltma yüzdesini seçmek için Özellik Azaltma kaydırıcısını kullanın. Azaltma yüzdesi 1,25'lik bir özellik-örnek oranı gösterene kadar küçük daireyi kaydırın (Ek Şekil 4).
  12. Pencerenin sağ alt kısmındaki Sonraki >> düğmesine tıklayarak Analiz sekmesine gidin.
  13. Çıktı Dizini Seç altında, Gözat düğmesini tıklatın ve oluşturulan çıktı dosyalarını depolamak için istediğiniz dizin konumunu seçin.
  14. Pencerenin sol alt kısmında bulunan Analizi Çalıştır düğmesine tıklayın. İlerleme çubukları her analiz bileşeni için güncellenir (Ek Şekil 5). Analiz Başarıyla Tamamlandı mesajını görüntüleyen açılır penceredeki Tamam düğmesine tıklayın.
  15. Analiz sekmesinde, etkileşimli Telkari alt ağlarını bir tarayıcı sekmesinde açmak için Ağlara Gözat düğmesini tıklatın.
  16. Alt Ağ Adı sütununun altındaki Alt Ağ 1 bağlantısına tıklayın.
  17. Çeşitli düğmeleri kullanarak etkileşimli alt ağı keşfedin. + düğmesine tıklayın ve ağın bir kısmını yakınlaştırın. - düğmesine tıklayın ve uzaklaştırın (Ek Şekil 6).
  18. Bir Grup Düğümüne tıklayın ve alt ağ içinde yeniden konumlandırmak için sürükleyin.
    NOT: Düğüm rengi yukarı/aşağı düzenlemeyi temsil eder ve renk opaklığı yüksek/alt kat değişimini temsil eder. Kenar rengi, gruplar arasındaki fark durumunu temsil eder.
  19. Tüm grup düğümlerini genişletmek için sayfanın sağ üst kısmındaki Özellikleri Genişlet düğmesine tıklayın. Grup düğümlerini oluşturan belirli bileşikleri gözden geçirin.
  20. Yakın zamanda genişletilen grup düğümlerini daraltmak için sayfanın sağ üst kısmındaki Özellikleri Daralt düğmesine tıklayın.
  21. Görünümü tek bir alt ağdan bir gruba bölünmüş birden çok alt ağa değiştirmek için sayfanın sağ üst kısmındaki Örnek Gruba Göre düğmesini tıklatın. Alt ağların bu görünümünü kullanarak grupları keşfedin ve karşılaştırın (Ek Şekil 7).
  22. Tek bir alt ağ görünümüne geri dönmek için Tüm Örnekler düğmesine tıklayın.
  23. Sayfanın sağ üst köşesindeki İleri düğmesine tıklayarak bir sonraki alt ağı görüntüleyin.
  24. Her alt ağ için 2.19-2.23 adımlarını tekrarlayın.
  25. Tüm alt ağları listeleyen özet tablo görünümüne dönmek için pencerenin üst ortasındaki Diferansiyel Ağ Zenginleştirme Analizi Sonuçları bağlantısını tıklatın.
    NOT: Ek ağ görselleştirmeleri oluşturmak için kenar ve/veya düğüm çıktı dosyalarını Cytoscape23 gibi farklı bir yazılım aracına aktarın.

3. Dikkat edilmesi gereken diğer noktalar

  1. Big Sur (OSX 11.2) veya sonraki sürümleri çalıştıran Mac bilgisayarlarda, Apple Menüsü > Sistem Tercihleri > Güvenlik ve Gizlilik > Genel'de aracı onaylayın ve sekmenin altındaki İzin Ver'i seçin.
  2. Buna ek olarak, soldaki menüden Dosyalar ve Klasörler'i seçerek ve ardından sağdaki menüden Telkari'yi seçerek Apple Menüsü > Sistem Tercihleri > Güvenlik ve Gizlilik > Gizlilik'teki dosyalara Telkari erişimine izin verin.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

CorrelationCalculator'ın kullanımını göstermek için, Krumsiek ve ark.24'te açıklanan KORA popülasyon çalışmasından elde edilen metabolomik verilerin bir alt kümesini kullanarak kısmi bir korelasyon ağı oluşturduk. Veri seti 151 metabolit ve 240 örnek içeriyordu. Şekil 1 , Cytoscape'de görselleştirilen ortaya çıkan kısmi korelasyon ağını göstermektedir. Ağ 148 düğüm ve 272 kenar içerir. Düğümlerin rengi, farklı kimyasal sınıflara ait metabolitleri temsil ederken, kenarlar kısmi korelasyon katsayılarının düzeltilmiş p değerini temsil eder (düzeltilmiş p değeri < 0.05) . Özellikle, herhangi bir ön bilgi kullanmamasına rağmen, CorrelationCalculator kimyasal olarak ilişkili metabolitleri bir araya getirebildi. Örneğin, fosfatidilkolinler ve lizofosfatidilkolinler ağda yakından bağlantılıdır. Metabolit değişikliklerini bu tür bir ağ bağlamında görselleştirmek, hipotez oluşturmayı kolaylaştırabilir, gelecekteki deneylerin planlanmasına yardımcı olabilir ve makale hazırlığını mümkün kılabilir. Kısmi korelasyon metabolit ağı kullanan potansiyel bir iş akışını göstermek için, Ma ve ark.22'de açıklandığı gibi konsensüs ağı kümelemesi gerçekleştirdik ve bu da 9 alt ağın veya metabolik modülün tanımlanmasıyla sonuçlandı. Bu modüller kimyasal sınıflarla iyi bir uyum içindeydi, yani aynı kimyasal sınıfa ait metabolitler aynı metabolik modülün parçası olma eğilimindeydi. Kullanıcı, kümeleme aracı clusterNet'e https://github.com/Karnovsky-Lab/clusterNet adresinden erişebilir.

Figure 1
Şekil 1: CorrelationCalculator ağının temsili örneği. Ağ,240 denekte 151 metabolitten oluşan KORA popülasyon çalışması metabolomik verilerinin 24 bir alt kümesinden oluşturulmuştur. Düğümler metabolitleri temsil eder ve bunları birbirine bağlayan kenarlar, kısmi korelasyon katsayılarının düzeltilmiş p değeri ile ağırlıklandırılır (düzeltilmiş p değeri < 0.05). Düğümlerin şekli farklı metabolik sınıfları temsil eder ve renk, konsensüs kümeleme yöntemi kullanılarak ağın kümelenmesiyle elde edilen metabolik modülleri temsil eder. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Tip I diyabetin (T1D) bir fare modelinden bir veri kümesini analiz ederek Telkari uygulamasını gösteriyoruz25,26. Diferansiyel kısmi korelasyon ağı oluşturmak için T1D ve diyabetik olmayan (NOD) farelerden alınan plazma metabolit ölçümleri kullanıldı (Şekil 2). Özellikle, diyabetik olmayan grupta daha yüksek derecede ağ bağlantısı gözlemliyoruz. Analizin sonraki adımları, dokuzu T1D ve diyabetik olmayan fareler arasında önemli ölçüde farklı olan on iki metabolik modül tanımladı (FDR < 0.05). Bu analizden çıkarılabilecek biyolojik sonuçlar hakkında daha fazla bilgi için okuyucuyu orijinal yayına yönlendiriyoruz21.

Figure 2
Şekil 2: Telkari ağının temsili örneği. Diferansiyel ağ, 71 fareden (30 T1D ve 41 T1D olmayan) 163 metabolit seviyeleri kullanılarak inşa edildi25,26. T1D ve T1D olmayan gruplar arasındaki diferansiyel kenarlar sırasıyla pembe ve mavi ile belirtilmiştir. Düğümler, kat değişikliğine göre renklendirilir. Tablo, Telkari tarafından üretilen zenginleştirme sonuçlarını göstermektedir. Tanımlanan on iki alt ağdan dokuzu, T1D ve T1D olmayanlar arasında önemli ölçüde farklıydı (düzeltilmiş p değeri 0.05<). Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Ek Şekil 1: CorrCalc_InputTab. Korelasyon Hesaplayıcı'nın Giriş sekmesinin ekran görüntüsü. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 2: CorrCalc_DataNormTab. Bağıntı Hesaplayıcı'nın Veri Normalleştirme sekmesinin ekran görüntüsü. Log-2 Transform Data ve Autoscale Data (Parametreleri Otomatik Ölçeklendirme ) kontrol edilir. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 3: CorrCalc_DataAnalTab. Korelasyon Hesaplayıcı'nın Veri Analizi sekmesinin Pearson'ın 0-0,8 Korelasyonuna göre filtrelemeyi gösteren ekran görüntüsü. Ek olarak, DSPC Yöntemi seçilmiştir. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 4: Filigree_DataTab. Telkari'nin Veri sekmesinin ekran görüntüsü. Sütunlar, satırlar ve gruplar belirtildi. Özellik Gruplarını Hesapla yöntemi, 1,25 özellik-örnek oranı özellik azaltımı ile seçilmiştir. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 5: Filigree_AnalysisTab. Farklı analiz bileşenlerinin ilerlemesini gösteren Telkari Analiz sekmesinin ekran görüntüsü. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 6: Filigree_Subnetwork1. Telkari'den oluşturulan bir alt ağ. Düğüm rengi yukarı/aşağı regülasyonu temsil eder ve renk opaklığı yüksek/alt kat değişimini temsil eder. Kenar rengi, gruplar arasındaki fark durumunu temsil eder. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Şekil 7: Filigree_Subnetwork_SampleGroup. Gruba göre ayrılmış alt ağ. Soldaki ağ diyabetik örnekleri, sağdaki ağ ise diyabetik olmayan örnekleri temsil eder. Düğüm rengi, grup ortalamasıyla orantılı ifade düzeyini temsil eder. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

CorrelationCalculator ve Telkari'de uygulanan kısmi korelasyon tabanlı ağ analizi yöntemleri, özellikle bilinmeyen metabolitlerin yüksek prevalansına ve metabolik yolların sınırlı kapsamına sahip veri kümeleri için bilgiye dayalı metabolik yol analizlerinin bazı sınırlamalarının üstesinden gelmeye yardımcı olur (örn., lipidomik veriler). Bu araçlar, araştırma topluluğu tarafından çok çeşitli metabolomik ve lipidomik verilerianaliz etmek için yaygın olarak kullanılmaktadır 14,22,27,28,29,30. Örneğin, mikrobiyom ve bitkilerden insan hastalıklarına kadar birçok biyolojik sistemden gelen verileri analiz etmek için CorrelationCalculatorkullanılmıştır 31,32,33,34. Burada, araçlarımız tarafından etkinleştirilen veriye dayalı ağ analizinin, ilgilenilen fenotiple ilişkili metabolik modülleri belirlemek için kümeleme ve regresyon analizi ile nasıl birleştirilebileceğini gösteriyoruz.

CorrelationCalculator ve Filigree kullanılarak oluşturulan kısmi korelasyon ağları, metabolik modüller üretmek için grafik kümeleme algoritmaları kullanılarak kümelenebilir. Bu modüller, kimyasal veya işlevsel olarak birbiriyle ilişkili metabolitleri içerme eğilimindedir. Bu tür modüller sadece görselleştirme açısından değil, aynı zamanda biyolojik alaka açısından da çok faydalıdır. Metabolik modüller ile ilgilenilen fenotipik sonuçlar (örneğin, hayatta kalma sonucu) arasındaki ilişkileri incelemek, bireysel metabolitleri test etmeye kıyasla daha fazla istatistiksel güç sağlayabilir ve ek biyolojik içgörüler üretebilir.

Ağ kümeleme yaklaşımları ile tanımlanan metabolik modüller zenginleştirme analizinde de kullanılabilir. Telkari, önceden tanımlanmış biyolojik yollar yerine konsensüs kümeleme yoluyla tanımlanan metabolik modülleri kullanır. Kısmi korelasyona dayalı metabolik modüller yolaklarla aynı olmasa da, kimyasal ve biyokimyasal olarak benzer metabolitleri (örneğin, amino asitler, asilkarnitinler, aynı sınıftaki lipitler, vb.) tutarlı bir şekilde gruplandırırlar. Telkari, NetGSAalgoritması 22,35'i kullanarak bu modüllerin önemini daha da test eder. Diferansiyel düğümlere ek olarak, NetGSA ağ yapısında hastalığa özgü farklılıkları da hesaba katar.

'Gerçek hayat' metabolomik ve lipidomik verilerinin analizi için CorrelationCalculator ve Filigree kullanılırken göz önünde bulundurulması gereken konulardan biri, belirli bir deneydeki metabolit sayısı ile numune sayısı arasındaki ilişkidir. Binlerce örneği içeren büyük ölçekli epidemiyolojik çalışmalar daha yaygın hale gelirken, metabolomik deneylerin çoğunda örneklem büyüklüğü mütevazı kalmaktadır. Bu, özellikle düşük biyolojik varyasyonun beklendiği sistemleri (yani, hücre hatları veya genetik olarak homojen hayvan modelleri) içeren mekanik çalışmalar için geçerlidir. Her iki araçta da uygulanan istatistiksel algoritmalar, metabolit sayısının numune sayısını aştığı durumlarda uygulanabilir, ancak bu orandaki artış daha seyrek ağlara yol açar.

Burada açıklanan araçların uygulanması için bir diğer önemli husus, izotopları, kimyasal eklentileri, kaynak içi fragmanları ve kirleticileri içerebilen çok sayıda gereksiz veya dejenere özellik36 içerdiği bilinen hedeflenmemiş metabolomik verilerin analizi ile ilgilidir. Birçok dejenere özellik aynı metabolitten kaynaklandığından, yüksek derecede korelasyona sahip olma eğilimindedirler. Bu tür verilerin kısmi korelasyona dayalı analizi, dikkatli bir şekilde açıklama yapılmasını ve dejenere özelliklerin kaldırılmasını gerektirebilir.

Sonuç olarak, burada sunulan araçlar, metabolomik verilerin yorumlanması için bilgiye dayalı yol analiz araçlarına uygun bir alternatif sunmaktadır.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarların rekabet eden hiçbir mali çıkarı yoktur.

Acknowledgments

Bu çalışma NIH 1U01CA235487 hibesi ile desteklenmiştir.

Materials

Name Company Catalog Number Comments
CorrelationCalculator JAVA http://metscape.med.umich.edu/calculator.html
clusterNet https://github.com/Karnovsky-Lab/clusterNet
Cytoscape Cytoscape https://cytoscape.org/
Filigree JAVA http://metscape.med.umich.edu/filigree.html
MetScape Cytoscape https://apps.cytoscape.org/apps/metscape Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

  1. Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
  2. Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
  3. Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
  4. Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
  5. Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
  6. Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
  7. Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
  8. Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
  9. Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
  10. Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
  11. Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
  12. Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
  13. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
  14. Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
  15. Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
  16. Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
  17. Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
  18. Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
  19. Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
  20. Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
  21. Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
  22. Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
  23. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
  24. Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
  25. Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
  26. Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
  27. Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
  28. Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
  29. Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
  30. Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
  31. Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
  32. Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
  33. Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
  34. Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
  35. Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
  36. Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Tags

Biyoloji Sayı 201
CorrelationCalculator ve Telkari: Metabolomik Verilerin Veriye Dayalı Ağ Analizi için Araçlar
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Iyer, G., Brandenburg, M., Patsalis, More

Iyer, G., Brandenburg, M., Patsalis, C., Michailidis, G., Karnovsky, A. CorrelationCalculator and Filigree: Tools for Data-Driven Network Analysis of Metabolomics Data. J. Vis. Exp. (201), e65512, doi:10.3791/65512 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter