Method Article

כריית מערכי נתונים של טרנסקריפטומיקה מרחבית באמצעות DeepSpaceDB

DOI:

10.3791/68892

September 5th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מאמר זה מציג פרוטוקול לשימוש ב-DeepSpaceDB, מסד נתונים דינמי ואינטראקטיבי לתעתיק מרחבי, המציע זרימות עבודה ודוגמאות לחקר ארגון רקמות וביטוי גנים הקשורים למחלות.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

טרנסקריפטומיקה מרחבית היא טכנולוגיה המתפתחת במהירות המאפשרת לכידת דפוסי ביטוי גנים בדגימות רקמה תוך שמירה על מידע מיקום. יש לו יישומים נרחבים במחקר ביולוגי וביואינפורמטיקה, המאפשרים לחוקרים לחקור ולעקוב אחר וריאציות מרחביות בביטוי גנים על פני רקמות, מצבים ומחלות שונות. עם ניתוח נתוני טרנסקריפטומיקה מרחבית צובר תאוצה, מספר מערכי הנתונים הזמינים לציבור עולה. עם זאת, טרנסקריפטומיקה מרחבית נותרה טכניקה ניסויית מיוחדת ביותר, עם אילוצים טכניים ופיננסיים משמעותיים. כדי להקל על הגישה לנתונים מרחביים, פיתחנו לאחרונה את DeepSpaceDB, מסד נתונים מקיף ודינמי לחקר נתוני טרנסקריפטומיקה מרחבית. מאמר זה מציג זרימות עבודה מפורטות המתארות את רכיבי מסד הנתונים ואת הניווט בו בעזרת כמה דוגמאות. ראשית, מודגם ניתוח של דגימת מוח של עכבר, תוך בחינת מדדי איכות, גנים ומסלולים משתנים מרחבית ושונות בביטוי גנים בין ההיפוקמפוס להיפותלמוס. לאחר מכן, הזיהוי וההערות של גנים המתבטאים באופן דיפרנציאלי הקשורים לפעילות חיסונית נחקרים עוד יותר על ידי השוואת אזורים גרורתיים ממקור המעי הגס עם אזורים מרוחקים של רקמה בריאה בכבד עכברים. DeepSpaceDB, עם הכלים המתקדמים והתכונות האינטראקטיביות שלו, משמש כמשאב רב ערך למחקר טרנסקריפטומיקה מרחבית, המאפשר חקירה מעמיקה יותר של ארגון רקמות וביולוגיה של מחלות.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

טרנסקריפטומיקה מרחבית היא טכנולוגיה חדשה המאפשרת לחוקרים לנתח ביטוי גנים תוך שמירה על מידע מרחבי בתוך חתך רקמה, ובכך מאפשרת לחקור את ארכיטקטורת הרקמות, הטרוגניות תאית והשפעות מיקרו-סביבתיות ברזולוציה חסרת תקדים 1,2. עם זאת, למרות הפוטנציאל של טכנולוגיה זו, הגישה והניתוח נותרים מוגבלים, טרנסקריפטומיקה מרחבית היא חסכונית עבור מעבדות רבות, וניתוח הנתונים דורש מיומנויות ביואינפורמטיקה מתקדמות.

פיתוח מאגרי מידע ציבוריים הוא אחת הדרכים להרחיב את הגישה לשיטה ניסויית מתפתחת זו. נוצרו מספר מסדי נתונים של טרנסקריפטומיקה מרחבית. הראשון היה SpatialDB, אך הוא מכיל רק מספר מוגבל של דגימות ולא עודכן3. מסדי הנתונים SODB, SOAR ו-STOmicsDB כוללים מספר רב של דגימות מפלטפורמות רבות ושונות וממלאים תפקיד גדול כמאגרי נתונים 4,5,6. עם זאת, כלי הניתוח מוגבלים וחסרי אינטראקטיביות. כדי לטפל בבעיה זו, פיתחנו לאחרונה את DeepSpaceDB, מסד נתונים אוצר וידידותי למשתמש של מערכי נתונים של תעתיק מרחבי זמינים לציבור שנועדו להוריד מחסומים טכניים ולהרחיב את הנגישות7. מאמר זה ממחיש מספר כלים במסד נתונים זה, כולל חיפוש במסד הנתונים, בדיקת איכות הדגימה, כלי הדמיה והשוואה של אזורים שנבחרו באופן אינטראקטיבי בתוך פרוסות רקמה. הוא מציג פרוטוקולים מפורטים תוך שימוש בשתי דוגמאות מייצגות: ניתוח של דגימת מוח של עכבר וכבד של עכבר עם גרורות במעי הגס כדי להדגים את הכלים הללו בהקשרים מעשיים. באמצעות כלים אלה, DeepSpaceDB מעצימה מגוון רחב יותר של חוקרים למנף טרנסקריפטומיקה מרחבית מבלי להזדקק לנתונים משלהם או ליכולת ביואינפורמטיקה פנימית. תיאור מקיף של איסוף הנתונים, בקרת האיכות, זרימת העבודה של העיבוד, כמו גם הנתונים והתכונות הכלולים ב-DeepSpaceDB, מסופק בפירוט על ידי Honcharuk et al7.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. דוגמה 1: ניתוח דגימת מוח של עכבר

הערה: בחלק זה, הניתוח של דגימת מוח של עכבר מומחש, תוך ניווט בין התכונות והעלילות השונות הזמינות ב-DeepSpaceDB (קישור למסד הנתונים זמין בטבלת החומרים).

  1. בחירת מדגם
    1. לחץ על הכרטיסייה מסד נתונים והשתמש במסנן כדי לבחור את עכבר האורגניזם, מוח האיבר והמקור זנודו. עברו בין הדגימות המתקבלות ובחרו DSID001557 לדוגמה. לחלופין, השתמש בתיבת החיפוש כדי לחפש במסד הנתונים את המונח "DSID001557" ובחר דוגמה זו.
    2. לחץ על המדגם ואשר את התיאור כ-2 × 106 תאים בתאי מלח-NK של 100 מיקרוליטר (הזרקה פעם בשבוע בסך הכל 5 פעמים).
  2. ניתוח איכות
    1. לחץ על הכרטיסייה איכות כדי להעריך את איכות המדגם שנבחר. מהתפריט הנפתח של מדדי האיכות , בחר אפשרויות שונות כמו גנים שזוהו (איור 1A), ספירת קריאה (איור 1B) ו-Mito (איור 1C), כדי להמחיש את הפרמטרים המתאימים בכל נקודה על פני פרוסת הדגימה.
  3. הערת תמונה
    1. נווט אל הכרטיסייה ביאור תמונה לזיהוי האזורים השונים של פרוסת הדגימה.
    2. הזז את סמן העכבר מעל פרוסת הדוגמה. הערות שנחזו על ידי מודל שפה גדול (LLM) מוצגות עבור חלקים מהתמונה לדוגמה בצורה מבוססת רשת, עם מידע על האנטומיה ומצב משויך8.
  4. ניתוח אשכולות
    1. להבנה מעמיקה יותר של אשכולות סוג התא בפרוסת הדוגמה, נווט אל הכרטיסיה אשכולות . תוצג הטמעה דו-ממדית של האשכולות, יחד עם ייצוג של אשכולות מקודדים בצבע על פני הכתמים על פרוסת הדגימה (איור 1E).
  5. גנים ומסלולים משתנים מרחבית
    1. נווט ללשונית גנים ושים לב לגנים המשתנים מרחבית (SVG; גנים שרמות הביטוי שלהם שונות בין מיקומי הרקמות) בדגימה 9,10. SVGs אלה צפויים באמצעות פונקציית singleCellHaystack, המאמצת את מדד הסטייה של Kullback-Leibler (D_KL בטבלה) כדי להעריך עד כמה דפוס הביטוי של כל גן שונה ממה שהיה צפוי באקראי (איור 2). גנים עם ערך p נמוך (log.p.adj שלילי גדול בטבלה) רשומים כ-SVG.
      הערה: נתוני ביטוי הגנים נורמלו באמצעות פרמטרי ברירת המחדל המשמשים בחבילת Seurat R (גרסה 5)11. בפועל, הקריאות של כל גן בכל נקודה חולקו בספירה הכוללת של הקריאות באותה נקודה, והוכפלו במקדם קנה המידה 10,000. לאחר מכן, הלוגריתם הטבעי חושב לאחר הוספת 1, כדי למנוע בעיות עם log(0). התרשים המוצג בכרטיסייה גנים מציג את הנתונים המנורמלים הללו.
    2. לחץ על כמה מהגנים המובילים ברשימה. זה יוצר עלילה מרחבית עבור הגנים על פני פרוסת הרקמה, עם כתמים מקודדים בצבע עבור רמת הביטוי (איור 2). לגנים בעלי ניקוד גבוה יש דפוסי ביטוי מרחביים ברורים.
    3. נווט הלאה לכרטיסייה מסלולים כדי לבדוק את הפעילות של קבוצות גנים (למשל, גנים הקשורים למסלול ביולוגי משותף) ולא גנים בודדים. מסלולים משתנים מרחבית רשומים באופן דומה ל-SVG שנדונו לעיל (איור 3). פעילויות המסלול מוערכות על סמך רמות הביטוי של הגנים הקשורים אליהם 7,11.
      הערה: פעילויות המסלול הוערכו באמצעות פונקציית החבילה Seurat R addModuleScore11. בקצרה, פונקציה זו לוקחת כקלט קבוצה של גנים (למשל, קבוצה של גנים המעורבים במסלול משותף) ומחזירה את רמות הביטוי הממוצעות שלהם, לאחר מספר שלבי עיבוד. בפועל, ערכים חיוביים מרמזים על פעילות גבוהה מהממוצע, וערכים שליליים מרמזים על פעילות נמוכה מהממוצע. התרשים המוצג בכרטיסיה מסלולים מציג נתוני ניקוד מודול זה.
    4. לחץ על כמה מהמסלולים המובילים ברשימה. זה יוצר עלילה מרחבית עבור המסלולים על פני פרוסת הרקמה, עם כתמים מקודדים בצבע לרמת הפעילות. לכמה מסלולים יש דפוסי פעילות מרחביים מובהקים (איור 3).
  6. השוואת ביטוי גנים תוך דגימה
    1. נווט אל הכרטיסייה סייר הטישו ובחר בחירה ידנית (אם היא עדיין לא נבחרה). לאחר מכן, השתמשו בסמן העכבר כדי לבחור את הנקודות באזור ההיפוקמפוס של פרוסת מוח העכבר, בצד שמאל. לחץ על סט 1 ובחר הוסף לסט. זה ידגיש את כל הנקודות שנבחרו על הפרוסה בצד ימין (איור 4A).
    2. כעת לחץ על סט 2, והשתמש בסמן העכבר כדי לבחור את הנקודות באזור ההיפותלמוס של פרוסת מוח העכבר. לחץ על הוסף להגדרה, שתדגיש את כל הנקודות שנבחרו על הפרוסה בצד ימין (איור 4A).
    3. לאחר השלמת תהליך הבחירה הנקודתית, לחץ על כפתור השווה ביטוי גנים . זה ייצור טבלה עם ערכי ביטוי הגנים הממוצעים של הכתמים שנבחרו בין שני האזורים, יחד עם ייצוג תרשים פיזור. הזיזו את הסמן מעל נקודות בודדות כדי לאשר את שמות הגנים ואת הביטוי הממוצע של הגנים בשני האזורים.
    4. בהתבסס על תוצאות השוואת ביטוי הגנים, זהה גנים המתבטאים באופן דיפרנציאלי ונווט מחדש לכרטיסייה גנים כדי לדמיין את הביטוי שלהם על פני פרוסת הדגימה (איור 4B,C).
      הערה: באמצעות השלבים המפורטים לעיל, ניתן להשתמש ב-DeepSpaceDB כדי לחקור את התכונות של דגימת תעתיק מרחבי של מוח עכבר.

2. דוגמה 2: זיהוי וביאור של גנים המתבטאים באופן דיפרנציאלי הקשורים לפעילות חיסונית באזורים גרורתיים ממקור המעי הגס בכבד עכברים

הערה: השוואה תוך-מדגמית נחקרת בסעיף הנוכחי. זה מומחש באמצעות זיהוי והערות של גנים המתבטאים באופן דיפרנציאלי בין אזורים גרורתיים ממקור המעי הגס, ואזורים מרוחקים של רקמה בריאה בתוך חתך כבד, בהתבסס על שתי דגימות שונות. הביטוי המרחבי של גנים לא מווסתים ספציפיים הרלוונטיים לפעילות החיסונית מודגם עוד יותר בקטעי הרקמה.

  1. ניווט במסד נתונים ובחירת דוגמאות
    1. לחץ על הכרטיסייה מסד נתונים והשתמש במסנן כדי לבחור את עכבר האורגניזם , כבד האיבר וסרטן המצב. מבין הדגימות המתקבלות, בחר DSID001005 לדוגמה. לחץ על הדגימה ואשר את התיאור המציין שהדגימה היא מכבד עכבר המכיל גרורות שמקורן בסרטן המעי הגס.
    2. נווט אל הכרטיסייה סייר הרקמות ובחר בחירה ידנית. לאחר מכן, באמצעות סמן העכבר, בחר את הכתמים באזור הגידול (גרורות המעי הגס) של DSID001005 דגימת הכבד, שזוהו על סמך הביטוי החיובי של סמן Epcam (איור 5A). לחץ על סט 1 ובחר הוסף לסט. זה מדגיש את כל הנקודות שנבחרו על הפרוסה בצד ימין (איור 5C).
    3. כעת לחץ על סט 2, והשתמש בסמן העכבר כדי לבחור את הנקודות באזור המרוחק שאינו גידול של דגימת הכבד. לחץ על הוסף להגדרה, שתדגיש את כל הנקודות שנבחרו על הפרוסה בצד ימין (איור 5C).
  2. השוואה של ביטוי גנים בין כתמים נבחרים
    1. לאחר השלמת תהליך הבחירה הנקודתית, לחץ על כפתור השווה ביטוי גנים . זה יוצר טבלה עם ערכי ביטוי הגנים הממוצעים של הנקודות שנבחרו בין שני האזורים, יחד עם ייצוג תרשים פיזור. הזיזו את סמן העכבר מעל נקודות בודדות ובדקו את שמות הגנים ואת הביטוי הממוצע של הגנים בשני האזורים.
    2. כדי לבצע ניתוח מעמיק יותר עם נתוני ביטוי הגנים, בחר באפשרות הורד CSV . פעולה זו יוצרת קובץ ערכים מופרדים בפסיקים (CSV) של נתוני ביטוי הגנים עבור שני אזורי המדגם.
    3. חזור על שלבים 2.1.1-2.1.3 ו-2.2.1-2.2.2 עבור דוגמה "DSID001007". אשר את תיאורו כפרוסה נוספת מכבד עכבר המכילה גרורות ממקור סרטן המעי הגס.
  3. ניתוח נתונים עם תכנות R
    1. ודא שהשלבים שלעיל הובילו לשני קבצי CSV, אחד DSID001005 לדוגמה ואחד DSID001007 לדוגמה. שני הקבצים מכילים 2 עמודות המייצגות את ביטוי הגנים הממוצע בשתי הבחירות (רקמת גידול ורקמה שאינה גידולית) שבוצעו בכל דגימה.
    2. קרא את קבצי ה-CSV ל-R ומזג אותם לניתוח נוסף במורד הזרם עם שני שכפולים לכל מצב (כלומר, אזור גידול עם גרורות של סרטן המעי הגס, ורקמה בריאה מרוחקת בכבד). עיין בסקריפט R ובקבצי הנתונים בחומרים המשלימים.
    3. השתמש בחבילת הלימה (גרסה 3.62.2) ב-R (גרסה 4.4.2)12 כדי לבצע ניתוח ביטוי דיפרנציאלי עבור הנתונים, תוך סיווג אזורי הגרורות במעי הגס של שתי הדגימות כסרטן, והאזורים הרחוקים והבריאים של שתי הדגימות כביקורת. השג את הגנים המווסתים עם מסנן של logFC > 0.5 וערך p מותאם < 0.05. באופן דומה, השג את הגנים המווסתים עם מסנן של logFC < -0.5 וערך p מותאם < 0.05.
      הערה: קבוצות גנים אלה משמשות לזיהוי מסלולים ביולוגיים המושפעים מהגידול בשלב הבא (איור 6A,B).
    4. השתמש בחבילת clusterProfiler (גרסה 4.14.6) ב-R13 כדי לבצע את ניתוח המסלולים של אנציקלופדיית קיוטו לגנים וגנומים (KEGG)14 עבור הגנים המווסתים והמוגברים. בהתבסס על מסנן מחמיר של ערך q < 0.05, זהה את המסלולים המשמעותיים הקשורים לגנים המווסתים והמוגברים. התמקדו בגנים שקשורים למסלולים אימונולוגיים, לפעילויות חיסוניות או לחתימות רלוונטיות (איור 6B).
  4. כריית נתונים ספציפיים לגנים
    1. לאחר מכן, חפש שמות גנים בסעיף גנים משתנים מרחבית כדי לאשר את הביטוי המרחבי של גני המטרה. לחצו על שם הגן כדי ליצור תרשים מרחבי עבור הגן על פני פרוסת הרקמה, עם כתמים מקודדים בצבע עבור רמת הביטוי (איור 7).
    2. לזהות גנים ספציפיים בעלי דפוסי ביטוי מרחביים באתר של גרורות במעי הגס, לעומת רקמת הכבד המרוחקת והבריאה. ניתן לחקור עוד יותר את הרלוונטיות התפקודית של הגנים, או ביטוים באיברים או במצבים אחרים במסד הנתונים.
    3. בחר את הכרטיסיה חיפוש ובחר את המין כעכבר. לחץ על אפשרות החיפוש לפי גן , והקלד שם גן. סקירה כללית של התפלגות האיברים והמצב של הגנים תוצג וניתן יהיה לנתח אותה עוד יותר.
      הערה: באמצעות השלבים המפורטים לעיל, ניתן להשתמש ב-DeepSpaceDB כדי לחקור דפוסי ביטוי גנים בין אזורים גרורתיים ולא גרורתיים בדגימות טרנסקריפטומיקה מרחבית של כבד עכבר.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

דוגמה 1 הדגימה ניתוח של דגימת מוח של עכבר, אימות פרמטרים כמו ספירת קריאה, גנים ומסלולים משתנים מרחבית ושונות בביטוי גנים בין ההיפוקמפוס לקליפת המוח. ראשית, איכות DSID001557 דגימת המוח של העכבר הוערכה מול כמה מדדי איכות: "גנים שזוהו" (איור 1A), "ספירת קריאות" (איור 1B) ו-"Mito" (אחוז הקריאות המיטוכונדריאליות; איור 1C). זה הדגיש בבירור אזור עם איכות נמוכה יותר בצד שמאל של דגימת המוח, בהתבסס על המספר הנמוך של גנים שזוהו וספירת הקריאה הנמוכה. כדי להבין את האיכות היחסית של המדגם לעומת כל שאר המדגמים, נלחצה על הכרטיסיה איכות יחסית של הדגימה במסד הנתונים, שהציגה גרף של ספירה לעומת לא. של גנים שזוהו בכל נקודה (ממוצע). עבור הדגימה שנותחה, זוהו בין 3500-4000 גנים בכל נקודה (איור 1D). המאפיינים האנטומיים של המדגם נותחו עוד יותר באמצעות לשונית הערת תמונה . כהערה כללית, הערות אלו נוצרו על ידי חיתוך תמונות רקמה לחלקים קטנים יותר ובקשת LLM לתאר את התכונות הנצפות8. הם אינדיקציות גסות המסייעות בפירוש הדגימה ויש לפרש אותם בזהירות. עבור תת-קבוצה של דגימות (במיוחד דגימות סרטן שד אנושיות), זמינות גם הערות על ידי מומחה אנושי. עם זאת, בהתחשב באיכות הנמוכה יותר של תמונות Visium H&E בהשוואה לתמונות המשמשות לאבחון שגרתי, ההערות המסופקות הן למטרות מחקר בלבד. עבור DSID001557 לדוגמה, העבר את הסמן מעל הפרוסה המוצגת הערות של האזורים השונים במוח העכבר, כגון אזור ההיפוקמפוס, שכבות קליפת המוח, שכבות תאיות צפופות עם גליוזיס וכו'. מהבנת המאפיינים האנטומיים הבסיסיים של פרוסת הדגימה, נחקרו עוד מאפיינים מפורטים כמו אשכולות מסוג תאים וגנים ומסלולים משתנים מרחבית. לדגימת המוח של העכבר היו 15 אשכולות בסך הכול, שיוצגו באמצעות קידוד צבע על פני פרוסת הדגימה (איור 1E). חלק מהגנים המשתנים מרחבית המובילים הקשורים לדגימה הם Nrgn, Slc17a7, Ly6h ו-Ddn (איור 2). Nrgn הפגין ביטוי גבוה באזור ההיפוקמפוס, בהתאם לעדויות הספרותיות המצביעות על תפקידו של החלבון המקודד Nrgn (נוירוגרנין) בתיווך פלסטיות סינפטית ולמידה מרחבית15. Slc17a7, גן המקודד לטרנספורטר גלוטמט שלפוחית החיוני להעברה עצבית בנוירונים גלוטמינרגיים16, ו-Ddn, גן המקודד לחלבון המווסת את מבנה השלד הציטולוגי הפוסט-סינפטי17, באו לידי ביטוי גם הם באזור ההיפוקמפוס. לעומת זאת, הביטוי של הגן Ly6h היה ממוקם באזור קליפת המוח, בהתאם לספרות המצביעה על התפקיד הסינפטי המגביל של Ly6h בקרומים של תאים בקליפת המוח18. באופן דומה, פעילות המסלולים הודגמה על פני פרוסת הדגימה (איור 3). המסלולים המשתנים מרחבית נצפו מופעלים בהתאמה עם התפקידים התפקודיים של הגנים המשתנים מרחבית, עם ויסות הפלסטיות הסינפטית ופעילות המוליכים העצביים באזור ההיפוקמפוס, ואיתות נוירופפטיד באזור קליפת המוח.

לבסוף, כדי לזהות גנים המתבטאים באופן דיפרנציאלי בין אזור ההיפוקמפוס להיפותלמוס של דגימת המוח של העכבר, נעשה שימוש בכרטיסייה Tissue Explorer . כתמים הקשורים לאזורי העניין נבחרו עם הנחיה מביאור התמונה (איור 4A). מתוך תרשים הפיזור שנוצר, חלק מהגנים המתבטאים באופן דיפרנציאלי שזוהו היו בין הגנים המשתנים מרחבית המובילים (Nrgn, Slc17a7, Ddn), בנוסף לכמה אחרים, כגון Pmch ו-Ttr. ביטוי הגנים הללו הודגם בפרוסת הדגימה. Pmch התבטא באופן ספציפי באזור ההיפותלמוס הצדדי (איור 4B; השווה לאזור הירוק שנבחר באיור 4A). גן זה מקודד את המבשר של הורמון ריכוז המלנין, ומעורב בשמירה על הומאוסטזיס אנרגטי19. לעומת זאת, הגן Ttr התבטא באופן ספציפי באזור ההיפוקמפוס (איור 4C; השווה לאזור הנבחר האדום באיור 4A), בהתאם לתפקידו התפקודי בלמידה ובזיכרון מרחבי20. על ידי ביצוע השוואות תוך-דגימה בין אזורי מוח שונים של עכברים באמצעות מסד נתונים זה, הצלחנו להדגיש מאפיינים תפקודיים ספציפיים לאזור בהתבסס על ביטוי גנים מרחבי ופעילות מסלול.

בדוגמה 2, מסד הנתונים שימש לזיהוי חתימות חיסוניות הקשורות לגרורות במעי הגס בכבד. השוואה תוך-דגימית נערכה בין אזור הגידול עם גרורות המעי הגס לבין רקמת הכבד המרוחקת והבריאה, באמצעות בחירה נקודתית מתאימה לשתי הדגימות: DSID001005 (איור 5A-C) ו-DSID001007 (איור 5D-F). הנתונים נותחו מחדש עם שני שכפולים לכל מצב באמצעות R. ניתוח ביטוי דיפרנציאלי שנערך בין אזור הגידול עם גרורות במעי הגס לבין רקמת הכבד הבריאה חשף את הוויסות הנמוך של 138 גנים ואת הוויסות המוגבר של 115 גנים, בהתבסס על הפרמטרים שנבחרו (איור 6A,B). ניתוח מסלול KEGG הדגים את העשרת מסלולי הגנים המווסתים, כמו מטבוליזם של תרופות וסרטן כימי (איור 6C), בעוד שהגנים המווסתים הראו חתימות המתאימות לנדידה טרנס-אנדותל של לויקוציטים, הידבקות מוקדית ומחזור תאים, בין היתר (איור 6D). תוך התמקדות ברלוונטיות של נדידת לויקוציטים טרנס-אנדותל לפעילות חיסונית, זוהו גנים מובילים שזוהו בקטגוריה, והביטוי המרחבי שלהם נצפה ב-DeepSpaceDB. מעניין לציין כי הגנים Cldn7, Cldn4 ו-Actg1 שזוהו תחת הקטגוריה של נדידת לויקוציטים טרנס-אנדותל, הפגינו ויסות מוגבר באזור הגידול (אתר Epcam+) של הדגימות, ולא באזור המרוחק עם רקמת כבד בריאה (איור 7). זה סיפק תובנות לגבי אופי הפעילות החיסונית המונעת באתר הגידול של הכבד, עם גיוס פעיל של לויקוציטים. לסיכום, ניתוח תוך-דגימה באמצעות DeepSpaceDB מאפשר חילוץ של תובנות ביולוגיות מגוונות. על ידי השוואת נתונים טרנסקריפטומיים מרחביים באמצעות כלים אינטראקטיביים ותהליכי עבודה של ניתוח מחדש, חוקרים יכולים ליצור ולאמת השערות לגבי ביטוי גנים ספציפי לרקמה והטרוגניות תפקודית.

figure-results-1
תרשים 1: מדדי איכות של המדגם. (A) מספר הגנים שזוהו, (B) ספירת הקריאות ו-(C) אחוז הקריאות המיטוכונדריאליות לכל נקודה. (D) המספר הממוצע של גנים שזוהו לכל נקודה בדגימה זו, בהשוואה להתפלגות של כל הדגימות האחרות במסד הנתונים. (E) אשכולות נקודתיים על פני פרוסת הרקמה. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-results-2
איור 2: ביטוי של גנים משתנים מרחבית עליונים. (A) Nrgn, (B) Slc17a7, (C) Ly6h, ו-(D) Ddn. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-results-3
איור 3: פעילות של מסלולים עליונים משתנים מרחבית. (A) איתות נוירופפטיד, (B) ויסות הפלסטיות הסינפטית, (C) הובלת נוירוטרנסמיטרים. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-results-4
איור 4: השוואה של דפוסי ביטוי גנים בין שני אזורים נבחרים במוח העכבר. (A) בחירה נקודתית באזורי ההיפותלמוס וההיפוקמפוס לצורך השוואות בתוך הדגימה. אזור 1 שנבחר מוצג באדום ואזור 2 בירוק. דפוסי ביטוי מרחביים של גנים המתבטאים באופן דיפרנציאלי (B) Pmch ו- (C) Ttr בין אזורי ההיפותלמוס וההיפוקמפוס. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-results-5
איור 5: מאפיינים של שתי דגימות כבד גרורתי של עכבר. לדוגמא DSID001005: (A) ביטוי סמן Epcam , (B) אשכולות נקודתיים ו-(C) אזורים נבחרים באזורים סרטניים ומרוחקים לצורך השוואות תוך-דגימה. לדוגמא DSID001007: (D) ביטוי סמן Epcam , (E) אשכולות נקודתיים ו-(F) אזורים נבחרים באזורים סרטניים ומרוחקים לצורך השוואות תוך-דגימה. עבור שתי הדגימות, כתמי גידול נמצאים באזורים המוצגים באדום, וכתמים שאינם גידול נמצאים באזורים המוצגים בירוק. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-results-6
איור 6: תוצאות ניתוח מחדש. (A) סיכום סכמטי של זרימת העבודה ששימשה בניתוח מחדש. (B) תרשים הר געש שמייצג את הגנים המתבטאים באופן דיפרנציאלי בין אזורים סרטניים ומרוחקים. העשרת מסלול KEGG של (C) גנים מווסתים ו-(D) גנים מווסתים. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-results-7
איור 7: ביטוי מרחבי של גנים. (A) Cldn7, (B) Cldn4 ו-(C) Actg1 בפרוסות רקמה DSID001005. ביטוי מרחבי של גנים. (D) Cldn7, (E) Cldn4 ו-(F) Actg1 בפרוסת רקמה DSID001007. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

קבצים משלימים 1-4: קבצי נתונים וסקריפט R עבור גרורות בכבד לדוגמה. אנא לחץ כאן להורדת קובץ זה.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

כאן, הצגנו שני פרוטוקולים מקיפים המתארים את הניווט, האחזור והניתוח של נתוני טרנסקריפטומיקה מרחבית ב-DeepSpaceDB. בעוד שרוב מסדי הנתונים של אומיקס מרחבי מתמקדים באיסוף נתונים ממספר רב של דגימות, שנוצרו באמצעות פלטפורמות שונות 3,4,5,6, DeepSpaceDB מתמקדת בפיתוח כלים אינטראקטיביים המאפשרים למשתמשים לחקור לעומק וביעילות תכונות תעתיק מרחביות. כדי לאפשר רמה זו של פונקציונליות, המהדורה הנוכחית מתמקדת אך ורק בפלטפורמת Visium. עם הופעתן של פלטפורמות ברזולוציה גבוהה, אנו מתכננים להרחיב את DeepSpaceDB בהתאם, ולפתח אסטרטגיות חדשות לעיבוד ושילוב של נתונים כאלה בצורה ידידותית למשתמש.

DeepSpaceDB מאפשר למשתמשים להעריך מדדי איכות מדגם (למשל, ספירת גנים, עומק קריאה) ולהשוות אותם בין מערכי נתונים. מסד הנתונים כולל הערות רב-שכבתיות: אשכולות ללא פיקוח על פני מסד הנתונים המלא עם תוויות שהוקצו, זיהוי מבוסס LLM של מאפיינים מבניים ופתולוגיים מתמונות היסטולוגיות, והערות היסטולוגיה של מומחים עבור תת-קבוצה הולכת וגדלה של דגימות. יתר על כן, משתמשים יכולים לבחור באופן אינטראקטיבי אזורי עניין בתוך או בין דגימות כדי להשוות ביטוי גנים, מה שמאפשר מחקרים של ניגודים מרחביים בין אזורים כמו גידול לעומת סטרומה או אזורים חולים לעומת בריאים. תכונות כאלה חסרות בדרך כלל במסדי נתונים אחרים 3,4,5,6. תכונות אחרות, כגון גנים ומסלולים משתנים מרחבית, תחזיות סוג תא ותוצאות אשכולות, זמינות גם כן. יחד, מסד נתונים זה מוריד משמעותית את החסמים לחקר נתוני טרנסקריפטומיקה מרחבית. דגימות ממגוון רחב של רקמות ומצבים נגישות באופן חופשי, ומשתמשים יכולים לנווט בהן באמצעות אינטראקציות פשוטות של הצבעה ולחיצה; אין צורך במומחיות מתקדמת בביואינפורמטיקה. עם זאת, ידע מוקדם כלשהו על גנים סמנים וארכיטקטורת רקמות נחוץ ככל הנראה לפירוש מדויק של דפוסי ביטוי ולבחירת אזורי עניין בכלי Tissue Explorer.

למרות שלא הוצג כאן, משתמשים יכולים גם להעלות דוגמאות משלהם וליישם רבים מאותם כלים כדי לנתח אותם. מסד הנתונים תומך גם בהשוואות בין דגימות בין 2 פרוסות רקמה שונות, ומאפשר, למשל, השוואות בין רקמות חולות לרקמות בקרה בריאות. לבסוף, נתונים גולמיים ומעובדים, יחד עם כל פלטי הניתוח הנגזרים, זמינים להורדה, ותומכים בזרימות עבודה במורד הזרם וניתוחים מותאמים אישית. עבור כמה מהכלים הללו, סרטוני הדרכה קצרים זמינים בדף ההדרכה של מסד הנתונים.

ישנם עדיין היבטים של מסד הנתונים הדורשים שיפור. האחד הוא חיזוי מדויק של סוגי תאים והרכבי סוגי תאים בכל מיקום בתוך פרוסות הרקמה. בגרסה הנוכחית של DeepSpaceDB (גרסה 1.0), חזינו את הרכב סוג התא של כל נקודת Visium באמצעות שיטה הנקראת פירוק סוג תא חזק (RCTD)21. RCTD ביצע ביצועים טובים יחסית במחקר בנצ'מרק שנערך לאחרונה22. תחזיות שנעשו על ידי RCTD יכולות להיות מאומתות גם בניסוי במחקר האחרון שלנו על הכבד של עכברים נושאי סרטן23. עם זאת, לא נערכה הערכה מקיפה של דיוק תחזיות סוג התא. נושא קשור הוא ש-RCTD ושיטות חיזוי אחרות של סוגי תאים דורשות מערך נתונים ייחוס עם סוגי תאים מוערים. באופן כללי, סוגי תאים (או קומפוזיציות סוגי תאים) בכל מיקום מרחבי צפויים באמצעות השוואה עם דפוסי ביטוי גנים במערך נתוני ייחוס זה. עם זאת, בחירת הפניה מתאימה לכל דגימת Visium אינה תמיד פשוטה. הפניות עשויות להיות חסרות סוגי תאים מרכזיים, או, להיפך, עשויות לכלול סוגי תאים שאינם קיימים בפרוסת הרקמה24. יתר על כן, בתוך סוג תא אחד, תאים יכולים להיות במצבים שונים באופן דרסטי, כגון תאים חיסוניים לא פעילים לעומת תאים פעילים25. מצבי התא הקיימים במערכי נתוני ייחוס אינם בהכרח תואמים לאלה של דגימות מרחביות, המתקבלות לעתים קרובות ממודלים של מחלות של חולים. שתי הבעיות עשויות לגרום לתחזיות לא מדויקות. אנו מקווים לטפל בנושא זה בעתיד.

ככל שתחום הטרנסקריפטומיקה המרחבית ממשיך להתפתח במהירות, מספר הולך וגדל של כלים חישוביים מפותחים לניתוח היבטים מגוונים של נתונים מרחביים, כולל אינטראקציות תא-תא, תחומים מרחביים וחיזוי גנים משתנים מרחבית (ראה, למשל, 26,27,28). בעוד שריבוי זה משקף את הדינמיות של התחום, הוא גם מציב אתגר לאוצר ולשלב כלים במסד נתונים זה. כדי להבטיח שהשיטות החזקות והישימות ביותר ייכללו, יש צורך דחוף במחקרי ביצועים שיטתיים המעריכים את ביצועי הכלים על פני מערכי נתונים ומשימות ניתוח 22,29,30. מאמצים כאלה יהיו חיוניים כדי להנחות בחירה מושכלת ותעדוף של כלים להכללה במסד הנתונים.

בעוד שמאגרי נתונים אחרים של תעתיק מרחבי מנסים לאסוף מספר רב של דגימות מפלטפורמות רבות ושונות, ב-DeepSpaceDB החלטנו להשתמש באסטרטגיה שונה: להתמקד בכמה פלטפורמות פופולריות וליישם כלים אינטראקטיביים ואינטואיטיביים המאפשרים למשתמש לחקור בקלות את הנתונים ביתר פירוט. למרות שמסד הנתונים שלנו מכיל רק דגימות של Visium בגרסה הנוכחית 1.0, אנו מתכננים לכלול גם דגימות מפלטפורמות אחרות בעדכון עתידי.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

למחברים אין מה לחשוף.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

המחברים מבקשים להודות לי' הרדה על עזרת המזכירות. עבודה זו נתמכה על ידי JST NBDC (מענק מספר JPMJND2303, A.V.) ו-AMED (מספר מענק JP24gm2010003, A.V.) עבודה זו נתמכה גם על ידי JSPS KAKENHI (20H03451, 24K02236 ו-24KK0147; S.K.), JST FOREST (JPMJFR2062; ס.ק), ג'יי.אס.טי מונשוט (JPMJMS2011-61; S.K). למממנים לא היה כל תפקיד בתכנון המחקר, איסוף וניתוח נתונים, החלטה לפרסם או הכנת כתב היד.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
clusterProfilerחבילת R - גרסה 4.14.6
DeepSpaceDBגרסה > 1.0קישור למאגר: www.deepspacedb.com
לימהחבילת R - גרסה 3.62.2
Rגירסה 4.4.2
RStudioפוזיטגרסה 2024.12

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
  2. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  3. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
  4. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
  5. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
  6. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
  7. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
  8. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
  9. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
  10. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
  11. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
  12. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
  13. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
  14. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
  15. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
  16. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
  17. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
  18. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
  19. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
  20. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
  21. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
  22. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
  23. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
  24. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
  25. A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
  26. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
  27. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
  28. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
  29. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
  30. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Spatial TranscriptomicsGene Expression PatternsDeepSpaceDB DatabaseTissue Slice AnalysisSpatially Variable GenesDifferential Gene ExpressionTumor MicroenvironmentMouse Brain SampleColorectal Cancer MetastasisBioinformatics Tools

Related Articles