Biology

유전자 규제 네트워크 추론 파이프라인의 출력을 평가하고 시각화하기 위한 대화형 응용 프로그램인 내재역학 시각화

Published: December 7, 2021 doi: 10.3791/63084

Robert C. Moseley¹, Sophia Campione¹, Bree Cummins², Francis Motta³, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Mathematical Sciences, Montana State University, ³Department of Mathematical Sciences, Florida Atlantic University

Summary

내재된 Dynamics 시각화는 향상된 능률적인 기능 성 네트워크 모델을 위해 유전자 규제 네트워크 추론 도구에 연결하는 대화형 시각화 패키지입니다. 시각화 도우미를 사용하여 추론 도구를 매개 변수화하기 위해 보다 정보에 입각한 결정을 내릴 수 있으므로 결과 모델에 대한 신뢰도가 높아질 수 있습니다.

Abstract

유전자 규제 네트워크 모델을 개발하는 것은 시스템 생물학의 주요 과제입니다. 새로 개발된 내재역학 파이프라인을 포함하여 이러한 과제를 해결하기 위해 여러 가지 계산 도구와 파이프라인이 개발되었습니다. 내재역학 파이프라인은 이전에 게시된 여러 도구로 구성되어 시너지 효과적으로 작동하고 선형 방식으로 연결되며, 여기서 한 도구의 출력이 다음 도구의 입력으로 사용됩니다. 대부분의 계산 기술과 마찬가지로 고유역학 파이프라인의 각 단계에서는 정확한 생물학적 정의가 없는 매개 변수를 선택해야 합니다. 이러한 선택은 분석에 의해 생성된 유전자 규제 네트워크 모델에 실질적으로 영향을 미칠 수 있습니다. 이러한 이유로 각 단계에서 다양한 매개 변수 선택결과를 시각화하고 탐색하는 기능은 선택 사항과 결과에 대한 신뢰를 높이는 데 도움이 될 수 있습니다. 고유역학 시각화는 웹 브라우저 내의 대화형 인터페이스를 통해 매개 변수 선택 사항을 평가하는 프로세스를 간소화하는 포괄적인 시각화 패키지입니다. 사용자는 파이프라인의 각 단계의 출력을 별도로 검사하고, 시각적 정보에 따라 직관적으로 변경하고, 고유역학 파이프라인에 필요한 입력 파일을 자동으로 생산하여 이점을 얻을 수 있습니다. 내재된 역학 시각화도우미는 타임시리즈 전사 데이터에서 유전자 규제 네트워크를 발견하기 위한 매우 복잡한 도구에 대한 비교할 수 없는 수준의 액세스를 제공합니다.

Introduction

세포 분화 및 환경 반응과 같은 많은 중요한 생물학적 과정은 유전자 규제 네트워크 (GRN)에서 서로 상호 작용하는 유전자 세트에 의해 지배됩니다. 이러한 GRN은 그들이 제어하는 표현형을 활성화하고 유지하는 데 필요한 전사 역학을 생성하므로 GRN의 구성 요소 및 토폴로지 구조를 식별하는 것이 많은 생물학적 과정과 기능을 이해하는 데 핵심적인 역할을 합니다. GRN은 노드가 유전자이고 그 가장자리가 상호 작용의 방향과 형태를 설명하는 네트워크에 의해 기술된 상호 작용하는 유전자 및/또는 유전자 제품의 집합으로 모델링될 수 있습니다 (예를 들어, 전사의 활성화/억압, 번역 후 수정 등) ¹. 상호 작용은 그 때 조절 유전자가 그것의 표적의 생산에 미치는 영향을 설명하는 매개 변수화된 수학 모형으로 표현될 수 있습니다 (들)^2,3,4. GRN 모델의 추론은 상호 작용 네트워크의 구조와 기본 상호 작용 매개 변수의 추정을 모두 추론해야 합니다. 다양한 전산 추론 방법이 개발되어 가장 구사된 타임시리즈 유전자 발현 데이터 및 출력 GRN 모델⁵. 최근에는 타임시리즈 유전자 발현 데이터를 활용하여 유전자 발현 데이터⁶에서 관찰된 역학과 일치하는 역학을 생성할 수 있는 표지된 레귤레이터 표적 상호작용으로 GRN 모델을 생성하는 고유역학 파이프라인(IDP)이라고 불리는 새로운 GRN 추론 방법이 개발되었다. IDP는 파이프라인에 선형으로 연결된 도구 모음으로, 유전자 발현 특성에 기초하여 유전자를 순위를 매기는 노드 찾기 단계인 ^GRN7,8의 기능과 관련이 있는 것으로 의심되는 단계, 쌍별 규제 관계를 순위를 매기는 Edge 찾는 단계⁸^,⁹, 관찰된 역학을 생성할 수 있는 GRN 모델을 생성하는 네트워크 찾기 단계10,11,12,13,14,15.

대부분의 계산 방법과 마찬가지로 IDP는 입력 데이터를 분석하는 방법을 지시하는 사용자 지정 인수 집합이 필요하며 서로 다른 인수 집합은 동일한 데이터에 대해 서로 다른 결과를 생성할 수 있습니다. 예를 들어 IDP를 비롯한 여러 메서드에는 데이터에 일부 임계값을 적용하는 인수가 포함되어 있으며 특정 메서드의 연속 실행 간에 이 임계값을 증가/줄이면 실행 간에 유사 결과가 발생할 수 있습니다(보충 참고 10: 네트워크 추론 방법 ⁵ 참조). 각 인수가 분석및 후속 결과에 어떤 영향을 미칠 수 있는지 이해하는 것은 결과에 대한 높은 신뢰를 달성하는 데 중요합니다. 대부분의 GRN 추론 방법과 달리 IDP는 사용자가 지정해야 하는 고유한 인수 집합을 가지며 각각 고유한 결과를 갖는 여러 계산 도구로 구성됩니다. IDP는 각 도구를 매개 변수화하는 방법에 대한 광범위한 문서를 제공하지만 이전 단계의 출력에 대한 각 도구의 상호 의존성은 중간 분석 없이 전체 파이프라인을 매개 변수화하는 데 어려움을 겪고 있습니다. 예를 들어, Edge 및 네트워크 찾기 단계의 인수는 이전 생물학적 지식에 의해 통보될 가능성이 있으므로 데이터 집합 및/또는 유기체에 따라 달라집니다. 중간 결과를 심문하려면 프로그래밍에 대한 기본적인 이해뿐만 아니라 IDP의 모든 결과 파일과 해당 내용을 깊이 이해해야 합니다.

내재역학 시각화(IDV)는 사용자의 브라우저 창에서 실행되는 대화형 시각화 패키지로 IDP 사용자가 IDP의 모든 단계에서 발생하는 결과에 대한 인수 선택의 영향을 평가할 수 있는 방법을 제공합니다. IDV는 IDP에서 생성된 복잡한 디렉터리 구조를 탐색하고 각 단계에 필요한 데이터를 수집하고 사용자가 탐색할 수 있도록 직관적이고 대화형 그림및 테이블에 데이터를 제공합니다. 이러한 대화형 디스플레이를 탐색한 후 사용자는 보다 정보에 입각한 의사 결정을 기반으로 IDP 단계에서 새 데이터를 생성할 수 있습니다. 그런 다음 이러한 새 데이터는 IDP의 다음 단계에서 즉시 사용할 수 있습니다. 또한 데이터를 탐색하면 IDP 단계를 조정된 매개 변수로 다시 실행해야 하는지 여부를 결정하는 데 도움이 될 수 있습니다. IDV는 IDP의 사용을 향상시킬 뿐만 아니라 효모 세포 주기의 핵심 발진기 GRN을 조사하여 입증된 바와 같이 IDP를 보다 직관적이고 친근하게 사용할 수 있습니다. 다음 프로토콜에는 완전히 매개변수화된 IDP 실행과 각 IDP 단계(예: 노드, 가장자리 및 네트워크 찾기)를 실행한 후 IDV를 통합하는 접근 방식의 IDP 결과가 포함됩니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. IDP 및 IDV 설치

참고: 이 섹션에서는 도커, 콘다, 핍 및 git이 이미 설치되어 있다고 가정합니다(재료 표).

터미널에서 명령을 입력합니다: git 클론 https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
IDP의 README 파일의 설치 지침을 따릅니다.
터미널에서 명령을 입력합니다: git 클론 https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
참고: IDV의 복제는 IDP의 최상위 디렉터리 외부에서 수행해야 합니다.
IDV의 README 파일의 설치 지침을 따르십시오.

2. 노드 찾기

노드 찾기 단계를 매개하는 새 IDP 구성 파일을 만듭니다.
참고: 다음 단계의 모든 인용부호를 입력해서는 안 됩니다. 인용 부호는 여기에 프로토콜 텍스트와 입력할 내용 사이의 구분기호로만 사용됩니다.
1. 구성 파일에 기본 IDP 인수를 추가합니다.
2. 텍스트 편집기에서 새 텍스트 파일을 열고 개별 줄에 "data_file =", "annotation_file =", output_dir =", "num_proc =", "IDVconnection = True"를 입력합니다.
3. "data_file"의 경우 서명과 같을 경우 각 시간 시리즈 파일의 경로 및 이름을 입력하고 이름 다음에 쉼표를 입력합니다. 두 개 이상의 타임 시리즈 데이터 집합이 사용되는 경우 각 데이터를 쉼표로 분리합니다. 타임시리즈 유전자 발현 파일의 예는 보충 파일 1 및 보충 파일 2 를 참조하십시오.
4. 서명과 같을 경우 "annotation_file"에 대한 별표 파일의 경로 및 이름을 입력합니다. 추가 파일 3 을 참조하여 추가 파일의 예를 들어 표시 파일의 예를 들어 보겠습니다.
5. "output_file"의 경우 서명과 같을 경우 결과가 저장될 폴더의 경로와 이름을 입력합니다.
6. "num_proc"의 경우 서명과 같을 경우 IDP가 사용해야 하는 프로세스 수를 입력합니다.
7. 구성 파일에 노드 찾기 인수를 추가합니다.
8. 2.1.1 단계와 동일한 텍스트 파일에서 개별 줄에 "[dlxjtk_arguments]" 및 "기간 =", "dlxjtk_cutoff =""라는 순서를 입력합니다. 주요 인수 후에 배치합니다.
9. "기간"의 경우, 서명과 같을 경우, 일회성 계열 데이터 집합을 사용하는 경우 쉼표로 구분된 각 기간 길이를 입력합니다. 두 개 이상의 타임 시리즈 데이터 집합의 경우 각 기간 길이 집합을 이전과 같이 입력하지만 각 집합 주위에 사각형 브래킷을 배치하고 집합 사이에 쉼표를 놓습니다.
10. 서명과 동일한 후, "dlxjtk_cutoff"에 대해, JTK_CYCLE(DLxJTK)에 의해 드 리히텐베르크에 의해 gene_list_file 출력에 유지되는 유전자의 최대 수를 지정하는 정수를 입력(표 1).
  참고: 각 인수를 더 잘 이해하기 위해 IDP README의 dlxjtk_arguments 섹션을 검토하는 것이 좋습니다. 노드 찾기 인수가 지정된 구성 파일의 예를 보려면 보충 파일 4 를 참조하십시오.
터미널에서 inherent_dynamics_pipeline 라는 IDP 디렉토리로 이동합니다.
단말에 명령을 입력 : 콘다 활성화 dat2net
파일 이름 <> 파일 이름인 단자에서 이 명령을 실행하여 2.1단계에서 만든 구성 파일을 사용하여 IDP를 실행합니다 : python src/dat2net.py
터미널에서 inherent_dynamics_visualizer 명명된 디렉터리로 이동하여 명령을 입력합니다. /viz_results.sh
참고: IDP의 출력 디렉터리로 사용되는 디렉터리를 가리킵니다.
웹 브라우저에서 url로 http://localhost:8050/ 입력합니다.
이제 브라우저에서 IDV가 열려 있으면 노드 찾기 탭을 클릭하고 드롭다운 메뉴에서 관심 있는 노드 찾기 폴더를 선택합니다.
후속 IDP 단계에 사용할 IDV의 유전자 목록 테이블에서 새로운 유전자 목록을 수동으로 큐레이트합니다.
1. 유전자 목록 표를 확장하거나 단축하려면 위쪽 또는 아래쪽 화살표를 클릭하거나 DLxJTK 등급 유전자의 유전자 발현 옆에 있는 상자에 1에서 50 사이의 정수에 수동으로 입력합니다. 상단:.
2. 유전자 목록 표에서 유전자 옆의 상자를 클릭하여 선 그래프에서 유전자 발현 프로파일을 봅니다. 다중 유전자를 추가할 수 있다.
3. 선택적으로 첫 번째 주기를 빈으로 분할하기 위해 입력 정수라고 표시된 유전자 목록 테이블 위의 입력 상자에 정수를 입력하여 피크 발현을 포함하는 시간 간격으로 유전자를 계산하고 주문할 수 있는 동등하게 크기의 쓰레기통수를 지정합니다.
  참고: 이 옵션은 진동 역학에 만전을 기하며 다른 유형의 역학에 적용되지 않을 수 있습니다.
4. 첫 번째 주기에서 유전자 발현 피크의 시간에 따라 유전자를 주문하는 순서 유전자에 의하여 옵션을 클릭하여 히트맵 보기 선호도를 선택합니다.
  참고: DLxJTK 랭크는 IDP의 DLxJTK 알고리즘의 주기도 순위에 따라 유전자를 주문합니다.
5. 유전자 목록 다운로드 버튼을 클릭하여 유전자 목록을 가장자리 찾기 단계에 필요한 파일 형식으로 다운로드합니다. 유전자 목록 파일의 예를 보려면 보충 파일 5를 참조하십시오.
편집 가능한 유전자 별표에서, 새로운 Edge 찾기 실행에서 가장자리 찾기 단계에 대한 별표 파일에 표적, 레귤레이터 또는 둘 다로 유전자를 라벨. 유전자가 조절자인 경우, 활성제, 억압자 또는 둘 다로 유전자를 라벨로 지정합니다.
1. 활성제로 유전자를 레이블을 지정하려면 tf_act 열의 세포를 클릭하고 값을 1로 변경합니다. 유전자를 억압자로 표시하려면 tf_rep 열의 값을 1로 변경합니다. 유전자는 tf_act 및 tf_rep 컬럼 모두에서 값을 1로 설정하여 Edge 찾기 단계에서 활성제 및 억압자 역할을 할 수 있습니다.
2. 유전자를 표적으로 지정하려면 대상 컬럼의 세포를 클릭하고 값을 1로 변경합니다.
에지 찾기 단계에 필요한 파일 형식으로 어노기 파일을 다운로드하려면 Annot. 파일 다운로드 버튼을 클릭합니다.

3. 에지 찾기

에지 찾기 단계를 매개하는 새 IDP 구성 파일을 만듭니다.
1. 구성 파일에 기본 IDP 인수를 추가합니다. 텍스트 편집기에서 새 텍스트 파일을 열고 2.1.1 단계를 반복합니다.
2. 구성 파일에 에지 찾기 인수를 추가합니다.
3. 3.1.1 단계와 동일한 텍스트 파일에서 "[lempy_arguments]", "gene_list_file=", "[netgen_arguments], "edge_score_column =", "edge_score_thresho=", "num_edges_for_list=", "seed_threshold =", 개별 줄에 "num_edges_for_seed="이라는 순서를 입력합니다. 이들은 주요 인수 아래로 이동해야합니다.
4. "gene_list_file"의 경우, 서명과 동일한 후, 2.8.5 단계에서 생성된 유전자 목록 파일의 경로 및 이름을 입력한다.
5. "edge_score_column"의 경우 서명과 같을 경우 "pld" 또는 "norm_loss"을 입력하여 lempy 출력의 데이터 프레임 열이 가장자리를 필터링하는 데 사용되는지 지정합니다.
6. "edge_score_threshold" 또는 "num_edges_for_list"을 선택하고 다른 항목을 삭제합니다. "edge_score_threshold"를 선택한 경우 0에서 1 사이의 숫자를 입력합니다. 이 숫자는 3.1.5 단계에 지정된 열을 기반으로 가장자리를 필터링하는 데 사용됩니다.
  1. "num_edges_for_list"를 선택한 경우 가능한 모서리 수와 같거나 적은 값을 입력합니다. 이 숫자는 3.1.5 단계에 지정된 열에서 순위가 어떻게 순위에 따라 가장자리를 필터링하는 데 사용됩니다. 남은 가장자리는 네트워크 찾기에서 네트워크를 구축하는 데 사용됩니다.
7. "seed_threshold" 또는 "num_edges_for_seed"를 선택하고 다른 항목을 삭제합니다. "seed_threshold"를 선택한 경우 0에서 1 사이의 숫자를 입력합니다. 이 숫자는 3.1.5 단계에 지정된 열을 기반으로 가장자리를 필터링하는 데 사용됩니다.
  1. "num_edges_for_seed"를 선택한 경우 가능한 모서리 수와 같거나 적은 값을 입력합니다. 이 숫자는 3.1.5 단계에 지정된 열에서 순위가 어떻게 순위에 따라 가장자리를 필터링하는 데 사용됩니다. 남은 모서리는 네트워크 찾기에 사용되는 시드 네트워크(표 1)를 구축하는 데 사용됩니다.
    참고: 각 인수를 더 잘 이해하기 위해 IDP README의 lempy_arguments 및 netgen_arguments 섹션을 검토하는 것이 좋습니다. 에지 찾기 인수가 지정된 구성 파일의 예를 보려면 보충 파일 7 을 참조하십시오.
2.2 및 2.3 단계를 반복합니다.
<파일 이름> 파일 이름인 단자에서 이 명령을 실행하여 3.1단계에서 만든 구성 파일을 사용하여 IDP를 실행합니다 : python src/dat2net.py
IDV가 여전히 실행 중인 경우 터미널 창에서 제어 C 를 눌러 프로그램을 중지합니다. 2.5 및 2.6 단계를 반복합니다.
브라우저에서 IDV가 열려 있으면 Edge 찾기 탭을 클릭하고 드롭다운 메뉴에서 관심 있는 폴더를 찾습니다.
참고: Edge 찾기에서 여러 데이터 집합을 사용하는 경우 LEM(로컬 에지 머신) 분석(표 1)에서 사용된 마지막 데이터 집합을 선택해야 합니다. LEM 결과를 기반으로 시드 네트워크 또는 에지 목록에 대한 가장자리를 선택할 때 이 출력은 노드 간의 규제 관계를 추론하는 데 모든 선행 데이터 파일을 통합하기 때문에 구성 파일에 나열된 마지막 시간 시리즈 데이터를 살펴보는 것이 중요합니다.
가장자리 테이블을 확장하거나 줄이려면 모서리 수 아래 입력 상자에 정수를 수동으로 입력합니다.
LEM ODE 매개 변수에서 선택적으로 가장자리를 필터링합니다. 클릭하고 드래그하여 각 매개 변수 슬라이더의 왼쪽 또는 오른쪽을 이동하여 새 허용 매개 변수 경계 외부에 매개 변수가 있는 가장자리 테이블에서 가장자리를 제거합니다.
선택적으로 IDP에서 제안한 시드 네트워크와 다른 시드 네트워크를 원하는 경우 새 시드 네트워크를 만듭니다. 시드 네트워크 파일의 예는 보충 파일 8 을 참조하십시오.
1. 시드에서 시드 네트워크를 선택하거나 네트워크 아래의 드롭다운 메뉴에서 선택 에서 선택 중 하나를 선택합니다.
2. 각 모서리에 인접한 해당 확인란을 클릭하여 가장자리 테이블에서 가장자리를 선택 해제/선택하여 종자 네트워크에서 가장자리를 제거/추가합니다.
DSGRN NetSpec 다운로드 버튼을 클릭하여 규제 네트워크(DSGRN)(표 1) 네트워크 사양 형식으로 생성된 동적 서명에서 시드 네트워크를 다운로드합니다.
네트워크 찾기 단계에서 사용할 추가 노드와 가장자리를 선택합니다.
1. 네트워크 찾기에 사용되는 가장자리 목록 파일에 포함할 해당 확인란을 클릭하여 가장자리 테이블에서 가장자리를 선택합니다.
2. 노드 및 Edge 목록 다운로드를 클릭하여 네트워크 찾기에서 사용하는 데 필요한 형식으로 노드 목록 및 에지 목록 파일을 다운로드합니다. 에지 및 노드 목록 파일의 예는 보충 파일 9 및 보충 파일 10을 참조합니다.
  참고: 노드 목록에는 가장자리 목록 파일에 모든 노드가 포함되어 있어야 하므로 IDV는 선택한 모서리를 기반으로 노드 목록 파일을 자동으로 만듭니다. 가장자리 찾기에서 가장자리를 볼 수 있는 두 가지 옵션을 사용할 수 있습니다. LEM 요약 테이블 옵션은 가장자리를 상위 25개의 가장자리의 순위 목록으로 제공합니다. 최상위 LEM 표 는 가능한 각 레귤레이터에 대해 상위 3개 순위 가장자리의 연결 된 목록에서 가장자리를 제공합니다. 각 옵션에 대해 조회된 모서리 수를 사용자가 가장자리 수 입력 상자의 수를 변경하여 조정할 수 있습니다.

4. 네트워크 검색

네트워크 찾기 단계를 매개하는 새 IDP 구성 파일을 만듭니다.
1. 구성 파일에 기본 IDP 인수를 추가합니다. 텍스트 편집기에서 새 텍스트 파일을 열고 2.1.1 단계를 반복합니다.
2. 구성 파일에 네트워크 찾기 인수를 추가합니다.
3. 4.1.1 단계와 동일한 텍스트 파일에서 "[netper_arguments]", "edge_list_file=", "node_list_file=", "seed_net_file ="range_operations=", "numneighbors =", "maxparams =", "[[확률]]", "AddNode =", "AddEdge =", "제거", "제거", "아래"를 입력합니다.
4. "seed_net_file"의 경우"edge_list_file"과 "node_list_file"은 동일한 기호 후 3.9 및 3.10.2 단계에서 생성된 시드 네트워크 파일및 모서리 및 노드 목록 파일의 경로 및 이름을 입력합니다.
5. "range_operations"의 경우 서명과 같을 경우 쉼표로 구분된 두 숫자를 입력합니다. 첫 번째 및 두 번째 숫자는 네트워크당 노드 또는 모서리를 각각 추가하거나 제거하는 최소 수입니다.
6. "numneighbors"의 경우 서명과 같을 경우 네트워크 찾기에서 찾을 네트워크 수를 나타내는 숫자를 입력합니다.
7. "maxparams"의 경우 서명과 같을 경우 네트워크를 허용하는 최대 DSGRN 매개 변수 수를 나타내는 숫자를 입력합니다.
8. 이러한 각 인수에 대해 0에서 1 사이의 값을 입력합니다: "addNode", "addEdge", "removeNode", "removeEdge", 서명과 같은 후 숫자는 1로 합해야 합니다.
  참고: 각 인수를 더 잘 이해하기 위해 IDP README의 netper_arguments 및 netquery_arguments 섹션을 검토하는 것이 좋습니다. 추가 파일(11 )과 보충 파일(12 )을 참조하여 지정된 네트워크 찾기 인수와 함께 구성 파일의 예를 들어 보겠습니다.
2.2 및 2.3 단계를 반복합니다.
파일 이름인 <컨피그 파일 이름> 파일 이름인 단자에서 이 명령을 실행하여 4.1 단계에서 만든 구성 파일을 사용하여 IDP.py <를 실행합니다>
IDV가 여전히 실행 중인 경우 터미널 창에서 제어 C 를 눌러 프로그램을 중지합니다. 2.5 및 2.6 단계를 반복합니다.
브라우저에서 IDV가 열려 있으면 네트워크 찾기 탭을 클릭하고 관심 있는 폴더를 찾는 네트워크를 선택합니다.
네트워크 또는 네트워크 집합을 선택하여 에지 보급 테이블(표 1)을 생성하고 해당 쿼리 결과와 함께 네트워크를 볼 수 있습니다.
1. 두 가지 옵션은 네트워크를 선택하는 데 사용할 수 있습니다: 옵션 1 - 플롯의 x축 및 y축에 해당하는 입력 상자에 최소 값과 최대 값을 입력하여 쿼리 결과에 대한 입력 하부 및 위쪽 경계. 옵션 2 - 분산플롯을 클릭하고 드래그하여 포함할 네트워크 주위에 상자를 그립니다. 선택 또는 입력 경계를 입력한 후 선택한 네트워크에서 가장자리 보급률 받기 단추를 누릅니다.
  참고: 두 개 이상의 DSGRN 쿼리를 지정한 경우 쿼리 유형으로 레이블이 지정된 라디오 단추를 사용하여 각 쿼리의 결과 간에 전환합니다. 두 개 이상의 엡실론(노이즈 레벨)을 지정한 경우에도 마찬가지입니다.
가장자리 보급 테이블 아래의 화살표를 클릭하여 테이블의 다음 페이지로 이동합니다. 다운로드 테이블을 눌러 가장자리 보급 테이블을 다운로드합니다.
네트워크 인덱스 입력 상자에 정수입력을 입력하여 4.6단계에서 선택한 단일 네트워크를 표시합니다. DSGRN NetSpec 다운로드 를 클릭하여 DSGRN 네트워크 사양 형식으로 표시된 네트워크를 다운로드합니다.
지정된 모티프 또는 관심 네트워크와 유사성을 위해 네트워크를 검색합니다.
1. 각 모서리에 해당하는 확인란을 사용하여 네트워크에 포함될 모서리또는 유사성 해석에 사용되는 모티프를 선택합니다. 선택한 모티프 또는 네트워크에 대한 유사성 산란플롯을 만들려면 제출 을 클릭합니다.
  참고: 가장자리 목록의 화살표를 사용하여 사전순으로 정렬하고 테이블 아래의 화살표를 테이블의 다음 페이지로 이동합니다.
2. 분산플롯을 클릭하고 드래그하여 네트워크 또는 네트워크 집합을 선택하여 에지 보급 테이블을 생성하고 각 쿼리 결과와 함께 네트워크를 볼 수 있는 네트워크 주위에 상자를 그립니다.
  참고: 두 개 이상의 DSGRN 쿼리를 지정한 경우 쿼리 유형으로 레이블이 지정된 라디오 단추를 사용하여 각 쿼리의 결과 간에 전환합니다. 두 개 이상의 엡실론(노이즈 레벨)을 지정한 경우에도 마찬가지입니다.
3. 4.7 및 4.8 단계를 반복하여 각각 유사성 분석을 위해 에지 보급 테이블과 표시된 네트워크를 다운로드합니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

도 1에서 텍스트로 전술한 단계는 효모 세포 주기의 핵심 진동 GRN에 적용되어 효모 세포 주기 연구에서 수집된 타임시리즈 유전자 발현 데이터에서 관찰되는 역학을 생성할 수 있는 기능적인 GRN 모델을 발견할 수 있는지 를 확인한다¹⁶. IDV가 IDP 출력을 명확히 하고 개선할 수 있는 방법을 설명하기 위해, 그 결과는 이 분석을 두 가지 방법으로 수행한 후, 1) IDV 없이 한 패스로 IDP의 모든 단계를 실행하고 2) IDV의 도움으로 IDP를 통해 단계별로 실행하여 사전 생물학적 지식을 통합하고 IDP 출력에 기초하여 정제된 선택을 함으로써 중간 결과를 조정할 수 있도록 하였다. 예를 들어 본보기로 사용되는 잘 연구 된 효모 세포 주기 GRN은 실험적으로 검증 된 많은 규제 관계가 있습니다. 다른 및/이하의 반노트 유기체 또는 생물학적 과정이 연구되고 있는 경우 중간 결과 또는 매개 변수가 조정되는 방법에 대한 선택은 다를 수 있습니다. 네트워크를 평가하는 데 사용할 수 있는 한 가지 유형의 쿼리를 설명하기 위해 각 네트워크의 견고성은 안정적인 진동을 지원하고 모델 매개 변수전반에 걸쳐 노드의 관찰된 전사 역학과 일치하도록 측정되었습니다.

2개의 복제 시리즈의 유전자 발현 타임시리즈 데이터는 올랜도 200816에서 취해졌고, 본래 실험에 적용된 세포 주기 동기화 방법과 관련된 임의의 유전자 발현을 제거하기 위해 미리 처리되었다(보충 파일 1 및 보충 파일 2). 별표 파일은 ^Yeastract17에서 발견되는 DNA 결합 및 발현 증거에 의해 지원되는 시계열 데이터의 모든 유전자를 포함하는 만들어졌으며 따라서 GRN에서 레귤레이터로 작동할 수 있습니다. TOS4, PLM2 및 NRM1은 또한 레귤레이터로 포함되었다, 그들은 문학^에 증거를 기반으로 효모 코어 GRN에 대한 중요한 것으로 추정되기 때문에 그들은 증거의 두 가지 유형을 가지고 Yeastract에서 발견되지 ^{않았지만 (}보충 파일 3). 모든 규제 기관은 활동및 억압자뿐만 아니라 표적으로 분류되었습니다.

IDP는 먼저 노드, 가장자리 및 네트워크 찾기인 IDP의 모든 단계를 실행하도록 매개 변수로 수정되었습니다. 강하게 연결된 네트워크에 참여하는 작은 유전자 세트인 효모 세포 주기 GRN의 현재 이해에 기초하여 적절한 것으로 나타난 인수 세트를 선택하였다(보충 파일 4). 이 이해는 대부분 노드 및 가장자리 찾기 선택에 영향을 미쳤습니다. 네트워크 찾기의 확률 매개 변수는 진정한 유전자와 규제 상호 작용만 네트워크 찾기에 전달될 것이라는 가정을 기반으로 했습니다. IDP의 이 완전히 매개 변수화된 실행은 노드 및 에지 찾기(그림 2B, C)에 대한 결과를 생성했지만 네트워크에서 모델 허용 가능한 네트워크가 발견되지 않았습니다(그림 2A,D). 모델 허용성은 IDP의 종속성인 파이썬 모듈 dsgrn_net_gen ¹⁴의 코드 설명서에 설명되어 있습니다. 간단히 말해서, 자체 리프레싱 모서리를 포함하거나 단일 노드에 너무 많은 입력이나 출력이 있는 네트워크는 DSGRN 소프트웨어(표 1)에서 쿼리할 수 없습니다. IDP는 모델 허용 네트워크를 찾을 수 없는 여러 가지 이유를 제공하며 문제를 해결하기 위한 문제 해결 단계를 설명합니다. 기본적으로 매개 변수 및/또는 입력 파일을 변경하고 각 IDP 단계를 다시 실행하고 결과를 검토하는 작업이 포함됩니다. IDV는 이 프로세스를 덜 지루하고 시간이 많이 소요되도록 하는 데 사용되었습니다.

노드 찾기 결과는 IDP의 가장자리 찾기 단계로 전달되는 유전자를 검사하기 위해 IDV에 로드되었습니다. IDP에 의해 주어진 노드는 DLxJTK (표 1)에 의해 순위가 매겨진 상위 N 유전자이며, N은 사용자에 의해 지정되고, 그러나, 이러한 유전자 목록은 분석의 목표에 적합하지 않을 수 있다. 사전 생물학적 지식 없이, DLxJTK 점수만을 사용하는 노드의 자동 선택은 효모 세포 주기(RME1)에 있는 역할의 제한된 기록을 가진 유전자를 반환했습니다, 몇몇 알려진 세포 주기 전사 레귤레이터는 높게 순위가 아니었습니다 (그림 2B). Yeastract 실험 적인 증거는 세포 주기 주석을 가진 DLxJTK에 의해 가장 높은 순위 유전자 중에서 선택 하기 위해 사용 되었다. 이들 유전자는 SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 및 SWI5이다. 알려진 규제 관계는 그림 3에서 볼 수 있습니다. FKH2 는 DLxJTK에 의해 순위가 매겨진 상위 10개 유전자(dlxjtk_cutoff 보충 파일 4에서 10으로 설정)에 나타나지 않으므로 , FKH2 가 발견될 때까지 유전자 목록이 IDV를 사용하여 확장되었다(도 4). 확장된 유전자 목록에 있는 추가 유전자의 몇몇은 공지된 핵심 유전자이고 노드 찾는 결과를 조사하지 않고 놓쳤을 것입니다. 더 알려진 핵심 유전자는 DLxJTK 순위 목록 아래로 유전자 목록을 확장하여 발견되었지만, 초점은 관심의 유전자에 보관되었다. 따라서, 몇몇 고위 유전자는 7개의 유전자를 포함하는 유전자 목록 (보충 파일 5)의 결과로 선택해제되었습니다 (그림 4). 이 7개의 유전자에 기초하여 새로운 애니칭 파일(보충 파일 6)이 만들어졌고, 각 유전자는 표적으로 표시되고, 레귤레이터 모형은 Yeastract를 사용하여 지정되었다. 새로운 유전자 목록 및 별표 파일은 다음 IDP 단계인 Edge Finding에서 후속 사용을 위해 다운로드되었습니다. IDV없이, 유전자 목록 및 부기 파일에서 유전자를 추가하고 제거하는 절차는 겸손한 코딩 기술이 필요합니다.

새 IDP 구성 파일은 새 유전자 목록 및 음표 파일과 함께 에지 찾기 단계(보충 파일 7)에 대한 매개 변수로 설정되었습니다. 새 구성 파일로 IDP가 완료된 후 결과가 IDV(그림 5A)에 로드되었습니다. 네트워크 찾기 단계가 제공된 시드 네트워크의 네트워크 공간을 중심으로 검색하므로 좋은 시드 네트워크를 제공하는 것이 중요할 수 있습니다. 좋은 시드 네트워크는 진정한 가장자리를 포함하는 네트워크로 생각할 수 있습니다. IDV와 예아스트랙트 및 사카로미세스 게놈 데이터베이스(SGD)²⁰과 같은 온라인 데이터베이스를 사용하면 실험적 증거가 있는 LEM(표 1)의 규제 관계를 사용하여 종자 네트워크를 보고 조정할 수 있습니다. 예를 들어, 예에서, 가장자리 YHP1 = tf_act(HCM1)은 Yeastract에서 이 관계의 문서화된 증거가 없기 때문에 선택 해제되었습니다(그림 5B). 이 관계의 문서화된 증거가 있는 가장자리 SWI5 = tf_act(FKH2)가 추가되었습니다²¹. 종자 네트워크(표 1)가 만족스러웠을 때 네트워크에 대한 DSGRN 네트워크 사양 파일이 다운로드되었습니다(보충 파일 8).

IDV없이, 종자 네트워크를 구성하는 데 사용되는 실험 증거가없는 가장자리의 높은 기회가있다. 도 2C에서 볼 수 있듯이, 각 단계를 통해 IDP 논스톱을 실행하는 데서 발생하는 에지 찾기 단계에서 생성된 종자 네트워크는 예스트랙트에서 실험증거에 의해 지원되지 않는 에지, SWI4 = tf_rep(NDD1)을 포함하고 있으며, 이는 NDD1 이 전사 ^{활성기로 알려져} 있기 때문이다. 이 정보는 논스톱 실행의 기여 파일에 인코딩되지 않았기 때문에 모든 규제 기관이 활성제와 억압자가 될 수 있었습니다.

IDV를 사용하여 시드 네트워크는 도 3의 하위 네트워크인 수동으로 선별되었으며, 나머지 4개의 가장자리는 샘플링 네트워크 공간(YHP1 = tf_act(SWI4), YOX1 = tf_act(SWI4), SWI4 =tf_rep(YOX1), SWI5 = tf_act(NDD1))을 샘플링하는 데 사용되는 에지 목록에 배치되었다. 이전 생물학적 지식을 기반으로 모서리를 선택하면 가장자리 목록을 작성하는 데도 사용할 수 있습니다. 그러나 이 경우 LEM 요약 테이블 보기의 상위 20개의 가장자리가 선택되었습니다(보충 파일 9). 노드 목록 파일은 선택한 가장자리에서 자동으로 만들어집니다(보충 파일 10). LEM의 ODE 매개 변수는 ODE 모델의 추론된 매개 변수가 생물학적으로 현실적이지 않다고 판단하는 경우 가장자리를 필터링하는 데 사용할 수도 있지만 이 정보는 여기에서 사용되지 않았습니다.

다음으로 세 개의 새 파일을 사용하여 네트워크 찾기 단계에 대해 새 IDP 구성 파일이 매개 변수화되었습니다. 시드 네트워크는 실험적인 증거에 의해 잘 지원되는 가장자리로 만들어졌기 때문에 모든 네트워크에 이러한 모서리가 포함되었습니다. 따라서 네트워크 찾기 확률은 노드 및 모서리를 제거할 수 있도록 설정되었지만 노드 및 모서리를 제거할 수 있도록 설정되었습니다(보충 파일 11). 네트워크 찾기 매개 변수 numneighbors는 2,000개의 네트워크를 검색하도록 설정되었습니다. IDP를 실행한 후 네트워크 찾기 단계에서 37개의 모델 허용 네트워크가 발견되었으며, 이는 0이 었던 논스톱 실행과는 대조적입니다. 네트워크 찾기 결과를 IDV에 로드하면 이들 37개 네트워크 중 64%(24개)가 안정적으로 진동할 수 있는 능력을 가지고 있었습니다(그림 6A). 이 24개의 네트워크 중 가장 뛰어난 성과를 거둔 사람은 안정적으로 진동하는 모델 매개 변수(그림 6B)의 50%에서 데이터와 일치하는 두 네트워크였습니다.

에지 보급표(표 1)는 선택한 네트워크 컬렉션에서 에지가 발생하는 횟수를 표로 표시하여 고성능 네트워크에서 유병률을 나타냅니다. 분산 플롯에서 이전 두 네트워크를 선택하여 생성된 Edge 보급 테이블을 살펴보면 모든 시드 네트워크 가장자리가 예상대로 두 개의 네트워크 각각에 존재하며, 두 개의 비종자 네트워크 에지(그림 6B), SWI4 = tf_act(SWI5) 및 HCM1 =tf_rep(YHP1)이 있음을 알 수 있습니다. 이 두 가장자리 중 어느 쪽도 예스트랙에서 그들을 뒷받침하는 증거가 없었다. 따라서 소량의 네트워크 공간을 탐구했기 때문에 관찰된 역학을 생성하는 데 에지 및 노드의 중요성을 평가하기가 어렵습니다.

네트워크 찾기에서 37개의 모델 허용 네트워크만 발견되었는데, 매개 변수 numneighbors가 2,000으로 설정되어 있어 네트워크 검색이 지나치게 제한되었을 수 있음을 시사합니다. IDP의 dsgrn_net_gen 파이썬 모듈에 대한 설명서에 설명된 바와 같이 이 문제는 시드 네트워크, 에지 목록, 노드 목록, 네트워크 찾기 매개 변수 선택 또는 이러한 조합과 관련이 있을 수 있습니다. 조사하려면 이전과 동일한 시드 네트워크, 에지 목록 및 노드 목록이 사용되었지만 네트워크 생성 중에 가장자리를 제거하는 기능을 추가하여 네트워크 찾기 매개 변수가 변경되었습니다(보충 파일 12). IDV에 새로운 네트워크 찾기 결과를 로드하면 이 단계에서 612개의 네트워크가 발견되었으며, 이러한 네트워크의 67%(411)가 안정적으로 진동할 수 있는 능력을 가지고 있음을 알 수 있습니다(그림 7A). 흥미롭게도, 안정적인 진동 역학을 할 수 있던 네트워크의 13%(82)는 데이터에서 볼 수 있는 것과 유사한 역학을 생성할 수 없었습니다(그림 7B). 411개 네트워크 중 30%(124개)가 데이터와 강력한 일치(즉, 안정적으로 진동하는 모델 매개 변수의 50% 이상이 데이터 일치를 나타냈다)(그림 7C)를 나타냈다.

네트워크 찾기의 두 번째 라운드에 의해 생성 된 가장자리 보급 번호는 이제 네트워크의 훨씬 더 큰 선택을 기반으로하고 더 자신있게 GRN에서 규제 관계의 중요성을 평가하는 데 사용할 수 있습니다. 예를 들어 HCM1 = tf_rep(YHP1)은 여전히 강력한 역학을 생성하는 네트워크에서 매우 많은 것으로 표시되어 있으며, 이는 이 관계가 실험적으로 조사할 가치가 있음을 시사합니다(그림 7C). 에지 보급표(위에서 언급한 124개 네트워크 기준)를 추가로 살펴보면 가장자리 SWI4 =tf_rep(YOX1) 및 YOX1 =tf_act(SWI4)은 아직 높은 순위를 차지하지 않은 것으로 나타났습니다 tf_act tf_rep. 부정적인 피드백은 진동 역학^을 생산하는 데 중요하며 이러한 규제 관계 둘 다 그림 3의 GRN에서 이 기능을 제공합니다. 이러한 네 개의 가장자리가 모두 포함된 네트워크가 존재하는지 찾아보면 GRN 모델 컬렉션에 이러한 네트워크가 자주 함께 존재하지 않는 이유에 대한 통찰력을 제공할 수 있습니다. 그러나 개별 네트워크를 클릭하는 것은 지루할 것입니다. 대신 네트워크 찾기 페이지의 유사성 분석 부분을 사용하여 네 개의 가장자리를 모두 포함할 수 있는 네트워크를 검색하는 데 사용되었습니다(그림 7D). 612네트워크가 이러한 네 개의 모서리와 유사한 지 보여주는 분산 플롯을 살펴보면 관찰된 역학과 일치하는 모델 매개 변수 공간의 백분율과 비교하여 612 네트워크의 4개 모서리(그림 7D)가 모두 포함되어 있음을 알 수 있습니다. 이는 관찰된 역학을 생성하기 위해 이 크기의 네트워크에 두 개의 음수 피드백 루프 중 하나만 필요하다는 테스트 가능한 가설을 암시합니다. 이러한 가설은 IDP 단계의 재매개변수화와 네트워크 공간 또는 유전자 녹아웃과 같은 실험적 보다 철저한 검색에 의해 계산적으로 더욱 조사될 수 있다. 이 분석의 모든 결과는 보충 파일 13에서 찾을 수 있습니다.

그림 1: IDP 및 IDV 워크플로 개요입니다. 아래쪽 행은 IDP의 세 가지 주요 단계인 노드, 모서리 및 네트워크 찾기를 묘사합니다. 맨 위 행은 IDV의 주요 단계를 묘사하고 사용자가 결과와 상호 작용할 수 있는 다양한 방법을 설명합니다. 둘 사이의 어두운 회색 화살표는 IDV와 IDP가 사용자가 IDP의 각 단계에 대해 정보에 입각한 결정을 내릴 수 있도록 시너지 효과를 낼 수 있는 방법을 묘사하며, IDV의 시각화에 대한 결과를 제공하는 개별 IDP 단계, 개별 IDV 단계는 새 또는 조정된 매개 변수의 입력및 후속 IDP 단계에 대한 조정된 결과 및 입력을 허용합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 2: 단계 간에 IDV를 사용하지 않고 IDP의 모든 단계를 연속적으로 실행한 결과의 예입니다. (A) 모든 IDP 단계를 연속적으로 실행에서 단말 출력의 스크린샷. IDP가 완료되었지만 네트워크 찾기 단계에서 네트워크 가 없는 네트워크를 찾았습니다. (B) 노드 결과 디렉토리 node_finding_20210705183301(보충 파일 13) IDV에 로드됨을 찾는다. 유전자 목록 표내의 모든 유전자는 라인 그래프에서 각각의 발현 프로파일을 표시하고 음표를 생성하기 위해 선택(적색 화살표). 부기 표는 유전자가 원래 의자(녹색 화살표)에 표지되는 방식을 반영하기 위해 채워졌다. (C) 에지 IDV에 로드된 결과 디렉토리 edge_finding_20210705183301(보충 파일 13)을 찾습니다. (D) IDV에 로드된 결과 디렉토리 network_finding_20210705183301(보충 파일 13)을 찾는 네트워크입니다. 네트워크 찾기 페이지에는 네트워크 찾기 단계의 재매개 변수화를 제안하거나 노드 또는 가장자리 찾기 단계를 재평가하는 것이 필요하지 않습니다. IDP 문서에는 사용자가 다음에 시도할 수 있는 것을 결정하는 데 도움이 되는 문제 해결 단계가 포함되어 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 3: 효모 세포 주기 GRN 모델. 알려진 효모 세포 주기 조절기세트는 SGD로부터 선택되었고 유전자 간의 알려진 규제 관계는 Yeastract에서 추출되었다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 4: IDP 노드 찾기 의 예는 IDV에서 결과를 찾습니다. IDV에 로드된 노드 결과 디렉터리 node_finding_20210705183301(보충 파일 13)입니다. 선별된 온라인 효모 데이터베이스를 검사한 후 조정된 결과. 유전자 목록 표는 도 3 의 GRN 모델에서 나머지 유전자를 찾기 위해 확장되었다(yellow arrow)와 유전자는 동일한 GRN 모델(적색 화살표)에서 발견되지 않은 유전자를 제거하기 위해 선택되었다. 별표는 Yeastract (녹색 화살표)에서 발견 된 각 유전자에 대한 규제의 증거에 따라 채워졌다. 새 유전자 목록 및 별글표 파일은 각각의 다운로드 버튼(파란색 화살표)을 선택하여 다운로드되었습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 5: IDP 가장자리 찾는 예제는 IDV에서 결과를 찾습니다. IDV에 로드된 결과 디렉터리 edge_finding_20210701100152 가장자리 찾기(보충 파일 13)입니다. (A) IDP에 의해 생성된 초기 결과. 네트워크 드롭다운 옵션에서 시드에서 (빨간색 화살표)를 선택하였습니까(보조 파일 7)의 인수에 따라 IDP에서 생성된 시드 네트워크를 볼 수 있습니다. 가장자리 표에서 선택한 유전자는 종자 네트워크에 사용되는 모서리입니다. (B) 실험적 증거를 포함하지 않는 모서리에 대한 시드 네트워크를 검사한 후 조정된 결과. 선택에서 네트워크 드롭다운 옵션이 선택(빨간색 화살표)을 선택했습니다. 가장자리 테이블(녹색 화살표)에서 모서리를 선택/선택 해제했습니다. 시드 네트워크, 에지 목록 및 노드 목록 파일은 각각의 단추(노란색 화살표)를 클릭하여 다운로드했습니다. 표시된 가장자리 테이블은 구성 파일 two_wts_EdgeFinding_config.txt 나열된 마지막 타임 시리즈 데이터에 대한 것입니다(보충 파일 7). LEM 결과를 기반으로 시드 네트워크 또는 에지 목록에 대한 가장자리를 선택할 때 이 출력은 노드 간의 규제 관계를 추론하는 데 모든 선행 데이터 파일을 통합하기 때문에 구성 파일에 나열된 마지막 시간 시리즈 데이터를 살펴보는 것이 중요합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 6: IDP 네트워크 찾는 예로 IDV가 IDP 구성 파일 two_wts_NetFind_rd1_config.txt(보충 파일 11)을 사용하여 결과를 생성합니다. (A) 쿼리 안정적 전체 주기 (빨간색 화살표)를 선택하여 분산 플롯에서 y축에 각각의 데이터를 표시하였다. 분산 플롯의 파란색 점은 분산 플롯에 대한 Box Select 함수를 사용하여 선택한 점을 나타냅니다. 점선 선택 상자는 상자 선택의 모양을 보여 주었다. (B) y축 및 x축용 최소 및 최대 정수는 이러한 경계(녹색 화살표) 내에서 선택한 네트워크에 수동으로 입력되었습니다. 각 선택 후 선택한 네트워크 버튼(노란색 화살표) 에서 가장자리 보급률을 클릭 하고 에지 보급 표 및 선택된 DSGRN 예측 네트워크 영역이 생성되었습니다. 네트워크 인덱스에서 위쪽 화살표를 클릭하여 선택한 네트워크(파란색 화살표)를 탐색할 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 7: IDP 네트워크 찾는 예로 IDV가 IDP 구성 파일 two_wts_NetFind_rd2_config.txt(보충 파일 12)을 사용하지 못하게 됩니다. (A-C) 네트워크 선택은 최소 및 최대 입력 상자(빨간색 화살표)에 값을 입력하여 수행되었습니다. 선택한 네트워크 버튼의 가장자리 보급률을 클릭하여 에지 보급 표 및 선택한 DSGRN 예측 네트워크 영역을 생성했습니다. (D) 관심의 가장자리는 edge_list 테이블(노란색 화살표)에서 선택되었고 제출 버튼(녹색 화살표)을 클릭하여 선택한 쿼리(파란색 화살표)에 대한 분산 플롯에서 점표를 플롯하기 위해 유사성 점수를 계산하였다. Box Select 함수는 에지 보급 표 및 선택된 DSGRN 예측 네트워크 영역을 생성하기 위해 네트워크 집합(보라색 화살표)을 선택하는 데 사용되었습니다. 네트워크 인덱스를 2(주황색 화살표)로 늘려 선택에서 두 번째 네트워크를 볼 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

학기	파이프라인 단계	정의
드 리히텐부르크 바이 JTK-CYCLE (DLxJTK)	노드 찾기	유전자의 순위를 매기는 데 사용되는 주기성과 조절 강도의 단일 정량적 척도. 이전에 게시된 주기 메트릭 드 리히텐베르크(DL) 및 JTK-CYCLE(JTK)을 결합합니다.
첫 번째 주기 최대 식	노드 찾기	주기적인 유전자 발현의 첫 번째 주기 동안 최대 유전자 발현. 첫 번째 주기 최대 발현에 의해 주문된 유전자는 최대 유전자 발현에 도달하는 첫 번째 주기로부터의 시간 지점에 따라 주문됩니다.
로컬 에지 머신(LEM)	가장자리 찾기	Weesian 네트워크 추론 방법은 타임 시리즈 유전자 발현 데이터를 사용하여 주어진 표적 유전자의 가장 가능성이 높은 레귤레이터 (들) 및 조절 모드 (활성화 또는 억압)를 식별하기 위해 유전자 상호 작용의 잠재적 모델을 순위를 매기는 것입니다.
시드 네트워크	네트워크 찾기	상위 순위 LEM 가장자리를 선택하여 글로벌 상호 작용의 그럴듯한 네트워크에서 초기 추측. 시드는 제공된 타임시리즈 데이터와 일관성을 보여줄 확률이 높은 진동성이 높은 네트워크 공간 영역을 지역화합니다.
규제 네트워크(DSGRN)에서 생성된 동적 서명	네트워크 찾기	네트워크가 나타낼 수 있는 다양한 장기 동적 동작을 포괄적으로 계산하기 위한 소프트웨어 패키지입니다.
에지 보급	네트워크 찾기	문제의 가장자리를 포함하는 네트워크 찾기 단계의 상위 점수 네트워크의 백분율입니다. 점수는 유병률이 없는 가장자리의 순위를 허용합니다.

표 1: 고유역학 파이프라인 및 고유역학 시각화도우미 용어의 정의입니다.

보충 파일 1: 200813년 올랜도에서 가져온 타임시리즈 유전자 발현 데이터(복제 1). 이 파일을 다운로드하려면 여기를 클릭하십시오.

추가 파일 2: 200813년 올랜도에서 가져온 타임시리즈 유전자 발현 데이터(복제 2). 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 3: 보충 파일 1 및 보충 파일 2에서 발견 된 모든 유전자를 포함하는 기장 파일. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 4: 완전히 매개 변수고유역학 파이프라인 구성 파일. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 5: 고유역학 시각화도우미의 노드 찾기 페이지에서 다운로드한 유전자 목록 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 6: 고유역학 시각화도우미의 노드 찾기 페이지에서 다운로드한 음표 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 7: 에지 찾기 단계에 만 매개 변수로 내재된 역학 파이프라인 구성 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 8: 고유역학 시각화도우미의 에지 찾기 페이지에서 다운로드한 시드 네트워크 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 9: 고유역학 시각화도우미의 에지 찾기 페이지에서 다운로드된 에지 목록 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 10: 고유역학 시각화도우미의 에지 찾기 페이지에서 다운로드한 노드 목록 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 11: 네트워크 찾기 단계에 만 매개 변수내재 역학 파이프라인 구성 파일. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 12: 네트워크 찾기 단계에 대한 매개 변수(보충 파일 11) 업데이트된 내재 역학 파이프라인 구성 파일(보충 파일 11). 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 13: 대표 결과 섹션의 결과가 포함된 디렉토리입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GRNs의 추론은 시스템 생물학에서 중요한 과제입니다. IDP는 점점 더 복잡한 방법으로 데이터를 활용하는 도구의 순서를 사용하여 유전자 발현 데이터에서 모델 GRN을 생성합니다. 각 단계마다 데이터를 처리하는 방법과 IDP의 다음 계층으로 전달되는 요소(유전자, 기능적 상호 작용)에 대한 결정이 필요합니다. 이러한 결정이 IDP 결과에 미치는 영향은 분명하지 않습니다. 이와 관련하여 IDV는 IDP 내의 GRN 추론 도구의 개별 단계에서 출력의 유용한 대화형 시각화를 제공합니다. IDV는 이러한 계산 추론 방법의 결과를 간소화하고 쉽게 평가하여 실험 속도를 높이고 분석 선택을 알릴 수 있으며, 이를 통해 고신뢰도 네트워크 모델및 가설의 빠른 생산을 가능하게 합니다. IDV는 또한 LEM ODE 매개 변수 선택에 의한 필터링 가장자리, 발현 시간별 유전자 비닝, 모티프 또는 네트워크와 유사성을 기반으로 하는 클러스터링 네트워크를 포함하여 IDP의 기능을 확장하는 기능을 구현합니다. 중요한 것은 IDV를 통해 각 IDP 단계 간의 수동 개입을 허용하므로 사용자가 쉽게 자동화할 수 없는 방식으로 문헌의 인간 지식과 사전 정보를 쉽게 통합할 수 있습니다. IDP의 순진한 실행은 기본적으로 이 정보를 통합하지 않으므로 IDV를 사용하면 실험에 특정한 정보를 사용할 수 있을 때마다 결과에 대한 신뢰도가 높아집니다. 전반적으로 IDP와 함께 IDV를 사용하면 실제 GRN에 대한 지식이 거의 없거나 전혀 없는 경우에도 더 큰 확신을 가지고 생물학적 프로세스에 대한 네트워크 가설을 만들 수 있습니다.

IDV에는 세 가지 중요한 단계가 있습니다. 첫 번째는 IDV에서 IDP 노드 찾기 결과를 평가하는 것입니다. IDV의 노드 찾기 페이지는 새로운 유전자 목록과 원하는 경우 유전자 추가 파일을 생성할 수 있습니다. 새로운 유전자 목록을 큐레이팅하는 것은 GRN 표적 및/또는 규제 기관으로 모델링될 수 있는 유전자를 제한하여 잠재적인 네트워크 공간을 크게 감소시키기 때문에 중요한 단계입니다. 추가적으로, GRNs는 주로 전사 요인으로 이루어져 있기 때문에, 유전자 주석을 갖는 것은 일관된 GRN 모형을 만드는 데 크게 도움이 될 것입니다.

다음 단계는 IDV에서 IDP 가장자리 찾기 결과를 평가하는 것입니다. 새 시드 네트워크를 큐레이팅하는 것은 네트워크 찾기 단계에서 샘플링될 네트워크 공간 영역을 지역화하기 때문에 중요한 단계입니다. 그러나 어디서부터 시작해야 할지 아는 것은 항상 명확하지 않으므로 일종의 실험 적 증거가 있는 가장자리를 사용하여 신뢰도가 높은 가장자리가 포함된 네트워크 공간 영역에서 시작되고 있다는 확신을 제공하는 것이 좋습니다. IDV의 에지 찾기 페이지는 시드 네트워크를 쉽게 어셈블리할 수 있으며 노드 및 에지 목록뿐만 아니라 연결된 DSGRN 네트워크 사양 파일을 생성합니다.

마지막 단계는 IDV에서 IDP 네트워크 찾기 결과를 평가하는 것입니다. IDV의 네트워크 찾기 페이지를 사용하면 샘플링된 네트워크와 관찰된 역학을 생성하는 네트워크 용량을 추정하는 관련 점수를 쉽게 탐색할 수 있습니다. 노드 및 에지 찾기는 항상 결과를 반환하지만(노드 찾기에서 적어도 두 개의 유전자가 전달되는 경우), 네트워크 찾기는 0 결과를 반환할 수 있습니다. 따라서 매개 변수의 조정이 필요한지 여부를 아는 것은 노드 및 에지 찾기보다 네트워크 찾기에서 더 분명할 것입니다. 이러한 몇 가지 네트워크에서 발견된 이러한 발생은 분석할 수 있는 네트워크에 대한 제약 조건의 결과일 수 있습니다. 이러한 제약 조건은 1) 네트워크가 항상 강하게 연결되어 있는지 여부, 2) 각 노드에 대한 최소 및 입력 가장자리의 최대 수, 3) 노드 및 모서리를 추가하고 제거할 확률, 4) 허용되는 노드 및 모서리의 추가 및 제거 수입니다. 그림 2에서와 같이 모델 허용 네트워크가 거의 없거나 없는 경우 IDV에서 결과를 후속 으로 평가하여 IDP의 모든 단계의 재매개 변수화에 대한 지침을 참조하는 것이 좋습니다.

이 방법의 현재 제한은 노드 찾기 페이지가 주로 세포 주기 및 circadian 시계의 전사 프로그램에서 볼 수 있는 것과 같은 진동 역학에 초점을 맞추고 있다는 것입니다. 특히, IDP 노드 찾기 단계는 현재 지정된 기간에 진동 역학을 나타내는 유전자를 검색하도록 구성된다. IDP가 다양한 유형의 전사 역학을 정량화할 수 있는 분석을 포함하도록 확장됨에 따라 IDV도 이러한 다른 동작의 시각화 및 심문을 지원하기 위해 업데이트됩니다. 네트워크 찾기 단계에서 검색및 분석된 네트워크의 크기는 현재 약 10개의 유전자와 같은 작은 크기의 네트워크로 제한됩니다. 이는 DSGRN 스케일의 계산이 조합적으로 발생하기 때문에 필수적입니다. 또 다른 제한 사항은 IDV에서 선택한 네트워크에 대한 모델 매개 변수 공간을 탐색할 수 없다는 것입니다. 그러나 지정된 네트워크에 대한 DSGRN 네트워크 사양 파일을 다운로드할 수 있으며 각 모델 매개 변수와 관련된 역학은 DSGRN 시각화 웹 사이트(https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/)에서 시각화될 수 있습니다. 마지막으로 IDV는 Linux(우분투)와 iOS(빅 수르) 시스템을 사용하여 테스트되었습니다. IDV는 윈도우에서 테스트 되었습니다 10 리눅스에 대 한 윈도우 서브 시스템을 사용 하 여 (WSL), 윈도우를 사용할 수 있습니다 10 사용자가 다른 컴퓨터없이 리눅스와 IDV를 실행할 수 있습니다, 가상 머신, 또는 듀얼 부팅 설정. IDV는 현재 기본 Windows에서 실행되지 않습니다.

IDP와 같은 고유한 복잡성과 유용한 추론 도구로 인해 GRNs를 연구하는 것은 자신있게 이해하고 배포하기가 어려울 수 있습니다. IDV는 유전자 발현 역학을 넘어 추가 정보의 포함을 용이하게하면서 IDP를 사용하여 추론된 GRN을 연구하는 복잡성을 줄이는 방법을 제공한다. 여기서 설명한 바와 같이 IDP와 함께 IDV를 사용하면 연구자들이 인간 세포 주기와 같은 잘 연구된 시스템의 기능 모델을 개발하고 분석할 수 있도록 힘을 실어줍니다. 더욱이, 이 공구는 ^GRN24 에 의해 통제되는 것으로 의심되는 말라리아 내 적혈구 발달 주기와 같은 보다 적게 이해되는 프로세스를 위한 시험 가능한 가설을 생성할 것입니다 그러나 모형은 아직 제안되지 않습니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 할 것이 없습니다.

Acknowledgments

이 작업은 NIH 보조금 R01 GM126555-01 및 NSF 보조금 DMS-1839299에 의해 지원되었다.

Materials

Name	Company	Catalog Number	Comments
Docker			https://docs.docker.com/get-docker/
Git			https://git-scm.com/
Inherent Dynamics Pipeline			https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer			https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda			https://docs.conda.io/en/latest/miniconda.html
Pip			https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

유전자 규제 네트워크 추론 파이프라인의 출력을 평가하고 시각화하기 위한 대화형 응용 프로그램인 내재역학 시각화

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.