このプロトコルは、自動化支援による遺伝子ライブラリの生成と評価を通じて、遺伝的にコードされたバイオセンサーの体系的なグローバル最適化のための方法を提供します。これは、実験を合理化し、特定の設計結果に合わせてバイオセンサーを調整するための遺伝的成分の選択を可能にする実験計画法と組み合わされます。
Method Article
このプロトコルは、自動化支援による遺伝子ライブラリの生成と評価を通じて、遺伝的にコードされたバイオセンサーの体系的なグローバル最適化のための方法を提供します。これは、実験を合理化し、特定の設計結果に合わせてバイオセンサーを調整するための遺伝的成分の選択を可能にする実験計画法と組み合わされます。
遺伝子コード化されたバイオセンサーは、ハイスループット情報処理のための強力なツールであり、環境または化学入力信号をさまざまな出力に変換できます。これにより、酵素の最適化、菌株開発、微生物プロセス制御など、幅広いバイオテクノロジー応用において、遺伝子発現の動的センシング、直接制御、微調整された制御が可能になります。バイオセンサーの性能を目的に適合させるには、バイオセンサー回路コンポーネント(トランスポーター、入出力モジュールなど)の化学量論を変更したり、関連する宿主とバイオセンサーの分子間相互作用(DNA-タンパク質、タンパク質-タンパク質など)を調整したりすることで、バイオセンサーの性能を改良できます。ただし、ここでは、膨大な数の可能なバイオセンサーの順列により複雑な組み合わせ設計空間が作成され、望ましい表現型性能を提供する構成を特定するためにスクリーニング戦略を慎重に最適化する必要があります。この複雑さは、モノクローナルスクリーニング条件下でのエフェクター滴定分析を必要とする調整可能性などのバイオセンサーの性能特性によってさらに悪化します。したがって、多様な配列と実験空間を探索する必要があるため、フラクショナル サンプリング法はこの目的に特に適しています。このワークフローを支えているのは実験計画法 (DoE) アルゴリズムであり、この組み合わせ実験計画空間の効率的な統計ベースの構造化マッピングと分数サンプリングを可能にするのに適した位置にあります。
報告されているのは、アロステリック転写因子ベースのバイオセンサーの設計空間を効率的にサンプリングし、デジタルとアナログの両方の線量反応曲線を備えた異なる構成を可能にするための、ハイスループットの自動化と計算アプローチを組み合わせたものです。プロトコルは、プロモーターおよびリボソーム結合部位ライブラリーの作成と自動選択から始まります。これらのライブラリとそれに対応する式データは、構造化された無次元入力に変換され、完全な実験計画空間の計算マッピングが可能になります。次に、DoEアルゴリズムを使用してフラクショナルサンプリングを実行し、ハイスループット自動化プラットフォームを使用したエフェクター滴定分析と組み合わせます。このワークフローは、将来のバイオセンサーシステムと遺伝回路の開発と最適化のための不可知論的なフレームワークを提供し、合成生物学コミュニティに規制ツールキットを提供します。
遺伝子の発現を調節する能力は、あらゆる形態の生命において不可欠な機能であり、化学的エフェクターから生物物理学的刺激に至るまで、内部と外部の両方の影響に対する動的でリアルタイムの応答を促進します1。自然界に見られる無数の転写調節システムは、合成生物学によって可能になる代謝工学とバイオテクノロジー研究の増強と加速において大きな可能性を秘めています。原核生物では、細胞内で発生する調節の多くは、アロステリック転写因子(aTF)と多数の低分子エフェクターとの相互作用によって駆動される一成分調節メカニズムを介して制御されています2。通常、エフェクター結合ドメイン(EBD)とDNA結合ドメイン(DBD)で構成されるaTFは、特定の小分子エフェクターに結合すると分子スイッチとして機能し、ゲノムのプロモーター領域にある特定のDNAオペレーター配列に対するDBDの親和性を調節し、転写の活性化または抑制をもたらします3.この一見単純なメカニズムは、抑制/脱抑制システムから、驚異的な数の低分子エフェクターまたは環境刺激を検出して応答できる活性化剤に至るまで、多くの多様な規制戦略を生み出しました4。その結果、合成生物学は、この多様性を利用して、大量の入力信号を特注の出力、つまり蛍光レポータータンパク質の産生と合成経路の調節に結合できる遺伝的にコードされたバイオセンサーを構築してきました。バイオテクノロジーワークフローに適用すると、このようなシステムは、代謝産物の細胞内濃度のリアルタイムモニタリング、経路の動的調節、およびより効率的な経路、菌株、およびバイオプロセスの開発を支援する簡単な読み出しを可能にします5,6,7,8。
基本的に、バイオセンサーは、特異性、動作範囲、ダイナミックレンジ、感度、傾きなどの多くのパラメーターに従って特徴付けられ、バイオセンサーの線量応答曲線は、リガンド濃度の関数として出力信号を介してこれらのパラメーターを記述します(図1)9、10、11、12.ヒル方程式は、バイオセンサーの性能特性を適合させるために使用でき、上記の各パラメーターについて半経験的証拠を提供し、バイオセンサーシステムを特徴付ける手段を提供すると同時に、アプリケーション主導の結果に向けてシステムを調整するために必要な労力の評価を可能にします。特異性は、他の潜在的なエフェクター分子のアレイと比較して、1つのエフェクターによって誘導されるシグナル出力の相対的な違いとして定義でき、通常、aTFのEBDレベルで変調されます。動作範囲は、バイオセンサーが感知できるリガンド濃度の範囲として定義され、バイオセンサーが応答できる濃度の範囲を決定します。対照的に、ダイナミックレンジは、測定可能な最高の活性化(ON)状態と不活性化(OFF)状態の比率を表し、バイオセンサーがバックグラウンドの自己蛍光10を超えるエフェクター濃度を確実に報告するための重要なパラメーターです。エフェクター分子の感度は、エフェクター13の半分最大濃度(EC50)によって測定される、特定の出力信号を誘発するために必要な濃度として説明される。最後に、曲線の傾きは、プロモーターのオペレーターサイトに対するaTFの協同性(nH)によって示され、よりデジタルまたはアナログの応答出力プロファイルが得られます。協調性は、オペレーター部位に対する親和性を強化する多量体複合体を形成するリガンド結合aTF間のタンパク質間相互作用から生じ、その結果、飽和リガンド濃度とよりデジタルな応答プロファイルで回路の応答性が急激に増加します14。
バイオセンサーの線量応答特性は、そのアプリケーションの適合性に大きな影響を与える可能性があり、多くの場合、あらゆる概念的なアプリケーションの「成否」のポイントとなります。バイオセンサーの性能はシステムごとに大きく異なり、動作範囲は通常0.1nM〜10mM13ですが、ダイナミックレンジは1.4〜2000倍15です。さらに、aTFについて報告されているエフェクター化合物の数は多岐にわたりますが(代謝産物、アミノ酸、金属、抗生物質、クオラムセンシングなど)。11、それはすべてを網羅しているわけではなく、エフェクターに適したバイオセンサーが文献にまだ存在しない場合、研究者に課題を提示します。合成生物学は、このような課題に対処するバイオセンサーのエンジニアリングを可能にし、アプリケーションの研究成果により密接に一致するようにエフェクターの範囲と用量反応特性の調整を可能にし、それぞれ前述の両方の問題に対処するために使用されてきました16,17。エンジニアリングの2つの重要な領域は、合成生物学、バイオセンサーのプロモーター領域、および転写およびタンパク質レベルでの効果を媒介するaTF自体を介して標的にすることができます。プロモーターレベルで性能を調節するためにバイオセンサーの遺伝的要素に焦点を当てたアプローチには、感度、動作範囲、ダイナミックレンジを調整するためのRBS、オペレーター部位、および-35、-10(ヘックスボックス)のエンジニアリングが含まれ、この原稿で概説されている方法論の焦点です(図1)。あるいは、バイオセンサーの選択性と感度を、そのエフェクター結合ドメインの分析およびエフェクター配位に関与する残基の変異(配列相同性および/または構造生物学を使用)によって変更することで、同族エフェクター18、19、20に対する応答を調節するか、関心のある非同族エフェクター16,17,21に完全に変更することができます.このような調整の取り組みは、バイオセンサーを特定のアプリケーションに向けることができ、これらは通常、代謝コントローラー(フィードバックループ、制御回路)、一次スクリーニングツール(酵素または株の発見)、二次スクリーニングツール(酵素変異体スクリーニング、代謝工学)、およびトランスポーターバイオプロスペクティング22,23,24です.そのような例の1つは、ムコン酸応答性aTF、CatMを、操作されたプロモーター配列と組み合わせて、動的および動作範囲を改善することである。このシステムは、適応実験室進化25に続くGFP蛍光に基づいて最も効果的なムコン酸産生株を単離するために、蛍光活性化細胞選別と統合されました。
上記のエンジニアリング戦略の成功は自明ですが、合成生物学者がバイオセンサーを調整するために利用できる手段の相互依存性により、設計プロセスが複雑になり、バイオセンサーの開発に費やされる期間が長くなる可能性があり、一部の研究者がバイオセンサーを独自のワークフローに実装することを思いとどまらせる可能性があります。図1に示すように、ヘックスボックスを変更することによってバイオセンサーを特定の結果に向けて調整しようとすると、他のパラメーターが誤って減衰する可能性があり、この相互依存性はバイオセンサー工学12で認識されている課題です。バイオセンサーチューニングの一般的なアプローチは、合理的設計と指向性進化工学で構成され、前者はシステムの構造的および機構的特徴のアプリオリな理解に依存して、成功の可能性が高いコンポーネントに実験を集中させます。一方、後者は、最適化された特性を示すバリアントを選択するために、ハイスループットスクリーニングと結合したランダム化された突然変異誘発および自然進化に依存しています26,27,28,29,30。効果的ではありますが、どちらの手法にもいくつかの欠点があります:たとえば、特定の構造的または機能的要素に焦点を当てることによるターゲットエンジニアリングは、完全な実験空間の探索が制限される傾向があり、アロステリックまたは二次効果を無視する可能性があります30。ノンターゲットライブラリの生成とスクリーニングは、ガイドなしの方法でデザインを最適化するのに理想的であり、事前のデザイン作業(つまり、ライブラリのデザインと生成)をほとんど必要としませんが、有用な突然変異へのバイアスが必要です。このようなバイアスがなければ、はるかに大きな割合の変異が有害である可能性があり、より多くのスクリーニングが必要になることが予想されます31。そのため、バイオセンサーの構成要素(aTF、RBS、オペレーターサイト、ヘックスボックス)の主な効果だけでなく、これらのコンポーネントが互いに相互作用してバイオセンサーパラメータに影響を与える方法も考慮する総合的なアプローチは非常に魅力的です。
構造化された多変量実験と統計モデリングの方法論は、可能な限り最小限の実験数を使用して多次元実験空間を調査するために、プロセスエンジニアリングのワークフローで広く採用されています。実験計画法(DoE)と呼ばれる実験とモデリングを組み合わせたこのアプローチは、研究者が広範なアプリオリな知識を必要としずに、定義された結果に向けて複雑な多変数プロセスを最適化することを可能にします23,30。通常、構造化された実験探索がより簡単な連続変数の最適化に適用されますが、DoEは遺伝子レベルでの代謝経路の最適化にも使用されています31,32,33。これには、望ましい結果にとって最も重要と考えられる因子を選択する最初のスクリーニングステップと、その後、選択された因子を調整して望ましい出力を得る最適化ステップが含まれ、この場合は、その適用範囲を拡大するために特定のバイオセンサーパラメータを最適化します。重要なことに、この技術を自動化されたリキッドハンドラープラットフォームと組み合わせて、スクリーニングスループットを103 - 104の中規模ライブラリまで向上させ、データ駆動型ベースでバイオセンサーの性能をグローバルに最適化することができます23。以下では、バイオセンサー感度のグローバル最適化のためのライブラリの生成、スクリーニング、およびデータ収集を合理化するために、リキッドハンドリングロボット工学を支援する、バイオセンサー最適化へのDoE主導のアプローチを実装するためのプロトコルについて説明します。
1. RBS/プロモーター部品の設計
2. 部品ライブラリの組み立てと検証
3. パートライブラリのクローンスクリーニング - 自動化
4. データ処理/変換と差分ランキング




5. 最終的なスクリーニング設計の生成/DoE
6. ステップ2を繰り返します - DoEに情報に基づいた遺伝子デザインの設計と組み立て
7. スクリーニングとデータの合理化
最初に、バイオセンサーの機能に影響を与えると考えられるモジュールをバリエーション用に選択する必要があります。これには、リガンドの細胞内濃度、ひいてはバイオセンサー出力に影響を与える可能性のある輸送タンパク質の調節が含まれますが、aTF自体の相対的な転写および翻訳レベル、および蛍光レポーターまたは出力遺伝子も含まれます(図1)。 図2 は、バイオセンサー最適化のためのDoEベースの実験の開発に使用される典型的なワークフローを示しています。調節要素を、特にオペレーターサイト、ヘックスボックス、またはRBSでの配列レベルでの変更を通じて、合成生物学 を介して 操作可能な個別のモジュールに編成することから始まります(図2A)。そのため、DoEワークフローの次のステップは、バリアントのライブラリを生成するための配列部位のランダム化です(図2B)。スクリーニングされたコロニーの数は、ランダム化の程度4N(Nはランダム化された塩基位置の数に等しい)に比例する必要があるため、ランダム化の程度は慎重に検討する必要があります。各一意のプロモーターまたはRBS配列をDoEの一意のカテゴリ変数として扱うことは、ライブラリの特性評価による連続変数への変換は、ランダム化によって獲得された機能の範囲を測定し、上部、中央、およびを定義するために必要なトリアージステップであるため、必要なコンストラクトの数を実験的に実行不可能なレベルまで増加させます。 そして機能の下限。これは、レポーター遺伝子を介したRBSまたはプロモーターバリアントの強度の尺度としてのライブラリーの出力の分析によって最初に達成されます(図2C)。図のように、連続変数をレベルに離散化して、DoE がさまざまな組み合わせを探索し、これらのバリアントの影響を記述するモデルを開発するために使用できるレベルに離散化します。次に、各因子の活性範囲を組み合わせて記述する3つのレベルを使用してスクリーニングデザインを実装します(図2D)。提案された設計の組み立てとテストを通じて、実験空間が効率的に探索され、要因間の相互作用が明らかになります。得られたデータの統計分析を使用して、どの要因の組み合わせがバイオセンサーの出力に最も大きな影響を与えるかを判断し、SLSRを使用してさまざまな基準の下でのシステムの動作を予測し、ダイナミックレンジや感度の向上などの特定の結果に向けてバイオセンサーの最適化を促進します(図2D)。
図 3 aTF調節プロモーターライブラリーの組み立てとスクリーニングを実証します。縮退オリゴヌクレオチドを使用した等温アセンブリを実行して、プラスミドでコードされたライブラリを作成し、各プラスミドを特定の位置で一意にランダム化しました。ライブラリの多様性の程度によって、最終的にスクリーニングされるコロニーの数が決まり、理論上のライブラリサイズが大きいほど自動化の恩恵が大きくなります。TphRと相同オペロンのプロモーター配列解析は、ランダム化位置、特にある程度の変動を示し、したがって絶対に必須ではなく活性を調節する可能性のある塩基を知らせるために使用された塩基保存のマップを提供しました23.-35 および -10 の六角ボックスのそれぞれにある 3 つの塩基は、オペレーター部位の 6 つの塩基に加えて、完全な無作為化の対象となりました (図3A)、理論上のプロモーターライブラリは~500,000になります。その後、プラスミドライブラリーを使用して宿主株を形質転換しました。この段階では、に示す一般的なトラブルシューティングアプローチで十分なライブラリカバレッジを得るためには、良好な変換効率が重要です。 図3B.DNA濃度、形質転換方法、クローニング設計を最適化することで、形質転換体の収量を大幅に向上させることができます。 図3C 形質転換体を取得する際の典型的なワークフローを示しており、特性評価作業を開始する前に、固有のバリアントに対応する個々のコロニーを培地中で最初に増殖させる必要があります。理論上のライブラリサイズをカバーするには、膨大な数のバリアントをピックしてプレートに配列する必要があります。リキッドハンドラーやコロニーピッカーなどの自動化システムを活用すると、この労働集約的なステップを簡単にすることができます。ステップ1 図3C は、リキッドハンドラードックに手動でロードされたMTPへの成長培地の移送と、その後コロニーピッカーによる自動接種を示しています。プレートを密封してオフラインインキュベーターに移すなど、一部の段階は手動ですが、必要に応じて自動化することもできます。培養物の成長に続いて、リキッドハンドラーを使用して、グリセロールを添加してクライオストックを生成することもできます。 図3C.この段階では、プレートのバーコード化により、ピッキングされたすべてのバリアントが特定のプレートとウェルの位置にリンクされ、さらなる下流の特性評価のために簡単に参照できるようになります。自動化されたアプローチの大きな利点の1つは、労力の削減とは別に、図書作成の段階でのミスが引き越されにくく、人的ミスが少ないことです。ステップ2 図3C は、ライブラリ調製の自動特性評価フェーズを示しています。これが始まります via リキッドハンドラープラットフォームを使用してDWBに培地を充填し、その後、バーコード付きのクライオストックを使用して接種します。この段階での自動化により、ピペッティングのエラーと労力が最小限に抑えられます。次に、プレートを密封し、手動でオフラインインキュベーターに移して増殖させ、その時点でエフェクター化合物の新鮮なディープウェルプレートへの配列を開始できます。部品ライブラリの初期スクリーニングの目的では、ベースコンストラクトと同等かそれ以上の活性を示す非機能バリアントを事前スクリーニングし、強化された活性を示すバリアントプールを濃縮するために使用できるため、単純なON/OFFスクリーンが望ましい場合があります。これには、大規模なライブラリースクリーニングプロトコルでは法外になる可能性のあるチップとプレートの材料費を削減できるという追加の利点があります。ただし、より複雑なバイオセンサーの性能指標の最適化が必要な場合 (例: EC50)、追加のエフェクター濃度が必要になります。培養物の増殖に続いて、プレートはリキッドハンドラープラットフォームに戻され、リキッドハンドラープラットフォームは、アッセイの期間中、もう一度手動でインキュベーターに戻される前に、エフェクター化合物を含むプレートの接種を開始します。 図3D データ収集前の最後の自動化ステップを示します。成長とバイオセンサーの活性化のための期間が経過した後、プレートはオフラインのインキュベーターから取り出され、リキッドハンドラープラットフォームに戻されます。蛍光データの収集を妨げる可能性のある残留増殖培地を除去するには、遠心分離、上清の除去、および1x PBSによる細胞の洗浄が必要です。リキッドハンドラーを使用すると、培養物の自動再懸濁により、洗浄された細胞をスクリーニングのために96ウェルフォーマットのMTPに移すなど、プレートの迅速な処理が可能になります。データ収集は手動または自動で実行でき、一部のリーダーには、リキッド ハンドラーと接続してデータ収集プロセスをさらに自動化できるプレート スタックが搭載されています。エフェクターの存在下 (ON) とエフェクターの非存在時 (OFF) でのバイオセンサー活性化の比率を比較することにより、バイオセンサーの活性化の程度 (倍数変化) を使用して 5,000 のバリアントを評価し、バイオセンサーの機能を決定しました。ベースコンストラクト(3.6倍)を超える活性を持つバリアントのみが、散布図の赤ピンクの網掛け領域(図3D).濃縮されたバリアントプールのプレートとウェルの位置に基づいて、ワークフローのステップ1で生成された元のバーコード付きクライオストックプレートを参照することで、生物学的複製または異なるエフェクター濃度を使用した堅牢な特性評価を実行できます。
図4は、感度を最適化するためのプロモーターライブラリーの開発を目的とした、最初のライブラリースクリーニングからトリアージされたバリアントのスクリーニングを示しています。前のワークフローでスクリーニングされた5,000のバリアントのデータを使用して、最初のON/OFFスクリーニングから親配列よりも活性が高いと判断された226のバリアントのトリアージプールをさらに特徴付け、感度に従ってランク付けし、DSDを設計できるレベルとして機能しました。最初のステップとして、カテゴリ変数 (この場合は Pout top バリアント) を、広い感度範囲にまたがる連続変数に変換する必要があります。感度をスクリーニングするには、プロットされたヒル関数から EC50 データを取得するために用量反応曲線が必要です。これにより、めっき作業が劇的に増加し、図4Aに示すように、アッセイのセットアップとスクリーニングのプロセスを簡素化するためのリキッドハンドラーを使用した自動化に適しています。図3Cのステップ2で確立したワークフローに従って、増殖培地と抗生物質で満たされたDWBに接種するために、バリアントの濃縮プールに対応するプレートバーコードとウェル位置を用いて接種した。実験の堅牢性を高めるために、バリアントは生物学的3回でスクリーニングされました。プレートをオフラインインキュベーターに移して増殖させた後、リキッドハンドラーを使用して、新鮮なDWBに0、1、25、および1000 μMのエフェクターを添加した増殖培地で充填し、労力を削減しました。アッセイに必要なプレートの数を減らすために、曲線の下部、中央部、上部を網羅する濃度範囲を選択し、図4Aに示すように、中間点の濃度で各バリアントの相対的な感度が明らかになりました。各エフェクター濃度でバリアントプールを接種し、蛍光とOD600を分析した後、用量反応曲線をプロットし、非線形回帰分析を使用してEC50を決定しました。この段階では、ライブラリサイズをさらに縮小するために、図4Bに示すように、一意のEC50値を持つ各バリアントの生のライブラリが生成され、上位100の最も堅牢なバリアントが進められました。ただし、このライブラリを DoE で使用する前に、一意のバリアントを、その中に含まれる感度の範囲を表すランク付けされたライブラリに変換する必要があります。これは、データのlin-log変換を実行し、各バリアントが最も感度の高い(-1)から最も感度の低い(+1)にランク付けされるようにデータをランク付けおよび再スケーリングし、データセットの幾何平均を表す中間点値(0)を定義することによって実現されました図4C。生データの変換により、図4Dに示す青いプロットが生成され、そこから+1、0、および-1に対応する離散的なPアウトシーケンスが、Pアウト因子レベルとして最終的なスクリーニングデザインに進められました。
図5 DSD生成からモデリング、DoE支援学習に基づくバイオセンサーのグローバル最適化までのライブラリ生成後の完全なワークフローを実証します。 図5A 一般的なバイオセンサーを3つのモジュールに分解し、1ノード(トランスポートモジュールとレギュレーターモジュール)または2ノード(出力モジュール)のいずれかを備えています。の例に従ってください。 図4、RBSまたはプロモーターライブラリが開発され、各因子の最大の変動を網羅するために+1、0、および-1の範囲のレベルが選択されます。通常、スクリーニングされたライブラリのサイズによって、設計空間を完全に探索するために必要な実験の数が決まります。たとえば、各ライブラリのサイズが 22 の場合、これは 22 に相当します4 (234,256)の組み合わせ。DoE は、構造化されたスクリーニング デザインを通じて組み合わせの数を減らすことで、実験の作業負荷を簡素化することを目指しています。多くの方法論が可能ですが、DSDは、交絡する二次効果を回避しながら、主要な要因と2因子相互作用を特定できるため、バイオセンサーの開発に最適です。また、DSD設計では3レベルを利用するため、曲率(非線形性)を推定することが可能です。 図5A 4つのモジュールのそれぞれが異なるレベルに設定されている典型的なDSD出力を示します。各レベルは特定のプロモーターまたはRBSバリアントに対応するため、等温アセンブリを使用して、DSDの推奨設計に対応する遺伝的構築物を生成します。推奨されるコンストラクトで宿主株を組み立てて形質転換した後、各コンストラクトの性能に対する信頼性を高めるために、全範囲のエフェクター濃度を使用して用量反応曲線が得られます 図5B.DSDはコンストラクトの数を劇的に減らすため、このステップは多くの場合、手作業で、または必要に応じて自動リキッドハンドラーを使用して実行できます。 図5C DSD画面から提案された組み合わせを構築およびテストし、ヒル係数(nH)とEC50 テストされた各組み合わせの出力。実験の目的は、両方の n に対してグローバルに最適化されたバイオセンサー構造を開発することでした。H とEC50 4つの調節リンパ節の発現を調節して、両方のパラメーターを最大化します。各調節因子は、lin-log変換プロモーターおよびRBS部品ライブラリ(-1〜+1)に対応するx軸に沿って発現度とともに、独自の列に表示されます。両方のECでノードの式を変更した場合の影響50 と nH は、サブプロットの曲線で示されます。プロファイルプロットは、バイオセンサー最適化の直感的でない性質を強調しており、1つの調節ノードの調整が出力パラメーターに反対の影響を与える可能性があります。たとえば、RBSトランス は、n と強い相関関係がないことが示されています。H,ただし、ECとは正の相関があります50 非線形に。RBSの場合、高次(非線形)相互作用も暗示されますアウト 強度が増加すると、勾配が増加します(NH) と同時に感度が増加します (EC50)、その結果、よりデジタルな勾配を持つ曲線が得られ、エフェクター濃度の増加に対する反応がより鋭くなります。これらのモデルから、バイオセンサーの調整の直感的でない側面をより明確にレンダリングできるため、グローバル最適に向けてレギュレーションノードを最適化できます。モデルを使用して、両方のECのグローバル最適値を予測しました50 と nH 、プロットの赤い線は、各調節ノードの最適レベル(図5C). 図5D 最高のパフォーマンスを発揮するDSD設計(緑)およびグローバルに最適化された構築物(ライラック)と比較して、最初の親バイオセンサー構成物(青)の用量反応プロファイルを示します。モデルを使用して、ECを最大化するための理想的なモジュール強度を予測します50 と nH、RBS に対応するバリアントトランス (-1)、P登録 (-0.7)、Pアウト (-0.3)、RBSアウト (+1) の強みを組み立て、最適化された構成で特徴付け、EC の強化を示しました50 と nH (図5D).DSDとグローバルに最適化されたバイオセンサーの両方が同様のECを表示しますが、50 (0.8 対 0.7 μM)、nH ECを損なうことなく大幅に改善されました50 すでに達成された利益。この結果は、直感に基づくアプローチに対するデータ駆動型設計の利点を明確に示しており、バイオセンサーのチューニングプロセスを合理化および簡素化する手段としてのDoEの検証に役立ちます。

図1:遺伝的にコードされたバイオセンサーパラメータの調整。 aTF、オペレーターサイト(OS)、ヘックスボックス(-35、-10)、RBSコンポーネントを含む、遺伝的にコードされたバイオセンサーの遺伝子モジュールのレイアウト。色付きのボックスは、リガンド-aTFアフィニティー(灰色)、aTFオペレーター(ピンク)、RNAP-Hexbox(緑)、RBS(オレンジ)など、通常バイオセンサーパラメーターに影響を与える相互作用に対応します。各パラメータが線量反応特性に及ぼす影響は、代表的なグラフ内に示されています。 この図の拡大版を表示するには、ここをクリックしてください。

図2:典型的なDoEバイオセンサー最適化ワークフローの概要。 (A)ターゲットエフェクターをインポートする輸送タンパク質をコードする輸送モジュール、aTFに関連するレギュレーターモジュール、およびsfGFPなどのレポータータンパク質をコードする出力モジュールを示すバイオセンサーコンポーネントのモジュール化の概要。また、RBStrans、Preg、Pout、 RBS out などの調節ノードも示されており、 これらはバイオセンサー パラメーターを探索するために無作為化の対象となる遺伝的ノードに対応します。(B)プロモーターとRBSを含む、塩基ランダム化に適した配列要素の選択。プロモーターの親配列は一番上の行に示され、最終化された変異体配列は以下に示され、星は変化していない塩基を示しますが、K、M、およびNはそれぞれグアニン/チミン、アデニン/シトシン、または任意のヌクレオチドを指します。プロモーターは、ヘックスボックスまたはオペレーター部位を標的とすることで、より大きなランダム化の可能性を提供し、配列の複製や間隔の変更も含めることができます。RBSライブラリは、より限られたランダム化オプションを提供しますが、最大多様性が小さいため、スクリーニングが大幅に容易です。(C)バリアントの発現レベルを特徴付け、ランク付けされたlin-logライブラリに変換して、カテゴリバリアント因子をDoE による 分析により適した3つの離散レベルに変換します。(D)実験空間のマッピングは、各モジュールの3つのレベルの多重化された組み合わせを使用して実行され、バイオセンサーの性能を望ましい結果に向けて調整するための設計の選択を通知するために使用できるモデルを生成します。 この図の拡大版を表示するには、ここをクリックしてください。

図3:バイオセンサーのモジュール化、プロモーターライブラリの構築、および自動化されたワークフロー。 (A)aTFプロモーター中の特定の配列のランダム化と、等温アセンブリ を介して バイオセンサー構築物への挿入の例。太字は、縮退オリゴヌクレオチド合成中に提供されたキーに従ってオペレーター部位またはヘックスボックスでランダム化された位置を示します。(B)得られたバイオセンサーバリアントライブラリーのクローニング宿主への形質転換を説明するパネル 大 腸菌 、および形質転換体の収量に応じた次のステップ。変換効率が低いと、理論ライブラリのカバレッジが低下し、設計空間の探索が不十分になる可能性があります。この段階でのトラブルシューティングは、一般的なトラブルシューティング対策の概要とともに、バリアントのかなりの部分を特性評価に利用できるようにするために不可欠です。(C)プロトコルに概説されているステップ1および2のワークフローで、赤い針の記号は手動ステップを示し、歯車は自動ステップを示します。ステップ1のワークフローでは、コロニーの選択からクライオストックの生成までのプロトコルの主要なステップを強調しています。ステップ2のワークフローでは、用量反応曲線によるアッセイのためのクライオストックの復活と再配列を示します。(D)蛍光およびODの測定前の細胞の洗浄およびアッセイプレートへの移送を含む、スクリーニング前の最終手順を示すパネル。5000のスクリーニングされたバリアントプールがパネルに示されており、オレンジ色のボックスで強調表示されている親プロモーター配列(3.6倍)を超えるオン/オフを示すバリアント。バリアントの多くは1付近に集まっていることがわかり、おそらく配列レベルでのランダム化が機能の喪失を引き起こすため、パフォーマンスが低く、変動性が低いことを示しています。プロットにボックスで囲まれた226のバリアントは、堅牢な特性評価のために進められました。データは、Alvarez Gonzalez etal 23 による元の出版物から引用されました。 この図の拡大版を表示するには、ここをクリックしてください。

図4:プロモーターライブラリーのトップバリアントスクリーニングとlin-log変換 による 離散化。 (A)RBSまたはプロモーターライブラリーの発現データを生成するための標準手順の概要。適切な範囲の発現レベルを表すトリアージされたバリアントを使用して、リキッドハンドラーを使用して、トリアージされた226バリアントの用量反応曲線を導き出すために、所定濃度のエフェクターがあらかじめ充填されたアッセイプレートを生成します。(B)EC50 の決定と、特徴付けられたライブラリを100のバリアントにさらに削減した後、データは、プロモーターのランダム化から生成されたさまざまな感度の組み合わせを示す棒グラフとしてプロットされます。(C)EC50 データは、lin-log レート方程式を使用して変換され、連続データ セットを DSD の因数分解により適したカテゴリ データ セットに変換されます。(D)変換されたEC50 バリアントデータは、簡略化されたスケールに縮小され、EC50 活性が高いものから低いものまでランク付けされています。この中から、上部 (+1) の幾何平均 (0) および下部 (-1) のバリアントに対応する 3 つのレベルが選択され、実験空間を探索するために DSD に繰り越されます。 この図の拡大版を表示するには、ここをクリックしてください。

図5:DSDの実験計画、テスト、およびモデルベースの学習成果。 (A) RBStrans、Preg、Pout、および RBSout モジュールの lin-log 変換ランク付けライブラリに基づく DSD 設計テーブルの生成を示す概略図ワークフロー。DSD設計表は、実験空間を効率的にマッピングするための最小数の組み合わせを提案します。出力例が示されており、+1、0、および-1は、lin-log変換で記述されているように、各規制ノードの上位、中間、および下位のパフォーマンスバリアントを参照します。これらは等温アセンブリ を介して 構築され、特性評価のために発現宿主に形質転換される前にシーケンシングによって確認されます。(B)形質転換後、細胞を成長させ、広範囲のエフェクター濃度に対してアッセイし、蛍光出力を測定して用量反応曲線を生成します。nH や EC50 などのさまざまなパラメーターが用量反応曲線から抽出され、DSD に供給されて各因子の予測モデルが生成されます。(C)モデルを使用して、調節モジュールの発現レベルを変更することにより、1つのバイオセンサーパラメーターを調節することの影響を予測できます。重要なのは、調節ノードのグローバルチューニングが可能になり、各サブプロットの赤い破線で示される1つまたは複数のバイオセンサーパラメーターを同時に最大化できるようになることです。(D)モデルを最大感度に向けて最適化すると、グローバルに最適化されたコンストラクト(ライラック)が得られ、その用量反応曲線は、最もパフォーマンスの高いDSDコンストラクト(緑)と親バイオセンサーコンストラクト(青)に対してプロットされます。抽出されたnH およびEC50 パラメータがプロットの下に示されており、最高のパフォーマンスのDSDコンストラクトよりも両方のパラメータが改善されていることを示し、DSDから生成された予測モデルの有効性を検証しています。データは、Alvarez Gonzalez etal 23 による元の出版物から引用されました。 この図の拡大版を表示するには、ここをクリックしてください。
補足図1:バイオセンサーライブラリの調製とアッセイのセットアップに使用される自動リキッドハンドリングプロトコルステップ。このファイルをダウンロードするには、ここをクリックしてください。
補足図2から補足図6:決定的スクリーニングデザイン(DSD)の段階的な生成。このファイルをダウンロードするには、ここをクリックしてください。
幅広い遺伝的多様性を網羅する遺伝的要素のライブラリは、DoEベースの方法論の成功に不可欠です。 図2Aに示されているように、理論上のバリアントの数は、突然変異誘発の標的となる位置の数と無作為化の程度とともに増加し、このライブラリサイズの増え続けることで、重大なスクリーニングのボトルネックが生じます。ターゲット位置の数やランダム化の程度を減らすことで、スクリーニングが必要なバリアントの数を減らすことができ、チューニングへのより的を絞ったアプローチが必要な場合、またはシステムに関する重要な先 験的 知識がガイドとして存在する場合、魅力的なアプローチです。しかし、バイオセンサーのように、多くの重複する特徴を特徴としたり、十分に特徴付けられた遺伝的要素を持っていなかったりするシステムの場合、ライブラリサイズの要件を回避することは困難です。自動リキッドハンドラーを使用すると、特に用量反応曲線などのより高度な機能をプロットするためにデータポイント収集を増やす必要がある場合、特にON/OFFなどの2つのデータポイントコンパレータと比較して、データポイント収集を増やす必要がある場合に、コロニーのピッキングとバリアントの培養の労力が簡単になります。自動化されたワークフローを含めることで節約される時間を具体的に定量化することは困難ですが、 その実装の主な利点は、他の並列実験に費やすことができる時間にあります38。
それにもかかわらず、ライブラリサイズが104を超える多くの場合、リキッドハンドラー支援の方法論でさえ実用的ではありません39。このような場合、フローサイトメーターを使用したバリアントの予備スクリーニングは非常に魅力的なアプローチであり、最大107細胞/h40のはるかに大きな選別能力を備えています。蛍光活性化細胞選別(FACS)を2ラウンドのポジティブセレクションと少なくとも1ラウンドのネガティブセレクションで使用することは、より広範な特性評価の前に、バイオセンサーの最もパフォーマンスの高いバリアントのトリアージに日常的に採用されてきました16,26,42。FACSを利用したこのようなプロトコルの開発と実行は、他の場所で詳細にレビューされています31。最初のトリアージスクリーニングは、上記のプロトコルで概説されているように、プレートベースのリキッドハンドラーアッセイを使用して可能です。図3Dに示すように、単一のエフェクター濃度を使用してON/OFFデータを比較することにより、かなりの機能獲得(メソッドで提供されている3.6倍)を持つバリアントバイオセンサーのみを選択して、より詳細な特性評価を行うことができ、ライブラリ開発と実験実行時間を合理化できます。ただし、FACSとリキッドハンドラープラットフォームはどちらもラボに多額の設備投資が必要であり、多くの場合、運用と保守に一定レベルの技術的専門知識が必要です。寒天プレートベースのスクリーニングは、参入に対する技術的および財政的障壁が低く、gfpまたは青白色コロニースクリーニングと組み合わせて使用され、蛍光の強度に基づいてRBSライブラリーバリアントおよび酵素変異体を選択しています43,44。しかし、これらもまた、効果的にスクリーニングできるバリアントの数が限られていますが、検出可能であるためには蛍光の有意な違いも必要です44。一度に複数の要素の完全に組み合わせた同時突然変異の間の妥協点として、「分割統治」方法論は、代わりに大規模なバリアントライブラリをより管理しやすいスクリーニングブロックに分割することを目的としています41。モジュール化されたアプローチは実用的かもしれませんが、生物学的成分の性能は、特に転写および翻訳結合が普及している細菌において、コンテキストに高度に依存することが知られているため、組み合わせ設計空間を効果的に探索することはできません。これにより、グローバル最適値ではなく局所的な最大値を対象とする設計選択が生じる可能性があります。
特定の誘導体の輸送と認識は、概説されたプロトコルの主な焦点ではないにもかかわらず、言及に値するバイオセンサー開発のもう一つの重要な特徴を表しています。標的分子に適切な aTF がないことは、研究者にとって大きな課題です。標的エフェクターの構造類似体に結合する既存のaTFの合理的選択は、aTFの特異性を目的のエフェクター17に調整するためにコドンランダム化を適用するための理想的なテンプレートを提供することができる。ターゲット配列を解決された構造またはアルファフォールド予測にアラインメントすることで、プロトコル17に適応可能な、半合理的なランダム化およびランク付けにかけられたアミノ酸残基が疑われるエフェクター結合部位の同定を可能にすることができます。同様に、エフェクターの輸出入に関与するトランスポーターの選択と調節は、バイオセンサーの線量反応特性を大幅に変化させる可能性があります。トランスポーター遺伝子の発現は、複数のFACSラウンドで発現を安定させるために使用されるMucKトランスポーターの発現を制御するPtac プロモーターとRBSの多様なライブラリにより、バイオセンサー応答の堅牢性を高めることで、バイオセンサー応答の重要なプレーヤーであることが判明しました17。同様に、異なるトランスポータータンパク質自体のスクリーニングは、PCA応答性バイオセンサーを使用したPcaKトランスポーターの推定セットのスクリーニングにより、3,5-ヒドロキシル化基質を独自に取り込むことができる2つのトランスポーターの同定につながり、そのシステムによって検出可能な化合物のセットを拡大します24。
自動化されたプラットフォームは、DoEの原理を深層学習モデルと組み合わせると、特性評価と探索のためのさらに強力なツールになる可能性があります46,47。ハイスループットプラットフォームを備えたバイオセンサーの設計空間を最初に探索した後、機械学習アルゴリズムを利用して、特徴付けられていない配列の機能を高い精度で予測しました47。このプロトコルで概説されている方法は、クロスRBS配列予測に基づいて開発されたモデルと同様に、プロモーター設計のための新しい言語学習モデルのテストに容易に適用できます48。さらに、このようなモデルを統合することで、非機能プロモーター設計に含まれる配列機能データを活用し、バイオセンサー全体のより広範な機能に関する重要な洞察を得ることができます。つまり、これは、偽陽性(例えば、機能しないプロモーター)が必ずしも測定された出力ゼロと同等ではないという、DoEワークフローの決定的な制限に対処する可能性があり、偽の転写やDoEデータへのノイズの要素の導入などの現象があり、識別と制御が困難です。決定的に、実験計画空間全体を網羅するためには、活動範囲が不十分であると設計出力が歪み、データセット30から生成された統計モデルに信頼性が低下するため、生成されたライブラリは幅広い活動を示さなければなりません。ライブラリの変動性が低いことが問題になる場合は、他の配列要素を探索したり、ランダム化の程度を高めたりして実装し、適切なバリアントプールが得られるまでライブラリ間の変動を比較できます。
DoE プロセスの重要な側面には、DSD から得られた一次効果と二次効果の正しい推定と選択が含まれ、統計分析に組み込まれます。DoEは、モデリングベースのアプローチであるため、過学習やバイアスが発生しやすく、反復的なエンジニアリング作業を設計空間の最適ではないセクションに誘導することにより、最適化プロセスを急速に複雑にする可能性があります49。そのため、構想の段階とデータの分析の両方で、設計がそのような影響から堅牢に隔離されていることを確認することが重要です。最初のスクリーニング設計段階では、すべての因子が幾何平均(すなわち、0,0,0)に設定されている中心実行は、非線形相互作用をより適切に考慮することにより、モデルのバイアスを減らすのに役立ちますが、大きな実験負荷(1〜3回の追加実行)を追加しません49。さらに、ランダム化計画を含めると、実験計画には含まれていないが、測定されている応答変数に影響を与える可能性のある無関係な変数を説明するのに役立ちます。生物学的な文脈では、ランダム化はプレート位置などの時空間効果やバッチ間の変動などの問題に対処し、そのような影響がデータの解釈に大きな影響を与えるのを防ぎます。この初期段階でこのような詳細に注意を払うことで、モデルの堅牢性が向上し、より信頼性の高い結論につながります。DSDが提案する実験を行った後、出力パラメータに有意な影響を与えた要因を解明するために、データの統計分析が必要です。半正規プロットは、効果の大きさを直感的に視覚的に表現し、有意な効果は通常直線に沿って落ちますが、大きな影響のある効果はこの線から逸脱するため、バイオセンサーの最適化において最も重要な要因を簡単に選択できます。これを念頭に置いて、モデルの過剰適合のリスクを減らすために、すべてのモデリングと同様に、効果選択に対して保守的なアプローチを取る必要があります。
バイオセンサーやその他の遺伝子回路を迅速に設計および最適化する能力は、菌株や酵素の開発だけでなく、リアルタイム診断などのバイオテクノロジー分野の研究のペースを大幅に加速させるでしょう。この分野でのDoEベースのスクリーニング方法論の出現は特に有望であり、可能な限り最大の設計空間を探求しながら時間とリソースの効率的な使用を促進し、代謝経路およびバイオセンサーの遺伝回路の最適化にすでに大きな効果をもたらしています31,33,34,51.DoEは、多くの1次、2次、さらには3次相互作用が機能している多因子最適化問題に特に適しています。さらに、バイオセンサーのある側面を設計する努力は、ダイナミックレンジ51を犠牲にして感度を向上させるなど、しばしば不注意で別のパラメータの犠牲をもたらす。このような隠れた相互作用をマッピングし、バイオセンサーの動作を予測するモデルを作成するDoEの機能により、ビルドテストの学習サイクルが大幅に加速されます。
著者は利益相反を宣言しません。
GAGとPLRは、BBSRC DTP助成金(BB/M011208/1)によって支援されました。MC は、BBSRC レスポンシブ モード助成金 (BB/P01738X/1) によってサポートされました。また、ヘンリー・ロイス先端材料研究所(EPSRC助成金番号を通じて資金提供)にも感謝したいと思います。EP/R00661X/1、EP/S019367/1、EP/P025021/1、EP/P025498/1)の施設へのアクセス。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| 1000 & マイクロ;L CO-REチップ、滅菌ノンフィルター | ハミルトン | 235939 | |
| 2.2 mL 96ディープウェルプレート、V字型底部の角型ウェル | 熱 | 11594754 | |
| 300 & マイクロ;L CO-RE チップ、スタックNTR、滅菌 | ハミルトン | 235985 | |
| 96ウェルクリアボトム、ブラックマイクロタイタープレート | グライナー | 655097 | |
| アガロース | インビトロゲン | 16500100 | |
| 組み立てられたプラスミドDNA | ユーザー指定 | NA | |
| ClarioStar Plus マイクロプレートリーダー | BMGの | NA | |
| デキシヌクロエチド (dNTP) 溶液混合物 | NEB | N0447L | |
| ジメチルスルホキシド(DMSO) | フィッシャーバイオリジェント | BP231-100 | |
| DNAラダー 100bp | NEB | N3231L | |
| DNAラダー 1KB | NEB | N3232L | |
| DNAシーケンシング | 出典:バイオサイエンス | NA | |
| DNA合成 | IDTの | NA | |
| 大腸菌 DH5&α;コンポテントセル | NEB | C2987H | |
| ゲルローディング染料、パープルX6SDSなし | NEB | B7025S | |
| 遺伝子パルサー/マイクロパルサーエレクトロポレーションキュベット、0.2cmギャップ | バイオラッド | 1652082 | |
| グラフパッドプリズム10 | グラフパッド | NA | |
| ハミルトンスターリキッドハンドラー | ハミルトン | NA | |
| HT マルチトロンプレートシェーカーインキュベーター | インフォーサー HT | NA | |
| JMP統計分析スイート | JMPの | NA | |
| LBブロス(ミラー) | ミラー | L3522 | |
| 寒天入りLBブロス(ミラー); | シグマ | L3147 | |
| マイクロパルサーエレクトロポレーター | バイオラッド | 1652100 | |
| NEBuilder HiFi DNAアセンブリマスターミックス | NEB | E2621S型 | |
| Q5 高忠実度DNAポリメラーゼ | NEB | M0491S | |
| QIAprep スピン ミディプレップキット | キアゲン | 12143 | |
| QIAprep スピン ミニプレップキット | キアゲン | 27104 | |
| QIAquickゲル抽出キット | キアゲン | 28706X4 | |
| QIAquick PCR精製キット | キアゲン | 28104 | |
| Qpix 420 コロニーピッカー | モレキュラーデバイス英国 | NA | |
| SOC成長媒体 | NEB | B9020S | |
| SYBR Safe DNAゲル染色 | インビトロゲン | S33102 | |
| TAEバッファー(トリス-酢酸-EDTA、50X) | サーモフィッシャー | B49 | |
| UltraPureTM Dnase/Rnase フリー蒸留水 | インビトロゲン | 10977015 |
Request permission to reuse the text or figures of this JoVE article
Request Permission