कई शोधकर्ता “मध्यम आकार”, कम वेग और बहु-आयामी डेटा उत्पन्न करते हैं, जिन्हें स्प्रेडशीट के बजाय डेटाबेस के साथ अधिक कुशलता से प्रबंधित किया जा सकता है। यहां हम बहु-आयामी डेटा की कल्पना करने, संबंधपरक डेटाबेस संरचनाओं में तालिकाओं को जोड़ने, अर्ध-स्वचालित डेटा पाइपलाइनों का मानचित्रण करने और डेटा अर्थ को स्पष्ट करने के लिए डेटाबेस का उपयोग करने सहित डेटाबेस का वैचारिक अवलोकन प्रदान करते हैं।
विज्ञान प्रगति के लिए तेजी से जटिल डेटा सेट पर निर्भर करता है, लेकिन स्प्रेडशीट कार्यक्रमों जैसे आम डेटा प्रबंधन विधियां बढ़ते पैमाने और इस जानकारी की जटिलता के लिए अपर्याप्त हैं। जबकि डेटाबेस प्रबंधन प्रणालियों में इन मुद्दों को सुधारने की क्षमता है, वे आमतौर पर व्यापार और सूचना के क्षेत्रों के बाहर उपयोग नहीं किए जाते हैं। फिर भी, कई शोध प्रयोगशालाएं पहले से ही “मध्यम आकार”, कम वेग, बहु-आयामी डेटा उत्पन्न करती हैं जो समान प्रणालियों को लागू करने से बहुत लाभान्वित हो सकती हैं। इस लेख में, हम एक वैचारिक अवलोकन प्रदान करते हैं जिसमें यह समझाया गया है कि डेटाबेस कैसे कार्य करते हैं और ऊतक इंजीनियरिंग अनुप्रयोगों में वे क्या फायदे प्रदान करते हैं। एक विशिष्ट प्रयोगात्मक संदर्भ में उदाहरणों को समझाने के लिए लैमिन ए/सी उत्परिवर्तन वाले व्यक्तियों से संरचनात्मक फाइब्रोब्लास्ट डेटा का उपयोग किया गया था । उदाहरणों में बहुआयामी डेटा की कल्पना करना, रिलेशनल डेटाबेस संरचना में तालिकाओं को जोड़ना, कच्चे डेटा को संरचित प्रारूपों में बदलने के लिए अर्ध-स्वचालित डेटा पाइपलाइन का मानचित्रण करना और क्वेरी के अंतर्निहित वाक्यकर को समझाना शामिल है। डेटा का विश्लेषण करने से परिणाम विभिन्न व्यवस्थाओं और महत्व के भूखंडों को बनाने के लिए इस्तेमाल किया गया था हचिनसन-गिलफोर्ड प्रोजेरिया, एक प्रसिद्ध लैमिनोपैथी, और अन्य सभी प्रयोगात्मक समूहों के सकारात्मक नियंत्रण के बीच गठबंधन वातावरण में सेल संगठन में प्रदर्शन किया गया था। स्प्रेडशीट की तुलना में, डेटाबेस विधियां अत्यधिक समय कुशल थीं, एक बार स्थापित होने के बाद उपयोग करने के लिए सरल थीं, मूल फ़ाइल स्थानों की तत्काल पहुंच और डेटा कठोरता में वृद्धि के लिए अनुमति दी गई थीं। प्रायोगिक कठोरता पर राष्ट्रीय स्वास्थ्य संस्थानों (NIH) के जोर के जवाब में, यह संभावना है कि कई वैज्ञानिक क्षेत्रों अंततः जटिल डेटा को प्रभावी ढंग से व्यवस्थित करने के लिए अपनी मजबूत क्षमता के कारण आम अभ्यास के रूप में डेटाबेस को अपनाना होगा ।
एक ऐसे युग में जहां वैज्ञानिक प्रगति प्रौद्योगिकी द्वारा भारी है, बड़ी मात्रा में डेटा को संभालना सभी विषयों में अनुसंधान का एक अभिन्न पहलू बन गया है । कम्प्यूटेशनल बायोलॉजी और जीनोमिक्स जैसे नए क्षेत्रों का उद्भव यह रेखांकित करता है कि प्रौद्योगिकी का सक्रिय उपयोग कितना महत्वपूर्ण हो गया है । मूर के कानून और तकनीकी प्रगति1,2से प्राप्त स्थिर प्रगति के कारण ये रुझान जारी रहना निश्चित है । हालांकि, एक परिणाम उत्पन्न डेटा की बढ़ती मात्रा है जो पहले व्यवहार्य संगठन विधियों की क्षमताओं से अधिक है। यद्यपि अधिकांश अकादमिक प्रयोगशालाओं में जटिल डेटा सेट ों को संभालने के लिए पर्याप्त कम्प्यूटेशनल संसाधन होते हैं, लेकिन कई समूहों के पास आवश्यकताओं के विकास के लिए अनुकूल कस्टम सिस्टम के निर्माण के लिए आवश्यक तकनीकी विशेषज्ञता की कमी होती है3। इस तरह के डेटा सेट का प्रबंधन और अद्यतन करने का कौशल होना कुशल कार्यप्रवाह और आउटपुट के लिए महत्वपूर्ण बना हुआ है। डेटा और विशेषज्ञता के बीच अंतर को पाटना कुशलतापूर्वक हैंडलिंग, फिर से अपडेट करने और बहुआयामी डेटा के व्यापक स्पेक्ट्रम का विश्लेषण करने के लिए महत्वपूर्ण है।
बड़े डेटा सेट को संभालते समय स्केलेबिलिटी एक आवश्यक विचार है। उदाहरण के लिए, बिग डेटा अनुसंधान का एक समृद्ध क्षेत्र है जिसमें भारी मात्रा, बड़ी विषमता और पीढ़ी की उच्च दरों जैसे ऑडियो और वीडियो4,5की विशेषता वाले डेटा प्रसंस्करण से नई अंतर्दृष्टि का खुलासा करना शामिल है। संगठन और विश्लेषण के स्वचालित तरीकों का उपयोग करना इस क्षेत्र के लिए डेटा के टोरेंट को उचित रूप से संभालने के लिए अनिवार्य है। बड़े डेटा में उपयोग किए जाने वाले कई तकनीकी शब्दों को स्पष्ट रूप से परिभाषित नहीं किया गया है, हालांकि, और भ्रामक हो सकते हैं; उदाहरण के लिए, “उच्च वेग” डेटा अक्सर प्रति दिन लाखों नई प्रविष्टियों से जुड़ा होता है जबकि “कम वेग” डेटा केवल प्रति दिन सैकड़ों प्रविष्टियां हो सकती हैं, जैसे कि अकादमिक प्रयोगशाला सेटिंग में। हालांकि वहां कई रोमांचक निष्कर्ष अभी तक बड़े डेटा का उपयोग कर की खोज की है, ज्यादातर अकादमिक प्रयोगशालाओं गुंजाइश, शक्ति की आवश्यकता नहीं है, और अपने स्वयं के वैज्ञानिक सवालों को संबोधित करने के लिए इस तरह के तरीकों की जटिलता5। हालांकि यह संदेह नहीं है कि वैज्ञानिक डेटा6समय के साथ तेजी से जटिल बढ़ता है, कई वैज्ञानिकों को संगठन के तरीकों का उपयोग करना जारी है कि अब उनके विस्तार डेटा की जरूरत को पूरा । उदाहरण के लिए, सुविधाजनक स्प्रेडशीट कार्यक्रमों का उपयोग अक्सर वैज्ञानिक डेटा को व्यवस्थित करने के लिए किया जाता है, लेकिन लंबे समय तक7,8में अस्केलेबल, त्रुटि प्रवण और समय अक्षम होने की कीमत पर। इसके विपरीत, डेटाबेस समस्या का एक प्रभावी समाधान है क्योंकि वे स्केलेबल, अपेक्षाकृत सस्ते और चल रही परियोजनाओं के विभिन्न डेटा सेटों को संभालने में उपयोग करने में आसान हैं।
डेटा संगठन के स्कीमों पर विचार करते समय उत्पन्न होने वाली तत्काल चिंताएं प्रशिक्षण और उपयोग के लिए लागत, पहुंच और समय निवेश हैं। अक्सर व्यापार सेटिंग्स में इस्तेमाल किया, डेटाबेस कार्यक्रम अधिक किफायती हैं, या तो अपेक्षाकृत सस्ती या मुक्त किया जा रहा है, बड़े डेटा सिस्टम के उपयोग का समर्थन करने के लिए आवश्यक धन से । वास्तव में, वाणिज्यिक रूप से उपलब्ध और ओपन सोर्स सॉफ्टवेयर दोनों की एक किस्म ओरेकल डेटाबेस, माईक्यूएल और माइक्रोसॉफ्ट (एमएस) एक्सेस9जैसे डेटाबेस बनाने और बनाए रखने के लिए मौजूद है। कई शोधकर्ताओं को भी जानने के लिए प्रोत्साहित किया जाएगा कि कई एमएस कार्यालय अकादमिक संकुल एमएस का उपयोग के साथ आते हैं, आगे लागत विचार ों को कम । इसके अलावा, लगभग सभी डेवलपर्स ऑनलाइन व्यापक दस्तावेज प्रदान करते हैं और शोधकर्ताओं को संरचित क्वेरी भाषा (एसक्यूएल)10,11,12को समझने और उपयोग करने में मदद करने के लिए कोदशकी, W3Schools और SQLBolt जैसे मुफ्त ऑनलाइन संसाधनों की अधिकता है। किसी भी प्रोग्रामिंग भाषा की तरह, एसक्यूएल का उपयोग करके डेटाबेस और कोड का उपयोग करने का तरीका सीखना मास्टर करने में समय लगता है, लेकिन पर्याप्त संसाधनों के साथ प्रक्रिया सरल और निवेश किए गए प्रयास के लायक है।
डेटाबेस डेटा पहुंच और एकत्रीकरण में आसानी बढ़ाने के लिए शक्तिशाली उपकरण हो सकते हैं, लेकिन यह समझना महत्वपूर्ण है कि कौन से डेटा को संगठन के अधिक नियंत्रण से सबसे अधिक लाभ होगा। बहु-आयामीता उन स्थितियों की संख्या को संदर्भित करती है जिनके खिलाफ माप को समूहीकृत किया जा सकता है, और कई अलग-अलग स्थितियों का प्रबंधन करते समय डेटाबेस सबसे शक्तिशाली होतेहैं। इसके विपरीत, स्प्रेडशीट कार्यक्रम का उपयोग करके कम आयामीता के साथ जानकारी सबसे सरल है; उदाहरण के लिए, वर्षों से युक्त डेटा सेट और प्रत्येक वर्ष के लिए मूल्य में केवल एक संभव समूह (वर्षों के विरुद्ध माप)। नैदानिक सेटिंग्स जैसे उच्च आयामी डेटा को प्रभावी ढंग से बनाए रखने के लिए मैनुअल संगठन की एक बड़ी डिग्री की आवश्यकता होगी, स्प्रेडशीटकार्यक्रमों 13के दायरे से परे एक थकाऊ और त्रुटि-प्रवण प्रक्रिया। गैर-संबंधपरक (NoSQL) डेटाबेस भी मुख्य रूप से उन अनुप्रयोगों में विभिन्न भूमिकाओं को पूरा करते हैं जहां डेटा पंक्तियों और कॉलम14में अच्छी तरह से व्यवस्थित नहीं होता है। अक्सर खुले स्रोत होने के अलावा, इन संगठनात्मक स्कीमों में ग्राफिकल संघ, समय श्रृंखला डेटा या दस्तावेज़-आधारित डेटा शामिल हैं। NoSQL SQL से बेहतर स्केलेबिलिटी में उत्कृष्टता प्राप्त करता है, लेकिन जटिल प्रश्न नहीं बना सकता है, इसलिए संबंधपरक डेटाबेस उन स्थितियों में बेहतर होते हैं जिन्हें स्थिरता, मानकीकरण और निराला बड़े पैमाने पर डेटा परिवर्तन की आवश्यकता होती है15। डेटाबेस प्रभावी ढंग से समूहीकृत करने और डेटा को फिर से अपडेट करने में सबसे अच्छे हैं , जो अक्सर वैज्ञानिक सेटिंग्स13,16में आवश्यक संरचनाओं की बड़ी सरणी में होते हैं ।
इसलिए, इस काम का मुख्य उद्देश्य वैज्ञानिक समुदाय को “मध्यम आकार” के लिए स्केलेबल डेटा प्रबंधन प्रणालियों के रूप में डेटाबेस की क्षमता के बारे में सूचित करना है, कम वेग डेटा के साथ-साथ रोगी सोर्स सेल-लाइन प्रयोगों के विशिष्ट उदाहरणों का उपयोग करके एक सामान्य टेम्पलेट प्रदान करना है। इसी तरह के अन्य अनुप्रयोगों में नदी के बिस्तरों के भू-स्थानिक डेटा, देशीयनैदानिक अध्ययनों से प्रश्नावली और विकास मीडिया17,18,19में माइक्रोबियल वृद्धि की स्थिति शामिल है। यह काम कच्चे डेटा को संरचित प्रारूपों में परिवर्तित करने के लिए आवश्यक डेटा-पाइपलाइन के साथ मिलकर डेटाबेस के निर्माण की सामान्य बातों और उपयोगिता पर प्रकाश डालता है। एसक्यूएल में डेटाबेस के लिए डेटाबेस इंटरफेस और कोडिंग की मूल बातें प्रदान की जाती हैं और उदाहरणों के साथ सचित्र हैं ताकि दूसरों को बुनियादी ढांचे के निर्माण के लिए लागू ज्ञान प्राप्त करने की अनुमति मिल सके। अंत में, एक नमूना प्रयोगात्मक डेटा सेट दर्शाता है कि विभिन्न तरीकों से बहुआयामी डेटा को एकत्र करने के लिए डेटाबेस को कितनी आसानी से और प्रभावी ढंग से डिज़ाइन किया जा सकता है। यह जानकारी अपनी प्रायोगिक जरूरतों के लिए डेटाबेस को लागू करने की दिशा में रास्ते पर साथी वैज्ञानिकों की सहायता के लिए संदर्भ, टीका और टेम्पलेट्स प्रदान करती है।
एक अनुसंधान प्रयोगशाला सेटिंग में एक स्केलेबल डेटाबेस बनाने के प्रयोजनों के लिए, मानव फाइब्रोब्लास्ट कोशिकाओं का उपयोग कर प्रयोगों से डेटा पिछले तीन वर्षों में एकत्र किया गया था । इस प्रोटोकॉल का प्राथमिक ध्यान कंप्यूटर सॉफ्टवेयर के संगठन पर रिपोर्ट करना है ताकि उपयोगकर्ता को सबसे अधिक लागत और समय-कुशल तरीके से डेटा को एकत्र करने, अद्यतन करने और प्रबंधित करने में सक्षम बनाया जा सके, लेकिन प्रासंगिक प्रायोगिक विधियां भी प्रदान की जाती हैं संदर्भ.
प्रायोगिक सेटअप
नमूनों को तैयार करने के लिए प्रायोगिक प्रोटोकॉल को पहले20,21वर्णित किया गया है, और यहां संक्षेप में प्रस्तुत किया गया है। पॉलीडिमेथिलसिलॉक्सेन (पीडीएमएस) और क्यूरिंग एजेंट के 10:1 मिश्रण के साथ स्पिन-कोटिंग आयताकार ग्लास कवरस्लिप द्वारा निर्माण तैयार किए गए थे, फिर 0.05 मिलीग्राम/एमएल फाइब्रोनेक्टिन, या तो असंगठित (आइसोट्रोपिक) या 5 माइक्रोमीटर गैप माइक्रोपैटर्न्ड व्यवस्थाओं (लाइनों) के साथ 20 माइक्रोमीटर लाइनों में लागू किया गया था। फाइब्रोब्लास्ट कोशिकाओं को इष्टतम घनत्व पर कवरस्लिप पर 7 (या सकारात्मक नियंत्रण के लिए 16 मार्ग) पर वरीयता प्राप्त की गई थी और 24 घंटे के बाद मीडिया के साथ 48 एच के लिए बढ़ने के लिए छोड़ दिया गया था। इसके बाद कोशिकाओं को 4% पैराफॉर्मलडिहाइड (पीएफए) समाधान और 0.0005% nonionic सर्फेक्टेंट का उपयोग करके तय किया गया था, इसके बाद सेल न्यूक्लिकी (4′,6′-डिमिनोडिनिनो-2-फेनिलिनोडोल [डीएपीआई]), ऐक्टिन (एलेक्सा फ्लोर 488 फेलोइडिन), और फाइब्रोनेक्टिन (पॉलीक्लोनकल खरगोश एंटी-ह्यूमन फाइब्रोनेक्टिन) के लिए कवरस्लिप इम्यूनोदाग किया जा रहा है। बकरी विरोधी खरगोश IgG एंटीबॉडी (एलेक्सा फ्लोर ७५० बकरी विरोधी खरगोश) का उपयोग कर फाइब्रोनेक्टिन के लिए एक माध्यमिक दाग लागू किया गया था और संरक्षण एजेंट फ्लोरोसेंट लुप्त होती को रोकने के लिए सभी कवरस्लिप पर मुहिम शुरू की गई थी । नेल पॉलिश माइक्रोस्कोप स्लाइड पर कवरस्लिप सील करने के लिए इस्तेमाल किया गया था तो 24 घंटे के लिए सूखी छोड़ दिया है ।
फ्लोरेसेंस छवियों के रूप में पहले20 वर्णित एक डिजिटल चार्ज युग्मित डिवाइस (सीसीडी) एक उल्टे मोटरीकृत माइक्रोस्कोप पर घुड़सवार कैमरे के साथ मिलकर किया गया । देखने के दस बेतरतीब ढंग से चयनित क्षेत्रों 40x आवर्धन पर प्रत्येक कवरस्लिप के लिए छवि थे, एक ६.२२ पिक्सल/μm संकल्प के अनुरूप । कस्टम-लिखित कोड का उपयोग न्यूक्लिकी, ऐक्टिन फिलामेंट्स और फाइब्रोनेक्टिन का वर्णन करने वाली छवियों से विभिन्न चरों की मात्रा निर्धारित करने के लिए किया गया था; इसी मूल्यों के साथ-साथ संगठन और ज्यामिति मापदंडों को डेटा फ़ाइलों में स्वचालित रूप से सहेजा गया था।
सेल लाइनें
सभी नमूना डेटा सेल लाइनों पर अधिक व्यापक प्रलेखन पूर्वप्रकाशनों 20में पाया जा सकता है । संक्षेप में वर्णन करने के लिए, डेटा संग्रह को मंजूरी दे दी गई थी और यूसी इरविन इंस्टीट्यूशनल रिव्यू बोर्ड (आईआरबी # 2014-1253) के अनुसार सूचित सहमति दी गई थी। मानव फाइब्रोब्लास्ट कोशिकाओं को लैमिन ए/सी(एलएमएनए)जीन उत्परिवर्तन के विभिन्न विविधताओं के तीन परिवारों से एकत्र किया गया: हेटेरोजिगौस एलएमएना स्प्लिस-साइट उत्परिवर्तन (c.357-2A>G)22 (परिवार ए); LMNA बकवास उत्परिवर्तन (c.736 सीएंडटी, pQ246X) एक्सोन 423 (परिवार बी) में; और LMNA गलत अर्थ उत्परिवर्तन (c.1003C>t, pR335W) एक्सोन ६२४ (परिवार सी) में । प्रत्येक परिवार के अन्य व्यक्तियों से संबंधित उत्परिवर्तन-नकारात्मक नियंत्रण के रूप में फाइब्रोब्लास्ट कोशिकाओं को भी एकत्र किया गया था, जिसे “नियंत्रण” के रूप में जाना जाता है, और अन्य को असंबंधित उत्परिवर्तन-नकारात्मक नियंत्रण के रूप में खरीदा गया था, जिसे “दानदाता” के रूप में जाना जाता है। एक सकारात्मक नियंत्रण के रूप में, हचिनसन-ग्लिफोर्ड प्रोजेरिया (एचजीपीएस) के साथ एक व्यक्ति से फाइब्रोब्लास्ट कोशिकाओं को खरीदा गया था और एक 8 वर्षीय महिला रोगी से ली गई त्वचा बायोप्सी से उगाया गया था, जिसमें एचजीपीएस के साथ एलएमएनए G608G पॉइंट म्यूटेशन25था । कुल मिलाकर, 22 व्यक्तियों से फाइब्रोब्लास्ट का परीक्षण किया गया और इस काम में डेटा के रूप में उपयोग किया गया।
डेटा प्रकार
फाइब्रोब्लास्ट डेटा दो श्रेणियों में से एक में गिर गया: सेलुलर न्यूक्लिकी चर (यानी, डिस्मॉर्फिक नाभिक का प्रतिशत, नाभिक का क्षेत्र, नाभिक सनक का क्षेत्र)20 या संरचनात्मक चर ओरिएंटेशनल ऑर्डर पैरामीटर (ओओपी)21,26,27 (यानी, ऐक्टिन ओओपी, फाइब्रोनेक्टिन ओओपी, न्यूक्लिकओओपी) से उपजी। यह पैरामीटर सभी अभिविन्यास वेक्टर के मीन ऑर्डर टेंपर के अधिकतम ईजेनवैल्यू के बराबर है, और इसे पिछले प्रकाशनों26,28में विस्तार से परिभाषित किया गया है। इन मूल्यों को विभिन्न प्रकार की संभावित संरचनाओं में एकत्रित किया जाता है, जैसे आयु के खिलाफ मूल्य, लिंग, रोग की स्थिति, कुछ लक्षणों की उपस्थिति आदि। इन चरों का उपयोग कैसे किया जाता है, इसके उदाहरण परिणाम अनुभाग में पाए जा सकते हैं।
उदाहरण कोड और फ़ाइलें
ऊपर दिए गए डेटा के आधार पर उदाहरण कोड और अन्य फाइलों को इस पेपर के साथ डाउनलोड किया जा सकता है, और उनके नाम और प्रकार तालिका 1में संक्षेप में दिए जाते हैं।
प्रोटोकॉल की तकनीकी चर्चा
डेटाबेस के उपयोग पर विचार करते समय पहला कदम यह मूल्यांकन करना है कि डेटा को ऐसे संगठन से लाभ होगा या नहीं।
अगला आवश्यक कदम एक स्वचालित कोड बनाना है जो उपयोगक?…
The authors have nothing to disclose.
इस काम को राष्ट्रीय हृदय, फेफड़े और रक्त संस्थान द्वारा राष्ट्रीय स्वास्थ्य संस्थानों में, अनुदान संख्या R01 HL129008 द्वारा समर्थित है। लेखक विशेष रूप से अध्ययन में उनकी भागीदारी के लिए LMNA जीन उत्परिवर्तन परिवार के सदस्यों का शुक्रिया अदा करते हैं । हम भी सेल संस्कृति के साथ उसकी सहायता के लिए लिंडा मैककार्थी शुक्रिया अदा करना चाहते है और प्रयोगशाला रिक्त स्थान को बनाए रखने, सेल इमेजिंग और नाभिक डेटा विश्लेषण में उसकी भागीदारी के लिए Nasam Chokr, और माइकल ए Grosberg हमारे प्रारंभिक माइक्रोसॉफ्ट का उपयोग डेटाबेस की स्थापना के साथ ही अंय तकनीकी सवालों का जवाब देने के साथ अपनी प्रासंगिक सलाह के लिए ।
4',6'-diaminodino-2-phenylinodole (DAPI) | Life Technologies, Carlsbad, CA | ||
Alexa Fluor 488 Phalloidin | Life Technologies, Carlsbad, CA | ||
Alexa Fluor 750 goat anti-rabbit | Life Technologies, Carlsbad, CA | ||
digital CCD camera ORCAR2 C10600-10B | Hamamatsu Photonics, Shizuoka Prefecture, Japan | ||
fibronectin | Corning, Corning, NY | ||
IX-83 inverted motorized microscope | Olympus America, Center Valley, PA | ||
Matlab R2018b | Mathworks, Natick, MA | ||
MS Access | Microsoft, Redmond, WA | ||
paraformaldehyde (PFA) | Fisher Scientific Company, Hanover Park, IL | ||
polycloncal rabbit anti-human fibronectin | Sigma Aldrich Inc., Saint Louis, MO | ||
polydimethylsiloxane (PDMS) | Ellsworth Adhesives, Germantown, WI | ||
Prolong Gold Antifade | Life Technologies, Carlsbad, CA | ||
rectangular glass coverslips | Fisher Scientific Company, Hanover Park, IL | ||
Triton-X | Sigma Aldrich Inc., Saint Louis, MO |