Summary
हम स्वचालित रूप से और सही ढंग से पता लगाने गिनती, और अपनी उड़ान की ध्वनि पर आधारित कीड़े उड़ान वर्गीकृत करने के लिए सस्ती, noninvasive छद्म ध्वनिक ऑप्टिकल सेंसर का उपयोग करता है कि एक प्रणाली का प्रस्ताव रखा.
Abstract
सही रूप में उड़ान कीड़े वर्गीकृत सकता है कि एक सस्ती, noninvasive प्रणाली कीट विज्ञानी अनुसंधान के लिए महत्वपूर्ण प्रभाव है, और दोनों चिकित्सा और कृषि कीट विज्ञान के लिए वेक्टर और कीट नियंत्रण में कई उपयोगी अनुप्रयोगों के विकास के लिए अनुमति होगी. यह देखते हुए, पिछले साठ वर्षों से इस कार्य के लिए समर्पित कई शोध प्रयासों को देखा है. तिथि करने के लिए, हालांकि, इस शोध में से कोई एक स्थायी प्रभाव पड़ा है. इस काम में, हम छद्म ध्वनिक ऑप्टिकल सेंसर बेहतर डेटा का उत्पादन कर सकते हैं कि दिखाने; अतिरिक्त सुविधाओं, दोनों आंतरिक और कीट की उड़ान व्यवहार के लिए बाह्य कि, कीट वर्गीकरण में सुधार करने के लिए इस्तेमाल किया जा सकता है; एक Bayesian वर्गीकरण दृष्टिकोण कुशलतापूर्वक ढाले खत्म करने में बहुत मजबूत हैं कि वर्गीकरण मॉडल जानने के लिए अनुमति देता है, और कि एक सामान्य वर्गीकरण ढांचे आसानी सुविधाओं का मनमाना संख्या को शामिल करने की अनुमति देता है. हम सब पिछले कार्यों combi बौना कि बड़े पैमाने पर प्रयोग के साथ निष्कर्षों का प्रदर्शननेड, कीड़ों की संख्या और माना प्रजातियों की संख्या से मापा.
Introduction
स्वचालित रूप से अपनी उड़ान का आकस्मिक ध्वनि का प्रयोग कीड़ों को वर्गीकृत करने का विचार जल्द से जल्द कंप्यूटर के दिनों और व्यावसायिक रूप से उपलब्ध ऑडियो रिकॉर्डिंग उपकरण 1 के लिए तारीखें. हालांकि, कम प्रगति हस्तक्षेप दशकों में इस समस्या पर किया गया है. इस खोज में प्रगति की कमी के कई संबंधित कारकों को जिम्मेदार ठहराया जा सकता है.
सबसे पहले, प्रभावी सेंसर की कमी डेटा संग्रह मुश्किल बना दिया है. डेटा एकत्र करने के लिए अधिकांश प्रयासों ध्वनिक माइक्रोफोन 2-5 का इस्तेमाल किया है. इस तरह के उपकरणों बहुत विरल और कम गुणवत्ता वाले डेटा, जिसके परिणामस्वरूप वातावरण में शोर और परिवेश शोर हवा के लिए अत्यंत संवेदनशील हैं.
दूसरा, इन आंकड़ों की गुणवत्ता के मुद्दों समझौता कई शोधकर्ताओं बहुत जटिल वर्गीकरण मॉडल, विशेष रूप से तंत्रिका नेटवर्क 6-8 जानने का प्रयास किया है कि तथ्य यह है. उदाहरण के एक मात्र दसियों के साथ, जटिल वर्गीकरण मॉडल जानने के लिए प्रयास कर रहा है,अधिक फिटिंग के लिए एक नुस्खा है.
तीसरा, प्राप्त डेटा की तकलीफ कई शोधकर्ताओं 300 उदाहरणों 9 या उससे कम के रूप में कुछ के रूप में, बहुत सीमित डेटा के साथ वर्गीकरण मॉडल का निर्माण करने का प्रयास किया है कि मतलब है. हालांकि, यह सही वर्गीकरण मॉडल के निर्माण के लिए, अधिक डेटा 10-13 बेहतर है कि जाना जाता है.
इस काम के लिए सभी तीन मुद्दों के पते. ऑप्टिकल (बल्कि ध्वनिक से) सेंसर शोर और परिवेश लगता है हवा के लिए पूरा invariance के साथ, दूर मीटर से कीट उड़ान की "" ध्वनि रिकॉर्ड करने के लिए इस्तेमाल किया जा सकता है. इन सेंसरों लेबल प्रशिक्षण उदाहरणों, सभी संयुक्त पिछले प्रयासों की तुलना में कहीं अधिक डेटा के लाखों लोगों की रिकॉर्डिंग की अनुमति दी, और इस तरह कि त्रस्त है पर ढाले पिछले अनुसंधान के प्रयासों से बचने में मदद की है. कि नीचे दिखाया गया है एक सैद्धांतिक विधि वर्गीकरण मॉडल में अतिरिक्त जानकारी के समावेश की अनुमति देता है. यह अतिरिक्त जानकारी दैनिक के रूप में और के रूप में हो सकता हैसमय के दिन के रूप में करने वाली प्राप्त आसान, अभी तक अभी भी मॉडल की सटीकता में महत्वपूर्ण लाभ का उत्पादन. अंत में, यह हम एकत्र डेटा की भारी मात्रा में अमेरिका, सरल, सटीक और मजबूत classifiers निर्माण करने के लिए "डेटा के अनुचित प्रभाव को" 10 का लाभ लेने के लिए अनुमति है कि प्रदर्शन किया है.
संक्षेप में, उड़ान कीट वर्गीकरण अनुसंधान प्रयोगशाला में बनाया संदिग्ध दावों से परे चला गया और अब वास्तविक दुनिया तैनाती के लिए तैयार है. इस काम में प्रस्तुत सेंसर और सॉफ्टवेयर दुनिया भर में अपने अनुसंधान में तेजी लाने के लिए मजबूत उपकरण के शोधकर्ताओं प्रदान करेगा.
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1 कीट कॉलोनी और पालन
- मच्छर कालोनी और पालन
- जंगली से उत्पन्न जो रियर क्युलेक्स tarsalis, क्युलेक्स quinquefasciatus, क्युलेक्स stigmatosoma, और प्रयोगशाला कालोनियों से एडीज एजिप्टी वयस्कों, व्यक्तियों को पकड़ लिया.
- मानक प्रयोगशाला परिस्थितियों में तामचीनी धूपदान में रियर मच्छर लार्वा (27 डिग्री सेल्सियस, 16: 8 घंटा लाइट: 1 घंटा गोधूलि बेला / भोर समय के साथ अंधेरे [एलडी] चक्र), और जमीन कृंतक चाउ के मिश्रण पर उन्हें यथेच्छ खिलाने और शराब बनानेवाला है खमीर (3: 1, वी वी).
- 200 मिलीलीटर कप में मच्छर pupae लीजिए, और प्रयोगात्मक कक्षों में उन्हें जगह है. वैकल्पिक रूप से, उद्भव के 1 सप्ताह के भीतर प्रयोगात्मक कक्षों में वयस्क मच्छर aspirate. प्रत्येक प्रयोगात्मक चैम्बर एक ही प्रजाति / सेक्स के 20 से 40 व्यक्तियों में शामिल है सुनिश्चित करें.
- एक 10% sucrose और पानी के मिश्रण पर फ़ीड वयस्क मच्छरों यथेच्छ. खाद्य साप्ताहिक बदलें.
- पीएल एक सप्ताह में दो बार कपास तौलिए को गीला औरपिंजरे के भीतर नमी बनाए रखने के लिए प्रयोगात्मक कक्षों के शीर्ष पर उन्हें इक्का. इसके अलावा, समग्र नमी का स्तर बनाए रखने में मदद करने के लिए हर समय कक्ष में नल के पानी के 200 मिलीलीटर कप जगह है.
- 8 घंटा प्रकाश: एक 16 पर प्रयोगात्मक कक्षों बनाए रखने के अंधेरे [एलडी] चक्र, 20.5-22 डिग्री सेल्सियस और 30-50% आरएच प्रयोग की अवधि के लिए.
- हाउस उड़ना और फल मक्खी कॉलोनी और पालन
- जंगली से ली गई एक प्रयोगशाला कॉलोनी से रियर Musca domestica, व्यक्तियों को पकड़ लिया. प्रयोगात्मक कक्षों में जंगली ड्रोसोफिला simulans व्यक्तियों और पीछे उन्हें पकड़ो.
- मानक प्रयोगशाला परिस्थितियों में प्लास्टिक के टब में रियर Musca domestica लार्वा (12:12 घंटे प्रकाश: अंधेरे [एलडी] चक्र, 26 डिग्री सेल्सियस, 40% आरएच) पानी, चोकर भोजन, अल्फला, खमीर, और पाउडर दूध के मिश्रण में. एक पालन कक्ष में रियर ड्रोसोफिला simulans लार्वा और सड़ के मिश्रण पर उन्हें यथेच्छ खिलानेफल.
- उद्भव के 1 सप्ताह के भीतर प्रयोगात्मक कक्षों में महाप्राण वयस्क Musca domestica. वयस्क ड्रोसोफिला simulans सीधे प्रयोगात्मक कक्षों में पाला जा सकता है. डेटा संग्रह से पहले, प्रत्येक प्रयोगात्मक चैम्बर से अधिक 10-15 व्यक्ति Musca domestica या 20-30 व्यक्ति ड्रोसोफिला simulans नहीं होता है सुनिश्चित करें.
- पानी के लिए स्वतंत्र पहुँच के साथ, चीनी और कम वसा वाले सूखे दूध का एक मिश्रण पर वयस्क Musca domestica यथेच्छ फ़ीड. फल सड़ के मिश्रण पर फ़ीड वयस्क ड्रोसोफिला simulans यथेच्छ. खाद्य साप्ताहिक बदलें.
- 8 घंटा प्रकाश: एक 16 पर प्रयोगात्मक कक्षों बनाए रखने के अंधेरे [एलडी] चक्र, 20.5-22 डिग्री सेल्सियस और 30-50% आरएच प्रयोग की अवधि के लिए.
प्रायोगिक मंडलों में 2 रिकॉर्ड फ्लाइंग ध्वनि
- प्रायोगिक कक्ष सेटअप
नोट: एक "प्रयोगात्मक सीhamber "डेटा दर्ज की गई थी, जिसमें हमारी प्रयोगशाला में बनाया गया पिंजरे, अर्थ. सेंसर काफी सस्ती है. थोक में बनाया गया है, एक सेट अप कम से कम $ 10 के लिए निर्मित किया जा सकता है.- 67 सेमी एल एक्स 22 सेमी डब्ल्यू एक्स 24.75 सेमी एच, या छोटे आकार: 30 सेमी एल एक्स 20 सेमी डब्ल्यू एक्स 20 सेमी एच प्रायोगिक कक्ष एक phototransistor सरणी और एक के होते हैं एक प्रायोगिक कक्ष, बड़े आकार का या तो निर्माण phototransistor सरणी तरफ इशारा करते हुए लेजर लाइन.
नोट: इसके अलावा, चैम्बर सेंसर तंत्र के साथ ही कीड़ों के लिए उपयोग की अनुमति के लिए पीवीसी पाइपिंग के एक टुकड़े से जुड़ी एक आस्तीन शामिल करने के लिए संशोधित कर रहे हैं कि Kritter रखवाले होते हैं. - एक इलेक्ट्रॉनिक बोर्ड को phototransistor सरणी कनेक्ट करें. इलेक्ट्रॉनिक बोर्ड के उत्पादन में एक डिजिटल साउंड रिकॉर्डर में फ़ीड और एमपी 3 प्रारूप में ऑडियो डेटा के रूप में दर्ज की गई है. चित्रा 1.II में सेंसर और चित्रा 1.I में चैंबर के एक भौतिक संस्करण का तर्क डिजाइन देखें.
नोट: एक कीट लेजर बीम के पार मक्खियों, अपने पंख आंशिक रूप से, प्रकाश रोक देना छोटे प्रकाश में उतार चढ़ाव के कारण. प्रकाश उतार चढ़ाव वर्तमान में परिवर्तन के रूप में phototransistor सरणी द्वारा कब्जा कर रहे हैं, और संकेत इलेक्ट्रॉनिक बोर्ड बनाया गया कस्टम द्वारा फ़िल्टर और परिलक्षित होता है. - 67 सेमी एल एक्स 22 सेमी डब्ल्यू एक्स 24.75 सेमी एच, या छोटे आकार: 30 सेमी एल एक्स 20 सेमी डब्ल्यू एक्स 20 सेमी एच प्रायोगिक कक्ष एक phototransistor सरणी और एक के होते हैं एक प्रायोगिक कक्ष, बड़े आकार का या तो निर्माण phototransistor सरणी तरफ इशारा करते हुए लेजर लाइन.
- एक बिजली की आपूर्ति करने के लिए प्रायोगिक कक्ष कनेक्ट करें. सत्ता पर बारी.
- प्रायोगिक कक्ष पर, लेजर लाइट और photoarray हैं. Photoarray के लिए लेजर लाइट संरेखित करें. लेज़र प्रकाश सभी व्यक्तिगत photodiod पर केंद्रित है जब तक चैम्बर के इंटीरियर पर photoarray से जुड़ी मैग्नेट के अनुरूप जो प्रायोगिक कक्ष के बाहर पर चुंबक का उपयोग photoarray समायोजित, उचित संरेखण को प्राप्त करने के लिएतों.
- सिस्टम ठीक से स्थापित है सुनिश्चित करने के लिए दो विवेक जाँच प्रदर्शन करना.
नोट: पहला कदम प्रणाली, सभी तारों को ठीक से जुड़े हुए हैं संचालित है और लेजर फोटो सरणी पर इशारा कर रहा है कि यह सुनिश्चित करना है. दूसरा कदम यह कीड़े 'wingbeats की ध्वनि पर कब्जा कर सकते हैं सुनिश्चित करने के लिए लेजर संरेखण पर आगे की जाँच का संचालन करने के लिए है.- ऑडियो जैक में (बल्कि रिकॉर्डर से) headphones प्लग. लेज़र प्रकाश के विमान को तोड़ने के लिए, photoarray के पास, में और प्रायोगिक कक्ष के बाहर हाथ डुबकी. यकीन लेज़र प्रकाश पर है (यह प्रकाश की एक लाल किरण) हो जाएगा और आप अपने हाथ के साथ प्रकाश का विमान एक बार कुछ तोड़ने कि. आपके हाथ में है और प्रकाश किरण के बाहर चला जाता है के रूप में शोर स्तर में परिवर्तन के लिए सुनो. आप एक श्रव्य अंतर का पता लगा, तो सेंसर बड़ी वस्तुओं के आंदोलन द्वारा उत्पादित लगता है पर कब्जा करने में सक्षम है. यदि सफल, हेड फोन्स ठीक से जुड़ा हुआ है अगर जाँच, अन्यथा, अगले मानसिक स्वास्थ्य की जांच के लिए आगे बढ़ना औरलेजर photoarray पर इशारा कर रहा है या नहीं. हाथ की आवाज में और प्रायोगिक कक्ष से बाहर जाने को सुना जा सकता है उसके अनुसार जब तक photoarray समायोजित करें.
- एक स्वचालित टूथब्रश के लिए बिजली के तारों की एक पतली टुकड़ा देते. टूथब्रश पर मुड़ें, और में और phototarray के करीब प्रायोगिक कक्ष के बाहर तारों डुबकी. यह कदम के रूप में लेजर प्रकाश तारों का टुकड़ा मार रहा है सुनिश्चित करें. आप आवृत्ति में एक श्रव्य परिवर्तन का पता लगाने यदि तारों का टुकड़ा लेजर प्रकाश के विमान जाती है,, सिस्टम तो यानी छोटे वस्तुओं,, कीट ध्वनियों का आंदोलन द्वारा उत्पादित लगता है पर कब्जा करने के लिए तैयार है. आप एक श्रव्य अंतर का पता नहीं है, तो लेजर लाइट और photoarray फिर से संरेखित करने के लिए 2.2.2 कदम को वापस जाओ.
- सिस्टम ठीक से स्थापित है, के बाद ढक्कन बंद और कीड़े जोड़ने.
- रिकॉर्डर ऑन करें और एक voic बनानेनिम्नलिखित जानकारी शामिल है कि ई एनोटेशन: प्रायोगिक कक्ष में प्रजातियों के नाम, कीड़े, तारीख और समय, वर्तमान परिवेश आरटी, और सापेक्ष आर्द्रता की उम्र. रिकॉर्डिंग रोकें.
- ऑडियो केबल के माध्यम से, सिस्टम को रिकॉर्डर कनेक्ट, और रिकॉर्डिंग फिर से शुरू. फिर रिकॉर्डिंग बंद करो, 3 दिन के लिए रिकॉर्ड करने के लिए रिकॉर्डर छोड़ दें.
- एक पीसी पर एक नया फ़ोल्डर में रिकॉर्डर से डेटा डाउनलोड करें. डेटा को हटा कर रिकॉर्डर खाली.
- शेष कीड़े बंद मारे गए हैं और पिंजरे में जीवित छोड़ दिया और अधिक से अधिक 5 कीड़े नहीं कर रहे हैं, जब तक ऊपर रिकॉर्डिंग प्रक्रिया को दोहराएं.
3 सेंसर डाटा प्रोसेसिंग और कीड़े उड़ान द्वारा उत्पादित ध्वनि की जांच
- फ्लाइंग कीड़ों द्वारा उत्पादित ध्वनि का पता लगाने के लिए सॉफ्टवेयर का उपयोग करें.
नोट: सॉफ्टवेयर (पता लगाने एल्गोरिथ्म) वास्तविक समय की तुलना में बहुत तेजी से होता है. यह डैट यानी, तीन दिन, एक रिकॉर्डिंग सत्र की प्रक्रिया को कम से कम 3 घंटा लेता हैएक, 2.00 गीगा और 8 जीबी रैम में इंटेल (नि.) कोर ™ सीपीयू के साथ एक मानक मशीन पर.- एक रिकॉर्डिंग सत्र से डेटा युक्त प्रत्येक फ़ोल्डर के लिए, कीट ध्वनियों का पता लगाने के लिए खोज सॉफ़्टवेयर चलाते हैं. सॉफ्टवेयर, खुला MATLAB चलाने, और DATADIR रिकॉर्डिंग डेटा की निर्देशिका है जहां कमांड विंडो में "circandian_wbf (DATADIR)", टाइप करें. फिर शुरू करने के लिए "Enter" दबाएँ.
नोट: संदर्भ # 16 से खोज सॉफ़्टवेयर circadian_wbf डाउनलोड. - एल्गोरिथ्म समाप्त हो जाता है, जब तक फिर पता लगाने के परिणामों की जांच रुको. एल्गोरिथ्म outputs के सभी का पता चला कीट DATADIR पिछले चरण की तरह ही है जहां "DATADIR _extf" नाम का एक नया फ़ोल्डर में लगता है. प्रत्येक ध्वनि फ़ाइल एक डिजिटल फिल्टर शोर को दूर करने के लिए आवेदन के साथ मूल कच्चे रिकॉर्डिंग से निकाले एक 1 सेकंड लंबे ऑडियो क्लिप है. प्रत्येक पता चला ध्वनि की घटना के समय "DATADIR _time.mat और नाम की कोई फ़ाइल में सहेजा जाता है# 8221 ;. चित्रा 2 में एक का पता चला कीट ध्वनि के उदाहरण पर गौर करें.
- एक रिकॉर्डिंग सत्र से डेटा युक्त प्रत्येक फ़ोल्डर के लिए, कीट ध्वनियों का पता लगाने के लिए खोज सॉफ़्टवेयर चलाते हैं. सॉफ्टवेयर, खुला MATLAB चलाने, और DATADIR रिकॉर्डिंग डेटा की निर्देशिका है जहां कमांड विंडो में "circandian_wbf (DATADIR)", टाइप करें. फिर शुरू करने के लिए "Enter" दबाएँ.
- पता लगाने एल्गोरिथ्म
- रिकॉर्डिंग के माध्यम से स्लाइड करने के लिए एक 0.1 सेकंड लंबी रपट खिड़की का प्रयोग करें. स्लाइडिंग खिड़की रिकॉर्डिंग की शुरुआत से शुरू होता है. प्रत्येक विंडो के लिए, नीचे दिए गए चरणों का पालन करें.
- वर्तमान विंडो के मौलिक आवृत्ति की गणना.
- मौलिक आवृत्ति 100 हर्ट्ज हर्ट्ज 1200 तक की सीमा के भीतर है, तो निम्न कार्य करें:
- रिकॉर्डिंग से चालू खिड़की पर केंद्रित 1 सेक लंबे ऑडियो क्लिप निकालें; क्लिप में शोर को दूर करने और फ़ोल्डर "DATADIR _extf" में फ़िल्टर्ड ऑडियो को बचाने के लिए एक डिजिटल फिल्टर लागू होते हैं.
- फ़ाइल "DATADIR _time" में वर्तमान विंडो की घटना के समय की बचत करें.
- तुरंत निकाले ऑडियो क्लिप इस प्रकार है कि बात करने के फिसलने ले जाएँ.
- मौलिक fr हैंequency 100 हर्ट्ज हर्ट्ज 1200 तक की सीमा के भीतर, बस आगे फिसलने खिड़की 0.01 सेकंड कदम नहीं है.
- स्लाइडिंग खिड़की रिकॉर्डिंग के अंत तक पहुँच जब तक प्रक्रिया को दोहराएं.
- रिकॉर्डिंग के माध्यम से स्लाइड करने के लिए एक 0.1 सेकंड लंबी रपट खिड़की का प्रयोग करें. स्लाइडिंग खिड़की रिकॉर्डिंग की शुरुआत से शुरू होता है. प्रत्येक विंडो के लिए, नीचे दिए गए चरणों का पालन करें.
4 कीट वर्गीकरण
- बस फ्लाइंग ध्वनि का प्रयोग Bayesian वर्गीकरण
नोट: Bayesian वर्गीकारक अपने सबसे संभावित वर्ग के लिए एक वस्तु का वर्गीकरण कि एक संभाव्य वर्गीकारक है.- ध्वनि फ़ीचर संगणना
- प्रत्येक कीट ध्वनि के लिए, अलहदा फूरियर रूपांतरण का उपयोग कर ध्वनि (DFT) की आवृत्ति स्पेक्ट्रम की गणना. आवृत्ति रेंज के लिए इसी केवल उन डेटा बिंदुओं को शामिल करने की आवृत्ति स्पेक्ट्रम काटना: 100 हर्ट्ज हर्ट्ज से 2,000. छोटा आवृत्ति स्पेक्ट्रम तो कीट ध्वनि की "प्रतिनिधि" के रूप में वर्गीकरण में प्रयोग किया जाता है.
नोट: DFT आवृत्ति डोमेन के लिए समय क्षेत्र में संकेत बदल देती है कि एक एल्गोरिथ्म है. यह एक bui हैलेफ्टिनेंट में सबसे प्रोग्रामिंग पुस्तकालयों में समारोह, और कोड की सिर्फ एक लाइन के साथ कार्यक्रम में कहा जा सकता है.
- प्रत्येक कीट ध्वनि के लिए, अलहदा फूरियर रूपांतरण का उपयोग कर ध्वनि (DFT) की आवृत्ति स्पेक्ट्रम की गणना. आवृत्ति रेंज के लिए इसी केवल उन डेटा बिंदुओं को शामिल करने की आवृत्ति स्पेक्ट्रम काटना: 100 हर्ट्ज हर्ट्ज से 2,000. छोटा आवृत्ति स्पेक्ट्रम तो कीट ध्वनि की "प्रतिनिधि" के रूप में वर्गीकरण में प्रयोग किया जाता है.
- एक Bayesian क्लासिफायरफ़ाइल ट्रेन
- ध्वनि सुविधा का उपयोग कर पीछे संभावना वितरण जानने के लिए KNN घनत्व आकलन दृष्टिकोण 14 का प्रयोग करें. KNN दृष्टिकोण के साथ, प्रशिक्षण चरण एक प्रशिक्षण डाटासेट बनाने की है.
- बेतरतीब ढंग से कीड़े की एक प्रजाति के लिए एकत्र किए गए आंकड़ों से कीट लगता है की एक संख्या का नमूना.
- धारा 4.1.1 में चरणों का पालन करें और प्रत्येक नमूना ध्वनि के लिए छोटा आवृत्ति स्पेक्ट्रम की गणना. नमूने को एक साथ 'वर्ग लेबल (कीड़ों की प्रजाति का नाम) के साथ छोटा स्पेक्ट्रम प्रशिक्षण डाटासेट बना.
- ध्वनि सुविधा का उपयोग कर पीछे संभावना वितरण जानने के लिए KNN घनत्व आकलन दृष्टिकोण 14 का प्रयोग करें. KNN दृष्टिकोण के साथ, प्रशिक्षण चरण एक प्रशिक्षण डाटासेट बनाने की है.
- एक अज्ञात कीट वर्गीकृत करने के लिए Bayesian क्लासिफायरफ़ाइल का प्रयोग करें
- अज्ञात कीट ध्वनि का छोटा आवृत्ति स्पेक्ट्रम कंप्यूट.
- Unknow का छोटा स्पेक्ट्रम के बीच इयूक्लिडियन दूरी की गणनाn वस्तु और प्रशिक्षण डाटासेट में सभी काट स्पेक्ट्रम.
- शीर्ष कश्मीर (इस पत्र में कश्मीर = 8) प्रशिक्षण डाटासेट में अज्ञात वस्तु का निकटतम पड़ोसी का पता लगाएं. वर्ग के रूप में चिह्नित कर रहे हैं जो शीर्ष कश्मीर निकटतम पड़ोसियों के अंश के रूप में एक वर्ग से संबंधित अज्ञात कीट ध्वनि के पीछे संभावना कंप्यूट.
- उच्चतम पीछे संभावना है कि कक्षा में अज्ञात वस्तु को वर्गीकृत.
- ध्वनि फ़ीचर संगणना
- कीट circadian ताल: क्लासिफायरफ़ाइल के लिए एक सुविधा जोड़ने
- , कीड़े की एक प्रजाति के लिए circadian ताल है कि कीट ध्वनि की घटना के समय, के वर्ग वातानुकूलित वितरण जानें.
- पता लगाने के परिणामों से प्रत्येक ध्वनि (CF धारा 3.2) की घटना के समय प्राप्त करते हैं.
- प्रत्येक प्रजाति के लिए, कीट ध्वनि घटना के समय की एक हिस्टोग्राम का निर्माण.
- हिस्टोग्राम के क्षेत्र से एक है कि इतना हिस्टोग्राम मानक के अनुसार. सामान्यized हिस्टोग्राम दी प्रजातियों के circadian ताल है. यह एक निश्चित समय अवधि के भीतर उड़ान में, कि प्रजातियों में से, एक कीट देख की संभावना बताता है.
- "कीट ध्वनि" और circadian ताल के संयोजन के द्वारा एक अज्ञात "कीट ध्वनि" वर्गीकृत
- अज्ञात कीट ध्वनि हुई जिसमें समय में विशिष्ट बिंदु को देखते हुए कक्षा की circadian ताल पर आधारित वर्ग की एक कीट देख की संभावना प्राप्त करते हैं.
नोट: circadian ताल एक प्रायिकता वितरण है. यह दिन के एक विशिष्ट समय में कीड़े की एक विशेष प्रजाति द्वारा उत्पादित एक ध्वनि, पता लगाने की संभावना को निर्दिष्ट एक सरणी है. एक समय दिया जाता है तो एक बार, एक बस संभावना पाने के लिए सरणी की जांच कर सकते हैं. - अज्ञात ध्वनि ध्वनि सुविधाओं का उपयोग वर्ग के अंतर्गत आता है कि पीछे संभावना गणना करने के लिए खंड 4.1.2 में चरणों का पालन करें. Fro परिणामों के पीछे संभावना गुणानई पीछे संभावना पाने के लिए पिछले चरण हूँ.
- उच्चतम नए पीछे संभावना है कि वर्ग के लिए "अज्ञात" ध्वनि बाँटिए.
- अज्ञात कीट ध्वनि हुई जिसमें समय में विशिष्ट बिंदु को देखते हुए कक्षा की circadian ताल पर आधारित वर्ग की एक कीट देख की संभावना प्राप्त करते हैं.
- , कीड़े की एक प्रजाति के लिए circadian ताल है कि कीट ध्वनि की घटना के समय, के वर्ग वातानुकूलित वितरण जानें.
- क्लासिफायरफ़ाइल के लिए एक और सुविधा जोड़ने: कीट भौगोलिक वितरण
- ब्याज की, या तो ऐतिहासिक रिकॉर्ड में प्रकाशित डेटा, प्रासंगिक साहित्य से प्रजातियों की भौगोलिक वितरण जानें, या बस क्षेत्र तकनीशियन / जीव से पहले हाथ ज्ञान इकट्ठा होते हैं. 7 चित्र में दिखाया के रूप में प्रदर्शन प्रयोजनों के लिए, ग्राफिक वितरण का अनुकरण का उपयोग करें.
- "उड़ान" ध्वनि और दो अतिरिक्त सुविधाओं का उपयोग कर एक "अज्ञात कीट ध्वनि" वर्गीकृत.
- कीट ध्वनि पकड़ा गया था जहां भौगोलिक स्थिति को देखते हुए, प्रजातियों के ग्राफिक वितरण का उपयोग उस विशिष्ट स्थान पर वर्ग से एक कीट देख की संभावना की गणना.
- खंड 4.2.2 एक में चरणों का पालन करेंएन डी "अज्ञात" ध्वनि ध्वनि सुविधाओं और circadian लय का उपयोग वर्ग के अंतर्गत आता है कि पीछे संभावना की गणना. नई पीछे संभावना प्राप्त करने के लिए, पिछले चरण से परिणाम के लिए इस कदम के परिणाम गुणा.
- उच्चतम नए पीछे संभावना है कि वर्ग के लिए "अज्ञात" ध्वनि बाँटिए.
- कीट ध्वनि पकड़ा गया था जहां भौगोलिक स्थिति को देखते हुए, प्रजातियों के ग्राफिक वितरण का उपयोग उस विशिष्ट स्थान पर वर्ग से एक कीट देख की संभावना की गणना.
- सुविधाओं को जोड़ने के लिए एक सामान्य रूपरेखा
- प्राथमिक क्लासिफायरफ़ाइल के रूप में सिर्फ आवाज सुविधाओं का उपयोग करता है कि Bayesian वर्गीकारक पर विचार करें. वर्गीकरण करने के लिए नई सुविधाओं को जोड़ने के लिए नीचे दिए गए चरणों का पालन करें.
- प्रशिक्षण चरण में नई सुविधा के वर्ग वातानुकूलित घनत्व कार्यों सीखना.
- वर्गीकरण चरण में, "अज्ञात" ध्वनि की नई सुविधा को देखते हुए पिछले चरण में सीखा घनत्व कार्यों का उपयोग कर वर्ग में सुविधा देख की संभावना की गणना. जनसंपर्क के लिए नई संभावना गुणासिर्फ अजीब सुविधाओं के आधार पर गणना कर रहे थे जो वर्ग से संबंधित "अज्ञात ध्वनि" के लिए इसी evious पीछे संभावना है, नए पीछे संभावना प्राप्त करने के लिए. उच्चतम नए पीछे संभावना है कि कक्षा में अज्ञात वस्तु को वर्गीकृत.
- प्राथमिक क्लासिफायरफ़ाइल के रूप में सिर्फ आवाज सुविधाओं का उपयोग करता है कि Bayesian वर्गीकारक पर विचार करें. वर्गीकरण करने के लिए नई सुविधाओं को जोड़ने के लिए नीचे दिए गए चरणों का पालन करें.
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
दो प्रयोगों यहां प्रस्तुत कर रहे हैं. दोनों प्रयोगों के लिए, इस्तेमाल किया डेटा बेतरतीब ढंग से 100,000 से अधिक वस्तुओं में शामिल है कि एक डाटासेट से जांचा गया.
पहला प्रयोग सही ढंग से कीड़ों की विभिन्न प्रजातियों / लिंगों वर्गीकृत करने के लिए प्रस्तावित वर्गीकारक की क्षमता को दर्शाता है. वर्गीकरण सटीकता में वर्गीकृत करने के कीड़ों पर निर्भर करता है, वर्गीकरण सटीकता के लिए एक एकल निरपेक्ष मूल्य पाठक प्रणाली के प्रदर्शन के बारे में एक अच्छा अंतर्ज्ञान नहीं देंगे. इसके बजाय, बल्कि कीड़ों की एक निश्चित सेट पर वर्गीकारक की सटीकता रिपोर्टिंग से, वर्गीकारक प्रजातियों में से एक संवर्द्धित बढ़ती संख्या के साथ डेटासेट के लिए लागू किया गया था, और इसलिए वर्गीकरण कठिनाई बढ़ रही है.
डाटासेट कीड़ों की सिर्फ 2 प्रजातियों के साथ शुरू हुआ; तो हर कदम पर, एक और प्रजाति (या एक यौन द्विरूपी प्रजातियों में से एक भी सेक्स) जोड़ा गया था और वर्गीकारक वृद्धि हुई वर्गीकृत करने के लिए इस्तेमाल किया गया थाप्रजातियों की संख्या (नई डाटासेट). कीड़ों के दस वर्गों (के रूप में विभिन्न वर्गों की गिनती एक ही प्रजाति से अलग लिंगों) के कुल प्रत्येक वर्ग में 5000 मिसाल के साथ, पर विचार किया गया.
वर्गीकारक दोनों कीट ध्वनि (आवृत्ति स्पेक्ट्रम) और समय की अवरोधन वर्गीकरण के लिए इस्तेमाल किया. तालिका 1 हर कदम और उस कदम पर गयी प्रासंगिक वर्ग में मापा वर्गीकरण सटीकता से पता चलता है.
तालिका 1 के अनुसार, वर्गीकारक 20% सटीकता के तयशुदा दर की तुलना में काफी अधिक कीड़ों का अधिक से अधिक 5 प्रजातियों को वर्गीकृत जब अधिक से अधिक 96% सटीकता प्राप्त होता है. कक्षाओं की संख्या 10 तक बढ़ जाती है माना जाता है, जब भी वर्गीकरण सटीकता फिर से, 10% की तयशुदा दर की तुलना में काफी अधिक 79% से अधिक कभी नहीं कम है. दस कक्षाएं भी मानव निरीक्षण से, अलग करने के लिए आसान नहीं हैं कि ध्यान दें. दस प्रजातियों के अलावा, उनमें से आठ मच्छरों, बुद्धि हैंज उन्हें एक ही जीनस से होने के छह.
दूसरे प्रयोग प्रणाली विशेष रूप से, कीड़े सेक्स उड़ान कर सकते हैं सही कैसे महिलाओं से पुरुष ऐ. एजिप्टी मच्छरों भेद करने के लिए, दिखाने के लिए है. प्रयोग के पहले भाग के लिए, महिलाओं के रूप में पुरुषों misclassifying की "गलत वर्गीकरण लागत" पुरुषों के रूप में महिलाओं misclassifying की लागत के रूप में ही है कि मान. इस धारणा के साथ, वर्गीकरण परिणाम तालिका 2.I में दिखाए जाते हैं. सेक्स ऐ. एजिप्टी को वर्गीकरण सटीकता के बारे में 99.4% है.
प्रयोग के दूसरे भाग के लिए, लागत, यानी पुरुषों के रूप में महिलाओं का गलत वर्गीकरण और अधिक महंगा रिवर्स से है, असममित नहीं है मान. इस धारणा के साथ, क्लासिफायरफ़ाइल का निर्णय दहलीज उच्च लागत misclassifications की संख्या को कम करने के लिए बदल गया था. सीमा के साथ ठीक से, 2 टेबल में वर्गीकरण परिणाम समायोजित.द्वितीय प्राप्त किया गया. प्रयोग में 2,000 कीड़ों की, बाईस पुरुषों, और शून्य महिलाओं misclassified गया.
चित्रा 1 (मैं) डेटा इकट्ठा करने के लिए इस्तेमाल किया प्रयोगात्मक पिंजरों में से एक. (द्वितीय) एनोटेट घटकों के साथ सेंसर स्थापना के एक तार्किक संस्करण. इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें.
चित्रा 2 (मैं) संवेदक द्वारा उत्पन्न एक "उड़ान कीट ध्वनि" से युक्त एक 1 सेकंड ऑडियो क्लिप का एक उदाहरण है. ध्वनि एक महिला Cx. stigmatosoma द्वारा तैयार की गई थी. INSEसीटी ध्वनि / लाल बोल्ड में प्रकाश डाला है. (द्वितीय) कहीं और 0 से कीट संकेत और गद्दी केंद्रित द्वारा एक 1 सेकंड लंबे ऑडियो क्लिप में साफ और सुरक्षित कर दिया है जो "कीट ध्वनि",. (तृतीय) आवृत्ति स्पेक्ट्रम की अलहदा फूरियर रूपांतरण का उपयोग कर प्राप्त कीट ध्वनि,. इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें.
चित्रा 3 वर्गीकरण के लिए एक भी सुविधा का उपयोग करता है कि एक Bayesian नेटवर्क.
चित्रा 4 classificat के लिए दो स्वतंत्र सुविधाओं का उपयोग करता है कि एक Bayesian नेटवर्क आयन
चित्रा 5 Cx के circadian लय. (महिला) stigmatosoma, Cx. tarsalis (पुरुष), और ऐ. एजिप्टी (महिला), 1 महीने की अवधि से अधिक एकत्र किए गए थे कि संवेदक द्वारा उत्पन्न टिप्पणियों पर आधारित सीखा. इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें.
चित्रा 6 वर्गीकरण के लिए तीन स्वतंत्र सुविधाओं का उपयोग करता है कि एक Bayesian नेटवर्क.
जी "/>
7 चित्रा अनुकरण में प्रत्येक कीट प्रजातियों और सेंसर स्थानों की भौगोलिक वितरण की मान्यताओं वर्गीकरण में स्थान का अवरोधन सुविधा का उपयोग करने के प्रभाव को प्रदर्शित करने के लिए. यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें.
8 चित्रा n एक सकारात्मक पूर्णांक है जहां वर्गीकरण, के लिए एन सुविधाओं का उपयोग करता है कि सामान्य Bayesian नेटवर्क. यह आंकड़ा का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें.
चरण | युक्तिएँ जोड़ा गया | वर्गीकरण शुद्धता | चरण | प्रजाति जोड़ा गया | वर्गीकरण शुद्धता | |
1 | ऐ. एजिप्टी ♂ | लागू नहीं | 6 | CX. quinquefasciatus ♂ | 92.69% | |
2 | MUSCA domestica | 98.99% | 7 | CX. stigmatosoma ♀ | 89.66% | |
3 | ऐ. एजिप्टी ♀ | 98.27% | 8 | CX. tarsalis ♂ | 83.54% | |
4 | CX. stigmatosoma ♂ | 97.31% | 9 | CX. quinquefasciatus ♀ | 81.04% | |
5 | <उन्हें> Cx. tarsalis ♀ | 96.10% | 10 | ड्रोसोफिला simulans | 79.44% |
वर्गों की संख्या में वृद्धि के साथ तालिका 1 वर्गीकरण सटीकता.
भविष्यवाणी की कक्षा | भविष्यवाणी की कक्षा | |||||||
मैं (सममित लागत) | महिला | पुरुष | द्वितीय (असममित लागत) | महिला | पुरुष | |||
वास्तविक वर्ग | महिला | 993 | 7 | वास्तविक वर्ग | महिला | 1000 | 0 | |
पुरुष टीडी> | 5 | 995 | पुरुष | 22 | 978 |
तालिका 2 (मैं) ऐ के लिंग भेदभाव के लिए भ्रम की स्थिति मैट्रिक्स. 0.5 (यानी, एक ही लागत धारणा) पर सेट है महिलाओं के लिए निर्णय दहलीज साथ एजिप्टी मच्छरों. सेक्स (ii) भ्रम मैट्रिक्स एक ही मच्छरों, निर्णय के साथ 0.1 पर सेट महिलाओं के लिए सीमा.
Subscription Required. Please recommend JoVE to your librarian.
Discussion
यहाँ वर्णित सेंसर / वर्गीकरण ढांचे उड़ान कीड़ों की सस्ती और स्केलेबल वर्गीकरण की अनुमति देता है. सिस्टम द्वारा प्राप्त accuracies वाणिज्यिक उत्पादों के विकास की अनुमति के लिए काफी अच्छा कर रहे हैं और कीट विज्ञानी अनुसंधान में एक उपयोगी उपकरण हो सकता है.
सही और स्वचालित रूप से उड़ान कीड़े वर्गीकृत करने के लिए सस्ती, noninvasive सेंसर का उपयोग करने की क्षमता कीट विज्ञानी अनुसंधान के लिए महत्वपूर्ण प्रभाव होगा. उदाहरण के लिए, कीट वैक्टर गिनती और वर्गीकृत करने के लिए क्षेत्र में प्रणाली की तैनाती से, प्रणाली, मलेरिया से निपटने के लिए हस्तक्षेप / दमन कार्यक्रमों की योजना के लिए इस्तेमाल किया जा सकता है कि उत्पादन वास्तविक समय की जानकारी लक्ष्य प्रजातियों की वास्तविक समय मायने रखता है प्रदान कर सकते हैं. इसके अलावा, प्रणाली स्वतः ही सेक्स से कीड़ों को अलग कर सकते हैं, और इस तरह यह मैन्युअल कीड़े sexing की थकाऊ और समय लेने वाला काम से बाँझ कीट तकनीक 15 पर काम कर मुक्त entomologists के लिए इस्तेमाल किया जा सकता है. </ P>
इस प्रणाली का उपयोग में, सबसे महत्वपूर्ण कदम ठीक से डेटा संग्रह के लिए सेंसर स्थापित करने के लिए है. लेजर और फोटो सरणी ठीक से गठबंधन नहीं कर रहे हैं, डेटा बहुत शोर हो जाएगा. कीड़े पिंजरे में रखा जाता है के बाद, फोटो सरणी हमेशा ठीक tuned पिंजरे के बाहर पर चुंबक का उपयोग किया जाना चाहिए. पिंजरों के पास लाइट, कैमरा चमक और कंपन चमकती आंकड़ों के शोर को लागू करेगा कि ध्यान दें. इसलिए, स्वच्छ डेटा प्राप्त एक अंधेरे कमरे में पिंजरे जगह है, और जहां आवश्यक हो, कंपन के स्तर को कम करने के क्रम में पिंजरों के तहत शुष्क तौलिए जगह.
इस काम में प्रस्तुत वर्गीकारक सिर्फ दो अतिरिक्त सुविधाओं का उपयोग किया. हालांकि, वर्गीकरण के प्रदर्शन में सुधार करने में मदद कर सकता है कि अतिरिक्त सुविधाओं के दर्जनों हो सकता है. संभावित सुविधाओं विशिष्ट डोमेन और आवेदन कर रहे हैं, उपयोगकर्ताओं को अपने विशिष्ट की जरूरत है या आवेदन पत्र के आधार पर सुविधाओं का चयन कर सकता है. सीएल के सामान्य रूपरेखाassifier उपयोगकर्ताओं को आसानी से वर्गीकरण के प्रदर्शन में सुधार करने के लिए वर्गीकरण के लिए सुविधाओं को जोड़ने के लिए अनुमति देता है.
हमारे विचारों को अपनाने और विस्तार को प्रोत्साहित करने के लिए, हम यूसीआर कम्प्यूटेशनल कीटविज्ञान पृष्ठ 16-17 पर स्वतंत्र रूप से उपलब्ध सभी कोड, डेटा, और सेंसर schematics बना रहे हैं. इसके अलावा, हमारे बजट की सीमाओं के भीतर, हम एक अनुरोध करता है जो किसी भी अनुसंधान कीटविज्ञानी के लिए (चित्र 1 में दिखाया गया है) एक पूरी प्रणाली देने की हमारी अभ्यास जारी रहेगा.
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
लेखकों वे कोई प्रतिस्पर्धा वित्तीय हितों की है कि घोषणा.
Acknowledgments
हम इस अनुसंधान के वित्तपोषण के लिए वोडाफोन अमेरिका फाउंडेशन, बिल और मेलिंडा गेट्स फाउंडेशन, और साओ पाउलो रिसर्च फाउंडेशन (FAPESP) को धन्यवाद देना चाहूंगा. हम भी इस परियोजना पर उनकी सलाह के लिए, कैलिफोर्निया, रिवरसाइड विश्वविद्यालय में कीट विज्ञान विभाग की ओर से कई संकाय सदस्यों को धन्यवाद देना चाहूंगा.
Materials
Name | Company | Catalog Number | Comments |
Audio recorder: ICD-PX312 | Sony | 4-267-065-11(2) | With a 8 GB microSD extra memory |
Insectary | Lee's Aquarium & Pet Products. | 20088 HerpHaven®, Large Rectangle | 14 1/2" long x 8 3/4" wide x 9 3/4" high. Modified to house insects. |
Laser line generator, 650 nm (red) | Apinex (www.apinex.com) | LN60-650 | 5 mW. This is a low powered laser, similar to a teacher's laser pointer |
Photodiode array | VISHAY SEMICONDUCTOR TEFD4300 PIN PHOTODIODE, 650NM, 20DEG, T1 | TEFD4300 | We made a custom array of 15 of these photodiodes wired in parallel. |
Analogue to digital convertor integrated circuit | Custom made in our lab | We made this item ourselves, but an easily available commercial product, Gino PCF8591 AD/DA Converter, provides the same functionality. |
References
- Kahn, M. C., Celestin, W., Offenhauser, W. Recording of sounds produced by certain disease-carrying mosquitoes. Science. 101 (2622), 335-336 (1945).
- Reed, S. C., Williams, C. M., Chadwick, L. E. Frequency of wing-beat as a character for separating species races and geographic varieties of Drosophila. Genetics. 27 (3), 349 (1942).
- Belton, P., Costello, R. A. Flight sounds of the females of some mosquitoes of Western Canada. Entomologia experimentalis et applicata. 26 (1), 105-114 (1979).
- Mankin, R. W., Machan, R., Field Jones, R. testing of a prototype acoustic device for detection of Mediterranean fruit flies flying into a trap. Proc. 7th Int Symp Fruit Flies of Economic Importance. , 10-15 (2006).
- Raman, D. R., Gerhardt, R. R., Wilkerson, J. B. Detecting insect flight sounds in the field Implications for acoustical counting of mosquitoes. Transactions of the ASABE. 50 (4), 1481 Forthcoming.
- Moore, A., Miller, J. R., Tabashnik, B. E., Gage, S. H. Automated identification of flying insects by analysis of wingbeat frequencies. Journal of economic entomology. 79 (6), 1703-1706 (1986).
- Moore, A., Miller, R. H. Automated identification of optically sensed aphid (Homoptera: Aphidae) wingbeat waveforms. Annals of the Entomological Society of America. 95 (1), 1-8 (2002).
- Li, Z., Zhou, Z., Shen, Z., Yao, Q. Automated identification of mosquito (diptera: Culicidae) wingbeat waveform by artificial neural network. Artificial Intelligence Applications and Innovations. , 483-489 (2005).
- Moore, A. Artificial neural network trained to identify mosquitoes in flight. Journal of insect behavior. 4 (3), 391-396 (1991).
- Halevy, A., Norvig, P., Pereira, F.
The unreasonable effectiveness of data. Intelligent Systems, IEEE. 24 (2), 8-12 (2009). - Mitigating the paucity-of-data problem exploring the effect of training corpus size on classifier performance for natural language processing. Banko, M., Brill, E. Proceedings of the first international conference on Human language technology research, , Association for Computational Linguistics. Stroudburg, PA. 1-5 (2001).
- Shotton, J., et al. Real-time human pose recognition in parts from single depth images. Communications of the ACM. 56 (1), 116-124 (2013).
- Ilyas, P.
Classifying insects on the fly. Ecological Informatics. , (2013). - Mack, Y. P., Rosenblatt, M. Multivariate k-nearest neighbor density estimates. Journal of Multivariate Analysis. 9 (1), 1-15 (1979).
- Benedict, M., Robinson, A. The first releases of transgenic mosquitoes an argument for the sterile insect technique. TRENDS in Parasitology. 19 (8), 349-355 (2003).
- Chen, Y. Supporting Materials. , Available from: https://sites.google.com/site/insectclassification Forthcoming.
- Chen, Y., Why, A., Batista, G., Mafra-Neto, A., Keogh, E. Flying Insect Classification with Inexpensive Sensors. Journal of Insect. 27 (5), 657-677 (2014).