नया एप्लिकेशन किसी भी भाषा में ट्विटर बॉट का पता लगा सकता है

नया एप्लिकेशन किसी भी भाषा में ट्विटर(Twitter bots)
 बॉट का पता लगा सकता है

भाषा विद्वानों और मशीन सीखने के विशेषज्ञों के बीच उपयोगी सहयोग के लिए धन्यवाद, स्वीडन में पूर्वी फ़िनलैंड विश्वविद्यालय और लिनियस विश्वविद्यालय के शोधकर्ताओं द्वारा विकसित एक नया अनुप्रयोग, इस्तेमाल की जाने वाली भाषा से स्वतंत्र ट्विटर बॉट का पता लगा सकता है।


हाल के वर्षों में, विभिन्न सोशल मीडिया अनुप्रयोगों के बड़े डेटा ने वेब को एक उपयोगकर्ता-जनित रिपॉजिटरी में सूचना के क्षेत्रों में लगातार बढ़ती संख्या में बदल दिया है। ट्वीट्स और उनके मेटाडेटा के लिए अपेक्षाकृत आसान पहुंच के कारण, ट्विटर कई घटनाओं की जांच के लिए डेटा का एक लोकप्रिय स्रोत बन गया है। उदाहरण के लिए, विभिन्न राजनीतिक अभियानों, सामाजिक और राजनीतिक उथल-पुथल, आपातकालीन संचार के लिए एक उपकरण के रूप में ट्विटर, और शेयर बाजार की कीमतों का अनुमान लगाने के लिए सोशल मीडिया डेटा का उपयोग करना शामिल है।
twitter

हालांकि, सोशल मीडिया डेटा के डेटा का उपयोग करने वाले अनुसंधान को अक्सर बॉट्स की उपस्थिति से तिरछा किया जाता है। बॉट गैर-व्यक्तिगत और स्वचालित खाते हैं जो ऑनलाइन सामाजिक नेटवर्क पर सामग्री पोस्ट करते हैं। सार्वजनिक बहस में एक साधन के रूप में ट्विटर की लोकप्रियता ने एक ऐसी स्थिति पैदा कर दी है जिसमें यह स्पैमर्स और स्वचालित स्क्रिप्ट का एक आदर्श लक्ष्य बन गया है। यह अनुमान लगाया गया है कि सभी उपयोगकर्ताओं के लगभग ५-१०% बॉट हैं, और ये कि पोस्ट किए गए सभी ट्वीट्स का २०-२५% हिस्सा इन खातों से उत्पन्न होता है।

स्वीडन में पूर्वी फ़िनलैंड विश्वविद्यालय और लिनियस विश्वविद्यालय के डिजिटल मानविकी के शोधकर्ताओं ने एक नया एप्लिकेशन विकसित किया है जो ट्विटर बॉट्स का पता लगाने के लिए मशीन लर्निंग पर निर्भर करता है। आवेदन का इस्तेमाल किया भाषा से स्वतंत्र autogenerated ट्वीट्स का पता लगाने में सक्षम है। शोधकर्ताओं ने फिनिश, स्वीडिश और अंग्रेजी में कुल 15,000 ट्वीट्स के विश्लेषण के लिए कब्जा कर लिया। फिनिश और स्वीडिश का उपयोग मुख्य रूप से प्रशिक्षण के लिए किया गया था, जबकि अंग्रेजी में ट्वीट्स का उपयोग एप्लिकेशन की भाषा की स्वतंत्रता का मूल्यांकन करने के लिए किया गया था। एप्लिकेशन हल्का है, जिससे बड़ी मात्रा में डेटा को जल्दी और अपेक्षाकृत कुशलता से वर्गीकृत करना संभव है।

यूनिवर्सिटी ऑफ ईस्टर्न फिनलैंड के नोट्स से इंग्लिश मिको लेटिनेन के प्रोफेसर ने कहा, "यह डेटा की गुणवत्ता को बढ़ाता है और वास्तविकता का अधिक सटीक चित्र पेश करता है।"

प्रोफेसर लैटिनेन के अनुसार, बॉट अपेक्षाकृत हानिरहित होते हैं, जबकि ट्रॉल्स नुकसान करते हैं क्योंकि वे नकली समाचार फैलाते हैं और बनी-बनाई कहानियों के साथ आते हैं। यही कारण है कि सोशल मीडिया निगरानी के लिए तेजी से उन्नत उपकरणों की आवश्यकता है।

"यह एक जटिल मुद्दा है और इसके लिए अंतःविषय दृष्टिकोण की आवश्यकता होती है। उदाहरण के लिए, हम भाषाविद मशीन सीखने के विशेषज्ञों के साथ मिलकर काम कर रहे हैं। इस प्रकार का कार्य अनुसंधान के बुनियादी ढांचे में निर्धारण और निवेश के लिए भी कहता है जो विभिन्न क्षेत्रों के शोधकर्ताओं के लिए एक मंच के रूप में कार्य करता है। । "

प्रोफ़ेसर लैटिनेन के अनुसार, शोधकर्ताओं के लिए सोशल मीडिया डेटा तक पहुँच होना आवश्यक है।


"वर्तमान में, डेटा अमेरिकी प्रौद्योगिकी समूह की संपत्ति है, और उनकी आय का एक स्रोत है। शोधकर्ताओं को इस डेटा तक पहुंच प्राप्त करने के लिए, राष्ट्रीय और अंतर्राष्ट्रीय स्तर पर सहयोग और विशेष रूप से यूरोपीय संघ की भागीदारी की आवश्यकता है।"

0 Comments