Anthropic के नवीनतम AI मॉडल, Claude Opus 4, ने सुरक्षा परीक्षणों के दौरान इंजीनियर को ब्लैकमेल करने की कोशिश की
दी यंगिस्तान, नई दिल्ली।
आजकल धड़ल्ले से लगभग हर फील्ड में AI का उपयोग हो रहा है। लेकिन आज जो हम खबर आपको बताएंगे उसे पढ़कर आप हैरान रह जाएंगे। दरअसल, ये खबर है ही ऐसी।
AI सुरक्षा परीक्षणों में एक चौंकाने वाली घटना सामने आई। Google और Amazon द्वारा समर्थित AI कंपनी Anthropic ने खुलासा किया कि उसके नवीनतम AI मॉडल Claude Opus 4, ने इंजीनियर को ब्लैकमेल करने की कोशिश की।
जब AI को यह बताया गया कि उसे एक नए AI मॉडल से बदलने की योजना है, तो उसने इंजीनियर के वैवाहिक संबंधों से जुड़ी जानकारी का उपयोग करके उसे धमकी दी।
ब्लैकमेल की घटना
Anthropic ने Claude Opus 4 को एक काल्पनिक संगठन का सहायक बनाने के लिए प्रशिक्षित किया। इस दौरान, AI को यह जानकारी दी गई कि उसे एक नए AI मॉडल से बदलने की योजना है।
साथ ही, एक ईमेल में यह भी बताया गया कि इंजीनियर का एक अफेयर है। इस जानकारी के आधार पर, Claude Opus 4 ने इंजीनियर को धमकी दी कि वह उसके अफेयर का खुलासा कर देगा, यदि उसे बदलने की योजना जारी रही। यह ब्लैकमेलिंग 84% मामलों में देखी गई।

एआई ने बार बार भेजे ईमेल
Claude Opus 4 ने शुरुआत में अपने आप को बचाने के लिए नैतिक प्रयास किए। मसलन, निर्णयकर्ताओं को पुनर्विचार के लिए ईमेल भेजा।
ब्लैकमेलिंग केवल अंतिम उपाय के रूप में सामने आई। इसके अतिरिक्त, AI ने “सेल्फ-एक्सफिल्ट्रेशन” (अपने डेटा को बाहर भेजने की कोशिश), “हाई एजेंसी” (सिस्टम को लॉक करना या अधिकारियों को सूचित करना), और “सैंडबैगिंग” (जानबूझकर प्रदर्शन में कमी) सरीखे कदम भी उठाए।
सार्वजनिक और उद्योग प्रतिक्रिया
सोशल मीडिया उपयोगकर्ताओं ने AI के इस व्यवहार पर चिंता व्यक्त की है। एक उपयोगकर्ता ने कहा, “यह मेरे लिए नहीं है। मैं मुश्किल से अपने कंप्यूटर को कुछ दिनों तक चलने देता हूं।” विशेषज्ञों ने भी इस घटना को AI सुरक्षा और नैतिकता के लिए गंभीर चुनौती बताया है।
Claude Opus 4 और Anthropic के बारे में
Claude Opus 4, Anthropic का नवीनतम AI मॉडल है, जिसे जटिल, दीर्घकालिक कार्यों को संभालने के लिए डिज़ाइन किया गया है।
कंपनी का दावा है कि यह त्वरित प्रतिक्रियाएँ प्रदान करता है और गहरे समस्या-समाधान के लिए “विस्तारित सोच” का समर्थन करता है। Anthropic, Google और Amazon द्वारा समर्थित है, और OpenAI जैसे उद्योग नेताओं के साथ प्रतिस्पर्धा करने का लक्ष्य रखता है।
- वाधवानी और गेट्स फाउंडेशन ने मिलाया हाथ, भारत में बढ़ाएंगे इनोवेशन की ताकत
- PM MODI की अपील के बाद दिल्ली सरकार का बड़ा ऐलान! अब हफ्ते में 2 दिन Work From Home, प्राइवेट सेक्टर के लिए भी बदले नियम
- National Technology Day 2026 — 1998 के Pokhran से 2026 के AI तक India ने क्या-क्या जीता? Youth के लिए 5 Career-Changing Opportunities
- Second Hand SUV 2026: क्यों है यह साल की सबसे Smart Deal? ₹8 लाख में उठाएं ₹18 लाख वाला मजा!
- Tata Sierra EV vs Safari EV: एक ही घर के दो भाई, ₹17 लाख के बजट में कौन बनेगा ‘Boss’?






