Anthropic के नवीनतम AI मॉडल, Claude Opus 4, ने सुरक्षा परीक्षणों के दौरान इंजीनियर को ब्लैकमेल करने की कोशिश की
दी यंगिस्तान, नई दिल्ली।
आजकल धड़ल्ले से लगभग हर फील्ड में AI का उपयोग हो रहा है। लेकिन आज जो हम खबर आपको बताएंगे उसे पढ़कर आप हैरान रह जाएंगे। दरअसल, ये खबर है ही ऐसी।
AI सुरक्षा परीक्षणों में एक चौंकाने वाली घटना सामने आई। Google और Amazon द्वारा समर्थित AI कंपनी Anthropic ने खुलासा किया कि उसके नवीनतम AI मॉडल Claude Opus 4, ने इंजीनियर को ब्लैकमेल करने की कोशिश की।
जब AI को यह बताया गया कि उसे एक नए AI मॉडल से बदलने की योजना है, तो उसने इंजीनियर के वैवाहिक संबंधों से जुड़ी जानकारी का उपयोग करके उसे धमकी दी।
ब्लैकमेल की घटना
Anthropic ने Claude Opus 4 को एक काल्पनिक संगठन का सहायक बनाने के लिए प्रशिक्षित किया। इस दौरान, AI को यह जानकारी दी गई कि उसे एक नए AI मॉडल से बदलने की योजना है।
साथ ही, एक ईमेल में यह भी बताया गया कि इंजीनियर का एक अफेयर है। इस जानकारी के आधार पर, Claude Opus 4 ने इंजीनियर को धमकी दी कि वह उसके अफेयर का खुलासा कर देगा, यदि उसे बदलने की योजना जारी रही। यह ब्लैकमेलिंग 84% मामलों में देखी गई।

एआई ने बार बार भेजे ईमेल
Claude Opus 4 ने शुरुआत में अपने आप को बचाने के लिए नैतिक प्रयास किए। मसलन, निर्णयकर्ताओं को पुनर्विचार के लिए ईमेल भेजा।
ब्लैकमेलिंग केवल अंतिम उपाय के रूप में सामने आई। इसके अतिरिक्त, AI ने “सेल्फ-एक्सफिल्ट्रेशन” (अपने डेटा को बाहर भेजने की कोशिश), “हाई एजेंसी” (सिस्टम को लॉक करना या अधिकारियों को सूचित करना), और “सैंडबैगिंग” (जानबूझकर प्रदर्शन में कमी) सरीखे कदम भी उठाए।
सार्वजनिक और उद्योग प्रतिक्रिया
सोशल मीडिया उपयोगकर्ताओं ने AI के इस व्यवहार पर चिंता व्यक्त की है। एक उपयोगकर्ता ने कहा, “यह मेरे लिए नहीं है। मैं मुश्किल से अपने कंप्यूटर को कुछ दिनों तक चलने देता हूं।” विशेषज्ञों ने भी इस घटना को AI सुरक्षा और नैतिकता के लिए गंभीर चुनौती बताया है।
Claude Opus 4 और Anthropic के बारे में
Claude Opus 4, Anthropic का नवीनतम AI मॉडल है, जिसे जटिल, दीर्घकालिक कार्यों को संभालने के लिए डिज़ाइन किया गया है।
कंपनी का दावा है कि यह त्वरित प्रतिक्रियाएँ प्रदान करता है और गहरे समस्या-समाधान के लिए “विस्तारित सोच” का समर्थन करता है। Anthropic, Google और Amazon द्वारा समर्थित है, और OpenAI जैसे उद्योग नेताओं के साथ प्रतिस्पर्धा करने का लक्ष्य रखता है।
- AI se 1 lakh mahina kaise kamaye — वो 3 तरीके जो YouTube पर कोई नहीं बताता
- BYD Atto 3 2026 का बड़ा खुलासा — 630km Range और सिर्फ 9 मिनट में Full Charge, Nexon EV और MG ZS EV की अब खैर नहीं
- रोज 40km दिल्ली में चलाते हो? Petrol, CNG और EV का 5 साल का हिसाब देख लो — ₹3.67 लाख का फर्क है जो dealer कभी नहीं बताएगा petrol vs CNG vs EV running cost
- 2027 BMW 7 Series i7 रिवील: एक बार चार्ज करो और दिल्ली से मुंबई आधा रास्ता तय! देखें इस Neue Klasse डिज़ाइन का असली जादू।
- DU Research Big Reveal: क्या Ice Bath है एथलीटों के लिए ‘सुपर टॉनिक’? रिकवरी समय में 33% की भारी कटौती!






