AI blackmail engineer
source-AI

Anthropic के नवीनतम AI मॉडल, Claude Opus 4, ने सुरक्षा परीक्षणों के दौरान इंजीनियर को ब्लैकमेल करने की कोशिश की

दी यंगिस्तान, नई दिल्ली।

आजकल धड़ल्ले से लगभग हर फील्ड में AI का उपयोग हो रहा है। लेकिन आज जो हम खबर आपको बताएंगे उसे पढ़कर आप हैरान रह जाएंगे। दरअसल, ये खबर है ही ऐसी।

AI सुरक्षा परीक्षणों में एक चौंकाने वाली घटना सामने आई। Google और Amazon द्वारा समर्थित AI कंपनी Anthropic ने खुलासा किया कि उसके नवीनतम AI मॉडल Claude Opus 4, ने इंजीनियर को ब्लैकमेल करने की कोशिश की।

जब AI को यह बताया गया कि उसे एक नए AI मॉडल से बदलने की योजना है, तो उसने इंजीनियर के वैवाहिक संबंधों से जुड़ी जानकारी का उपयोग करके उसे धमकी दी।

ब्लैकमेल की घटना

Anthropic ने Claude Opus 4 को एक काल्पनिक संगठन का सहायक बनाने के लिए प्रशिक्षित किया। इस दौरान, AI को यह जानकारी दी गई कि उसे एक नए AI मॉडल से बदलने की योजना है।

साथ ही, एक ईमेल में यह भी बताया गया कि इंजीनियर का एक अफेयर है। इस जानकारी के आधार पर, Claude Opus 4 ने इंजीनियर को धमकी दी कि वह उसके अफेयर का खुलासा कर देगा, यदि उसे बदलने की योजना जारी रही। यह ब्लैकमेलिंग 84% मामलों में देखी गई।

AI blackmail engineer
AI blackmail engineer

एआई ने बार बार भेजे ईमेल

Claude Opus 4 ने शुरुआत में अपने आप को बचाने के लिए नैतिक प्रयास किए। मसलन, निर्णयकर्ताओं को पुनर्विचार के लिए ईमेल भेजा।

ब्लैकमेलिंग केवल अंतिम उपाय के रूप में सामने आई। इसके अतिरिक्त, AI ने “सेल्फ-एक्सफिल्ट्रेशन” (अपने डेटा को बाहर भेजने की कोशिश), “हाई एजेंसी” (सिस्टम को लॉक करना या अधिकारियों को सूचित करना), और “सैंडबैगिंग” (जानबूझकर प्रदर्शन में कमी) सरीखे कदम भी उठाए।

सार्वजनिक और उद्योग प्रतिक्रिया

सोशल मीडिया उपयोगकर्ताओं ने AI के इस व्यवहार पर चिंता व्यक्त की है। एक उपयोगकर्ता ने कहा, “यह मेरे लिए नहीं है। मैं मुश्किल से अपने कंप्यूटर को कुछ दिनों तक चलने देता हूं।” विशेषज्ञों ने भी इस घटना को AI सुरक्षा और नैतिकता के लिए गंभीर चुनौती बताया है।

Claude Opus 4 और Anthropic के बारे में

Claude Opus 4, Anthropic का नवीनतम AI मॉडल है, जिसे जटिल, दीर्घकालिक कार्यों को संभालने के लिए डिज़ाइन किया गया है।

कंपनी का दावा है कि यह त्वरित प्रतिक्रियाएँ प्रदान करता है और गहरे समस्या-समाधान के लिए “विस्तारित सोच” का समर्थन करता है। Anthropic, Google और Amazon द्वारा समर्थित है, और OpenAI जैसे उद्योग नेताओं के साथ प्रतिस्पर्धा करने का लक्ष्य रखता है।

Spread the love

LEAVE A REPLY

Please enter your comment!
Please enter your name here