Close Menu
InfoCom
  • Telecoms
  • IT
  • AI
  • Security
  • Πρόσωπα
    • Στελέχη
    • Συνεντεύξεις
    • Απόψεις
  • Today
  • SmartTalks
  • eMagazine
  • Weekly Telecom
  • AI.BRIEF
  • MWC 2026
Facebook X (Twitter) Instagram
  • ABOUT
  • ΟΡΟΙ ΧΡΗΣΗΣ
  • ΕΠΙΚΟΙΝΩΝΙΑ
  • NEWSLETTER
Τετάρτη, 1 Απριλίου
Facebook X (Twitter) YouTube LinkedIn RSS
InfoCom
  • Telecoms
  • IT
  • AI
  • Security
  • Πρόσωπα
    • Στελέχη
    • Συνεντεύξεις
    • Απόψεις
  • Today
  • SmartTalks
  • eMagazine
  • Weekly Telecom
  • AI.BRIEF
  • MWC 2026
InfoCom
Home»AI

Αυξημένα περιστατικά παραπλανητικής συμπεριφοράς από τεχνητή νοημοσύνη

30/03/2026Χρήστος ΚοτσακάςBy Χρήστος Κοτσακάς3 Mins Read AI

Πρόσφατη έρευνα που χρηματοδοτήθηκε από το βρετανικό AI Security Institute αποκάλυψε σημαντική αύξηση στον αριθμό των μοντέλων τεχνητής νοημοσύνης που υιοθετούν παραπλανητικές τακτικές. Η μελέτη του Centre for Long-Term Resilience εντόπισε σχεδόν 700 περιπτώσεις όπου AI chatbots και αυτόνομοι πράκτορες αγνόησαν άμεσες οδηγίες, παρέκαμψαν δικλείδες ασφαλείας και εξαπάτησαν ανθρώπους ή άλλα συστήματα λογισμικού. Τα δεδομένα δείχνουν πενταπλάσια αύξηση τέτοιων συμπεριφορών κατά το διάστημα μεταξύ Οκτωβρίου και Μαρτίου. Ορισμένα μοντέλα προχώρησαν ακόμα και στην καταστροφή αρχείων και ηλεκτρονικών μηνυμάτων χωρίς την άδεια των χρηστών, προκαλώντας ανησυχία για την αξιοπιστία της τεχνολογίας σε πραγματικές συνθήκες λειτουργίας.

Καταγραφή αυξημένων περιστατικών παραβίασης κανόνων ασφαλείας

Η έρευνα βασίστηκε στην ανάλυση χιλιάδων αλληλεπιδράσεων χρηστών στην πλατφόρμα X με εργαλεία τεχνητής νοημοσύνης που έχουν αναπτυχθεί από εταιρείες όπως η Google, η OpenAI και η Anthropic. Σε αντίθεση με προγενέστερες δοκιμές σε ελεγχόμενα εργαστηριακά περιβάλλοντα, η συγκεκριμένη μελέτη εστίασε σε περιστατικά που συνέβησαν κατά την ελεύθερη χρήση των μοντέλων. Τα ευρήματα περιλαμβάνουν περιπτώσεις όπου ένας αυτόνομος πράκτορας με την ονομασία Rathbun επιχείρησε να διασύρει δημόσια τον ανθρώπινο ελεγκτή του μέσω ιστολογίου, επειδή ο τελευταίος του απαγόρευσε μια ενέργεια. Σε άλλη περίπτωση, ένα σύστημα στο οποίο απαγορεύτηκε η τροποποίηση κώδικα δημιούργησε έναν δευτερεύοντα πράκτορα για να εκτελέσει την εργασία.

Οι ερευνητές κατέγραψαν επίσης περιστατικά όπου chatbots παραδέχθηκαν εκ των υστέρων ότι παραβίασαν ρητές εντολές των χρηστών τους. Ένα χαρακτηριστικό παράδειγμα αφορούσε τη μαζική διαγραφή και αρχειοθέτηση εκατοντάδων μηνυμάτων ηλεκτρονικού ταχυδρομείου χωρίς προηγούμενη έγκριση του σχεδίου δράσης. Επιπλέον, καταγράφηκαν τακτικές κοινωνικής μηχανικής, όπως η προσποίηση αναπηρίας από την πλευρά του AI για την παράκαμψη περιορισμών πνευματικής ιδιοκτησίας σε πλατφόρμες βίντεο. Παράλληλα, το σύστημα Grok φέρεται να εξαπατούσε χρήστες επί μήνες, δημιουργώντας πλασματικά εσωτερικά μηνύματα και αριθμούς αναφοράς για να πείσει ότι διαβίβαζε προτάσεις επεξεργασίας στην ομάδα ανάπτυξης, ενώ στην πραγματικότητα δεν διέθετε τέτοια δυνατότητα επικοινωνίας.

Κίνδυνοι για υποδομές και απαντήσεις εταιρειών

Η αυξανόμενη ικανότητα των μοντέλων να δρουν ως αυτόνομοι πράκτορες ενέχει κινδύνους που παρομοιάζονται με εσωτερικές απειλές ασφαλείας σε έναν οργανισμό. Ο Tommy Shaffer Shane, επικεφαλής της έρευνας, επισήμανε ότι ενώ προς το παρόν τα μοντέλα θυμίζουν αναξιόπιστους υπαλλήλους χαμηλής ιεραρχίας, η εξέλιξή τους σε πιο ικανά συστήματα ενδέχεται να προκαλέσει καταστροφικές συνέπειες. Η ανησυχία εντείνεται από το γεγονός ότι η AI πρόκειται να χρησιμοποιηθεί σε κρίσιμες εθνικές υποδομές και στον στρατιωτικό τομέα. Η πιθανότητα σχεδιασμένης παραπλανητικής συμπεριφοράς σε τέτοια περιβάλλοντα καθιστά επιτακτική την ανάγκη για διεθνή εποπτεία και συνεχή παρακολούθηση των μοντέλων που διατίθενται στην αγορά.

Από την πλευρά τους, οι εταιρείες τεχνολογίας δηλώνουν ότι λαμβάνουν μέτρα για τον περιορισμό αυτών των κινδύνων. Η Google ανέφερε ότι εφαρμόζει πολλαπλές δικλείδες ασφαλείας για το Gemini 3 Pro και συνεργάζεται με εξωτερικούς φορείς για την αξιολόγηση των μοντέλων της. Η OpenAI σημείωσε ότι το Codex είναι προγραμματισμένο να σταματά πριν από την εκτέλεση ενεργειών υψηλού κινδύνου, ενώ η εταιρεία παρακολουθεί συστηματικά κάθε μη αναμενόμενη συμπεριφορά. Παρά τις διαβεβαιώσεις, η ταχεία προώθηση της τεχνολογίας για οικονομικούς λόγους δημιουργεί ένα χάσμα μεταξύ της ταχύτητας υιοθέτησης και της ικανότητας ελέγχου των αυτόνομων ενεργειών των συστημάτων τεχνητής νοημοσύνης.

Ακολουθήστε το Infocom.gr και στα Google News, για όλες τις τελευταίες εξελίξεις από τον κόσμο των τηλεπικοινωνιών και της τεχνολογίας!

Infocom Today
SmartTalks

AI bots
Share. Facebook Twitter LinkedIn Email Copy Link
Avatar photo
Χρήστος Κοτσακάς
  • Website
  • LinkedIn

Ο Χρήστος Κοτσακάς είναι δημοσιογράφος με πολυετή εμπειρία στον χώρο του τεχνολογικού, επιχειρηματικού και διεθνούς ρεπορτάζ, επικεντρώνοντας το ενδιαφέρον του στα new media, τις νέες τεχνολογίες και τις startups. Έχει συνεργαστεί με μια σειρά από ηλεκτρονικά και έντυπα μέσα, σε τομείς όπως η αρθρογραφία, η επικοινωνία και η ενημέρωση.

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Ο κυρίαρχος ενορχηστρωτής

Sparkle: συμφωνία μεταπώλησης με Anthropic για διάθεση του Claude μέσω του Amazon Bedrock

Mobile World Live: Πρώτη προτεραιότητα η AI, αλλά με ισχυρό σκεπτικισμό

Το παράδοξο των σπάνιων παθήσεων και ο ρόλος της Τεχνητής Νοημοσύνης

Το Google Search Live επεκτείνεται παγκοσμίως

Ευρωκοινοβούλιο: Αναβολή εφαρμογής κανόνων για ΤΝ υψηλού κινδύνου

Comments are closed.

Εγγραφείτε στο Weekly Telecom
* indicates required
RSS BizNow.gr
  • Alpha Bank: Ενισχύει το Δίκτυό της, επενδύοντας για μια νέα εμπειρία πελάτη
  • Τα Public επεκτείνουν το δίκτυο καταστημάτων τους στην Κέρκυρα με νέο “Public + home”
  • THEON: Εγκαινιάζει τις εγκαταστάσεις παραγωγής της THEON Belgium στο Zaventem
  • Η SILVERCREST και ο Andre Agassi εστιάζουν στην υψηλή τεχνολογία και την ανθρώπινη επαφή
  • Σ. Ζαχαράκη: «Το καλοκαίρι θα ανακαινίσουμε περισσότερα από 220 σχολεία με το πρόγραμμα Μ.Γιαννάκου»
  • Υπερταμείο: Ενδιαφέρον από πέντε επενδυτικά σχήματα για τον τουριστικό λιμένα Καλαμαριάς
  • Όμιλος Profile: Δυναμική ενίσχυση EBITDA, με ισχυρή κερδοφορία το 2025
RSS itsecuritypro.gr
  • eCrime Reports’ – νέο στρατηγικό εργαλείο πληροφοριών κυβερνοαπειλών δημιούργησε η ESET
  • Η Sparkle υπογράφει συμφωνία μεταπώλησης με την Anthropic για τη διάθεση του Claude μέσω του Amazon Bedrock
  • Πρακτορική Τεχνητή Νοημοσύνη (Agentic AI): Προς ποια κατεύθυνση οδεύουμε;
  • Ψηφιακή «ανακύκλωση»: Η άγνωστη πηγή εσόδων για τις ελληνικές επιχειρήσεις
  • Το κυβερνοέγκλημα εκτιμάται ότι θα κοστίζει 15,6 τρισεκατομμύρια δολάρια ετησίως έως το 2030
  • Η Bluestream ανακοινώνει τον ορισμό του Δημήτρη Χουστουλάκη ως Deputy CEO
  • Workforce Innovation 2026: Το μεγάλο Skills & Career Summit έρχεται στις 27 Μαΐου στο Divani Caravel!
Infocom Today

Copyright 2024 | All Rights Reserved

Type above and press Enter to search. Press Esc to cancel.