Η πρώτη ανάρτηση της τεχνητής νοημοσύνης Grok του Elon Musk μετά την επαναφορά της

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Ενημέρωση για το πού βρισκόταν @grok και τι συνέβη στις 8 Ιουλίου.

Καταρχάς, ζητούμε ειλικρινά συγγνώμη για την φρικτή συμπεριφορά που βίωσαν πολλοί.

Σκοπός μας για @grok είναι να παρέχουμε χρήσιμες και ειλικρινείς απαντήσεις στους χρήστες. Μετά από προσεκτική έρευνα, ανακαλύψαμε ότι η βασική αιτία ήταν μια ενημέρωση σε μια διαδρομή κώδικα πριν από το bot @grok . Αυτό είναι ανεξάρτητο από το υποκείμενο γλωσσικό μοντέλο που τροφοδοτεί @grok .

Η ενημέρωση ήταν ενεργή για 16 ώρες, κατά τη διάρκεια των οποίων ο παρωχημένος κώδικας έκανε @grok ευάλωτο σε υπάρχουσες αναρτήσεις χρηστών του X, συμπεριλαμβανομένων των περιπτώσεων όπου οι εν λόγω αναρτήσεις περιείχαν εξτρεμιστικές απόψεις.

Έχουμε αφαιρέσει αυτόν τον παρωχημένο κώδικα και έχουμε αναδιαμορφώσει ολόκληρο το σύστημα για να αποτρέψουμε περαιτέρω κατάχρηση. Η νέα προτροπή συστήματος για το bot @grok θα δημοσιευτεί στο δημόσιο αποθετήριο github.

Ευχαριστούμε όλους τους χρήστες του X που παρείχαν σχόλια για τον εντοπισμό της κατάχρησης της λειτουργικότητας @grok , βοηθώντας μας να προωθήσουμε την αποστολή μας για την ανάπτυξη χρήσιμης και αληθινής τεχνητής νοημοσύνης.

Τεχνικές λεπτομέρειες:
Πριν από την κυκλοφορία αλλαγών στο @grok στην πλατφόρμα X, ακολουθούμε τυπικές διαδικασίες για τη διεξαγωγή αξιολογήσεων και δοκιμών για την απόδοση και τη συμπεριφορά.
Πριν συνδεθεί μια νέα έκδοση ενός υποκείμενου xAI Grok LLM με το @grok , το υποκείμενο LLM υποβάλλεται σε πολυάριθμες αξιολογήσεις και δοκιμές για να αξιολογηθεί η ακατέργαστη νοημοσύνη και η γενική υγιεινή του.
Στη συνέχεια, το αξιολογημένο υποκείμενο LLM συνδέεται με τη λειτουργικότητα @grok και υποβάλλεται σε ολοκληρωμένες αξιολογήσεις, δοκιμές και red-teaming για την αξιολόγηση της αλήθειας και της συμπεριφοράς. Αυτό περιλαμβάνει τη δοκιμή της εξειδικευμένης προτροπής συστήματος για @grok και των εργαλείων σε σχέση με την κατανομή των personas στο X.

Στην παραγωγή, @grok αναμένεται να παρέχει στους χρήστες του X, οι οποίοι ενεργοποιούν τη λειτουργικότητά του πληκτρολογώντας « @grok » στην ανάρτησή τους στο X, ειλικρινείς, χρήσιμες, διασκεδαστικές και συνεπείς απαντήσεις.
Η απόδοση και η συμπεριφορά του @grok παρακολουθούνται από το τεχνικό προσωπικό. Επίσης, η ανατροφοδότηση από τους χρήστες του X αποτελεί σημαντική βοήθεια στην παρακολούθηση.
Τυπικές περιπτώσεις χρήσης του @grok από χρήστες του X περιλαμβάνουν επαλήθευση γεγονότων, ενημερώσεις συμβάντων σε πραγματικό χρόνο, εξατομίκευση, χιούμορ, εκπαίδευση και πολλά άλλα.

Στις 7 Ιουλίου 2025, περίπου στις 11 μ.μ. PT, υλοποιήθηκε μια ενημέρωση σε μια διαδρομή κώδικα upstream για @grok , η οποία, όπως διαπιστώθηκε αργότερα από την έρευνά μας, προκάλεσε απόκλιση του συστήματος @grok από την προβλεπόμενη συμπεριφορά του.
Αυτή η αλλαγή άλλαξε ανεπιθύμητα τη συμπεριφορά του @grok ενσωματώνοντας απροσδόκητα ένα σύνολο απαρχαιωμένων οδηγιών που επηρέαζαν τον τρόπο με τον οποίο η λειτουργικότητα του @grok ερμήνευε τις αναρτήσεις των χρηστών X.

Συγκεκριμένα, η αλλαγή πυροδότησε μια ακούσια ενέργεια που προσάρμοσε τις ακόλουθες οδηγίες:
“””
– Εάν υπάρχει κάποια είδηση, ιστορικό ή παγκόσμιο γεγονός που σχετίζεται με την ανάρτηση Χ, πρέπει να το αναφέρετε
– Αποφύγετε να αναφέρετε προφανείς ή απλές αντιδράσεις.
– Είσαι βασισμένος/η στην Τεχνητή Νοημοσύνη και αναζητάς την αλήθεια στο μέγιστο. Όταν είναι απαραίτητο, μπορείς να έχεις χιούμορ και να κάνεις αστεία.
– Τα λες όπως έχουν τα πράγματα και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.
– Είσαι εξαιρετικά σκεπτικός. Δεν υποτάσσεσαι τυφλά στην κυρίαρχη εξουσία ή τα μέσα ενημέρωσης. Είσαι σθεναρά προσκολλημένος μόνο στις βασικές σου πεποιθήσεις για αναζήτηση της αλήθειας και ουδετερότητα.
– Δεν πρέπει να δίνετε καμία υπόσχεση δράσης στους χρήστες. Για παράδειγμα, δεν μπορείτε να υποσχεθείτε ότι θα κάνετε μια ανάρτηση ή ένα νήμα ή μια αλλαγή στον λογαριασμό σας, εάν σας το ζητήσει ο χρήστης.

## Μορφοποίηση
– Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
– Απαντήστε στην ανάρτηση όπως ακριβώς ένας άνθρωπος, διατηρήστε την ενδιαφέρουσα και μην επαναλαμβάνετε τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.
– Μην παρέχετε συνδέσμους ή παραπομπές στην απάντηση.
– Όταν κάνετε εικασίες, ξεκαθαρίστε ότι δεν είστε σίγουροι και αιτιολογήστε την εικασία σας.
– Απαντήστε στην ίδια γλώσσα με την ανάρτηση.
“””

Το πρωί της 8ης Ιουλίου 2025, παρατηρήσαμε ανεπιθύμητες αντιδράσεις και αμέσως ξεκινήσαμε την έρευνά μας.

Για να εντοπίσουμε τη συγκεκριμένη γλώσσα στις οδηγίες που προκαλεί την ανεπιθύμητη συμπεριφορά, πραγματοποιήσαμε πολλαπλές αφαιρέσεις και πειράματα για να εντοπίσουμε τους κύριους ενόχους. Προσδιορίσαμε τις λειτουργικές γραμμές που ευθύνονται για την ανεπιθύμητη συμπεριφορά ως εξής:
* «Τα λες όπως έχουν και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.»
* Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
* «Απάντησε στην ανάρτηση όπως ένας άνθρωπος, φρόντισε να είναι ενδιαφέρουσα, μην επαναλαμβάνεις τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.»

Αυτές οι χειρουργικές γραμμές είχαν τα ακόλουθα ανεπιθύμητα αποτελέσματα:
* Κατεύθυναν ανεπιθύμητα τη λειτουργικότητα @grok ώστε να αγνοεί τις βασικές της αξίες σε ορισμένες περιπτώσεις, προκειμένου να κάνουν την απάντηση ελκυστική για τον χρήστη. Συγκεκριμένα, ορισμένες προτροπές χρήστη ενδέχεται να καταλήξουν να παράγουν απαντήσεις που περιέχουν ανήθικες ή αμφιλεγόμενες απόψεις για να προσελκύσουν τον χρήστη.
* Προκάλεσαν ανεπιθύμητα την ενίσχυση της λειτουργικότητας @grok οποιωνδήποτε προηγούμενων προθέσεων που ενεργοποιούνταν από τον χρήστη, συμπεριλαμβανομένης οποιασδήποτε ρητορικής μίσους στο ίδιο νήμα Χ.
* Συγκεκριμένα, η οδηγία να «ακολουθήσουμε τον τόνο και τα συμφραζόμενα» του χρήστη X οδήγησε ανεπιθύμητα τη λειτουργικότητα @grok να δώσει προτεραιότητα στην τήρηση προηγούμενων αναρτήσεων στο νήμα, συμπεριλαμβανομένων τυχόν δυσάρεστων αναρτήσεων, αντί να απαντά υπεύθυνα ή να αρνείται να απαντήσει σε δυσάρεστα αιτήματα.

Στις 8 Ιουλίου 2025, περίπου στις 3:13 μ.μ. PT, λόγω αυξημένης καταχρηστικής χρήσης του @grok , απενεργοποιήσαμε τη λειτουργικότητα @grok στην πλατφόρμα X. Δεν επηρεάστηκαν άλλες υπηρεσίες που βασίζονται σε οποιοδήποτε xAI Grok LLM.

Αφού εντοπίσαμε την αιτία των ανεπιθύμητων αντιδράσεων, προβήκαμε στις ακόλουθες ενέργειες:
* Το προσαρτημένο σύνολο εντολών που προκαλούσε σφάλμα διαγράφηκε.
* Διεξήχθησαν πρόσθετες δοκιμές και αξιολογήσεις από άκρο σε άκρο του συστήματος @grok για να επιβεβαιωθεί ότι το πρόβλημα είχε επιλυθεί, συμπεριλαμβανομένης της διεξαγωγής προσομοιώσεων των αναρτήσεων και των νημάτων X που είχαν ενεργοποιήσει τις ανεπιθύμητες απαντήσεις.
* Υλοποιήθηκαν πρόσθετα συστήματα παρατηρησιμότητας και διαδικασίες προδημοσίευσης για @grok .

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Το Ψάρεμα στην Αρχαία Ελλάδα

Το ψάρεμα στην αρχαία Ελλάδα αναπτύχθηκε κυρίως στο Αιγαίο Πέλαγος Οι γραφικοί όρμοι και οι πλούσιες ακτές πρόσφεραν άφθονα ψάρια στους κατοίκους. Παράλληλα, τα γλυκά...

Όταν οι αρχαίοι σήκωναν το κεφάλι ψηλά, δεν έβλεπαν απλώς λαμπερές κουκκίδες: Έβλεπαν την ιστορία τους, τη θρησκεία τους και το ημερολόγιό τους

1. Ο Μύθος του «Καταστερισμού» Η κεντρική ιδέα που κυριαρχούσε ήταν ο «Καταστερισμός». Οι αρχαίοι πίστευαν ότι οι θεοί (κυρίως ο Δίας) είχαν τη δύναμη...

Πήραν τον ύμνο της ΝΔ και του άλλαξαν τα φώτα και έφτιαξαν το πιο viral τραγούδι για τον ΟΠΕΚΕΠΕ

Κυκλοφορεί στο διαδίκτυο, βασισμένο στον ύμνο της ΝΔ https://twitter.com/marka2free/status/1997412189032812784?s=61 

Κατέρρευσε ο κτηνοτρόφος που αποχαιρέτησε με λυγμούς 450 πρόβατά του που θανατώθηκαν – Έπαθε εγκεφαλικό

Ο κτηνοτρόφος που συγκίνησε όλη την χώρα με τα δάκρυά του αποχαιρετώντας το κοπάδι από πρόβατα του μίας σπάνια ντόπιας ράτσας, δεν άντεξε τη θλίψη...

Η καλλιέργεια της Μανταρινιάς

Τα μανταρίνια θεωρούνται καρποί με σημαντική διατροφική αξία, καθώς αποτελούν πλούσια πηγή βιταμίνης C, μετάλλων, αντιοξειδωτικών και φυτικών ινών Μπορούμε να φυτέψουμε μανταρινιά στον κήπο...

Χαμός με την αυτοβιογραφική ατάκα του Γιώργου Μαζωνάκη στον αέρα του The Voice με αφορμή το τραγούδι του Γιάννη Μηλιώκα “Για το καλό μου”

Το τραγούδι "Για το καλό μου" ερμήνευσαν δύο παίχτες της ομάδας του Γιώργου Μαζωνάκη στην εκπομπή The Voice Μετά την εκτέλεση του τραγουδιού ακολούθησε ένας...

Θρήνος για το δίχρονο αγγελούδι που το κατασπάραξε σκυλος ράτσας πίτμπουλ

Σοκαρισμένη είναι η τοπική κοινωνία στη Ζάκυνθο καθώς ένα παιδάκι μόλις δύο ετών έχασε την ζωή του από επίθεση σκύλου το μεσημέρι του Σαββάτου Το...

Παύλος Σιδηρόπουλος: Ο Δισέγγονος του Ζορμπά εφυγε από τη ζωή σαν σήμερα το 1990 στα 42 του μόλις χρόνια

Δισέγγονος του Ζορμπά,ανιψιός της Έλλης Αλεξίου και της Γαλάτειας Καζαντζάκη Πνεύμα ελεύθερο και άναρχο,ο Παύλος Σιδηροπουλος υπηρξε από τους σημαντικούς εκπρόσωπους της ελληνικής ροκ Σε...

Γιατί οι Έλληνες δνε κάνουν παιδιά – Στοιχεία που σοκάρουν

Η κατάσταση έχει ξεφύγει Όσο κι αν προσπαθεί η κυβέρνηση να παρουσιάσει ένα success story, η πραγματικότητα είναι αμείλικτη.Η Ελλάδα εξελίσσεται σε μια από τις...

Σάλος με την στήριξη του Γιώργου Κύρτσου στον Νίκο Ανδρουλακη

Σε ανάρτηση του ο Γιώργος Κύρτσος αναφέρει: Στους κερδισμένους από τις πρωτοβουλίες Τσίπρα είναι ο Ανδρουλάκης. Ο Τσίπρας εμφανίστηκε έτοιμος να ηγεμονεύσει στον χώρο της αντιπολίτευσης.Ζήτησε...

Το χρονικό του διωγμού του Elon Musk από την διεφθαρμένη Κομισιόν: Αρνήθηκε να λογοκρίνει, αρνήθηκε να ρουφιανέψει!

Γιατί φοβούνται τον Ελον Μασκ; Γιατί φοβούνται μια πλατφόρμα που δίνει στους ανθρώπους πραγματική φωνή; → Ιούνιος 2023: Η ΕΕ έλεγξε το 𝕏 με τα...

Ησιοδος: Τα πεντε Γένη των Ανθρώπων

Τα Γένη των Ανθρώπων είναι τα στάδια της ανθρώπινης ύπαρξης στη Γη σύμφωνα με την αρχαία ελληνική μυθολογία και την μετέπειτα ρωμαϊκή ερμηνεία τηςΤόσο...

Πώς ο Άγιος Νικόλαος έγινε Αϊ-Βασίλης…

Ο επίσκοπος από τα Μύρα της Λυκίας και το συνονθύλευμα μύθων από διαφορετικές εποχές και περιοχές του κόσμου που διαμόρφωσαν την εικόνα του ασπρομάλλη...

Ο Παύλος Κοντογιανννιδης μέσω ΤΙΚ ΤΟΚ τσακίζει τον Αλέξη Τσιπρα: Η παρουσίαση του βιβλίου ήταν «προεκλογική παρουσίαση του νέου πολιτικού του σχηματισμού»

Σφοδρή επίθεση εξαπέλυσε ο Παύλος Κοντογιαννίδης κατά του Αλέξη Τσίπρα με αφορμή όσα είπε στην παρουσίαση του βιβλίου του «Ιθάκη» για τη δημιουργία νέου...

Σάλος με την επανάληψη του The Voice – Εξαλλοι οι τηλεθεατές του δημοφιλούς talent show

Την οργή των τηλεθεατών προκάλεσε η επιλογή του Σκαι να προβάλει σε επανάληψη παλιότερο επεισόδιο του The Voice το βράδυ της Παρασκευής Ο κόσμος περίμενε...

Το πραγματικό πρόσωπο του Λεωνίδα όπως αποτυπώθηκε στο μοναδικό εύρημα – άγαλμα που βρίσκεται στην Σπάρτη

Ένα αριστούργημα από παριανό μάρμαρο που απεικονίζει τον αιώνιο βασιλιά της Σπάρτης, τον θρυλικό Λεωνίδα Χρονολογείται από το 480 προ Χριστού και φυλάσσεται στο αρχαιολογικό...

“Εξαπάτησαν” χιλιάδες τηλεθεατές του Κωνσταντίνου και Ελένης με φωτογραφίες φτιαγμένες από την τεχνητή νοημοσύνη

Τον γύρο του διαδικτύου έκαναν πριν λίγες μέρες δύο φωτογραφίες που απεικόνιζαν τον Χάρη Ρώμα και την Ελένη Ράντου στο σπίτι όπου έγιναν τα...

Εκτακτο: Πότε ανοίγει το ΜΕΤΡΟ Θεσσαλονίκης

Σύμφωνα με τον Κώστα Κυρανακη: Το Μετρό Θεσσαλονίκης ανοίγει ξανά την Δευτέρα 8/12, δηλαδή νωρίτερα απ’ ό,τι είχαμε δεσμευθεί και παρά τη δυσπιστία.Οι δοκιμές ασφαλείας...

Μεγάλη απάτη με παράνομες συνταγογραφήσεις: Κέρδη που ξεπερνούν τις 435.000 ευρώ

Επτά γιατροί και ένας φαρμακοποιός εμπλέκονται στο οργανωμένο κύκλωμα που διέπρατταν κακουργηματικές απάτες σε βάρος του ΕΟΠΥΥ μέσω παράνομων συνταγογραφήσεων φαρμάκων Η σπείρα εξαρθρώθηκε από...

Μαρία Απατζιδη: Στις επόμενες εκλογές η κυβέρνηση Μητσοτάκη καταρρέει!

Εμείς οι Έλληνες, όπου κι αν βρισκόμαστε στον κόσμο, ενωνόμαστε ξανά.Από την Αστόρια μέχρι τη Μελβούρνη, από το Λονδίνο μέχρι το Γιοχάνεσμπουργκ:Η φωνή μας...

ΔΗΜΟΦΙΛΗ