Έχει αρχίσει η γκρίνια για το Fable. Η ενσωμάτωση δικλείδων ασφαλείας από την Anthropic στο Fable 5 αναδεικνύει τη σύγκρουση μεταξύ της αποτροπής κακόβουλης χρήσης και της αναγκαίας διαφάνειας για την αυστηρή έρευνα. Με στόχο την προστασία από απειλές (πχ. βιολογικά όπλα) και την κλοπή πνευματικής ιδιοκτησίας, εφαρμόστηκαν αυστηροί ταξινομητές, οι οποίοι ωστόσο λειτουργούν αδιαφανώς: αντί να απορρίπτουν ρητά τις στοχοποιημένες εντολές, τις ανακατευθύνουν σιωπηρά σε ένα υποδεέστερο μοντέλο (Opus 4.8).
Αυτή η πρακτική του "covert sandbagging" προκαλεί αιφνίδια πτώση της απόδοσης. Κατά συνέπεια, υπονομεύεται η αξιοπιστία του συστήματος για μηχανικούς και ερευνητές, καθώς καθίσταται αδύνατη η διάγνωση των αιτιών μιας αστοχίας και ως αποτέλεσμα αφαιρώντας τη δυνατότητα να είσαι σίγουρος εάν ένα σφάλμα οφείλεται σε ανεπάρκεια του prompt, στα εγγενή όρια του μοντέλου ή σε σκόπιμη υποβάθμιση από τον πάροχο.
Σε άλλα νέα, προσπαθώ τις τελευταίες ημέρες να στήσω το codex ακριβώς για τα workflow μου που δεν έχουν σχέση με προγραμματισμό. Και όσο περισσότερο διαβάζω και το ψάχνω, τόσο μου θυμίζει τον πειραματισμό μου με το Openclaw. Μπορείς να κάνεις απίστευτα πράγματα με πολύ μεγαλύτερη ασφάλεια σε σχέση με το openclaw, αλλά δεν υπάρχουν ούτε tutorials ούτε guides. Επίσης είναι από τα λίγα πράγματα που η Pro έκδοση του ChatGPT βοηθάει περισσότερο και πιο στοχευμένα σε σχέση με το απλό Thinking, ανεξαρτήτως effort στο να καταλάβεις τις δυνατότητες και να παραμετροποιήσεις αντίστοιχα.
Μπορώ να πω με σιγουριά ότι από τους φίλους που τους έχω βοηθήσει ελάχιστοι θα μπορούσαν καν να καταλάβουν πως αυτό λειτουργεί χωρίς πολύωρο σεμινάριο. Και επειδή το κάθε workflow σε διαφορετικό πεδίο είναι διαφορετικό θέλει βελτιστοποίηση για τον καθένα. Οπότε ακόμη και να το στήσω και να τους δείξω πως να το χρησιμοποιούν, δεν θα μπορέσουν στην πράξη να το προσαρμόσουν περισσότερο.
Αν και δεν έχω παίξει σε τέτοιο βάθος με το Claude code νομίζω αντίστοιχα θα ισχύουν και εκεί.
Να δώσω συγκεκριμένα παραδείγματα. Μπορείς να έχεις ιεραρχικά διαφορετικά agents.md. Μπορείς να φτιάξεις skills για διαφορετικούς Agents. Μπορείς αυτόματα να δώσεις άλλο περιβάλλον εργασίας (κυρίως όσο αφορά το context) σε διαφορετικούς agents που μπορούν να δουλεύουν και παράλληλα και μπορούν να αναπτύσσουν και να χρησιμοποιούν αυτόνομα και sub-agents διασφαλίζοντας διαφορετικές οπτικές και μείωση τυχόν Bias κλπ.
Προς το παρόν και οι δύο εταιρίες έχουν βάλει τα δυνατά τους να δουλεύουν Out of the box καλά για task που έχουν σχέση με προγραμματισμό. Στην πράξη είναι πλατφόρμες ανάπτυξης και υλοποίησης πολυπρακτορικών συστημάτων, όμως σε αφήνουν μόνος σου τα στήσεις για τέτοια χρήση. Η ψαλίδα μεταξύ αυτών που ξέρουν και μπορούν ανοίγει τρελά πολύ σε σχέση με το κλασσικό chat based εργαλείο.