
Βγήκε και το νέο DeepSeek, πολύ μεγάλο βήμα για τα ανοιχτά μοντέλα, πέρασε μπροστά από το GLM 5.1 και το Kimi 2.6.
Διαβάζω σιγά σιγά για το ChatGPT 5.5 και τις νέες δυνατότητες που φέρνει. Και αυτές από ότι καταλάβαίνω δεν είναι τα καλύτερα σκορ στα benchmarks, αλλά το τι μπορεί να κάνει τώρα το Codex.
Με απλά λόγια η OpenAI διαθέτει πλέον μια αξιόπιστη διαδρομή προς κάθε λογισμικό που διαθέτει γραφικό περιβάλλον διεπαφής (GUI), και το κατάφερε αυτό χωρίς να χρειαστεί τη συνεργασία ούτε ενός προμηθευτή. Ο πράκτορας (agent) απλώς χειρίζεται τη διεπαφή που χειριζόμαστε ήδη εμείς.
Σκεφτείτε τι αλλάζει με αυτό. Πριν από έξι μήνες, οποιοδήποτε λογισμικό δεν διέθετε API βρισκόταν εξ ολοκλήρου εκτός της συζήτησης περί αυτοματισμού. Εσωτερικά ταμπλό ελέγχου (dashboards), πύλες παλαιών προμηθευτών (legacy portals), η εφαρμογή που έφτιαξε μια εταιρεία το 2019 και δεν συντήρησε ποτέ. Αυτό το λογισμικό μόλις επέστρεψε στο προσκήνιο, μέσα από μια πόρτα που δεν απαιτεί την άδεια κανενός για να ανοίξει.
Η Anthropic έκανε το ίδιο στοίχημα όσον αφορά την έξοδο των πρακτόρων από το πλαίσιο του προγραμματισμού (coding box), αλλά μέσω δομημένων διεπαφών που εξαρτώνται από το αν το οικοσύστημα θα αναπτυχθεί εξαρχής για πράκτορες. Και τα δύο εργαστήρια κατευθύνονται στον ίδιο προορισμό. Οι διαδρομές που επέλεξαν είναι θεμελιωδώς διαφορετικές, και αυτή η διαφορά καθορίζει σε ποιο λογισμικό μπορούν πραγματικά να έχουν πρόσβαση οι πράκτορές σας σήμερα.
ΑΝ δουλέψει σωστά και γρήγορα το νέο codex, νομίζω θα γυρίσει πάλι η πλάστιγγα προς την OpenAI. Πρακτικά δεν θα χρειάζεσαι καν MCP Servers...Αυτό και αν είναι άλμα σε επίπεδο λίγων εβδομάδων. Το ChatGPT 5.4 βγήκε 5 Μαρτίου για να θυμόμαστε λίγο. Πείτε μου εσείς ότι δεν έχουμε μπει στο singularity...
Γιώργο το τι λέει ο καθένας για ένα μοντέλο σε θεωρητικό επίπεδο τα ακούω λίγο αέρα φρέσκο.
Δεν έχει γίνει καμμία επανάσταση με το computer use όπως δεν έγινε και με το dispatch της Anthropic. Βασικά όχι επανάσταση δεν έγινε, πουθενά δεν πήγαμε. Καλό το θεωρητικό σενάριο και αυτά τα πομπώδη που λέει ο καθένας, αλλά βάλε το από το computer use ή το dispatch να ανοίξουν services στο azure, στο AWS ή το GCP και μετά συνέκρινε τη διαδικασία με το Azure CLI ή το cloud shell του GCP.
Και εγώ έχω ένα claude app ανοιχτό 24/7 σε ένα mac mini που είχα πάρει, το dispatch (το αντίστοιχο του computer use) το έχω χρησιμοποιήσει 2 φορές και αυτό δοκιμαστικά.