Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

1777018249325.png

Βγήκε και το νέο DeepSeek, πολύ μεγάλο βήμα για τα ανοιχτά μοντέλα, πέρασε μπροστά από το GLM 5.1 και το Kimi 2.6.

Διαβάζω σιγά σιγά για το ChatGPT 5.5 και τις νέες δυνατότητες που φέρνει. Και αυτές από ότι καταλάβαίνω δεν είναι τα καλύτερα σκορ στα benchmarks, αλλά το τι μπορεί να κάνει τώρα το Codex.


Με απλά λόγια η OpenAI διαθέτει πλέον μια αξιόπιστη διαδρομή προς κάθε λογισμικό που διαθέτει γραφικό περιβάλλον διεπαφής (GUI), και το κατάφερε αυτό χωρίς να χρειαστεί τη συνεργασία ούτε ενός προμηθευτή. Ο πράκτορας (agent) απλώς χειρίζεται τη διεπαφή που χειριζόμαστε ήδη εμείς.

Σκεφτείτε τι αλλάζει με αυτό. Πριν από έξι μήνες, οποιοδήποτε λογισμικό δεν διέθετε API βρισκόταν εξ ολοκλήρου εκτός της συζήτησης περί αυτοματισμού. Εσωτερικά ταμπλό ελέγχου (dashboards), πύλες παλαιών προμηθευτών (legacy portals), η εφαρμογή που έφτιαξε μια εταιρεία το 2019 και δεν συντήρησε ποτέ. Αυτό το λογισμικό μόλις επέστρεψε στο προσκήνιο, μέσα από μια πόρτα που δεν απαιτεί την άδεια κανενός για να ανοίξει.

Η Anthropic έκανε το ίδιο στοίχημα όσον αφορά την έξοδο των πρακτόρων από το πλαίσιο του προγραμματισμού (coding box), αλλά μέσω δομημένων διεπαφών που εξαρτώνται από το αν το οικοσύστημα θα αναπτυχθεί εξαρχής για πράκτορες. Και τα δύο εργαστήρια κατευθύνονται στον ίδιο προορισμό. Οι διαδρομές που επέλεξαν είναι θεμελιωδώς διαφορετικές, και αυτή η διαφορά καθορίζει σε ποιο λογισμικό μπορούν πραγματικά να έχουν πρόσβαση οι πράκτορές σας σήμερα.

ΑΝ δουλέψει σωστά και γρήγορα το νέο codex, νομίζω θα γυρίσει πάλι η πλάστιγγα προς την OpenAI. Πρακτικά δεν θα χρειάζεσαι καν MCP Servers...Αυτό και αν είναι άλμα σε επίπεδο λίγων εβδομάδων. Το ChatGPT 5.4 βγήκε 5 Μαρτίου για να θυμόμαστε λίγο. Πείτε μου εσείς ότι δεν έχουμε μπει στο singularity...

Γιώργο το τι λέει ο καθένας για ένα μοντέλο σε θεωρητικό επίπεδο τα ακούω λίγο αέρα φρέσκο.
Δεν έχει γίνει καμμία επανάσταση με το computer use όπως δεν έγινε και με το dispatch της Anthropic. Βασικά όχι επανάσταση δεν έγινε, πουθενά δεν πήγαμε. Καλό το θεωρητικό σενάριο και αυτά τα πομπώδη που λέει ο καθένας, αλλά βάλε το από το computer use ή το dispatch να ανοίξουν services στο azure, στο AWS ή το GCP και μετά συνέκρινε τη διαδικασία με το Azure CLI ή το cloud shell του GCP.

Και εγώ έχω ένα claude app ανοιχτό 24/7 σε ένα mac mini που είχα πάρει, το dispatch (το αντίστοιχο του computer use) το έχω χρησιμοποιήσει 2 φορές και αυτό δοκιμαστικά.
 
View attachment 270644

Βγήκε και το νέο DeepSeek, πολύ μεγάλο βήμα για τα ανοιχτά μοντέλα, πέρασε μπροστά από το GLM 5.1 και το Kimi 2.6.



Γιώργο το τι λέει ο καθένας για ένα μοντέλο σε θεωρητικό επίπεδο τα ακούω λίγο αέρα φρέσκο.
Δεν έχει γίνει καμμία επανάσταση με το computer use όπως δεν έγινε και με το dispatch της Anthropic. Βασικά όχι επανάσταση δεν έγινε, πουθενά δεν πήγαμε. Καλό το θεωρητικό σενάριο και αυτά τα πομπώδη που λέει ο καθένας, αλλά βάλε το από το computer use ή το dispatch να ανοίξουν services στο azure, στο AWS ή το GCP και μετά συνέκρινε τη διαδικασία με το Azure CLI ή το cloud shell του GCP.

Και εγώ έχω ένα claude app ανοιχτό 24/7 σε ένα mac mini που είχα πάρει, το dispatch (το αντίστοιχο του computer use) το έχω χρησιμοποιήσει 2 φορές και αυτό δοκιμαστικά.
Ακριβώς ο τρόπος που το ρωτάς δίνει την απάντηση.

Το πόσο ξεφεύγουμε από το "εργαλεία που κυρίως στοχεύουν σε υποδομές ΙΤ" σε εργαλεία που στοχεύουν τα πάντα. Για το δικό σου χώρο, workflow, κλπ προφανώς ότι λες είναι η καθημερινότητά σου.
Από την άλλη στο δικό μου χώρο εργασίας, workflow, αν χωρίς API καταφέρει να μου φτιάχνει προσομοιώσεις/βελτιστοποιήσεις σε υπάρχοντα μοντέλα πχ matlab/simulink ή στο LabVIEW χωρίς MCP Servers ή άλλα API είναι απλά επαναστατικό. Στο μελετητικό χώρο υπάρχουν ένα σκασμό λογισμικά, άλλα παλιά, άλλα καινούργια που τα περισσότερα είναι δύστροπα αλλά χρησιμοποιούνται ακόμη ευρέως. Και βέβαια οι άνθρωποι που ξέρουν να τα χρησιμοποιούν σωστά και γρήγορα είναι περιζήτητοι. Σίγουρα αυτό θα έχει επίπτωση (κανείς δεν ξέρει αν θα είναι συνολικά καλή ή κακή), αλλά θα ήθελα πραγματικά π.χ. ο επόμενος ΚΕΝΑΚ (Κανονισμός Ενεργειακής Απόδοσης Κτηρίων) να βασίζεται σε ένα εργαλείο προσομοιώσεων πολύ πιο στιβαρό, από αυτό που χρησιμοποιούν οι μηχανικοί σήμερα βάσει νόμου.