Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

1777018249325.png

Βγήκε και το νέο DeepSeek, πολύ μεγάλο βήμα για τα ανοιχτά μοντέλα, πέρασε μπροστά από το GLM 5.1 και το Kimi 2.6.

Διαβάζω σιγά σιγά για το ChatGPT 5.5 και τις νέες δυνατότητες που φέρνει. Και αυτές από ότι καταλάβαίνω δεν είναι τα καλύτερα σκορ στα benchmarks, αλλά το τι μπορεί να κάνει τώρα το Codex.


Με απλά λόγια η OpenAI διαθέτει πλέον μια αξιόπιστη διαδρομή προς κάθε λογισμικό που διαθέτει γραφικό περιβάλλον διεπαφής (GUI), και το κατάφερε αυτό χωρίς να χρειαστεί τη συνεργασία ούτε ενός προμηθευτή. Ο πράκτορας (agent) απλώς χειρίζεται τη διεπαφή που χειριζόμαστε ήδη εμείς.

Σκεφτείτε τι αλλάζει με αυτό. Πριν από έξι μήνες, οποιοδήποτε λογισμικό δεν διέθετε API βρισκόταν εξ ολοκλήρου εκτός της συζήτησης περί αυτοματισμού. Εσωτερικά ταμπλό ελέγχου (dashboards), πύλες παλαιών προμηθευτών (legacy portals), η εφαρμογή που έφτιαξε μια εταιρεία το 2019 και δεν συντήρησε ποτέ. Αυτό το λογισμικό μόλις επέστρεψε στο προσκήνιο, μέσα από μια πόρτα που δεν απαιτεί την άδεια κανενός για να ανοίξει.

Η Anthropic έκανε το ίδιο στοίχημα όσον αφορά την έξοδο των πρακτόρων από το πλαίσιο του προγραμματισμού (coding box), αλλά μέσω δομημένων διεπαφών που εξαρτώνται από το αν το οικοσύστημα θα αναπτυχθεί εξαρχής για πράκτορες. Και τα δύο εργαστήρια κατευθύνονται στον ίδιο προορισμό. Οι διαδρομές που επέλεξαν είναι θεμελιωδώς διαφορετικές, και αυτή η διαφορά καθορίζει σε ποιο λογισμικό μπορούν πραγματικά να έχουν πρόσβαση οι πράκτορές σας σήμερα.

ΑΝ δουλέψει σωστά και γρήγορα το νέο codex, νομίζω θα γυρίσει πάλι η πλάστιγγα προς την OpenAI. Πρακτικά δεν θα χρειάζεσαι καν MCP Servers...Αυτό και αν είναι άλμα σε επίπεδο λίγων εβδομάδων. Το ChatGPT 5.4 βγήκε 5 Μαρτίου για να θυμόμαστε λίγο. Πείτε μου εσείς ότι δεν έχουμε μπει στο singularity...

Γιώργο το τι λέει ο καθένας για ένα μοντέλο σε θεωρητικό επίπεδο τα ακούω λίγο αέρα φρέσκο.
Δεν έχει γίνει καμμία επανάσταση με το computer use όπως δεν έγινε και με το dispatch της Anthropic. Βασικά όχι επανάσταση δεν έγινε, πουθενά δεν πήγαμε. Καλό το θεωρητικό σενάριο και αυτά τα πομπώδη που λέει ο καθένας, αλλά βάλε το από το computer use ή το dispatch να ανοίξουν services στο azure, στο AWS ή το GCP και μετά συνέκρινε τη διαδικασία με το Azure CLI ή το cloud shell του GCP.

Και εγώ έχω ένα claude app ανοιχτό 24/7 σε ένα mac mini που είχα πάρει, το dispatch (το αντίστοιχο του computer use) το έχω χρησιμοποιήσει 2 φορές και αυτό δοκιμαστικά.
 
View attachment 270644

Βγήκε και το νέο DeepSeek, πολύ μεγάλο βήμα για τα ανοιχτά μοντέλα, πέρασε μπροστά από το GLM 5.1 και το Kimi 2.6.



Γιώργο το τι λέει ο καθένας για ένα μοντέλο σε θεωρητικό επίπεδο τα ακούω λίγο αέρα φρέσκο.
Δεν έχει γίνει καμμία επανάσταση με το computer use όπως δεν έγινε και με το dispatch της Anthropic. Βασικά όχι επανάσταση δεν έγινε, πουθενά δεν πήγαμε. Καλό το θεωρητικό σενάριο και αυτά τα πομπώδη που λέει ο καθένας, αλλά βάλε το από το computer use ή το dispatch να ανοίξουν services στο azure, στο AWS ή το GCP και μετά συνέκρινε τη διαδικασία με το Azure CLI ή το cloud shell του GCP.

Και εγώ έχω ένα claude app ανοιχτό 24/7 σε ένα mac mini που είχα πάρει, το dispatch (το αντίστοιχο του computer use) το έχω χρησιμοποιήσει 2 φορές και αυτό δοκιμαστικά.
Ακριβώς ο τρόπος που το ρωτάς δίνει την απάντηση.

Το πόσο ξεφεύγουμε από το "εργαλεία που κυρίως στοχεύουν σε υποδομές ΙΤ" σε εργαλεία που στοχεύουν τα πάντα. Για το δικό σου χώρο, workflow, κλπ προφανώς ότι λες είναι η καθημερινότητά σου.
Από την άλλη στο δικό μου χώρο εργασίας, workflow, αν χωρίς API καταφέρει να μου φτιάχνει προσομοιώσεις/βελτιστοποιήσεις σε υπάρχοντα μοντέλα πχ matlab/simulink ή στο LabVIEW χωρίς MCP Servers ή άλλα API είναι απλά επαναστατικό. Στο μελετητικό χώρο υπάρχουν ένα σκασμό λογισμικά, άλλα παλιά, άλλα καινούργια που τα περισσότερα είναι δύστροπα αλλά χρησιμοποιούνται ακόμη ευρέως. Και βέβαια οι άνθρωποι που ξέρουν να τα χρησιμοποιούν σωστά και γρήγορα είναι περιζήτητοι. Σίγουρα αυτό θα έχει επίπτωση (κανείς δεν ξέρει αν θα είναι συνολικά καλή ή κακή), αλλά θα ήθελα πραγματικά π.χ. ο επόμενος ΚΕΝΑΚ (Κανονισμός Ενεργειακής Απόδοσης Κτηρίων) να βασίζεται σε ένα εργαλείο προσομοιώσεων πολύ πιο στιβαρό, από αυτό που χρησιμοποιούν οι μηχανικοί σήμερα βάσει νόμου.
 
Μόλις έφτιαξα μια παρουσίαση με το 5.5. Μου έχει πέσει το σαγόνι στο πάτωμα, γιατί απλά του έδωσα παράλληλα ένα template παρουσίασης και τα ετοίμασε όλα και γραφιστικά τέλεια.
10 λεπτά κυρίως να τη διαβάσω και μικροδιορθώσεις και ήταν έτοιμη...
Έτσι το δυνατό σημείο που είχε το ChatGPT στην ανάλυση μεγάλων report και την παραγωγή του περιεχομένου της παρουσίασης τώρα έχει συνδυαστεί και με δυνατή παρουσίαση οπτικά.
 
Συγχωρέστε τον άσχετο,αλλά θα ήθελα την γνώμη και εμπειρίας σας.Έως και την Τετάρτη 22/04 και στα πλαίσια συνεχών βελτιώσεων και προσθηκών του site που έχει φτιάξει,του ζητούσα πχ μία προσθήκη σε μία σελίδα και σε ελάχιστο χρόνο το έκανε σε πχ 100 αρχεία html χωρίς το παραμικρό λάθος.Από εχθές το απόγευμα είναι σαν να επεξεργάζεται τις προσθήκες και βελτιώσεις το δωρεάν Google AI με το οποίο είχα ξεκινήσει να φτιάξω το site και μετά από 6 ημέρες όπου έβγαλα το xτικιό,πήγα στο Claude.Δηλαδή πχ,του ζητάω να μεταφράσει το βασικό html που είναι στα Αγγλικά και να φτιάξει 11 html's σε 11 γλώσσες,κάτι που όπως είπα έως την Τετάρτη το έκανε χωρίς λάθος και αστραπιαία.Από εχθές,το κάνει σκατά.Άλλες παράγραφοι στο πχ Ελληνικά,άλλες παραμέμουν στα Αγγλικά.Τι άλλαξε?
 
Συγχωρέστε τον άσχετο,αλλά θα ήθελα την γνώμη και εμπειρίας σας.Έως και την Τετάρτη 22/04 και στα πλαίσια συνεχών βελτιώσεων και προσθηκών του site που έχει φτιάξει,του ζητούσα πχ μία προσθήκη σε μία σελίδα και σε ελάχιστο χρόνο το έκανε σε πχ 100 αρχεία html χωρίς το παραμικρό λάθος.Από εχθές το απόγευμα είναι σαν να επεξεργάζεται τις προσθήκες και βελτιώσεις το δωρεάν Google AI με το οποίο είχα ξεκινήσει να φτιάξω το site και μετά από 6 ημέρες όπου έβγαλα το xτικιό,πήγα στο Claude.Δηλαδή πχ,του ζητάω να μεταφράσει το βασικό html που είναι στα Αγγλικά και να φτιάξει 11 html's σε 11 γλώσσες,κάτι που όπως είπα έως την Τετάρτη το έκανε χωρίς λάθος και αστραπιαία.Από εχθές,το κάνει σκατά.Άλλες παράγραφοι στο πχ Ελληνικά,άλλες παραμέμουν στα Αγγλικά.Τι άλλαξε?
Δεν χρησιμοποιώ Claude για να σε βοηθήσω άμεσα.
Πάντως η Anthropic ψάχνεται πως να αντιμετωπίσει την έλλειψη υπολογιστικής υποδομής. Όπως έγραψα πιο πριν έκοψαν για λίγες ώρες το Claude Code από τις 20δολαρες συνδρομές, έγινε χαμός και το μάζεψαν. Ίσως όμως να έχουν υποβαθμίσει είτε το μοντέλο, είτε το πόσο πολύ σκέφτεται το μοντέλο σε αυτό το επίπεδο συνδρομής. Είναι τελείως εικασία αυτό που κάνω προφανώς.
 
Μιλάμε για χάλια Γιώργο.Εχτες "καταπιε" 25 ευρω για extra usage και απο τα λάθη και τις παραλείψεις του τα έφαγε χωρις να φτιάξει οτι του ζητούσα.
 
Του έχεις πει να φτιάξει Claude.md και ένα directory /docs;
Ειναι το πρώτο που πρέπει να του πεις να κάνει. Εκεί να αναλύσει το project και ότι άλλο κάνει σε κάθε session.
Και στην αρχή του κάθε session του λες να τα διαβάσει
 
Του έχεις πει να φτιάξει Claude.md και ένα directory /docs;
Ειναι το πρώτο που πρέπει να του πεις να κάνει. Εκεί να αναλύσει το project και ότι άλλο κάνει σε κάθε session.
Και στην αρχή του κάθε session του λες να τα διαβάσει
Ποιός ήρθε;' :unsure: Οπως έγραψα και ποιο πάνω,είμαι εντελώς άσχετος,αλλά παρά την ασχετοσύνη μου,έως και την Τετάρτη ήταν αλάθητο.Πεμπτη,Παρασκευή και Σάββατο,γ...θηκε.Σήμερα έστρωσε αρκετά.Αν το Claude.md είναι κάτι σαν οδηγίες,ναι είχα σώσει σε txt ένα κείμενο όπου σε κάθε νέα συζήτηση το έβαζα στην αρχή,δίνοντάς του ταυτόχρονα και το αντίστοιχο της εργασίας που ήθελε να κάνει αρχείο html.Συνολικά έγραψε 225 αρχεία html συν κάτι
.htaccess,
apple-touch icon,
cookie-banner.js,
favicon.ico,
favicon.svg,
favicon-96x96.png,
robots.txt,
send_booking.php,
site.webmanifest,
sitemap.xml,
style.css. που μόνο εκείνο ξέρει τι είναι.
 
Γράψε του το εξής
"Κάνει ανάλυση στο project και γράψε ένα αναλυτικό Claude.md. Μετά φτιάξε ένα directory /docs με αρχεία για να κρατάς σημειώσεις και να δημιουργείς ένα καινούργιο σε κάθε session."
Πριν ξεκινήσεις θα του γράφεις "διάβασε το Claude.md και τα αρχεία κάτω από το /docs"
 
Ως αδαης της χρησεως ΑΙ σημερα μπορω να πω επαθα ενα μικρο σοκ


θεωρωντας οτι το Pro της Gemini θα ειχει καλυτερη πληροφορηση , ζητησα να μου δωσει link να πληρώσω...και πηρα την απαντηση

Δεν χρειάζεται να κάνεις καμία συνδρομή για να έχεις "Pro" συμβουλές! Ως τεχνητή νοημοσύνη, αυτή τη στιγμή μιλάς ήδη με το Gemini 3.1 Pro (στη δωρεάν βαθμίδα του). Είμαι το βασικό, ισχυρό μοντέλο και η ποιότητα της στρατηγικής, της ανάλυσης και της νομικής/τραπεζικής κατεύθυνσης που λαμβάνεις είναι ήδη στο υψηλότερο "Pro" επίπεδο. Οπότε, κράτα τα χρήματα της συνδρομής... θα σου χρειαστούν για τα έξοδα του.......
 
Πάντως έχει πλάκα ότι δεν έχουν εντολές για να προωθούν πωλήσεις για την εταιρία τους.
- Ρωτάω το ChatGPT αν πρέπει να αναβαθμιστώ σε Pro και μου λέει όχι, είναι πολύ μικρά τα ωφέλη στο workflow. Και μου λέει επίσης κάνε Business συνδρομή που με πολύ λιγότερα χρήματα σου δίνει περιορισμένη χρήση του Pro Μοντέλου και βλέπουμε.
- Ρωτάω το Gemini ποιο μοντέλο είναι καλύτερο για εμένα και μου λέει πήγαινε στο ChatGPT.
- Ρωτάω το Gemini αν πρέπει να πληρώσω τη μεγάλη συνδρομή και μου λέει πρέπει να μάθεις πρώτα να χρησιμοποιείς σωστά το οικοσύστημα της google με τη συνδρομή που έχεις.
- Ρωτάω το ChatGPT αν πρέπει να πάω στο Claude και μου λέει ότι βλέπει ότι έχω χρόνια να γράψω πραγματικό κώδικα βάσει των επιστημονικών δημοσιεύσεών μου κσι ότι οι παρουσιάσεις μου είναι περισσότερο business/academic και όχι marketing, οπότε καλύτερα να μείνω εκεί. Μου πρότεινε να αγοράσω συνδρομή στην Anthropic αν ξαναενεργοποιηθώ στο coding πολύ ή αν θέλω fancy παρουσιάσεις...
- Ρωτάω το Co-pilot πως να κάνω κάτι και καταλήγουμε ότι πρέπει να περιμένω στο update channel που είμαι (χωρίς χρονοδιάγραμμα) να ενεργοποιηθεί στο office η επιλογή που χρειάζεται για να μου κάνει τη δουλειά που θέλω.
 
I love the smell of drop database in the morning...

Όταν οι εταιρίες απολύουν developers επειδή νομίζουν ότι τα ΑΙ θα κάνουν καλύτερη δουλειά, αυτά συμβαίνουν.
 
Ακόμη και το Codex ή το Claude Code αν τα εγκαταστήσεις στον υπολογιστή σου και τους δώσεις άδειες μπορούν να κάνουν ότι θέλουν...
Η OpenAI δεν έχει βγάλει ακόμη υποστήριξη για τον πλήρη έλεγχο των Windows 11 -όπως έχει ήδη γίνει για το Mac OS X- τα θέματα ασφάλειας είναι τεράστια και τα δουλεύουν ακόμη...
 
Για το περιστατικό αυτό καμιά άποψη;

Το περιστατικό αυτό είναι περισσότερο fail για όλα τα άλλα υποσυστήματα και διαδικασίες της εταιρείας παρά για το AI..

Άκου να κρατάνε τα backups στο ίδιο σημείο που είναι και η βάση.. ηλίθιοι..
 
Στη δεδομένη περίπτωση η Railway φταίει.
Είναι υποτίθεται "cloud" και κρατάει τα backup στο ίδιο volume. :ROFLMAO:
Από την άλλη, φταίει και η ίδια η εταιρία που δεν έχει ψυχωτικό CTO.
Σαν μερικούς μερικούς που βάζουν το hosting να κάνει backup, τα παίρνουν σε δικό τους server στη hetzner και από εκεί στο NAS της εταιρίας που έχει mirroring NAS σε άλλο σπίτι.