Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Λοιπόν,τα συμπεράσματά μου από την χρήση 3 AI.Όπως έγραψα και πιο πάνω,ξεκίνησα με το τσάμπα AI του Google.Πολύ γρήγορο αλλά ηλίθιο εντελώς.Του ζητούσα να κάνει μία διόρθωση στο site,την έκανε,αλλά ξεχνούσε να γράψει κάτι.Αυτό συνεχίστηκε για 5 ημέρες.Έβγαλα το χτικιό και πήγα στο pro του ChatGPT.Απελπιστικά αργό και αρκετά ηλίθιο.Όχι σαν το Google βέβαια,αλλά και αυτό έκανε λάθη και παραλείψεις σε αυτό που του ζητούσα.Και πάμε στον Θεό,το Claude AI.Ξεκίνησα χθες βράδυ κατά τις 22:30 λέγοντάς του τι θέλω και στις 5 τα ξημερώματα,είχαμε τελειώσει.Ότι αλλαγή ή διόρθωση ή συμπλήρωση στην εικόνα του site ,την έκανε χωρίς το παραμικρό λάθος με αστραπιαία ταχύτητα.Εννοείται ότι και σε αυτό πλήρωσα τα 18 ευρώ για 1 μήνα συνδρομή,αλλά για αυτό που έκανε σε σύγκριση με το χτικιό στην ταχύτητα,ανταπόκριση και τα λάθη του Chatgpt,τα 18 ευρώ είναι κλοπή.

Το επί πληρωμή gemini, 3.1 pro, ειδικά για frontend, να φτιάξει ένα website δεν είναι κακό.
Το "δωρεάν" τους, στην επιλή fast είναι το gemini 3 flash με minimal thinking, όντως χάλια, το thinking 3 flash δεν είναι κακό επίσης για το μέγεθος του.

Κατά τα άλλα φυσικά, τα μοντέλα claude είναι πολύ δυνατά.

Να δώσω ένα παράδειγμα εκτός δουλειάς. Ολοκληρώνω το σχεδιασμό των καλοκαιρινών διακοπών, ένα roadtrip στη Γερμανία. Έχω φτιάξει ένα αρχείο κειμένου σαν guide που με βοηθάει στην οργάνωση. Το έδωσα στα:
- Google Pro 3.1
- ChatGPT 5.4 Thinking xHigh
- Claude Sonnet Thinking

Γιώργο, στείλε μου το prompt σε ένα πμ να στο βάλω στο μεγάλο gemini και στο Opus της Claude να δούμε.
 
Κατά τα άλλα φυσικά, τα μοντέλα claude είναι πολύ δυνατά.

Τα μοντέλα claude είναι όντως πολύ δυνατά αν είσαι developer.
Αν δεν ξέρεις τι θέλεις να κάνεις και με ποιο τρόπο θα σου τρώει τα tokens σαν στραγάλια.
 
Δεν είναι καλά μόνο αν είσαι dev. είναι καλά σε ότι και να κάνεις.
Από το να σου φτιάχνει παρουσιάσεις, αρχεία excel, να καταλάβει ένα project και να γράψει documentation σε ότι θέλεις.

Από εκεί και ύστερα, προφανώς, όσο μεγαλύτερο μοντέλο επιλέγεις και όσο πιο περίπλοκο γίνεται το task που του βάζεις, θα κοστίζει και περισσότερο.

Ωστόσο και έτσι να το δείς, ακόμη και 20€ να κόστιζε κάθε έγγαφο που βγάζει, το να το έκανα εγώ θα κόστιζε περισσότερο σε ανθρωποώρα.
 
Να πω και εγώ τη εμπειρία μου ως άσχετος από προγραμματισμό.

Έχω ξεκινήσει ένα project ενός μαγνητικού εργαλείου που μετραει παχος σε μη μαγνητικά αντικείμενα.

Το σχεδιαστικό/μηχανολογικο μέρος το έχω άνετα και με χρήση 3d printer οι διορθώσεις γινόταν μέσα σε 1 ώρα. Το ηλεκτρολογικο το κατέχω εν μέρη καθώς είχα φτιάξει παλαιότερα μέχρι και μικρό ενισχυτή για κιθάρα απλά το ΑΙ επιβεβαιωνε τους πυκνωτές και τις αντιστάσεις καθώς έπρεπε να διορθώσω ένα "bug" που υπάρχει στο rp2040.

Εδώ όμως χρειαζόμουν κώδικα...

Το project ξεκίνησε από το δωρεάν chatgpt και τώρα έχω βάλει το Plus για ένα μήνα.

Πέρασε ο κώδικας έλεγχο και από το ai studio και από το Claude.

Τα συμπεράσματα μου.

Το απλό chatgpt όσο το project έμενε σε έναν απλό κώδικα για arduino ήταν άψογο. Όταν πήγα σε raspberry rp2040 για επιπλέον δυνατότητες άρχισε το μπάχαλο. Έμοιαζε σαν το chatgpt να περίμενε να μάθει από μένα αν λειτούργησε αυτό που μου έδειξε, πράγμα που μου το επιβεβαίωσε στην plus έκδοση που σχεδόν μου το είπε στα μούτρα "ας προσεχες" .

Το ai studio απλά επιβεβαίωσε τον κώδικα με μερικές προτάσεις για βελτίωση τον οποίο μετά τον έβαλα πίσω στο chatgpt και "ξινησε" επειδή λέει έκανα πράγματα του κεφαλιού μου ... Μετά έβαλα τον ίδιο κώδικα στο Claude (δωρεάν) που έβγαλε το ai studio και μου εδωσε συγχαρητήρια για την απλότητα του και την δομή του

Δεν έχω κάνει χρήση του codex ακόμη. Αλλά όπως φαίνεται οι δωρεάν ακούσεις της Google και Claude φτιάχνουν καλύτερο κώδικα από το δωρεάν chatgpt . Στην πράξη μάλιστα το ai studio έφτιαξε ένα κώδικα εκμεταλευομενος τις πραγματικές δυνατότητες του hardware σε υπολογιστική ισχύ κάτι που το chatgpt δεν περιμενε να λειτουργήσει, σε καμία έκδοση του και όταν του το απέδειξα με μετρήσεις σχεδόν με σνομπαρε προτείνοντας αλλαγές για "σταθεροτητα" .

Δεν ξέρω αν αξίζουν τα 20€ για αυτές τις συνδρομές πάντως.
 
Στο ChatGPT επέλεξες χειροκίνητα το 5.4 Thinking και μετά να επιλέξεις το "Extended Thinking"; Ναι μπορεί να κάνει άνετα 10 λεπτά να απαντήσει αλλά οι απαντήσεις είναι ποιοτικές. Καθημερινά σε πολλά prompt περίπλοκά και αναλυτικά που φτιάχνω κάνει άνετ 40-45 λεπτά να απαντήσει, αλλά οι απαντήσεις είναι απλά απίστευτες (στο δικό μου αντικείμενο καλύτερες σε σχέση με Claude).
Άσε που σήμερα για κάτι τέτοιο (φτάξιμο website) πρέπει να πας στο codex και να επιλέξεις και εκεί High ή Extra High στο Thinking.
Γιώργο μου είμαι σίγουρoς ότι είσαι έτη φωτός πιο ενημερωμένος από εμένα,όμως αυτό που μου έφτιαξε το Claude,είναι άψογο τόσο γιατί το τελικό αποτέλεσμα με ικανοποιεί απόλυτα όσο και στο ότι προέβλεπε τι άλλη διόρθωση έπρεπε να κάνει για να γίνει πχ το site πιο γρήγορο ή πιο λειτουργικό ή πιο SEO. Έφτιαξε για παράδειγμα το βασικό index.html και όταν του είπα ότι θέλω να υπάρχουν 10 συνολικά γλώσσες,έφτιαξε 10 διαφορετικά index files και όποια προσθήκη του ζητούσα,αυτόματα την έκανε και στα 10 αρχεία τα οποία μου εμφάνιζε και είχε από κάτω κουμπί download για να τα κατεβάσω όλα μαζί. Με το chatgpt,ακόμα θα έκανε προσθήκες στο βασικό index.html οπότε το "ποιοτικές απαντήσεις" δεν ξέρω τι νόημα έχουν αν σου έχουν σπάσει τα νεύρα περιμένοντας και κυρίως αφού περιμένεις 5,10 λεπτά,να σου εμφανίζει μήνυμα ότι το AI δεν ανταποκρίνεται. Παιδευόμουν με δάφτο 3 ώρες γιατί δεν μπορούσε να εμφανίσει έναν κίονα πάνω από το λεκτικό με την ονομασία της εταιρείας κα τελικά δεν τα κατάφερε. To claude όταν του είπα ότι δεν φαίνεται ο κίονας,κατευθείαν με ρώτησε αν η εικόνα του είναι φτιαγμένη στο Canva(εκεί την είχα φτιάξει).Μου ζήτησε να του την ανεβάσω και τέλος. Να σου πω επίσης ότι το chatgpt δεν κατάφερε ΠΟΤΕ να εμφανίζει το site τις σημαίες με τις γλώσσες?10 σημαιούλες και όλο συγγνώμη και συγγνώμη ήταν που δεν μπορούσα να τις δω.Και ξανάμανά περίμενε 6-7 λεπτά να στο "διορθώσει" και ξανά σκατά μετά.Ας είναι καλά ο Aνδρέας που από την 1η μου προσπάθεια με το Google,μου έστειλε ένα index.html φτιαγμένο από το Claude και αφού είδα και αποείδα με το Google AI (που ήταν αστραπιαίο άλλά ηλίθιο αφού ήταν τσάμπα) και το καραχτιχιό chatgpt,είπα να δοκιμάσω και το Claude.όταν τελείωσε,μου έστειλε κα ιτο τι έφτιαξε περιληπτικά:
Να η συνοπτική λίστα με όλα όσα φτιάξαμε μαζί:
10 index σε 10 γλώσσες με σημαίες, animations, SEO, Schema markup
10 contact αρχεία με Formspree
Lightbox με 8 προορισμούς (φωτογραφίες σου)
What We Offer section
Mobile responsive
📍 Marketing:
Google Business Profile
Sitemap.xml για Google
Schema markup
WhatsApp Business
Y.Γ.
Εννοείται ότι δεν ξέρω τι εννοείς με το" Άσε που σήμερα για κάτι τέτοιο (φτάξιμο website) πρέπει να πας στο codex και να επιλέξεις και εκεί High ή Extra High στο Thinking."Εγώ πάντως δεν πήγα σε κανένα από αυτά που αναφέρεις.
 
Δεν είναι καλά μόνο αν είσαι dev. είναι καλά σε ότι και να κάνεις.

Ναι, εννοώ να ξέρεις τι κάνεις. Αν θέλεις να κάνεις development να έχεις επαφή με τον προγραμματισμό.
Αν θέλεις να κάνεις μία παρουσίαση, να έχεις επαφή με τις παρουσιάσεις.
Πέρα από το ότι δεν θα μάθεις τελικά ούτε προγραμματισμό ούτε για παρουσιάσεις, δεν θα ξέρεις αν είναι σωστό το αποτέλεσμα και θα φας πολύ περισσότερα tokens γιατί το ΑΙ θα είναι το "αφεντικό" και όχι εσύ.
 
  • Like
Reactions: anderm
Πέρυσι τέτοια εποχή, η OpenAI ήταν 4 φορές μεγαλύτερη.
Αυτό τον μήνα, η Anthropic πέρασε μπροστά σε τζίρο, κατά κύριο λόγο εξαιτίας των επιχειρήσεων.


1775547031943.png


Γιώργο, στείλε μου το prompt σε ένα πμ να στο βάλω στο μεγάλο gemini και στο Opus της Claude να δούμε.

Εν τω μεταξύ, τη κάναμε τη δοκιμή εχθές, ο Γιώργος έχει πλέον 3 report για τις διακοπές του 😁
@Γιώργος Κυριακαράκος όποτε έχεις χρόνο, δεν γράφεις δυο εντυπώσεις μεταξύ των 3 μεγάλων;
 
Βασικά αυτό που μπορώ να πω είναι ότι αν πληρώνεις τις πολύ ακριβές εκδόσεις των Google Gemini, ChatGPT, Opus παίρνεις απίστευτο αποτέλεσμα που το ποιο είναι καλύτερο δεν είναι εύκολα διακριτό μιας και μετράνε:
- ο τρόπος που γράφεις τα prompt (πχ αν έχεις μάθει καλά τα κουσούρια του ενός και έχεις μάθει τα prompt σου να ξεπερνάνε τα κουσούρια αυτά).
- ο τρόπος που έχεις κάνει τη γενική παραμετροποίηση των μοντέλων
- πως ο τρόπος που δουλεύουν ταιριάζει περισσότερο ή λιγότερο με τον τρόπο που διαμορφώνεις τα workflows σου σήμερα.

Στην πράξη για μένα το μόνο που παίζει ρόλο σήμερα είναι το πόσο πληρώνεις.

Το Gemini αν δεν έχεις το μεγάλο / ακριβό μοντέλο ξέχασέ το. Από την άλλη προσφέρει ένα πολύ πλούσιο οικοσύστημα με εργαλεία για βίντεο / ήχο, το Notebook που είναι πολύ χρήσιμο κλπ. Προσωπικά δεν μου ταιριάζει, αλλά θα καταλάβαινα και κάποιον που δεν μπορεί να δουλέψει χωρίς αυτό. Το 3.1 Pro επειδή κάνει σπάνια πάνω από 1 λεπτό το ρωτάω για τα ποιο χαζά / καθημερινά πράγματα - λογικά καίω περισσότερη ενέργεια από όση χρειάζεται. Επίσης η ενσωμάτωσή του στο Android Auto σίγουρα θα αυξήσει τη χρήση του μιας και θα μπορώ να εχω προσοποποιημένες ειδήσεις κλπ με φωνητικές εντολές όσο οδηγώ.

Η Anthropic έχει το πιο φιλικό πακέτο για το χρήστη σήμερα, μιας μπορείς να πετύχεις και πρόσβαση στο API μέσω συνδρομής (αυτό τυπικά απαγορεύεται βάσει όρων χρήσης όμως με συνδυασμό των εργαλείων που προσφέρει μπορεί κάποιος να το υλοποιήσει έμμεσα με Claude Code - δεν έχω βρει αντίστοιχο τρόπο πχ μέσω του CODEX της OpenAI). Επίσης το co-work είναι ο πιο εύκολος τρόπος για κάποιον αρχάριο να μπει στην ανάπτυξη agentic εφαρμογών. Πάντως έχει αρχίσει και κόβει δραστικά το τι προσφέρει σε σχέση με την έμμεση πρόσβαση στο API (αυτό που ανέφερα ποιο πάνω) γιατί ναι μεν αυτό της έδωσε το boost σε revenue, όμως ταυτόχρονα κοστίζει πολύ όταν μεγάλο μέρος των χρηστών με μια καλή συνδρομή άφηνε openclaw agents να παρτάρουν.

Η OpenAI δίνει τo CODEX που στην πράξη κάνει ότι κάνει το Claude Co-work σε συνδυασμό με το Claude Code αλλά με όχι τόσο εύκολο τρόπο. Επίσης δεν υπάρχει έμμεσος τρόπος να χρησιμοποιήσεις agentic framework αυτοματοποιημένο χωρίς API.

Ο μέσος χρήστης, ακόμη και αν μπει στη διαδικασία να πληρώσει, σπάνια μπορεί να εκμεταλευτεί τα εργαλεία που του προσφέρονται.
Συνήθως αφήνει όλες τις επιλογές στο Auto. Επίσης αρκετοί αρχάριοι χρήστες γκρινιάζουν όταν βλέπουν τα λεπτά να περνούν χωρίς απάντηση και ισοπεδώνουν ότι "είναι άχρηστο μοντέλο, περίμενα 10 λεπτά να απαντήσει", που δείχνει παντελή έλλειψη κατανόησης του τι έχεις στα χέρια σου. Να γράψω ότι μισάωρα και σαραντάλεπτα αναμονής είναι η καθημερινότητά μου. Αλλά προφανώς δεν είμαι πάνω από την οθόνη να βλέπω τι κάνει, κάνω κάτι διαφορετικό.

Για αυτό ακούγεται ότι το βασικό πλεονέκτημα που θα έχουν τα νέα μοντέλα για το μέσο χρήστη είναι να τον καταλαβαίνουν καλύτερα και να επιλέγουν καλύτερα από τη μεγάλη λίστα των διαθέσιμων μοντέλων και επιλογών τους.

Να πάμε τώρα και στο πείραμα που κάναμε. Να τονίζω ότι μιλάμε για τα ακριβά μοντέλα της Google και της Anthropic και το Chatgpt 5.4 Thinking xHigh Πρώτα από όλα πήραμε 17σέλιδους ταξιδιωτικούς οδηγούς στα χέρια μας, που ήταν απίστευτοι έτσι και αλλιώς.
Όσο αφορά τις λεπτομέρειες, όλα βρήκαν πολλές λεπτομέρειες που χειροκίνητα θα θέλαμε ώρες για να εντοπίσουμε μόνοι μας. Το να κάτσω να γράψω ότι το ένα βρήκε μια μικρή λεπτομέρεια που δεν βρήκε το άλλο ή το άλλο έβγαλε ένα κακό συμπέρασμα από ένα αντικειμενικά κακογραμμένο website θα ήταν άδικο.

Αυτό που θα γράψω είναι το βασικό σχόλιο που έκανε το απλό Gemini 3.1 Pro από όλο το πρόγραμμα ταξιδιού που του έστειλα ότι το WV Golf που έχω νοικιάσει θα είναι μάλλον περιοριστικό για την οικογενειά μου (2 παιδάκια) και να αναβαθμίσω σε station wagon...Να πω ότι άνετα παίρνει 4 χειραποσκευές και 1 ακόμη σακίδιο ο χώρος αποσκευών. Τα ακριβά μοντέλα ούτε καν ασχολήθηκαν με αυτό (edit, ψέμματα, το ακριβό gemini το ανέφερε). Για αυτό και τα δωρεάν μοντέλα για μένα είναι τελείως παιχνιδάκια.
 
Last edited:
  • Like
Reactions: Tzimisce
Επειδή η Anthropic είναι πιο "επαγγελματικό" εργαλείο από ότι το chatgpt που θα το ρωτήσεις τι γάλα να παίρνεις στη γάτα σου.
Έκανα ένα πείραμα σήμερα που έληξε μόλις τώρα.
Βαριόμουν και το έπαιζα junior developer που βαριέται τη ζωή του.
Βγάζω KPIs και τσιμπάω έρευνες από την fraport και την έρευνα συνόρων του INSETE.
Από το πρωί κάνω vibe coding σαν κάποιον που δεν έχει ιδέα από προγραμματισμό. Αντί να ψάξω να βρω τις έρευνες βάζω το claude να τις βρει. Δεν τις βρίσκει και αντί να ψάξω εγώ (ένα google search είναι) και να του δώσω το σχήμα του λέω "δεν ισχύει το link, ψάξε το, διάβασέ την και βρες τρόπο να γίνει import".
Ε, σε 2 ώρες έφτασα το πεντάωρο limit του payed plan!

oh-yeah.gif
 
Επειδή η Anthropic είναι πιο "επαγγελματικό" εργαλείο από ότι το chatgpt που θα το ρωτήσεις τι γάλα να παίρνεις στη γάτα σου.
Έκανα ένα πείραμα σήμερα που έληξε μόλις τώρα.
Βαριόμουν και το έπαιζα junior developer που βαριέται τη ζωή του.
Βγάζω KPIs και τσιμπάω έρευνες από την fraport και την έρευνα συνόρων του INSETE.
Από το πρωί κάνω vibe coding σαν κάποιον που δεν έχει ιδέα από προγραμματισμό. Αντί να ψάξω να βρω τις έρευνες βάζω το claude να τις βρει. Δεν τις βρίσκει και αντί να ψάξω εγώ (ένα google search είναι) και να του δώσω το σχήμα του λέω "δεν ισχύει το link, ψάξε το, διάβασέ την και βρες τρόπο να γίνει import".
Ε, σε 2 ώρες έφτασα το πεντάωρο limit του payed plan!

oh-yeah.gif
Έδινες χάλια prompt...είμαι σίγουρος...απόλυτα σίγουρος... :ROFLMAO: :ROFLMAO: :ROFLMAO: :ROFLMAO:
 
  • Haha
Reactions: Tzimisce
Από ότι καταλαβαίνω, το AI το χρησιμοποιούν μόνο οι προγραμματιστές για να τσεκάρουν ποιος το κάνει καλύτερα :p
 
  • Haha
Reactions: Tzimisce
Μπα, ίσα ίσα. Τώρα πια το χρησιμοποιεί κυριολεκτικά όλος ο κόσμος, ειδικά οι νεότεροι.

Και περισσότερο απ' ότι θα έπρεπε, βασικά.

Υπάρχει αρκετός κόσμος που το συμβουλεύεται ακόμα και για τα ψυχολογικά του.
 
  • Like
Reactions: Tzimisce and anderm
Το πιστεύω.. και είναι από τα πιο ηλίθια prompts που θα μπορούσε να δώσει κανείς.

Γιαυτό δεν φτάνει το ρεύμα πια για τα datacenters..

Ένα NVL72 GB300 της Nvidia θελει 150KW. Αυτό είναι ενα rack.

Στην επόμενη γενιά, τα NVL576, που στο ιδιο rack χωράνε 8xNVL72, παμε στα 600!KW/rack.

Πολλές φορές μπορεί να δείτε datacenter με τετοια συστήματα, που ειναι απο μετατροπή compute σε accelerated workloads και υπαρχει ενα rack στη θέση 3. Πλέον αποτελεί σοβαρό περιορισμό η διαθέσιμη ενέργεια.

Το θερμικό φορτίο λύθηκε εφόσον πλέον ολα ειναι υδρόψυκτα.
 
Πραγματικά, κανέναν δε νοιάζει πια το ότι όλη αυτή η ενέργεια τελικά καταλήγει στο περιβάλλον.

Άκου 600KW ανά ρακ.. Αδιανόητο είναι..

Από την άλλη, the Jeanie is out of the bottle που λένε, και δεν ξαναμπαίνει.