Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Έκριναν πως ο κίνδυνος του να μείνουν πίσω για 5-6 μήνες είναι μεγαλύτερος από το να διαταραχθεί ο οικονομικός τους κύκλος. Εάν πάμε σε ράλι ανάπτυξης μοντέλων, θα δούμε αξιόλογους παίκτες που δεν θα μπορούν να ακολουθήσουν τον ρυθμό να εξαφανίζονται. Το αντεύχομαι.
Σε ένα Arms Race - δυστυχώς - δεν περιμένεις κάτι καλύτερο.
Στα offline open source / open weights μοντέλα πάντως υπάρχει περισσότερη λογική. Τα τελευταία πχ της Mistral ήρθαν σχεδόν ένα χρόνο μετά τα προηγούμενα.
 
Προσέθεσαν στο artificial analysis και το GPT-5.2 xhigh

1765893252155.png

Στο σύνολο των benchmarks έφτασε στα ίδια με το Gemini 3 pro.
Για κάποιο λόγο ωστόσο τα benchmarks, τουλάχιστον στη δική μου χρήση δεν έρχονται κοντά στη πραγματικότητα.

Το Gemini, εάν του ζητήσεις να σχεδιάσει frontend είναι το καλύτερο όλων, το πιο δημιουργικό, ωστόσο στο backend, οτιδήποτε πέραν από το Claude Code με τα Sonnet & Opus, τα κάνει μαντάρα. Το ότι στο coding index βγαίνουν μπροστά από το Opus, δείχνει πρόβλημα στα benchmarks.

Το GPT από την άλλη, βγάζει τα καλύτερα documents στο office, ενώ στο copilot από το office έχεις τη δυνατότητα να επιλέξεις και μοντέλο. Έρχεται κάπως κοντά το claude for excel, αλλά περιορίζεται μόνο στο excel, το οποίο μετά από ~20 prompts σταματάει, εφόσον εξαντλείται το όριο ακόμη και στη μεγάλη max συνδρομή.

Αυτό που μου κάνει εντύπωση είναι πως στο μέγιστο thinking level το 5.2 συνεχίζει για 3-4 φορές μεγαλύτερο διάστημα από το θεωρητικά αντίστοιχο "deep research" του gemini 3 pro, στην pro συνδρομή. Μπορείς να φτάσεις στο ίδιο αποτέλεσμα αλλά μετά από 2-3 prompts ακόμα στο gemini.
 
Αυτή τη στιγμή έχω βρεθεί με πρόσβαση σε αρκετά μοντέλα χωρίς να το επιδιώξω. Στην καθημερινότητά μου κανένα δεν φτάνει το ChatGPT στη βάση ανάπτυξης ιδεών / concept / factual analysis / κλπ.
Χθες σε μια κουβέντα έφτασε τα 22 λεπτά thinking για να απαντήσει. Σίγουρα δεν αξίζει αυτός ο χρόνος / παράμετροι για απλά πράγματα. Αυτό απλά με το extended thinking όχι την pro εκδοση.
Για όλα τα καθημερινά/απλά χρησιμοποιώ πια το Gemini 3 Pro Thinking. Νιώθω πάντα πως οι απαντήσεις του είναι ένα κλικ πιο απλοϊκές.
Για literature review το Perplexity Pro σαν πρώτο στάδιο δεν παίζεται όπως και νιώθω ότι είναι καλύτερο στην σύγκριση συσκευών και αναζήτηση τιμών.
Το Co-pilot μόνο για confidential έγγραφα που έχω θέμα με GDPR, τουλάχιστον μέχρι να αναβαθμίσω και το chatgpt. Για κάποιο λόγο, ενώ το μοντέλο είναι ίδιο με το ChatGPT βγάζει διαφορετικά αποτελέσματα. Ίσως φταίει η παραμετροποίηση που έχω δώσει στο ChatGPT.

Δοκιμάστε στο ChatGPT την έξοδο σε powerpoint. Κάνει και όμορφα γραφικά τώρα. Προσοχή δεν λέω ότι κάνει παπάδες, αλλά ως τώρα στο σχεδιαστικό ήταν χάλια.
 
Να είναι καλά το ΑΙ , απέκτησα επιτέλους το μαλλί που ονειρευόμουν.
Στο αυτόματο βέβαια.
Κάνε με Ντάνιελ Χάκετ του λέω, το συζητάς μου λέει. 😇

 

Attachments

  • Screenshot 2025-12-27 034351.png
    Screenshot 2025-12-27 034351.png
    683.8 KB · Views: 50
  • Screenshot 2025-12-27 011402.png
    Screenshot 2025-12-27 011402.png
    508.5 KB · Views: 51
Αρκετοί έχουν αρχίσει να πιστεύουν σοβαρά (είμαι και εγώ ένας από αυτούς) ότι η σημερινή ΑΙ που υπάρχει ήδη διαθέσιμη σε όλους μας είναι κάπου μεταξύ του μέσου ανθρώπου και ανθρώπων με τη νοημοσύνη πχ του Αινστάιν.
Μια από τις αποδείξεις είναι τις προόδους που προσφέρει στα μαθηματικά. Για παράδειγμα τους τελευταίους λίγους μήνες, όλο και περισσότερα προβλήματα από τη λίστα του Erdős λύνονται είτε από την ΑΙ είτε με τη βοήθεια ΑΙ στη μορφή των LLM.
Για όσους δεν ξέρουν τι είναι τα προβλήματα Erdős μας βοηθάει το Gemini:
Τα προβλήματα Erdős συνιστούν ένα ευρύ φάσμα ανοικτών μαθηματικών εικασιών —κυρίως στη συνδυαστική, τη θεωρία γράφων και τη θεωρία αριθμών— τα οποία διακρίνονται για τη «παραπλανητική» απλότητα της διατύπωσής τους, που όμως υποκρύπτει δυσθεώρητη αποδεικτική πολυπλοκότητα και συχνά απαιτεί νέες μεθοδολογικές προσεγγίσεις. Λειτουργώντας ως διαχρονικός καταλύτης για την ακαδημαϊκή έρευνα, πολλές από αυτές τις προκλήσεις συνοδεύονται από χρηματικά έπαθλα που θεσμοθέτησε ο ίδιος ο Paul Erdős, προάγοντας έτσι μια μοναδική κουλτούρα συνεργατικής επίλυσης και αναζήτησης της δομικής «κομψότητας» στη μαθηματική σκέψη.

Στην παρακάτω σελίδα φαίνεται πόσα προβλήματα είτε έχουν λυθεί πλήρως είτε έχουν δώσει κάλύτερη λύση από την προηγούμενη και ο αριθμός αυξάνει.

Προφανώς θέλουμε την πιο εξωτική διαθέσιμη έκδοση των μοντέλων. Μην περιμένουμε τέτοια αποτελέσματα από τις δωρεάν εκδόσεις ή και από τις απλές πληρωμένες. Εδώ φαίνεται και ξεκάθαρα το βήμα εμπρός με το ChatGPT 5.2 Pro...
 
Δεν ξέρω τι κάνουν τα "εξωτικά" μοντέλα, αλλά το Gemini 3 pro που χρησιμοποιώ αυτές τις μέρες μπερδεύεται ακόμα και με τα εύκολα.

Μιλάμε για χαζά λάθη.

Έχουμε πολύ μέλλον ακόμα.
Δημήτρη όπως είπα πιο πάνω έχω πληρωμένες εκδόσεις των παρακάτω:
- ChatGPT 5.2 Plus
- Gemini 3 Pro
- Perplexity Pro
- Microsoft 365 Enterprise Copilot - Business Edition

Στο πρώτο σκαλοπάτι κόστους κοντά στα 20 δολάρια δεν υπάρχει συναγωνισμός, η OpenAI σε αφήνει να ενεργοποιήσεις και Extended Thinking (ή στο ΑΡΙ xhigh reasoning effort level) και πραγματικά το μοντέλο είναι υπεραρκετό για τα περισσότερα πράγματα που μπορώ να σκεφτώ. Στα περισσότερα ερωτήματα που το χρησιμοποιώ θέλει άνετα πάνω από 10 λεπτά για να μου απαντήσει, ενώ έχω δει και αναμονές της τάξης των 25 λεπτών για απάντηση σε 1 και μόνο Prompt. Όμως μαγεία η απάντηση, γλυτώνει κυριολεκτικά ώρες εργασίας.

Το Gemini 3 Pro Thinking βγάζει σχετικά καλές απαντήσεις με σκέψη σχεδόν πάντα κάτω του 1 λεπτού. Για καθημερινά πράγματα όχι τόσο σημαντικά πάω σχεδόν πάντα προς τα εκεί. Επίσης, επειδή έχει πρόσβαση στο youtube βάζω καθημερινά πολλά βίντεο να μου τα συνοψίσει σε Bullets. Για σοβαρά θέματα δουλειάς είναι αστείο να το χρησιμοποιήσω, θα έχω προβλήματα πολλά.

Το Perplexity Pro επίσης είναι αναντικατάστατο για δύο πράγματα:
- Ανασκόπιση βιβλιογραφίας. Μπορεί μέσα σε 3-5 λεπτά αν του έχεις δώσει ένα καλό prompt να σου βγάλει λίστα με τη πιο σχετική βιβλιογραφία σε πίνακα, με weblink και με 1-2 προτάσεις γιατί και πως η κάθε αναφορά είναι σχετική με αυτό που κάνεις.
- Ψάξιμο για περίεργα προϊόντα στην αγορά, κυρίως για να βρεις περίεργα πράγματα από κάποιο eshop στην ΕΕ και σε χαμηλή τιμή.

Το Co-pilot το χρησιμοποιώ μόνο για δουλειά όπου πρέπει να είμαι GDPR compliant.

Πάντως είμαι οριακά στο να αγοράσω την Business έκδοση του ChatGPT για να μπορώ να είμαι GDPR compliant και με εκείνο και ταυτόχρονα να μπορώ να έχω πρόσβαση σε περιορισμένο αριθμό μηνυμάτων με το ChatGPT 5.2 Pro. Από τα 20 δολάρια πρέπει να ανέβω στα 50 δολάρια το μήνα, αλλά δεν ξέρω αν υπάρχει ουσιαστικός λόγος.

Τέλος η χρήση των δωρεάν εργαλείων είναι θετικό προφανώς γιατί επιτρέπουν στον κόσμο να έρθει σε επαφή με μια νέα καινοτομία, αλλά είναι σαν να σου δίνουν ένα αυτοκίνητο ηλεκτρικό πόλης με μέγιστη ταχύτητα 60 κμ και εσύ θέλεις να πας από την Αθήνα στο Βερολίνο...Ναι κάποτε θα φτάσεις, αλλά θα κοπιάσεις, θα βαρεθείς να φορτίζεις όπου βρεις, θα κουραστείς κλπ.
 
Last edited:
Πλεον και με την εκδοση go του chat gtp (8€ μηνα) μπορεις οικονομικά να κάνεις αρκετα πράγματα χωρις ιδιαιτερο κόστος, αναμονές και περιορισμούς.
 
Πλεον και με την εκδοση go του chat gtp (8€ μηνα) μπορεις οικονομικά να κάνεις αρκετα πράγματα χωρις ιδιαιτερο κόστος, αναμονές και περιορισμούς.
Δεν είχα δει καν ότι έβαλαν και νέο tier κάτω από το Plus!

Πάντως όταν είχα πληρώσει για πρώτη φορά το Plus 20 δολάρια μου είχαν φανεί να πω την αλήθεια πολλά. Γιατί προφανώς το έβλεπα σαν ένα παιχνίδι. Σήμερα και 500 ευρώ για την έκδοση plus ως έχει σήμερα να μου έλεγαν θα τα πλήρωνα χωρίς δεύτερη σκέψη γιατί πια κάνει δουλειά που θα έπρεπε να είχα προσλάβει κόσμο για να την έχω στο χρόνο που μου τη δίνει.
 
  • Like
Reactions: Φρα.Πε.
Εγώ ξέρω ότι τώρα που ψάχνουμε για junior προγραμματιστή και τους βάζω απλά προβληματάκια σε css/html/javascript και λίγη php, φαίνονται αμέσως όσοι χρησιμοποιούν AI για να τα λύσουν.
Είτε δεν τα λύνουν είτε δεν ξέρουν τι γράφουν και γιατί.
Απλές αλλαγές, που αν είχαν γράψει τον κώδικα μόνοι τους θα μιλούσαμε για μία γραμμή, το ΑΙ τους προτείνει να κάνουν rewrite όλο τον κώδικα.
 
Εγώ ξέρω ότι τώρα που ψάχνουμε για junior προγραμματιστή και τους βάζω απλά προβληματάκια σε css/html/javascript και λίγη php, φαίνονται αμέσως όσοι χρησιμοποιούν AI για να τα λύσουν.
Είτε δεν τα λύνουν είτε δεν ξέρουν τι γράφουν και γιατί.
Απλές αλλαγές, που αν είχαν γράψει τον κώδικα μόνοι τους θα μιλούσαμε για μία γραμμή, το ΑΙ τους προτείνει να κάνουν rewrite όλο τον κώδικα.
Σε βλέπω να γράφεις μήνυμα σε αυτό εδώ το νήμα σε 1-2 χρόνια και να λες "ο μόνος τρόπος για να βρω καλό junior προγραμματιστή σήμερα είναι να δω ποιο εργαλείο χρησιμοποιεί ο καθένας, γιατί έτσι και αλλιώς όλοι χρησιμοποιούν ΑΙ" και να ψάχνεις να βρεις ποιος χρησιμοποιεί τα πιο ψαγμένα εργαλεία που δίνουν επιλογές παραμετροποίησης στον προγραμματιστή και δεν δίνουν τελείως κονσέρβα αποτέλεσμα. :p
 
Εγώ ξέρω ότι τώρα που ψάχνουμε για junior προγραμματιστή και τους βάζω απλά προβληματάκια σε css/html/javascript και λίγη php, φαίνονται αμέσως όσοι χρησιμοποιούν AI για να τα λύσουν.
Είτε δεν τα λύνουν είτε δεν ξέρουν τι γράφουν και γιατί.
Απλές αλλαγές, που αν είχαν γράψει τον κώδικα μόνοι τους θα μιλούσαμε για μία γραμμή, το ΑΙ τους προτείνει να κάνουν rewrite όλο τον κώδικα.

Άλλο ένα datapoint..

Πριν λίγες μέρες προσπαθούσα να βρω ένα bug σε κώδικά μου που είχα γράψει πριν κάποια χρόνια.

Το Gemini Pro ήταν γεμάτο καλές ιδέες, αλλά παρότι έφαγα 1-2 ώρες μαζί του, άκρη δεν έβγαλε.

Το δίνω λοιπόν στο Claude (το free). Βρήκε το πρόβλημα με την πρώτη.

Οπότε, θέλει πολύ προσοχή η επιλογή του κατάλληλου εργαλείου.
 
Σε βλέπω να γράφεις μήνυμα σε αυτό εδώ το νήμα σε 1-2 χρόνια και να λες "ο μόνος τρόπος για να βρω καλό junior προγραμματιστή σήμερα είναι να δω ποιο εργαλείο χρησιμοποιεί ο καθένας, γιατί έτσι και αλλιώς όλοι χρησιμοποιούν ΑΙ" και να ψάχνεις να βρεις ποιος χρησιμοποιεί τα πιο ψαγμένα εργαλεία που δίνουν επιλογές παραμετροποίησης στον προγραμματιστή και δεν δίνουν τελείως κονσέρβα αποτέλεσμα. :p
η αλλιως ψάχνω τον καλύτερο prompter....
 
  • Haha
Reactions: Tzimisce
Άλλο ένα datapoint..

Πριν λίγες μέρες προσπαθούσα να βρω ένα bug σε κώδικά μου που είχα γράψει πριν κάποια χρόνια.

Το Gemini Pro ήταν γεμάτο καλές ιδέες, αλλά παρότι έφαγα 1-2 ώρες μαζί του, άκρη δεν έβγαλε.

Το δίνω λοιπόν στο Claude (το free). Βρήκε το πρόβλημα με την πρώτη.

Οπότε, θέλει πολύ προσοχή η επιλογή του κατάλληλου εργαλείου.

Για coding, τα μοντέλα της Anthropic είναι σουρεάλ μπροστά.
Το gemini για να δουλέψει πρέπει να το χρησιμοποιήσεις μέσω agent σε IDE που θα κάνει δοκιμές/τρέχει τον κώδικα μέχρι να το κάνει να δουλέψει. Τα claude τις περισσότερες φορές είναι first try.
 
Ρε φίλε, τους δίνω αυτό και τους λέω "κάνε το sanitize. Να μη χτυπάνε warnings και να είσαι σίγουρος ότι αυτά που παίρνεις είναι σωστά".

PHP:
if ($_SERVER['REQUEST_METHOD'] === 'POST') {
    $name  = $_POST['name'];
    $email = $_POST['email'];
    $age   = $_POST['age'];

    echo "Saved!";
}

Το όποιο ΑΙ θα σου δώσει over engineered λύση, θα σου το κάνει 50 γραμμές.
Και αν του πεις "ωραία, τώρα θέλω την ηλικία να μην είναι υποχρεωτική, αλλά αν τη δώσει να είναι πάνω από 18 και είσαι από πάνω του για να μη χρησιμοποιήσει ΑΙ σε κοιτάζει σαν χαζός.