Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Έκριναν πως ο κίνδυνος του να μείνουν πίσω για 5-6 μήνες είναι μεγαλύτερος από το να διαταραχθεί ο οικονομικός τους κύκλος. Εάν πάμε σε ράλι ανάπτυξης μοντέλων, θα δούμε αξιόλογους παίκτες που δεν θα μπορούν να ακολουθήσουν τον ρυθμό να εξαφανίζονται. Το αντεύχομαι.
Σε ένα Arms Race - δυστυχώς - δεν περιμένεις κάτι καλύτερο.
Στα offline open source / open weights μοντέλα πάντως υπάρχει περισσότερη λογική. Τα τελευταία πχ της Mistral ήρθαν σχεδόν ένα χρόνο μετά τα προηγούμενα.
 
Προσέθεσαν στο artificial analysis και το GPT-5.2 xhigh

1765893252155.png

Στο σύνολο των benchmarks έφτασε στα ίδια με το Gemini 3 pro.
Για κάποιο λόγο ωστόσο τα benchmarks, τουλάχιστον στη δική μου χρήση δεν έρχονται κοντά στη πραγματικότητα.

Το Gemini, εάν του ζητήσεις να σχεδιάσει frontend είναι το καλύτερο όλων, το πιο δημιουργικό, ωστόσο στο backend, οτιδήποτε πέραν από το Claude Code με τα Sonnet & Opus, τα κάνει μαντάρα. Το ότι στο coding index βγαίνουν μπροστά από το Opus, δείχνει πρόβλημα στα benchmarks.

Το GPT από την άλλη, βγάζει τα καλύτερα documents στο office, ενώ στο copilot από το office έχεις τη δυνατότητα να επιλέξεις και μοντέλο. Έρχεται κάπως κοντά το claude for excel, αλλά περιορίζεται μόνο στο excel, το οποίο μετά από ~20 prompts σταματάει, εφόσον εξαντλείται το όριο ακόμη και στη μεγάλη max συνδρομή.

Αυτό που μου κάνει εντύπωση είναι πως στο μέγιστο thinking level το 5.2 συνεχίζει για 3-4 φορές μεγαλύτερο διάστημα από το θεωρητικά αντίστοιχο "deep research" του gemini 3 pro, στην pro συνδρομή. Μπορείς να φτάσεις στο ίδιο αποτέλεσμα αλλά μετά από 2-3 prompts ακόμα στο gemini.
 
Αυτή τη στιγμή έχω βρεθεί με πρόσβαση σε αρκετά μοντέλα χωρίς να το επιδιώξω. Στην καθημερινότητά μου κανένα δεν φτάνει το ChatGPT στη βάση ανάπτυξης ιδεών / concept / factual analysis / κλπ.
Χθες σε μια κουβέντα έφτασε τα 22 λεπτά thinking για να απαντήσει. Σίγουρα δεν αξίζει αυτός ο χρόνος / παράμετροι για απλά πράγματα. Αυτό απλά με το extended thinking όχι την pro εκδοση.
Για όλα τα καθημερινά/απλά χρησιμοποιώ πια το Gemini 3 Pro Thinking. Νιώθω πάντα πως οι απαντήσεις του είναι ένα κλικ πιο απλοϊκές.
Για literature review το Perplexity Pro σαν πρώτο στάδιο δεν παίζεται όπως και νιώθω ότι είναι καλύτερο στην σύγκριση συσκευών και αναζήτηση τιμών.
Το Co-pilot μόνο για confidential έγγραφα που έχω θέμα με GDPR, τουλάχιστον μέχρι να αναβαθμίσω και το chatgpt. Για κάποιο λόγο, ενώ το μοντέλο είναι ίδιο με το ChatGPT βγάζει διαφορετικά αποτελέσματα. Ίσως φταίει η παραμετροποίηση που έχω δώσει στο ChatGPT.

Δοκιμάστε στο ChatGPT την έξοδο σε powerpoint. Κάνει και όμορφα γραφικά τώρα. Προσοχή δεν λέω ότι κάνει παπάδες, αλλά ως τώρα στο σχεδιαστικό ήταν χάλια.