Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Τελικά, εμείς οι υπόλοιποι δεν θα μάθουμε ποτέ ποιος είναι ο Sir Nicolas
To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.

Δεν τον κρύβουμε :) (σε στυλ τι μας κρύβουν και δεν μας το λένε... :ROFLMAO: )
Την προσωπική μου γνώμη την είπα.
 
"The highest overall AI hallucination rate was 94 % for Grok‑3, indicating nearly all its answers were incorrect."

Κάτι δεν πάει καλά εδώ.. αποκλείεται να ισχύει το παραπάνω..

Δεν ξέρω ποιο benchmark είναι αυτό.
Το standard για τα hallucinations είναι τα παρακάτω. Τα οποία βέβαια μειώνονται δραματικά όταν χρησιμοποιούν tools, όπως το google search, academic references κλπ στις απαντήσεις τους. Το να παραδεχθεί ένα μοντέλο πως δεν ξέρει μια απάντηση είναι εξαιρετικά δύσκολο εφόσον πάει ακριβώς αντίθετα με την φύση λειτουργίας του, που είναι οι προβλέψεις. Η καλύτερη στον τομέα αυτόν είναι η claude.

Δείτε εδώ το σύνολο των benchmarks.

1764678673171.png

1764678738092.png

1764678762257.png
 
Last edited:
Υπάρχουν διαφορές αλλα και κοινα σημεια στις έρευνες, η προηγουμενη έρευνα απ οτι βλέπω εγινε 3/25, οπότε με τον ρυθμό που αλλάζουν τα μοντέλα λογικο οι μετρήσεις να έχουν άλλάξει. Αυτο που μένει ως δεδομένο σίγουρα ειναι οτι καθε πληροφόρηση πρέπει να διασταυρώνεται ανεξαρτήτου μοντέλου που θα επιλέξεις και σίγουρα εαν χρειάζεται να ζητουνται academic references, cross-checking κλπ.
Κοινως το ai μπορει να σου λύσει τα χέρια να σου γλιτώσει χρόνο και να βγάλει σωστό αποτέλεσμα ΑΝ το χρησιμοποιείς σωστά. Διαφορετικά...
 
Θα το ξαναπώ...κάθε μικρή ρύθμιση/κουμπάκι που πατάς ενεργοποιεί και άλλο μοντέλο με άλλες ιδιαιτερότητες.
Λίγες ημέρες που έχω το Gemini 3 Pro Thinking το έχω βάλει τελικά στην καθημερινότητα για οτιδήποτε ΔΕΝ είναι σημαντικό και ΔΕΝ είναι για δουλειά. Και δουλεύει μια χαρά σε αυτό το ρόλο και είναι και γρήγορο.
Για σοβαρά πράγματα θέλεις extended thinking μοντέλα. Πια άνετα χτυπάω 10-20 λεπτά σκέψης για 1 απάντηση με τα prompt που δίνω και τα αποτελέσματα είναι απίστευτα καλά.
 
Τα νέα έρχονται απίστευτα γρήγορα.
Η νέα έκδοση του Deepseek έχει επιδόσεις που δίνουν χρυσό στην μαθηματική ολυμπιάδα και έδωσαν τα πάντα open source και Permisive (ΜΙΤ άδεια). Για άλλη μια φορά έλαμψαν στην αποδοτικότητα των αλγορίθμων τους.


και το επιστημονικό paper που περιγράφει πως το έφτιαξαν.

 
1764687931890.png

Εντυπωσιακό το ότι πλησιάζει frontier μοντέλα.
Από εκεί και ύστερα βέβαια, τα benchmarks απέχουν από την πραγματική εμπειρία πολλές φορές. Λ.χ. εάν θέλεις το καλύτερο δυνατό frontend σήμερα, στο φτιάχνει το gemini 3 pro, για να σου κάνει troubleshooting, refactoring σε μεγάλα codebases όμως, ανεξαρτήτως metrics, τα Sonnet & Opus 4.5 είναι καλύτερα.

Λίγες ημέρες που έχω το Gemini 3 Pro Thinking το έχω βάλει τελικά στην καθημερινότητα για οτιδήποτε ΔΕΝ είναι σημαντικό και ΔΕΝ είναι για δουλειά. Και δουλεύει μια χαρά σε αυτό το ρόλο και είναι και γρήγορο.
Για σοβαρά πράγματα θέλεις extended thinking μοντέλα. Πια άνετα χτυπάω 10-20 λεπτά σκέψης για 1 απάντηση με τα prompt που δίνω και τα αποτελέσματα είναι απίστευτα καλά.

Το GPT5.1 ακόμη και στο κανονικό του thinking για εμένα είναι πάρα πολύ αργό. Το βελτίωσαν λίγο για σχετικά απλά prompts, αλλά παραμένει αργό. Το είχα προεπιλογή και στο perplexity, το αφαίρεσα.
Σε 10 λεπτά περίπου το gemini 3 pro ολοκληρώνει το deep research.
 
Ανδρέα έχει να κάνει με το domain χρήσης. Εγώ έχω ξεκουραστεί απίστευτα με το ότι χρειάζομαι πια πολύ λιγότερα prompts για να πάρω αυτό που χρειάζομαι. Δεν με νοιάζει καθόλου αν θέλει 15+ λεπτά να μου απαντήσει και δεν μιλάω για Deep Research, μιλάω για απλά prompts στο Extended Thinking.
 
  • Like
Reactions: anderm
Σήμερα διάλεγα ασκήσεις μαθηματικών από ένα βοήθημα για τα παιδιά και δεν μπορούσα με τίποτα να βρω τη λύση. Ήμουν σίγουρος ότι η εκφώνηση ήταν λάθος. Οπότε ζήτησα τη βοήθεια του Gemini. Απάντησε ότι η εκφώνηση ήταν λάθος και μου πρότεινε (και έλυσε) την άσκηση που έβγαζε το αποτέλεσμα που υπήρχε στις λύσεις. Μου έκανε θετική εντύπωση ότι πρότεινε ΄τρία επιχειρήματα για τους λόγους που η εκφώνηση ήταν λάθος!
 
Έχω ξαναπεί ότι η βίβλος του ΑΙ που είχα όταν έκανα το διδακτορικό μου 20 χρόνια πίσω ήταν το Artificial Intelligence: A Modern Approach των Russel και Norvig.

Πριν λίγες ημέρες βγήκε η παρακάτω συνέντευξη του Russel.

To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.

Λέει ωραία πράγματα, λέει ότι δεν έχουμε AGI γιατί δεν ξέρουμε πως να την υλοποιήσουμε. Επίσης λέει ότι ίσως έχουμε πάνω από 1000 φορές παραπάνω επεξεργαστική ισχύ από αυτό απαιτείται για AGI. Και ότι η χρηματοδότηση είναι ήδη 50 φορές μεγαλύτερη από το Manhatan Project. Και πολλά άλλα ωραία.

Μου άρεσε πολύ γιατί είναι ένας από τους νονούς από αυτούς που άνοιξαν το δρόμο...όχι κάποιος από τη νέα γενιά
 
  • Like
Reactions: athlon6401

3. Ενέργεια (Energy)​

  • Το Πρόβλημα: Η έλλειψη παραγωγής ηλεκτρικής ενέργειας για να τροφοδοτήσει όλα τα νέα κέντρα δεδομένων ΤΝ, καθώς και το πρόβλημα της θερμότητας που παράγουν.
  • Η Λύση της Google: Το Project Suncatcher, μια αποστολή της Google για τη δημιουργία αυτοτροφοδοτούμενων κέντρων δεδομένων ΤΝ στο διάστημα. Οι ηλιακοί συλλέκτες στο διάστημα μπορούν να λειτουργούν 24 ώρες την ημέρα, ενώ η θερμότητα αποβάλλεται χωρίς να επηρεάζει την ατμόσφαιρα.
  • Με βάση τις τρέχουσες προβλέψεις, το κόστος εκτόξευσης στο διάστημα θα πέσει τόσο πολύ που μέχρι το 2035, η κατασκευή αυτών των κέντρων δεδομένων στο διάστημα θα είναι οικονομικά εφικτή και ανταγωνιστική με την κατασκευή τους στη Γη. Η Google σχεδιάζει να στείλει ένα πραγματικό πρωτότυπο δορυφόρου μέχρι το 2027.

Πως κλείνεις ένα AGI που τροφοδοτείται από τον ήλιο; Καλά θα πάει αυτό
"We don't know who struck first, us or them. But we do know it was us that scorched the sky" The Matrix
 
Πως κλείνεις ένα AGI που τροφοδοτείται από τον ήλιο; Καλά θα πάει αυτό
"We don't know who struck first, us or them. But we do know it was us that scorched the sky" The Matrix
Κόβεις το καλώδιο από τα Φ/Β προς τους αναστροφείς :)
Αν είναι πολύ χοντρό θα δυσκολευτούμε. Αλλά είναι πιο εύκολο από embedded πυρηνικά.
 
Έχω ξαναπεί ότι η βίβλος του ΑΙ που είχα όταν έκανα το διδακτορικό μου 20 χρόνια πίσω ήταν το Artificial Intelligence: A Modern Approach των Russel και Norvig.

Πριν λίγες ημέρες βγήκε η παρακάτω συνέντευξη του Russel.

To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.

Λέει ωραία πράγματα, λέει ότι δεν έχουμε AGI γιατί δεν ξέρουμε πως να την υλοποιήσουμε. Επίσης λέει ότι ίσως έχουμε πάνω από 1000 φορές παραπάνω επεξεργαστική ισχύ από αυτό απαιτείται για AGI. Και ότι η χρηματοδότηση είναι ήδη 50 φορές μεγαλύτερη από το Manhatan Project. Και πολλά άλλα ωραία.

Μου άρεσε πολύ γιατί είναι ένας από τους νονούς από αυτούς που άνοιξαν το δρόμο...όχι κάποιος από τη νέα γενιά
2 ώρες well spent
 
Kαι στη μουσική τα πράγματα είναι....
Πχ η stoner/metal "μπάντα" Evil Chicken.
Kαι που΄σαι ακόμα..

To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.
 
Έχω ξαναπεί ότι η βίβλος του ΑΙ που είχα όταν έκανα το διδακτορικό μου 20 χρόνια πίσω ήταν το Artificial Intelligence: A Modern Approach των Russel και Norvig.

Πριν λίγες ημέρες βγήκε η παρακάτω συνέντευξη του Russel.

To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.

Λέει ωραία πράγματα, λέει ότι δεν έχουμε AGI γιατί δεν ξέρουμε πως να την υλοποιήσουμε. Επίσης λέει ότι ίσως έχουμε πάνω από 1000 φορές παραπάνω επεξεργαστική ισχύ από αυτό απαιτείται για AGI. Και ότι η χρηματοδότηση είναι ήδη 50 φορές μεγαλύτερη από το Manhatan Project. Και πολλά άλλα ωραία.

Μου άρεσε πολύ γιατί είναι ένας από τους νονούς από αυτούς που άνοιξαν το δρόμο...όχι κάποιος από τη νέα γενιά
Το ΑΙ ειναι μια φούσκα οικονομική για αρχή.

Ήδη έχουν στοιχηματησει εκατομμύρια για το ότι θα σκάσει.

Τρις πηγαίνουν και έρχονται μεταξύ 7 εταιρειών με κεντρική εταιρεία την Nvidia. Οπότε δεν αμφισβητώ ότι έχουμε πλεοναζουσα επεξεργαστικη ισχύ .
b9eba70db781baddb050ea2b950eb222.jpg
 
Το ΑΙ ειναι μια φούσκα οικονομική για αρχή.

Ήδη έχουν στοιχηματησει εκατομμύρια για το ότι θα σκάσει.

Τρις πηγαίνουν και έρχονται μεταξύ 7 εταιρειών με κεντρική εταιρεία την Nvidia. Οπότε δεν αμφισβητώ ότι έχουμε πλεοναζουσα επεξεργαστικη ισχύ .
b9eba70db781baddb050ea2b950eb222.jpg

Δεν ξέρω που έχουμε την πλεονάζουσα επεξεργαστική ισχύ, μάλλον θα πρέπει να ενημερώσουμε τους hyperscalers γιατί αντιθέτως βλέπω καθημερινά throttling στα API των μεγάλων εταιριών και ορισμένες στιγμές "request exhausted" στο VERTEX και overloaded στο Claude.
 
Δεν ξέρω που έχουμε την πλεονάζουσα επεξεργαστική ισχύ, μάλλον θα πρέπει να ενημερώσουμε τους hyperscalers γιατί αντιθέτως βλέπω καθημερινά throttling στα API των μεγάλων εταιριών και ορισμένες στιγμές "request exhausted" στο VERTEX και overloaded στο Claude.
Κάπως πρέπει να πουλήσει η Nvidia ...

Κάποιο σχόλιο για την ανταλλαγή κεφαλαίων μεταξύ αυτών των εταιρειών για να διατηρούν το hype του AI ;
209ebb698b8648380f35c9ea28febe13.jpg
 
Κάπως πρέπει να πουλήσει η Nvidia ...

H nvidia δεν πουλάει κάρτες που μένουν αδρανείς. Το ότι τα προϊόντα που τρέχουν πάνω στην υποδομή, μετακινούνται από τη παραδοσιακή έννοια του compute σε accelerated instances με GPU, είναι αυταπόδεικτο, φαίνεται από το τι πουλάνε οι hyperscalers.

Κάποιο σχόλιο για την ανταλλαγή κεφαλαίων μεταξύ αυτών των εταιρειών για να διατηρούν το hype του AI ;

Καταρχάς, έστω πως τα νούμερα που ακούγονταν, αφορούσαν το σήμερα, εάν δέχονται να τα πληρώσουν οι μέτοχοι μιας ιδιωτικής εταιρίας βλέποντας value σε αυτό, από λίγο έως ελάχιστα μας αφορά. Στην ουσία τώρα, το νούμερο αυτό αφορά υπερ-μακροπρόθεσμο σχεδιασμό, για να ακολουθήσει τις καμπύλες ζήτησης που βλέπουν. Να είσαι σίγουρος πως κανένας μέτοχος δεν θα δώσει ποτέ χρήματα για υποδομή που δεν πιστεύει ότι θα του τα γυρίσει πίσω.

Για την nvidia συγκεκριμένα, είναι ο φυσικός συνεργάτης όλων αυτών των εταιριών. Χωρίς αυτή, δεν υπάρχουν.

Το hype είναι σχετικό. Είναι το αντίστοιχο του να ήμασταν στον 19ο αιώνα και να έλεγε κάποιος ότι κακώς χτίζονται εργοστάσια ηλεκτροπαραγωγής, μια χαρά γίνεται η δουλειά και με τον ατμό.