Χρήση ΤΝ για την επεξεργασία εικόνας - image processing using AI assistance

22 June 2006
35,547
NEO HRAKLEIO
τωρα τελευταια, επειδη εχω χρονο, ασχολουμαι λιγο με το ΑΙ και την επεξεργασια εικονας και βιντεο μεσω αυτης.

Επειδη ολα σχεδον τα προγραμματα εχουν γινει πανακριβα και με συνδρομη, ειπα να δω τι γινεται με το open source community.

Γινεται κυριολεκτικα χαμος, ειναι αρεκετα δυσκολο για καποιον ν ασχοληθει αν δεν εχει εμπειρια κι εκει φυσικα βασιζονταιι οι εταιρειιες για να δωσουν ετοιμα προγραμματα γιι αυτο το σκοπο.

Ενας τομεας που ειπα να δω, ειναι του upscaling/denoising φωτογραφιων και βιντεο... εχω φυσικα και τ αντισοιχα επι πληρωμης εργαλεια, οποτε ηταν μια καλη ευκαιρεια να τα συγκρινω.

Σε πρωτη φαση, δοκιμασα να κανω upscale μια χαμηλης αναλυσης φωτο (720p) σε 4κ, μεσω του κορυφαιου Topaz Gigapixel και του ComfyUI που ειναι ενα δωρεαν open source προγραμμα διαχειρισης/σχεδιασμου ΑΙ μοντελων.
Το comfyui δεν κανει κατι απο μονο του, ερχεται "αδειο", ειναι απλα ενα frontend για τη δημιουργια ΑΙ διαδικασιων...ενα απ αυτα ειναι το upscaling .
Xρειαζεται χρονο να το στησεις και θελει και καποιες γνωσεις περι του ΑΙ.

Το καλο ομως οτι πρωτον ειναι δωρεαν, δευτερον το τρεχεις τοπικα (αφου το στησεις) , και αν ψαχτεις μπορεις να βγαλεις ισαξια ή και καλυτερα αποτελεσματα , ακομα και απο εξιδυκευμενα εργαλεια οπως το topaz.

Θελει ομως πολυ δυνατο μηχανημα (τρεχει σε ολες τις πλατφορμες win / mac / linux) , εγω εχω Intel i9 , 64 GB RAM και Nvidiia RTX 3090 24GB VRAM, SSD NVME δισκους.

Οι χρονοι ειναι παρομοιοι με αυτους του topaz, για μια εικονα 720p se 4Κ, μπορει να παρει εως και 30 δευτερα (τη πρωτη φορα αργει παραπανω γιια να φορτωσει τ αντισtοιχα μοντελα , αλλα μετα ειναι πιο γρηγορο).

Τ αποτελεσματα ειναι πολυ καλα εως εντυπωσιακα.
Εχει απειρες ρυθμισεις βεβαια, χρονο και ορεξη να εχεις να παιζεις.


Ενα παραδειγμα εδω, σε μια εικονα 720p -> 4K 100% crop

Aριστερα ειναι η αρχικη φωτο, στη μεση το Topaz gigapixel και δεξια το Comfyui.


YG... αν υπαρχει ενδιαφερον, μπορω ν ανοιξω ενα νημα ειδικα γι αυτο.

g7Ql7PN.jpeg
 
Last edited:
Άμεσα συγκρίσιμα αποτελέσματα! Πολύ ενδιαφέρον. ΤοComfyui μοιάζει να έχει κάνει καλύτερη δουλειά στο συγκεκριμένο δέρμα. Το Topaz στα συγκεκριμένα υφάσματα και τις τρίχες.
 
οπως ειπα , το καλο ειναι οτι το comfyui ειναι δωρεαν και το τρεχεις τοπικα μονο.

Μπορεις , εκτος των αλλων, να δημιουργεις/επεξεργαζεσαι δικες σου φωτο/εικονες/βιντεο , ειτε απο το μηδεν ειτε απο δικο σου υλικο.

Απλα ειναι περιπλοκο και θελει χρονο και δυνατο μηχανημα.
 
Last edited:
εδω αλλο ενα παραδειγμα, απο 1080p σε 4κ.

και παλι, Aριστερα ειναι η αρχικη φωτο, στη μεση το Topaz gigapixel και δεξια το Comfyui.

ΥΓ... υπαρχουν πολλες παραμετροι στο καθε προγραμμα, που μπορεις να το φερεις εκει που θελεις οπως ειπα... θελει ψαξιμο .
Αλλωστε παρομοια μοντελα ΑΙ χρησιμοποιουν και τα 2, αλλα εδω μιλαμε για τοπικη χρηση και δωρεαν !


O3Lzute.jpeg
 
αν καποιος ενδιαφερεται, εδω ειναι ενα βιντεο που εξηγει το ComfyUI , πως το εγκαθιστας και πως το χειριζεσαιι.

Αν θελει καποιος να ρωτησει καποια πραγματα, μπορουμε ν ανοιξουμε καποιο νημα ειδικα γι αυτο.

To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.
 
το ιδιο ισχυει και για το βιντεο...δειτε ενα καρε απο βιντεο απο κινητο 15ετιας ποσο καλυτερο μπορει να γινει.
Το μονο προβλημα εδω ειναι οτι θελει ακομα μεγαλυτερη ισχυ, μνημη κλπ

UjTVmHN.png
 
  • Like
Reactions: toupia
κυριως ειναι για δημιουργια , οχι επεξεργασια.
Text to video, image to video... επεξεργασια μονο καποια πραγματα που εχουν να κανουν με ΑΙ, πχ αφαιρεση καποιων αντικειμενων, upscaling/detailing κλπ

Δεν αντικαθιστα καποιο προγραμμα επεξεργασιας/editing πχ Photoshop / davinci.... αντικαθιστα σε ενα βαθμο τα πληρωμενα μοντελα δημιουργιας οπως το google Veo, Midjournay, Kling κλπ

αυτα τα μοντελα εχουν διαφορες χρεωσεις, πχ 1 ευρω το δευτερολεπτο δημιουργιας βιντεο (google veo), 10/20 cents ανα εικονα κλπ
Ειναι πολυ ακριβα για ερασιτεχνικη / απλη χρηση , οποτε το comfyui ειναι μια καλη εναλλακτικη (δωρεαν), αλλα φυσικα θελει ψαξιμο.
 
Last edited:
  • Like
Reactions: Kosh
για να καταλαβεις , με αυτο το προγραμμα κι ενα δωρεαν μοντελο το Flux2 , εχειις την ιδια σχεδον ποιοτητα εικονας με τα επαγγελματικα και πανακριβα μοντελα της google/OpenAI klp... δες εδω ενα καρε που εφτιαξα για υποθετικο διαφημιστικο.

ΥΓ... ολο αυτο ειναι φτιαγμενο απο ενα prompt (ερωτημα/αιτημα δηλ στο μοντελο αυτο) και μονο!!!
Πηρε περιπου 2 λεπτα στο δικο μου συστημα για να φτιαχτει, με την 3090 24GB καρτα, με μια 4090 γινεται στο μισο χρονο και με μια 5090 στο 1/4 περιπου.



GZlXKes.png
 
Στο ονομα του Comfy εχει αρχισει να πινει πολυς κοσμος νερο πλεον......ειναι μια διαδικασια που ακομα ξενιζει αλλα ειναι απο την αλλη πολυ ποιοτικο και κυριως open source.
 
υπαρχει και το SWARMUI , που ειναι ενα κελυφος, ενα πιο ευχρηστο γραφικο περιβαλλον για το Comfyui, γι αυτους που δεν μπορουν να καταλαβουν τη λειιτουργια του comfyui με τα nodes, ειναιι λιγο πιο ευχρηστο και το επιλεγω καποιες φορες.

To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.
 
  • Like
Reactions: evanfotis
Ενδιαφέρον. Σε λίγο δεν θα μπορούμε να ξεχωρίσουμε το πραγματικό από το φανταστικό. Το Flux 2 σε τι χρειάζεται το ComfyUI; Δεν δουλεύει ως αυτόνομο πρόγραμμα;
 
to flux ειναι μοντελο που μπορει να το εισαγεις στο comfyui οπως και πολλα αλλα οπως τα QWEN, Z image turbo, WAN κλπ

Μπορεις επισης να κανεις mix ολων αυτων , να διαλεξεις πχ ποιo κανει τη καλυτερη "μεταφραση" του text που εισαγεις, ποιο κανει τη καλυτερη δημιουργια/επέξεργασια, ποιο κανει τη καλυτερη τελικη απεικονηση κλπ.

Τα μοντελα αυτα δεν ειναι προγραμματα , δεν μπορεις να τα κατεβασεις... ειναι μοντελα που κοστιζουν αν τα χρησιιμοποιεις online.

Εδω με το comfyui μπορεις να κατεβασεις αυτα τα μοντελα και να χρησιμοποιησεις μεσα απ αυτο (καποιες εκδοσεις τους, υπαρχουν πολλες)

φυσικα χρειαζεσαι πολυ δυνατο μηχανημα και χρονο...


ΥΓ.. υπαρχουν κι αλλοι λογοι για τα δουλεψεις offline αυτα τα μοντελα, οπως πχ οτι μπορεις να παρακαμψεις πολλους περιορισμους που εχουν onliine .
ΥΓ2... δεν υπαρχει ενα μονο μοντελο flux, wan κλπ... υπαρχουν πολλες εκδοσεις.
Υπαρχει καποια βασικη για χρηση online, καποια μικροτερη για τοπικη χρηση, καποια αλλη για ασθενεστερα μηχανηματα, καποια ταχυτερη με λιγοτερη ακριβεια κλπ
 
Last edited:
To έχεις ψάξει καλά το θέμα. Μου φαίνεται λίγο περίπλοκο το πως δουλεύει όλο αυτό το σύστημα. Από ότι κατάλαβα το μοντέλο πχ flux είναι κάτι αντίστοιχο με τα plugins στο photoshop το οποίο κλείνει φέτος 38 χρόνια παρουσίας . Εμένα αυτό που με ενδιαφέρει πιο πολύ είναι η διαδικασία upscaling αρχείων video χαμηλής ανάλυσης σε HD ή 4Κ με ρεαλιστικό αποτέλεσμα. Μάλλον θα χρειαστεί χρόνος για αυτό.
 
ειναι περιπλοκο... δυστυχως (γιατι ειναι δωρεαν και open source).
Αλλα μπορεις να φτιαξεις ενα workflow ή να το βρειις online μιια φορα και μετα το χρησιμοποιεις συνεχως.

φυσικα αυτα αλλαζουν διαρκως... μια εκδοση ενος μοντελου σημερα σε 6 μηνες θα ειναι απαρχειωμενο.

Το βιντεο ειναι συλλογη εικονων , που σημαινει οτι αυτο που κανεις ειναι να παιρνεις ενα ενα καρε αρχικα και να τα κανεις upscale καιι μετα τα ξανα ενωνεις (το comfyui δηλ).

Το θεμα ειναι οτι αυτο απαιτει πολλους πορους και πολυ χρονο.

Η ταχυτητα επεξεργασιας με μια 5090 ειναι της ταξης 2 με 3 fps, με τη δικια μου 3090 λιγοτερο κι απο 1 fps!
Θελεις πολυ μνημη (απο 64 gb και πανω ) και πολυ VRAM , απο 24 και πανω ιδανικα.

Στα ονλινε μοντελα φυσικα οι εταιρειες εχουν μεγαλα cluster GPU με 100δες GB VRAM ... γι αυτο αλλωστε και χρεωνουν πολλα, καιι οι τιιμες μνημης και GPU εχουν εκτοξευθει.

Εβαλα νομιιζω παραπανω ενα δειγμα βιντεο upscaling, απο 480p σε 1080... το δικο μου συστημα δεν αντεχει πανω απο 2κ upscale χωρις συμβιβασμους.
Eδω ειναι το workflow...


Screenshot 2026-01-21 015054.png
 
εδω ειναι ενα σημειο που υπερεχουν σημαντικα οι νεοι υπολογιστες της Apple με M επεξεργαστες... μπορουν να εχουν ΠΟΛΥ μεγαλυτερη ποσοτητα VRAM που χρειαζονται αυτα τα μοντελα.
Στα νορμαλ pc που εχουμε εμεις, δεν μπορεις να εχεις παραπανω απο 24 και μονο η 5090 μπορει να φτασει τα 32.
Που για τοπικα LLM kai graphics/video models ειναι πολυ λιιγα.
Τα περισσοτερα απ αυτα τα μοντελα που ανεφερα, στις ολοκληρωμενες εκδοσεις τους, απαιιτουν 48-64 ή και 128GB VRAM (καιι παραπανω καμια φορα).

Σε λογικο κοστος, μονο ενας mac μπορει να εχει τοση vram (στην ουσια δεν κανει διακριση σε ram kai vram).
Aν εχεις δηλ. ενα macstudio με 512 gb ram, μπορεις να εχεις εως και 468 περιπου VRAM !!!

αν ηθελε καποιος ενα αντιστοιχο pc θα επρεπε να δωσει καποιες δεκαδες ή και εκατονταδες χιλιαδες ευρω .
 
  • Like
Reactions: takisot
με ρωτησατε αν μπορουμε εκτος της δημιιουργιιας να κανουμε κι επεξεργασια εικονας... μπορουμε φυσικα.

Οτι μπορεις να κανεις με τα ονλινε μοντελα μπορεις καιι μ αυτα εδω.

Πχ εδω αλλαξα την ενδυμασια μιας κοπελας με ενα prompt μονο!

ΥΓ.. αριστερα ειναι η αρχικη φωτογραφια, δεξια η παραγομενη.
Στο κεντρο βλεπετε το prompt.


Screenshot 2026-01-21 140952.png
 
Last edited:
  • Like
Reactions: takisot