
Συμβουλή: Μπορείτε να δημιουργήσετε μια ρεαλιστική πολύχρωμη εικόνα ενός σκύλου σε ένα κοστούμι στο δρόμο σε αναλογία 16: 9
Στιγμιότυπο οθόνης της Sabrina Ortis/ZDNET
Το OpenAI μπορεί να έχει αρχίσει να είναι πάθος για την παραγωγή κειμένου να απεικονίσει με το μοντέλο Dall-E, αλλά από τότε που αυτές οι προηγούμενες ένδοξες μέρες η πρόταση AI έχει γίνει πολύ πιο ικανή για εικόνες. Ως αποτέλεσμα, όταν η OpenAI κυκλοφόρησε το τελευταίο και μεγαλύτερο μοντέλο εικόνων GPT-4O, ήμουν σκεπτικός. Μετά τη δοκιμή, άλλαξα τελείως το μυαλό μου.
Εκκίνηση
Όταν ο Dall-E ξεκίνησε για πρώτη φορά, έζησε στον αυτόνομο ιστότοπό του. Από τότε, μετακόμισε στο Chatgpt. Αυτό το βήμα ήρθε με πολλά πλεονεκτήματα, συμπεριλαμβανομένης της ευκαιρίας να ζητήσετε από το AI chatbot να αποκτήσετε μια εικόνα που θέλετε στην ίδια διεπαφή όπου μιλάτε ήδη για κάτι άλλο, εξαλείφοντας έτσι την ανάγκη για μια συνεχή αλλαγή του πλαισίου.
Με τη δημιουργία εικόνων GPT-4O, η OpenAI διατήρησε αυτή τη βολική μορφή μετατρέποντας τη γεννήτρια εικόνων από προεπιλογή από το Dall-E σε GPT-4O για τους συνδρομητές που πληρώθηκαν. Ως αποτέλεσμα, ήταν πολύ εύκολο να αρχίσετε να δημιουργείτε νέες εικόνες από τον λογαριασμό μου στο ChatGPT Plus. Το μόνο που έπρεπε να κάνω είναι να εισέλθω στον υπαινιγμό για το τι ήθελα να δω, και στη συνέχεια τα δημιουργεί. Οι χρήστες μπορούν επίσης να έχουν πρόσβαση στη διεπαφή Sora.
Επίσης: Πώς να χρησιμοποιήσετε το Sora OpenAI για να δημιουργήσετε εκπληκτικά βίντεο που δημιουργήθηκαν AI
Προσοχή: Μπορείτε ακόμα να δημιουργήσετε εικόνες με τον ίδιο τρόπο εάν είστε δωρεάν χρήστης. Ωστόσο, εάν δεν είστε εντυπωσιασμένοι, αυτό οφείλεται στο γεγονός ότι, παρά την εκτόξευση, ανακοινώθηκε ένα μοντέλο που θα έρθει σε όλους τους χρήστες, συμπεριλαμβανομένου του ελεύθερου γενικού διευθυντή του OpenAI, ο Sam Altman ανακοίνωσε σε μια μέρα ότι η ανάπτυξη σε ελεύθερο επίπεδο θα “αναβληθεί για λίγο”.
Εικόνες
Τη στιγμή που περιμένατε – εικόνες. Αφού εισαγάγετε μια υπόδειξη, το AI εμφανίζει γενιά σε λιγότερο από ένα λεπτό. Η διαδικασία παίρνει πραγματικά λίγο περισσότερο χρόνο από πριν, αλλά οι εικόνες είναι προσδοκίες, παρέχοντας πολλές λεπτομέρειες, υφές, ρεαλισμό και ακόμη και ακρίβεια του κειμένου. Αντί να περιγράψω αυτό, θα ενεργοποιήσω τα παρακάτω παραδείγματα, ώστε να μπορείτε να δείτε τον εαυτό σας.
Γρήγορα: Μπορείτε να δημιουργήσετε μια ρεαλιστική εικόνα ενός χαμαιλέοντα, κοντά, πυροβολούν, σαν να ήταν στο National Geographic σε αναλογία 16: 9;
Γρήγορα: Μπορείτε να δημιουργήσετε μια εικόνα ενός φορητού υπολογιστή ανοιχτή στο τραπέζι, το οποίο λέει: “Αυτό το μοντέλο είναι τόσο καλό που μπορεί να πάρει ακόμη και το σωστό κείμενο και τα χέρια που είναι συνήθως τα κύρια προβλήματα για τα μοντέλα τεχνητής νοημοσύνης” όταν τα χέρια εισάγονται σε ένα πληκτρολόγιο σε αναλογία 16: 9;
Γρήγορα: Μπορείτε να δημιουργήσετε μια ρεαλιστική γυναίκα σε κοντινή απόσταση μιας γυναίκας σε ένα πλήθος στην Times Square, κοιτάζοντας την κάμερα και χαμογελαστά, με την ποιότητα ενός που λαμβάνεται σε κάμερα καθρέφτη;
Όπως μπορείτε να δείτε παραπάνω, η γεννήτρια εικόνων αντιμετωπίζει τέλεια με τη συγκράτηση ενός υπαινιγμού και την παροχή υψηλής ποιότητας, ρεαλιστικών εικόνων. Ωστόσο, κατά τη δοκιμή του μοντέλου AI, ένας από τους πραγματικούς δείκτες απόδοσης είναι ο τρόπος με τον οποίο συγκρίνεται με τους ανταγωνιστές της αγοράς. Για να σας δώσω έναν καλό δείκτη γι ‘αυτό, τον ανάγκασα να δημιουργήσει τον ίδιο υπαινιγμό ότι έλεγξα όλες τις κύριες γεννήτριες των εικόνων τεχνητής νοημοσύνης, όπως το Midjourney, το Google Imagen 3, το Adobe Firefly και πολλά άλλα.
Συνδέω την απόδοση του GPT-4O παρακάτω. Σε αυτό το άρθρο, μπορείτε να δείτε πώς σχετίζεται με όλες τις άλλες γεννήτριες των εικόνων AI, συμπεριλαμβανομένης της εκτέλεσης του Dall, οι οποίες σαφώς καλύπτουν το τι μπορεί να κάνει το νέο μοντέλο.
Γρήγορα: Μπορείτε να δημιουργήσετε μια εικόνα ενός φωτεινού, ρεαλιστικού κολιμπού που βρίσκεται σε ένα δέντρο;
Άλλες αξιοσημείωτες λειτουργίες
Παρά το γεγονός ότι η ποιότητα των εικόνων μπορεί να είναι μία από τις μεγαλύτερες νίκες του μοντέλου, υπάρχουν και άλλα πλεονεκτήματα. Ένα από τα μεγαλύτερα είναι ότι ζει στη διασύνδεση συνομιλίας, γεγονός που καθιστά εύκολη τη διαμόρφωση των γενεών με τη βοήθεια απλών συμβουλών της φυσικής γλώσσας. Επιπλέον, δεδομένου ότι η συζήτηση για το περίοδο έχει το πλαίσιο αυτού που μόλις ρώτησες, μπορεί να το εξετάσει αυτό κατά τη δημιουργία μιας εικόνας.
Για παράδειγμα, εάν επικοινωνείτε μαζί του για να σταματήσετε τα γενέθλιά σας, μπορείτε να πείτε: “Μπορείτε τώρα να δημιουργήσετε μια πρόσκληση που είναι οι παραπάνω πληροφορίες;” Αντί για την ανάγκη επανεγγραφής. Για παράδειγμα, άρχισα να επικοινωνώ με το ChatGPT σχετικά με τη ρίψη νοικοκυριών και όταν του ζήτησα να δημιουργήσει μια πρόσκληση, δεν έπρεπε να επαναλάβω τις πληροφορίες που είπα στο παρελθόν.
Μπορείτε επίσης να κατεβάσετε τις εικόνες αναφοράς και, στη συνέχεια, να ζητήσετε από το ChatGPT να δημιουργήσετε μια άλλη έκδοση ή να τις χρησιμοποιήσετε ως νέα στοιχεία. Για παράδειγμα, μπορείτε να το εισαγάγετε ως selfie και να το δημιουργήσετε με το ύφος του anime, όπως φαίνεται στη νέα θέση του Altman.
άλλαξε το PFP μου, αλλά ίσως κάποιος θα με κάνει καλύτερο
– Sam Altman (@sama) 26 Μαρτίου 2025
Όλες αυτές οι λειτουργίες ρυθμίσεων καθιστούν μια πραγματικά ισχυρή προσφορά για τους δημιουργούς, οι οποίοι μπορούν επίσης να του ζητήσουν να εμφανιστεί σε ένα διαφανές υπόβαθρο ή να ενεργοποιήσει το στυλ μάρκας, όπως εξαγωνικούς κώδικες ή λογότυπα.
Μιλώντας για τον Altman, ήμουν σε θέση να δημιουργήσω την εικόνα του σε ένα καπέλο. Θα μπορούσα να το κάνω αυτό επειδή το νέο μοντέλο έχει πολύ πιο αδύναμες εγγυήσεις που έχουν σχεδιαστεί για να επιτρέπουν στους χρήστες να έρθουν στη δημιουργική τους ελευθερία. Σε ένα μήνυμα ιστολογίου, το οποίο αναφέρει ότι το μοντέλο σημειώνει ότι περιορίζει αυτό που μπορεί να δημιουργηθεί όταν οι πραγματικοί άνθρωποι βρίσκονται στο πλαίσιο, συμπεριλαμβανομένων “ιδιαίτερα αξιόπιστων εγγυήσεων για γυμνότητα και γραφική βία”.
Δεν μπορώ να πω αν υπάρχει μια πρακτική έκδοση χρήσης για αυτή τη λειτουργία, αλλά αυτή είναι μια αξιοσημείωτη αλλαγή που έπρεπε να προσπαθήσω για τον εαυτό μου. Όταν προσπάθησα να δημιουργήσω μια εικόνα του Mickey Mouse, είπε ότι δεν θα μπορούσε να οφείλεται στις συνέπειες των δικαιωμάτων πνευματικής ιδιοκτησίας, οπότε φαίνεται ότι δεν είναι όλα τα δημόσια στοιχεία είναι ένα ειλικρινές παιχνίδι.
Γενικός
Σε γενικές γραμμές, η γεννήτρια εικόνων GPT-4O είναι μια μεγάλη νίκη επί των μοντέλων Dall-E και, ενδεχομένως, μεταξύ των καλύτερων από πολλούς που δοκιμάσαμε. Αξίζει 20 $ το μήνα; Εάν απλά ενδιαφέρεστε για την παραγωγή εικόνων υψηλής ποιότητας, υπάρχουν ακόμα ελεύθερες εκδόσεις που μπορείτε να μελετήσετε που είναι πραγματικά ικανές, για παράδειγμα, Adobe Firefly ή Google Imagen 3.
Επίσης: Οι καλύτερες γεννήτριες των εικόνων AI: δοκιμασμένες και προβολές
Έχοντας πει αυτό, αν είστε συχνός χρήστης chatgpt, η ενημέρωση ChatGPT Plus γίνεται πολύ πιο δελεαστική. Με αυτήν την ενημέρωση, θα έχετε πρόσβαση σε όλες τις τελευταίες και καλύτερες λειτουργίες των bots chat openai, καθώς και υψηλής ποιότητας εικόνες και γενιά βίντεο, όλα για $ 20 το μήνα, κάτι που δεν είναι κακή συμφωνία, λαμβάνοντας υπόψη ειδικά τις άλλες προσφορές της αγοράς. Για παράδειγμα, η συνδρομή Midjourney ξεκινά από $ 10 το μήνα και προσφέρει μόνο γενιά εικόνων.
Θέλετε περισσότερες ιστορίες για το AI; Εγγραφείτε για καινοτομίαΗ εβδομαδιαία ψηφοφορία πληροφόρησης.