
Γεια σας και καλώς ήλθατε να κοιτάξετε το AI. Στη σημερινή έκδοση … OpenAi εκδίδει μια πιο ικανή γεννήτρια εικόνων, ενώ η Microsoft βάζει το μερίδιό της σε πράκτορες λογικής. Η Google κάνει το ντεμπούτο του Gemini 2.5 “Thinking” του μοντέλου. Amazon δοκιμάζει τους βοηθούς για την υγεία και το schopping. Χαρακτήρας. Το AI δίνει στους γονείς το φακό κατά τη διάρκεια του παιδιού τους στην πλατφόρμα. Και οι επιθετικοί σαρωτές AI συντρίβουν τα έργα ανοιχτού κώδικα.
Αυτή την εβδομάδα, τόσο ο OpenAI όσο και ο υποστηρικτής του (και ο πρώην αντίπαλος … είναι δύσκολο), η Microsoft κυκλοφόρησε μερικές από τις πιο ισχυρές δυνατότητες AI για τις κύριες πλατφόρμες του. Η OpenAI έκανε ντεμπούτο με μια νέα δυνατότητα δημιουργίας εικόνων για το GPT-4O στην κύρια υπηρεσία CHATGPT, προσφέροντας προηγμένες δυνατότητες για τη δημιουργία εικόνων και κοκκώδους επεξεργασίας με βάση συμβουλές κειμένου. Αυτό κάνει τη δημιουργία εικόνων πολύ για να υπερβεί αυτό που ήταν δυνατό με το προηγούμενο μοντέλο Dall-E. Και η Microsoft ανακοίνωσε ότι αύξησε την πρότασή της Microsoft 360 με δύο “βαθιούς συλλογιστικούς πράκτορες”, καθώς και “ροές πρακτορείων” που έχουν σχεδιαστεί για να αφαιρέσουν κάποια απρόβλεπτη, οι οποίες παρέχονται χρησιμοποιώντας πράκτορες AI.
Το ChatGpt είχε ήδη μια γεννήτρια εικόνων και η Microsoft έχει ήδη αναπτύξει διάφορους τύπους παραγόντων προσανατολισμένων στην επιχείρηση. Και τα δύο θέματα, ωστόσο, προσφέρουν μια νέα στροφή σε αυτό που πρότειναν και δείχνει τη δυνατότητα να επεκτείνει αμέσως τη νέα λειτουργία στην πλατφόρμα, η οποία έχει ήδη εκατοντάδες εκατομμύρια χρήστες. Η παρουσία αυτού του είδους διανομής είναι ένα τεράστιο πλεονέκτημα, καθώς ο ανταγωνισμός μεταξύ αυτών των προϊόντων θερμαίνεται.
Η γενιά 4ο αυξάνει τη ράβδο
Τώρα, η εισαγωγή στο Chatgpt Plus, Pro, Team και Free Reseam, η OpenAI περιγράφει μια νέα ενσωμάτωση ως “η πιο προηγμένη γεννήτρια εικόνων”. Και πρέπει να πω ότι τα αποτελέσματα είναι εντυπωσιακά.
Γενικά, η 4ο -γενιά των εικόνων μπορεί να δημιουργήσει φωτεινές ρεαλιστικές σκηνές και να δημιουργήσει εντυπωσιακούς μετασχηματισμούς φορτωμένων εικόνων “μετάδοση στυλ” με βάση τις συμβουλές. (Μπορείτε επίσης να επεξεργαστείτε τις βασικές λειτουργίες των φορτωμένων εικόνων, μόνο από συμβουλές.) Με βάση πολλές εικόνες που πλημμυρίζουν από το Catgpt Subreddit, αυτή η πιθανότητα μετάδοσης στυλ είναι δημοφιλής. Η εικόνα που δημιουργήθηκε από το μοντέλο, αφού ο χρήστης τον ώθησε να αλλάξει το μίμωμα του “αφηρημένου τύπου” στο στυλ του South Park, για παράδειγμα, ειλικρινά συγκλονιστικό πώς θα εξετάσει την οπτική εμφάνιση των εκπληκτικών εταιρειών Show-Ni που δημιουργούν γενετικά μοντέλα τεχνητής νοημοσύνης είναι γεμάτα με δικαστικές αγωγές. Από την άλλη πλευρά, οι χρήστες ελέγχουν ήδη τα όρια της δημιουργίας εικόνων δημόσιων μορφών, όπως ο Donald Trump και ο Elon Musk. Ο OpenAi επιβεβαίωσε ότι εξετάζει το AI, ότι δεν περιορίζει το νέο μοντέλο εικόνας από τη δημιουργία εικόνων πραγματικών ανθρώπων, εκτός από περιπτώσεις γυμνότητας ή γραφικής βίας. Αυτή είναι μια μετατόπιση από τους περιορισμούς του για το Dall-E, το οποίο θα αρνείται να δημιουργήσει εικόνες πραγματικών ανθρώπων.
Ίσως η πιο ενδιαφέρουσα προώθηση, ωστόσο, είναι ένα τεράστιο άλμα στην ικανότητα του μοντέλου να παράγει κείμενο. Το Dall-E και άλλα προηγούμενα μοντέλα που δημιουργούν εικόνες συνήθως δημιουργούν ένα παραμορφωμένο κείμενο, αλλά η 4ο γενιά των εικόνων μπορούν να δημιουργήσουν μακρές, λεπτομερείς και ακριβείς γραμμές του κειμένου μέσα στις εικόνες. Το πρώτο παράδειγμα στο blog του OpenAI δείχνει ένα ολόκληρο συμβούλιο του κειμένου που διαβάζεται εύκολα και ακριβής για μια ένδειξη.
“Ερευνητής” και “Αναλυτής” Συμμετοχή στο χώρο εργασίας σας 365
Η Microsoft περιγράφει τους νέους “βαθιά αιτιολογημένους παράγοντες” της για το Microsoft 365 Copilot, το οποίο έχει σχεδιαστεί για να “επεξεργάζεται σύνθετα καθήκοντα που απαιτούν λεπτομερή ανάλυση, μεθοδολογική σκέψη και απόχρωση”. Με βάση τα μοντέλα συλλογισμού OPEAI O1, ο πράκτορας του ερευνητή επικεντρώνεται στην έρευνα πολλαπλών σταδίων και να ενσωματώνεται σε εξωτερικές πλατφόρμες όπως το Salesforce, το ServiceNow και τη συρροή για να αποκτήσουν μια ιδέα από όλα τα δεδομένα της εταιρείας. Στη συνέχεια, υπάρχει ένας αναλυτικός παράγοντας που βασίζεται στο μοντέλο συλλογισμού O3-Mini Open. Η Microsoft ισχυρίζεται ότι είναι βελτιστοποιημένη για τη διεξαγωγή μιας εκτεταμένης ανάλυσης δεδομένων στην εργασία, χρησιμοποιεί συζητήσεις σχετικά με την αλυσίδα των σκέψεων και μπορεί να ξεκινήσει την Python για να λύσει σύνθετα αιτήματα δεδομένων. Και οι δύο πρόκειται να αρχίσουν να ξεδιπλώνονται τον Απρίλιο.
Εκτός από τους νέους παράγοντες, η Microsoft ανακοίνωσε επίσης μια νέα ευκαιρία που προκαλεί “ροές πράκτορα”, η οποία έχει σχεδιαστεί για να αυξάνει την προβλεψιμότητα στη χρήση παραγόντων. Οι αγωγοί του πράκτορα παρέχουν δομημένες διαδικασίες εργασίας με βάση τους κανόνες που περιλαμβάνουν τις ενέργειες του ΑΙ, ακολουθώντας τις προκαθορισμένες και καθορισμένες οδούς. Αυτό είναι σημαντικό επειδή, όπως έγραψα στην ψηφοφορία πληροφοριών την περασμένη Πέμπτη, οι πράκτορες τεχνητής νοημοσύνης έχουν σοβαρά προβλήματα με την αξιοπιστία και μπορεί να είναι επικίνδυνα, ειδικά όταν πρόκειται για κρίσιμες ενέργειες ή εμπιστευτικά δεδομένα.
Πρόσφατα, διάφορες εταιρείες παράγουν πράκτορες AI που διαφημίζονται για “βαθιά έρευνα”, αλλά ο ρόλος της Microsoft 365, δεδομένου ότι η κεντρική πλατφόρμα πολλών επιχειρήσεων είναι και η ένταξη με όλα τα άλλα προϊόντα που χρησιμοποιούν – η Microsoft ένα μοναδικό πλεονέκτημα. Το πεδίο AI είναι συγκλονισμένο με το γεγονός ότι οι εταιρείες ανταγωνίζονται με παρόμοια προϊόντα, καθένα από τα οποία είναι ένας αναβάτης για την ιδιοκτησία της διαφοροποίησης. Αυτές οι ενημερώσεις καθιστούν εύκολα τις διευρυμένες λειτουργίες της τεχνητής νοημοσύνης, όπου λειτουργούν οι χρήστες δημοφιλών προϊόντων, τα οποία πιθανότατα θα είναι ένα σημαντικό πλεονέκτημα της αγοράς. Επιπλέον, τόσο η Microsoft όσο και η Google μετακόμισαν έτσι ώστε από προεπιλογή να συνδυαστούν οι λειτουργίες της τεχνητής νοημοσύνης στο εταιρικό τους λογισμικό και να αυξήσουν τις τιμές για τα κύρια προϊόντα, μετά από αυτό που επέτρεψε προηγουμένως οι πελάτες να επιλέξουν τις λειτουργίες της τεχνητής νοημοσύνης για επιπλέον κόστος. Αυτό είναι το πλεονέκτημα της πλατφόρμας.
Και με αυτό, εδώ είναι περισσότερα νέα AI.
Φασκόμηλο Λαζάρο
sage.lazzaro@consultant.fortune.com
Sagelazzaro.com
Αυτή η ιστορία παρουσιάστηκε αρχικά στο Fortune.com