Το QWEN3 κάνει ντεμπούτο στο SO -που ονομάζεται “μοντέλα υβριδικής συλλογιστικής”, τα οποία, σύμφωνα με τον ίδιο, συνδυάζουν τις παραδοσιακές δυνατότητες του LLM με “εκτεταμένη, δυναμική συλλογιστική”.
Εικόνες SOPA | Lighttroket | Getty εικόνες
Την Τρίτη, η Alibaba κυκλοφόρησε την επόμενη γενιά των μεγάλων γλωσσικών μοντέλων της με ανοιχτή πηγή και οι εμπειρογνώμονες το ονομάζουν μια άλλη ανακάλυψη στον αυξανόμενο κινεζικό χώρο της τεχνητής νοημοσύνης με ανοιχτή πηγή.
Στο μήνυμα του ιστολογίου, ο κινεζικός τεχνικός γίγαντας δήλωσε ότι το QWEN3 υπόσχεται βελτιώσεις στη συλλογιστική, την κατάρτιση, τη χρήση εργαλείων και των πολυγλωσσικών καθηκόντων, εγκαταλείποντας άλλα μοντέλα κορυφαίων επιπέδων, όπως το R1 της Deedseek σε διάφορα κριτήρια της βιομηχανίας.
Η σειρά LLM περιλαμβάνει οκτώ επιλογές που καλύπτουν μια σειρά αρχιτεκτονικών και μεγεθών, προσφέροντας την ευελιξία των προγραμματιστών όταν χρησιμοποιούν το QWEN για τη δημιουργία εφαρμογών για τεχνητή νοημοσύνη για περιφερειακές συσκευές, όπως κινητά τηλέφωνα.
Το QWEN3 επίσης κάνει ντεμπούτο στο SO -που ονομάζεται “μοντέλα υβριδικής συλλογιστικής”, τα οποία, σύμφωνα με τον ίδιο, συνδυάζουν τις παραδοσιακές δυνατότητες της LLM με “διευρυμένη, δυναμική συλλογιστική”.
Σύμφωνα με την Alibaba, τέτοια μοντέλα μπορούν να μεταβούν ελεύθερα μεταξύ του “τρόπου σκέψης” για σύνθετα καθήκοντα, όπως η κωδικοποίηση και το “μη -κοινοτικό καθεστώς” για ταχύτερες, γενικές απαντήσεις.
“Αξίζει να σημειωθεί ότι το μοντέλο MOE QWEN3-235B-A22B μειώνει σημαντικά το κόστος ανάπτυξης σε σύγκριση με άλλα σύγχρονα μοντέλα, αυξάνοντας την προσκόλληση της Alibaba στην AI υψηλής απόδοσης”, δήλωσε ο Alibaba.
Τα νέα μοντέλα είναι ήδη ελεύθερα διαθέσιμα για μεμονωμένους χρήστες σε πλατφόρμες, όπως η αγκαλιά του προσώπου και του GitHub, καθώς και η διεπαφή ιστού Alibaba Cloud. Το QWEN3 χρησιμοποιείται επίσης για τις αρχές AI AI AI, Quark.
Η διοίκηση του AI της Κίνας
Ένας αναλυτής της AI δήλωσαν στο CNBC ότι το QWEN3 είναι ένα σοβαρό πρόβλημα για τους συναδέλφους της Alibaba στην Κίνα, καθώς και για τους ηγέτες της βιομηχανίας στις Ηνωμένες Πολιτείες
Στη δήλωση για το CNBC, ο Vai San, ο επικεφαλής αναλυτής της τεχνητής νοημοσύνης στην αντίθετη έρευνα, δήλωσε ότι η σειρά QWEN3 είναι “μια σημαντική ανακάλυψη, όχι για το καλύτερο της στην τάξη της”, αλλά και για διάφορες λειτουργίες που δείχνουν “το δυναμικό για τη χρήση μοντέλων”.
Αυτές οι λειτουργίες περιλαμβάνουν τη λειτουργία Hybrid Thinking QWEN3, την πολυγλωσσική υποστήριξή του, που καλύπτει 119 γλώσσες και διαλέκτους και την προσβασιμότητά της με ανοιχτή πηγή, πρόσθεσε τον Sun.
Το λογισμικό ανοικτού κώδικα αναφέρεται συνήθως στο λογισμικό, στο οποίο ο πηγαίος κώδικας γίνεται ελεύθερα διαθέσιμος στο Διαδίκτυο για πιθανή αλλαγή και ανακατανομή. Στις αρχές του τρέχοντος έτους, το μοντέλο R1 Deepseek με τον κώδικα ανοιχτού κώδικα R1 έσφιξε τον κόσμο του AI και γρήγορα έγινε καταλύτης για την εισαγωγή του κινεζικού χώρου του AI και του ανοιχτού κώδικα.
“Η απελευθέρωση της σειράς Alibaba Qwen 3 υπογραμμίζει περαιτέρω τις ισχυρές δυνατότητες των κινεζικών εργαστηρίων για την ανάπτυξη υψηλών ανταγωνιστικών, καινοτόμων και ανοιχτών μοντέλων, παρά την αύξηση της πίεσης από τον σκληρό έλεγχο των εξαγωγών των Ηνωμένων Πολιτειών”, δήλωσε ο Ray Van, αναλυτής της Ουάσιγκτον που ειδικεύεται στον οικονομικό και τεχνολογικό ανταγωνισμό των Ηνωμένων Πολιτειών.
Σύμφωνα με την Alibaba, η Qwen έχει ήδη γίνει ένα από τα πιο ευρέως αποδεκτά στον κόσμο των μοντέλων AI με ανοιχτή πηγή, προσελκύοντας περισσότερα από 300 εκατομμύρια λήψεις σε όλο τον κόσμο και περισσότερα από 100.000 παράγωγα μοντέλων για την αγκαλιά.
Ο Van δήλωσε ότι αυτή η υιοθεσία θα μπορούσε να συνεχιστεί με το QWEN3, προσθέτοντας ότι οι ισχυρισμοί του για την απόδοση μπορούν να το καταστήσουν το καλύτερο μοντέλο με ανοιχτό κώδικα στον κόσμο, αν και ακόμα για τα πιο προηγμένα μοντέλα στον κόσμο, όπως τα O3 και O4-Mini OpenAI.
Οι Κινέζοι ανταγωνιστές, όπως ο Baidu, επίσης έσπευσαν να απελευθερώσουν νέα μοντέλα τεχνητής νοημοσύνης μετά την εμφάνιση του Deepseek, συμπεριλαμβανομένου του σχεδιασμού να μετατοπιστούν προς ένα επιχειρηματικό μοντέλο με πιο ανοιχτή πηγή.
Εν τω μεταξύ, το Reuters ανέφερε τον Φεβρουάριο ότι ο Deepseek επιταχύνει την έναρξη του διαδόχου του στο R1, αναφερόμενος σε ανώνυμες πηγές.
“Στο ευρύτερο πλαίσιο του αγώνα AI AI, το χάσμα μεταξύ των αμερικανικών και των κινεζικών εργαστηρίων περιορίζονταν μέχρι και αρκετούς μήνες και μερικοί μπορούν να υποστηρίξουν, ακόμη και μέχρι και αρκετές εβδομάδες”, δήλωσε ο Van.
“Με την τελευταία έκδοση Qwen 3 και την επερχόμενη έναρξη του Deepseek R2, αυτό το κενό είναι απίθανο να επεκταθεί – και μπορεί ακόμη και να συνεχίσει να συμβάλλει”.