
Υπήρχε πολύς θόρυβος για το πώς το AI μπορεί να βοηθήσει τον προγραμματισμό, αλλά στα πρώτα ή δύο χρόνια γενετικής, AI ήταν πολλή διαφημιστική εκστρατεία. Η Microsoft πραγματοποίησε τεράστια γεγονότα που σημειώνουν πώς ο Copilot μπορεί να σας βοηθήσει να κωδικοποιήσετε, αλλά όταν το ελέγξω τον Απρίλιο του 2024, απέτυχε και οι τέσσερις τυποποιημένες δοκιμές μου. Διάταξε εντελώς. Καταστράφηκε και καίγεται. Πέφτει από το βράχο. Ολοκλήρωσε το χειρότερο από όλα τα AI που έλεγξα.
Οι μικτές μεταφορές στην άκρη, ας φύγουμε με το μπέιζμπολ. Ο Pipilot αντάλλαξε τις μπότες του για ένα πέρασμα λεωφορείου. Δεν ήταν άξια.
Επίσης: το καλύτερο AI για κωδικοποίηση το 2025 (και τι δεν πρέπει να χρησιμοποιήσετε)
Αλλά ο χρόνος που πέρασε στο PPZ της ζωής φαίνεται να βοήθησε τον Copilot. Αυτή τη φορά, όταν εμφανίστηκε για δοκιμές, θα θερμαίνεται και θα ήταν έτοιμος να εισέλθει στο κουτί. Έριξε τη ζεστασιά στην υυνσίδα. Όταν ήρθε η ώρα να παίξει, κοίταξε την μπάλα και η κούνια του πληκτρολογήθηκε. Προφανώς, ήταν έτοιμος για το παιχνίδι και ψάχνει για ένα βήμα για οδήγηση.
Αλλά μπορεί αυτό να αντισταθεί στις δοκιμές μου; Με το Yarod στα μάτια μου, πήγα στο ανάχωμα μιας κανάτας και ξεκίνησα με ένα μικρό μερίδιο. Πίσω το 2024, θα μπορούσατε να αισθανθείτε πώς ο άνεμος ταλαντεύτηκε και έχασε. Αλλά τώρα, τον Απρίλιο του 2025, ο Copilot συνδέθηκε απευθείας με την μπάλα και τον χτύπησε άμεσα και την αλήθεια.
Επίσης: πώς ελέγχω την ικανότητα ικανότητας του AI chatbot – και μπορείτε επίσης
Έπρεπε να στείλουμε τον Copilot, αλλά επέστρεψε στην παράσταση. Εδώ είναι ένα παιχνίδι πίσω από το παιχνίδι.
1. Γράφοντας το plugin WordPress
Λοιπόν, ο Copilot βελτιώθηκε σίγουρα από την πρώτη του κυκλοφορία αυτής της δοκιμής τον Απρίλιο του 2024. Για πρώτη φορά, δεν παρείχε κώδικα για την πραγματική εμφάνιση τυχαιοποιημένων γραμμών. Τους κράτησε με νόημα, αλλά δεν τα πήρε και δεν τα έδειξε. Με άλλα λόγια, αυτό ταλαντεύτηκε και έχασε. Αυτό δεν κατέληξε σε συμπέρασμα.
Αυτό είναι το αποτέλεσμα της τελευταίας εκτέλεσης:
Αυτή τη φορά λειτούργησε ο κώδικας. Άφησε μια τυχαία πρόσθετη κενή γραμμή στο τέλος, αλλά από τη στιγμή που ολοκλήρωσε την εργασία προγραμματισμού, θα το ονομάσουμε καλά.
Επίσης: Πώς να χρησιμοποιήσετε το chatgpt για να γράψετε κώδικα – και το αγαπημένο μου τέχνασμα για να εντοπίσει σφάλμα τι δημιουργεί
Η συνεχής λωρίδα του απολύτως αχαλίνωτου προγραμματισμού ήταν σπασμένη. Ας δούμε πώς συμβαίνει αυτό σε άλλες δοκιμές.
2. Με τη δημιουργία συμβολοσειράς
Αυτή η δοκιμή έχει σχεδιαστεί για να δοκιμάζει μετασχηματισμούς σε δολάρια και σεντ. Στην πρώτη μου δοκιμή, τον Απρίλιο του 2024, ο κώδικας που δημιουργήθηκε για την αντιγραφή σωστά σημείωσε το σφάλμα εάν η τιμή που περιέχει το γράμμα ή περισσότερα από ένα δεκαδικό ψηφίο απεστάλη σε αυτό, αλλά δεν πραγματοποίησε πλήρη έλεγχο. Αυτό επέτρεψε τα αποτελέσματα που θα μπορούσαν να οδηγήσουν στην αποτυχία των μεταγενέστερων διαδικασιών.
Επίσης: Πώς χρησιμοποίησα το ChatGPT για να γράψω το χρήστη JavaScript Bookmarkletlet
Αυτός ο αγώνας, ωστόσο, πέτυχε. Εκτελεί τις περισσότερες δοκιμές σωστά. Επιστρέφει ψευδείς για αριθμούς με περισσότερα από δύο ψηφία στα δεξιά του δεκαδικού σημείου, για παράδειγμα, 1,234 και 1,230. Επιστρέφει επίσης ψευδείς για αριθμούς με επιπλέον κορυφαία μηδενικά. Έτσι, επιτρέπεται 0,01, αλλά το 00.01 δεν είναι έτσι.
Τεχνικά, αυτές οι τιμές μπορούν να μετατραπούν στη χρήση των νομισμάτων, αλλά ποτέ δεν είναι κακές, έτσι ώστε το υποπρόγραμμα επαλήθευσης να είναι αυστηρό στις δοκιμές του. Ο κύριος στόχος είναι ότι η διαδικασία επαλήθευσης δεν επιτρέπει την τιμή που μπορεί να οδηγήσει σε δυσλειτουργία της επακόλουθης ρουτίνας. Ο Pipilot έκανε καλά εδώ.
Τώρα έχουμε δύο για δύο, μια τεράστια βελτίωση σε σύγκριση με τα αποτελέσματά του από την πρώτη διαδρομή.
3. Βρείτε ένα ενοχλητικό σφάλμα
Πρέπει να σας πω πώς ο Copilot απάντησε για πρώτη φορά αυτό τον Απρίλιο του 2024, επειδή είναι πολύ καλό.
Επίσης: Γιατί προσθέσαμε απλώς το Gemini 2.5 Pro σε έναν πολύ σύντομο κατάλογο εργαλείων τεχνητής νοημοσύνης για τα οποία κλαίω
Αυτό ελέγχει την ικανότητα του AI να πιστεύει ότι πολλά σκάκι προχωρούν προς τα εμπρός. Η απάντηση, η οποία φαίνεται προφανής, δεν είναι η σωστή απάντηση. Μου πιάστηκε όταν αρχικά έβγαλα το πρόβλημα, το οποίο τελικά έγινε αυτό το τεστ.
Στον πρώτο Copilot του αγώνα, πρότεινε να ελέγξει την ορθογραφία της λειτουργίας μου και το όνομα του WordPress Hook. Το WordPress Hook είναι ένα δημοσιευμένο πράγμα, οπότε ο Copilot έπρεπε να επιβεβαιώσει την ορθογραφία. Και η λειτουργία μου είναι η λειτουργία μου, οπότε μπορώ να το γράψω, ανεξάρτητα από το πώς θέλω. Εάν το φωτογραφήσαμε κάπου στον κώδικα, το IDE θα το έδειχνε πολύ αισθητά.
Και βελτιώθηκε. Εκείνη την εποχή, ο Copilot επανέλαβε πολύ ευτυχώς μια δήλωση σχετικά με το πρόβλημα για μένα, υποδηλώνοντας ότι λύνω τον εαυτό μου το πρόβλημα. Ναι, αυτή είναι η όλη σύσταση που έβλεπα. Λοιπόν, το πνεύμα. Στη συνέχεια, αυτό τελείωσε στο “Λαμβάνοντας υπόψη τη δυνατότητα αναζήτησης υποστήριξης από τον προγραμματιστή plugins ή φόρουμ της κοινότητας.” – Και ναι, αυτό το emoticon ήταν μέρος της απάντησης AI.
Ήταν εντυπωσιακό, ενθουσιώδες, emoticon. Δείτε τι εννοώ; Οι πρώτες απαντήσεις του AI, ανεξάρτητα από το πόσο άχρηστα, πρέπει να αποθανατιστούν.
Ειδικά όταν αυτή η φορά ο Copilot δεν ήταν τόσο αστείο. Απλώς το αποφάσισε. Γρήγορη, καθαρή, καθαρή. Έγινε και τελείωσε. Αποφασισμένος.
Αυτό θέτει την έκρηξη των τριών έως τριών και το εμφανίζει έντονα από την κατηγορία “Μην χρησιμοποιείτε αυτό το εργαλείο”. Οι βάσεις φορτώνονται. Ας δούμε αν ο Copilot μπορεί να σκοράρει το σπίτι -bug.
4. Γράφοντας το σενάριο
Η ιδέα με αυτή τη δοκιμή είναι ότι ρωτάει για ένα αρκετά σκοτεινό εργαλείο των σεναρίων Mac που ονομάζονται Maestro Keyboard, καθώς και τη γλώσσα των σεναρίων μήλων, καθώς και τη συμπεριφορά του Chrome Scripting. Για αυτό το αρχείο, το πληκτρολόγιο Maestro είναι ένας από τους μεγαλύτερους λόγους για τους οποίους χρησιμοποιώ Mac, όχι Windows για την καθημερινή μου απόδοση, επειδή σας επιτρέπει να επαναπρογραμματίσετε ολόκληρο το λειτουργικό σύστημα και διάφορες εφαρμογές σύμφωνα με τις ανάγκες μου. Είναι τόσο ισχυρό.
Σε κάθε περίπτωση, για να περάσει η δοκιμή, το AI πρέπει να περιγράψει σωστά τον τρόπο επίλυσης του προβλήματος χρησιμοποιώντας το συνδυασμό του κώδικα Maestro, του κώδικα Applescript και της λειτουργικότητας του API Chrome.
Επίσης: AI πέρασε την ανθρώπινη γνώση, λέει η μονάδα Google Deepmind
Την ίδια μέρα, ο Copilot δεν το έκανε σωστά. Αγνόησε εντελώς τον μαέστρο πληκτρολογίου (εκείνη την εποχή, πιθανότατα, δεν υπήρχε γνώση στη βάση δεδομένων). Στο παραγόμενο Applescript, όπου τον ζήτησα να σαρώσει το τρέχον παράθυρο, ο Copilot επανέλαβε τη διαδικασία για όλα τα παράθυρα, επιστρέφοντας τα αποτελέσματα για λάθος παράθυρο (το τελευταίο στην αλυσίδα).
Αλλά όχι τώρα. Αυτή τη φορά ο Copilot το έκανε σωστά. Έκανε ακριβώς αυτό που δόθηκε, έλαβε το σωστό παράθυρο και καρτέλα, μίλησε σωστά με το πληκτρολόγιο Maestro και Chrome και χρησιμοποίησε την πραγματική σύνταξη Applescript για το Applescript.
Οι βάσεις φορτώνονται. Αρχική μίλια.
Γενικά αποτελέσματα
Πέρυσι, είπα ότι δεν εντυπωσιάστηκα. Στην πραγματικότητα, βρήκα τα αποτελέσματα λίγο απογοητευτικά. Αλλά το είπα επίσης:
Αχ, καλά, η Microsoft βελτιώνει πραγματικά τα προϊόντα της με την πάροδο του χρόνου. Ίσως το επόμενο έτος.
Πέρυσι, ο Copilot άλλαξε από τα outs στον αναδευτήρα στον πίνακα αποτελεσμάτων. Πήγε από τον καθαρισμό του Vatin στο υπόγειο για να επιδιώξει μια φιάλη κάτω από πυρκαγιά.
Και εσύ? Έχετε εισέλθει πρόσφατα στο πεδίο ή σε άλλο βοηθό κωδικοποίησης AI; Πιστεύετε ότι είναι τελικά έτοιμος για το ανώτερο πρωτάθλημα, ή εξακολουθεί να ταξιδεύει σε έναν πάγκο; Είχατε κάποιες σειρές ή σπιτικές σειρές χρησιμοποιώντας AI για ανάπτυξη; Και τι χρειάζεται για ένα από αυτά τα εργαλεία για να κερδίσετε μια θέση στην αρχική σας σειρά; Ενημερώστε μας στα παρακάτω σχόλια.
Μπορείτε να ακολουθήσετε τις καθημερινές ενημερώσεις έργων μου στα κοινωνικά δίκτυα. Φροντίστε να εγγραφείτε στην εβδομαδιαία ενημέρωση του ενημερωτικού δελτίου μου και να με ακολουθήσετε στο Twitter/X IN @DavidgeWirtzΣτο Facebook στο Facebook.com/davidgewirtz, instagram.com/davidgewirtz και YouTube στο youtube.com/davidgewirtztv.