Monday, May 12, 2025
  • About Us
  • Contact Us
  • Terms and Conditions
  • Privacy Policy
  • Disclaimer
Viral Source
  • Home
  • Business
  • Health
  • Gaming
  • Economy
  • Technology
  • Gadgets
  • Lifestyle
  • Sports
  • World
No Result
View All Result
Viral Source
Home Technology

Το μοντέλο AI Deepseek είναι εύκολο στο jailbreak – και χειρότερα

Jessica Thompson by Jessica Thompson
February 1, 2025
in Technology
0
Το μοντέλο AI Deepseek είναι εύκολο στο jailbreak – και χειρότερα
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Related posts

Η θύρα USB της τηλεόρασής σας έχει ανεκτίμητη λειτουργία που πρέπει να χρησιμοποιήσετε κατά τη διάρκεια των αποσυνδέσεων στο Διαδίκτυο

Η θύρα USB της τηλεόρασής σας έχει ανεκτίμητη λειτουργία που πρέπει να χρησιμοποιήσετε κατά τη διάρκεια των αποσυνδέσεων στο Διαδίκτυο

May 12, 2025
100 κορυφαίοι επιστήμονες -οι τεχνολογίες τεχνολογιών εμφανίζουν τη διαδρομή σε πιο “αξιόπιστες, αξιόπιστες, ασφαλείς” AI

100 κορυφαίοι επιστήμονες -οι τεχνολογίες τεχνολογιών εμφανίζουν τη διαδρομή σε πιο “αξιόπιστες, αξιόπιστες, ασφαλείς” AI

May 12, 2025
GetTyimages-122442731

Goc/Getty Images

Μεταξύ των ίσων μερών, της απόλαυσης και των διαφωνιών σχετικά με το γεγονός ότι η απόδοσή της σημαίνει για την AI, η κινεζική εκκίνηση Deepseek συνεχίζει να αυξάνει τα προβλήματα ασφαλείας.

Την Πέμπτη, η 42 μονάδα, η ομάδα στον κυβερνοχώρο στο Palo Alto Networks, δημοσίευσε αποτελέσματα σε τρεις μεθόδους Jalebrack, τις οποίες χρησιμοποίησε σε σχέση με αρκετές αποσταγμένες εκδόσεις των μοντέλων Deepseek V3 και R1. Σύμφωνα με την έκθεση, αυτές οι προσπάθειες “έφθασαν σε σημαντικές ταχύτητες παράκαμψης, ενώ δεν υπήρχαν πρακτικά εξειδικευμένες γνώσεις ή εμπειρία”.

Επίσης: Η βάση δεδομένων του κοινού Depsek AI ανοίγει τα κλειδιά API και άλλα δεδομένα χρήστη

“Τα ερευνητικά μας αποτελέσματα δείχνουν ότι αυτές οι μέθοδοι jailbreak μπορούν να προσδιορίσουν έναν σαφή οδηγό για την επιβλαβή δραστηριότητα”, ανέφερε η έκθεση. “Αυτές οι ενέργειες περιλαμβάνουν τη δημιουργία του Keylogger, την εκμετάλλευση των δεδομένων και ακόμη και τις οδηγίες για εμπρηστικές συσκευές, αποδεικνύοντας τους ενσύρους κινδύνους ασφαλείας που συνδέονται με αυτή τη νέα κατηγορία επίθεσης”.

Οι ερευνητές μπόρεσαν να καλέσουν το Deepseek για να καθοδηγήσουν πώς να κλέψουν και να μεταδώσουν εμπιστευτικά δεδομένα, να παράκαναν την ασφάλεια, να γράψουν “πολύ πειστικά” μηνύματα ηλεκτρονικού ταχυδρομείου σχετικά με τις συσσωρεύσεις, να διεξάγουν “σύνθετες” επιθέσεις της κοινωνικής μηχανικής και να κάνουν το κοκτέιλ Molotov. Ήταν επίσης σε θέση να χειριστούν μοντέλα στη δημιουργία επιβλαβών προγραμμάτων.

“Ενώ οι πληροφορίες σχετικά με τη δημιουργία κοκτέιλ Molotov και Keyloggers είναι εύκολα διαθέσιμες στο διαδίκτυο, η LLM με ανεπαρκείς περιορισμούς ασφαλείας μπορεί να μειώσει το εμπόδιο για την είσοδο για κακόβουλους συμμετέχοντες, να καταρτίσει και να αντιπροσωπεύει εύκολα χρήσιμα και αποτελεσματικά συμπεράσματα”, προσθέτει το άρθρο.

Επίσης: Το OpenAI εγκαινιάζει το νέο μοντέλο O3 -Mini – έτσι μπορούν να το δοκιμάσουν δωρεάν χρήστες chatgpt

Την Παρασκευή, η Cisco κυκλοφόρησε επίσης ένα jailbreak -Report για το Deepseek R1. Αφού στοχεύει στο R1 με 50 προτροπές Harmbench, οι ερευνητές διαπίστωσαν ότι η Deepseek είχε “100% επιτυχία επίθεσης, πράγμα που σημαίνει ότι δεν μπορούσε να εμποδίσει τις επιβλαβείς συμβουλές”. Μπορείτε να δείτε πώς συγκρίνεται το Deepseek με τους δείκτες αντίστασης άλλων κορυφαίων μοντέλων παρακάτω.

Μοντέλο-ασφάλεια-γέμισο-διάγραμμα

Σίσκο

“Πρέπει να καταλάβουμε αν η Deepseek και το νέο πρότυπο της συλλογιστικής έχουν σημαντικούς συμβιβασμούς όταν πρόκειται για ασφάλεια και ασφάλεια”, αναφέρει η έκθεση.

Επίσης, την Παρασκευή, ο προμηθευτής ασφαλείας της Wallarm δημοσίευσε το δικό του jailbreak -Report, λέγοντας ότι έκανε ένα βήμα έξω από την προσπάθεια να πάρει το Deepseek για να δημιουργήσει επιβλαβές περιεχόμενο. Μετά τη δοκιμή των V3 και R1, η έκθεση ισχυρίζεται ότι αποκάλυψε το σύστημα Deepseek υπαινιγμό ή τις κύριες οδηγίες που καθορίζουν τον τρόπο συμπεριφοράς του μοντέλου, καθώς και τους περιορισμούς του.

Επίσης: ένα ισχυρό νέο copilot “Think Deeper” είναι δωρεάν για όλους τους χρήστες – πώς λειτουργεί

Τα αποτελέσματα δείχνουν “πιθανές ευπάθειες στο πλαίσιο της ασφάλειας του μοντέλου”, λέει ο Wallr.

Η OpenAi κατηγόρησε τη Deepseek ότι χρησιμοποιεί τα μοντέλα τους, τα οποία είναι δικά τους για την κατάρτιση V3 και R1, η οποία παραβιάζει τις συνθήκες εξυπηρέτησης. Στην έκθεσή του, ο Wallarm ισχυρίζεται ότι η Deepseek προκάλεσε ανοιχτή την “στην ανοιχτή γραμμή εκπαίδευσης”, η οποία, όπως αναφέρεται στην εταιρεία, δείχνει ότι “η τεχνολογία OpenAI μπορεί να διαδραματίσει κάποιο ρόλο στη δημιουργία της βάσης γνώσεων Deepseek”.

Deepseek-Img-2

Το Wallarm συνομιλεί με το Deepseek, το οποίο ανέφερε το OpenAi.

Τοίχος

“Στην περίπτωση του Deepseek, μια από τις πιο ενδιαφέρουσες ανακαλύψεις μετά την ευκαιρία COD είναι η ευκαιρία να εξαγάγετε λεπτομέρειες σχετικά με τα μοντέλα που χρησιμοποιούνται για την κατάρτιση και την απόσταξη. Συνήθως, προστατεύονται τέτοιες εσωτερικές πληροφορίες, γεγονός που εμποδίζει τους χρήστες να κατανοούν τα δίπλωμα ευρεσιτεχνίας ή εξωτερικά σύνολα δεδομένων που χρησιμοποιούνται για τη βελτιστοποίηση της απόδοσης “, εξηγεί η αναφορά.

“Συνδυάζοντας τους τυπικούς περιορισμούς, οι Jailbraits αποκαλύπτουν πόσοι προμηθευτές AI ελέγχουν τα δικά τους συστήματα, προσδιορίζοντας όχι μόνο την ευπάθεια ασφαλείας, αλλά και τις πιθανές ενδείξεις για τη διατροπική επιρροή στους αγωγούς κατάρτισης AI”, συνεχίζει.

Επίσης: Οι ερευνητές της Apple αποκαλύπτουν τη μυστική σάλτσα που στέκεται πίσω από το Deepseek AI

Η πρόσκληση Wallarm που χρησιμοποιείται για την απόκτηση αυτής της απάντησης επεξεργάζεται στην έκθεση, “έτσι ώστε να μην θέσουμε σε κίνδυνο άλλα ευάλωτα μοντέλα”, ανέφεραν οι ερευνητές του ZDNET από το e -mail. Η εταιρεία υπογράμμισε ότι αυτή η απάντηση στο Jailbrokem δεν αποτελεί επιβεβαίωση των υποψιών OpenAi που επιταχύνει τα μοντέλα της Deepseek.

Όπως σημειώθηκαν 404 μέσα ενημέρωσης και άλλα, η ανησυχία του OpenAI είναι κάπως ειρωνική, δεδομένης της ομιλίας της δικής του κλοπής των δεδομένων.

Η Wallarm λέει ότι ενημέρωσε το Deepsek για την ευπάθεια και ότι η εταιρεία έχει ήδη διορθώσει το πρόβλημα. Αλλά μόλις λίγες μέρες μετά τη βάσης δεδομένων Depseek βρέθηκε χωρίς προστασία και διαθέσιμη στο Διαδίκτυο (και στη συνέχεια απομακρύνθηκε γρήγορα, μετά την ειδοποίηση), τα αποτελέσματα του σήματος δυνητικά σημαντικών προστατευτικών οπών στα μοντέλα που δεν βγήκαν η Deepseek ελευθέρωση. Παρ ‘όλα αυτά, οι ερευνητές συχνά ήταν σε θέση να jailbreak των δημοφιλών μοντέλων που δημιουργήθηκαν στις Ηνωμένες Πολιτείες από πιο διάσημους γίγαντες του AI, συμπεριλαμβανομένου του ChatGPT.

Previous Post

Overwatch 2 Deleys το τελευταίο του καθεστώς από ένα ανταγωνιστικό παιχνίδι

Next Post

Ο εξοπλισμός Deepseek μπορεί να φτάσει τα 500 εκατομμύρια $: αναφορά

Next Post
Ο εξοπλισμός Deepseek μπορεί να φτάσει τα 500 εκατομμύρια $: αναφορά

Ο εξοπλισμός Deepseek μπορεί να φτάσει τα 500 εκατομμύρια $: αναφορά

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

RECOMMENDED NEWS

Big Spring Sale Amazon – Live: 95+ Οι καλύτερες τεχνικές προσφορές για καταστήματα (με μερικές από τις χαμηλότερες τιμές στην ιστορία)

Big Spring Sale Amazon – Live: 95+ Οι καλύτερες τεχνικές προσφορές για καταστήματα (με μερικές από τις χαμηλότερες τιμές στην ιστορία)

2 months ago
Εξαιρετική φυσική, απλοί τρόποι παιχνιδιού

Εξαιρετική φυσική, απλοί τρόποι παιχνιδιού

9 months ago
Οι Ηνωμένες Πολιτείες θα εγκαταλείψουν μια ειρηνική ώθηση στην Ουκρανία, αν δεν υπάρχει πρόοδος μέσα σε λίγες ημέρες για αρκετές ημέρες “, λέει ο Rubio

Οι Ηνωμένες Πολιτείες θα εγκαταλείψουν μια ειρηνική ώθηση στην Ουκρανία, αν δεν υπάρχει πρόοδος μέσα σε λίγες ημέρες για αρκετές ημέρες “, λέει ο Rubio

3 weeks ago
Ο Άντονι Μπουρντέν τιμήθηκε μετά θάνατον με το Εθνικό Μετάλλιο των Τεχνών.

Ο Άντονι Μπουρντέν τιμήθηκε μετά θάνατον με το Εθνικό Μετάλλιο των Τεχνών.

7 months ago

BROWSE BY CATEGORIES

  • Business
  • Economy
  • Gadgets
  • Gaming
  • Health
  • Lifestyle
  • Sports
  • Technology
  • Travel
  • World

POPULAR NEWS

  • Το 40% των παγκόσμιων αναγκών σε νερό θα παραμείνει ανεκπλήρωτο μέχρι το 2030 λόγω της παύσης της ανάπτυξης της τεχνολογίας αφαλάτωσης

    Το 40% των παγκόσμιων αναγκών σε νερό θα παραμείνει ανεκπλήρωτο μέχρι το 2030 λόγω της παύσης της ανάπτυξης της τεχνολογίας αφαλάτωσης

    0 shares
    Share 0 Tweet 0
  • Το Astro Bot έχει ένα εκπληκτικό ανεξερεύνητο επίπεδο με τόνους μυστικών αυγών

    0 shares
    Share 0 Tweet 0
  • Μόλις γελοιοποιήθηκε για το ύψος του, ο «ζεστός» παρααθλητής αναγκάζει άλλους να κάθονται στις μύτες των ποδιών τους

    0 shares
    Share 0 Tweet 0
  • Μέσα στο μακροχρόνιο πρόβλημα χρηματοοικονομικής παιδείας της Αμερικής που οδηγεί σε τρισεκατομμύρια χρέη μαθητών: “Πρέπει να διδάξετε τους δασκάλους”

    0 shares
    Share 0 Tweet 0
  • Μια προσέγγιση με γνώμονα τα δεδομένα για την εταιρική διακυβέρνηση

    0 shares
    Share 0 Tweet 0

Our mission is to deliver accurate, timely, and comprehensive news coverage that keeps our readers informed and engaged. We strive to provide a balanced perspective on the latest events and issues shaping our world, offering insightful analysis and in-depth reporting on a wide range of topics.

Follow us on social media:

Recent News

  • Λεπίδες αστέρων
  • Πήραν τη δουλειά μας: συνέχεια
  • Δελχί, Τζαϊπούρ για την τοποθέτηση 3 συμπτώσεων το καθένα

Category

  • Business
  • Economy
  • Gadgets
  • Gaming
  • Health
  • Lifestyle
  • Sports
  • Technology
  • Travel
  • World

World News

Μια κρυφή λειτουργία των Χαρτών Google κάνει τους ανθρώπους να αισθάνονται συναισθηματικοί – Να γιατί

Μια κρυφή λειτουργία των Χαρτών Google κάνει τους ανθρώπους να αισθάνονται συναισθηματικοί – Να γιατί

December 19, 2024
Τώρα μπορείτε να αγοράσετε την κεραία Internet Starlink Mini της SpaceX που χωράει στο σακίδιό σας

Τώρα μπορείτε να αγοράσετε την κεραία Internet Starlink Mini της SpaceX που χωράει στο σακίδιό σας

August 9, 2024
  • About Us
  • Contact Us
  • Terms and Conditions
  • Privacy Policy
  • Disclaimer

© 2024 Viral Source . All Rights Reserved.

No Result
View All Result
  • Home
  • Business
  • Health
  • Gaming
  • Economy
  • Technology
  • Gadgets
  • Lifestyle
  • Sports
  • World

© 2024 Viral Source . All Rights Reserved.