Γιγαντιαίο LLM Τρέχει με Μία Μόνο GPU Χάρη σε 768GB Φθηνής Μνήμης Intel Optane

Ένας χρήστης του Reddit κατάφερε να εκτελέσει ένα τεράστιο μεγάλο γλωσσικό μοντέλο (LLM) με 1 τρισεκατομμύριο παραμέτρους σε έναν σταθμό εργασίας με μία μόνο GPU, χρησιμοποιώντας 768GB Intel Optane PMem DIMM ως RAM. Αυτή η καινοτόμος ρύθμιση, χρησιμοποιώντας την τοπική εγκατάσταση Kimi K2.5, πέτυχε εντυπωσιακό ρυθμό παραγωγής "tokens" περίπου τεσσάρων ανά δευτερόλεπτο.

Σε μια αξιοσημείωτη επίδειξη έξυπνης χρήσης υλικού, ένας χρήστης του Reddit έχει τραβήξει την προσοχή της τεχνολογικής κοινότητας, αναπτύσσοντας ένα Μεγάλο Γλωσσικό Μοντέλο (LLM) 1 τρισεκατομμυρίου παραμέτρων σε ένα σύστημα που διαθέτει μόνο μία GPU. Το μυστικό όπλο πίσω από αυτό το επίτευγμα ήταν 768GB Intel Optane Persistent Memory (PMem) DIMMs, τα οποία επαναχρησιμοποιήθηκαν έξυπνα για να λειτουργήσουν ως RAM συστήματος.

Παραδοσιακά, η εκτέλεση ενός τόσο τεράστιου LLM τοπικά θα απαιτούσε μια υπέρογκη ποσότητα συμβατικής, υψηλής ταχύτητας RAM, συχνά σε συνδυασμό με πολλαπλές A6000 ή A100 GPUs. Το κόστος και η πολυπλοκότητα που σχετίζονται με μια τέτοια ρύθμιση συνήθως παραπέμπουν αυτά τα μοντέλα σε περιβάλλοντα υπερυπολογιστών βασισμένα σε cloud. Ωστόσο, η προσέγγιση αυτού του χρήστη του Reddit υποδεικνύει έναν πιο προσβάσιμο, αν και αντισυμβατικό, δρόμο.

Συνεργατικό περιεχόμενο

Instant Gaming

Παιχνίδια έως -90%

Άμεση παράδοση κωδικών στο Instant Gaming

Δες προσφορές →

Τα Intel Optane PMem DIMMs, αν και όχι τόσο γρήγορα όσο οι στάνταρ RAM DDR4 ή DDR5, προσφέρουν σημαντικά μεγαλύτερες χωρητικότητες και πολύ χαμηλότερο κόστος ανά gigabyte. Με τη διαμόρφωση ενός σταθμού εργασίας ώστε να χρησιμοποιεί αυτά τα DIMMs, ο χρήστης δημιούργησε ένα σύστημα με μια τεράστια δεξαμενή μνήμης ικανή να φιλοξενήσει το μνημειώδες μέγεθος του LLM 1 τρισεκατομμυρίου παραμέτρων. Το συγκεκριμένο μοντέλο που χρησιμοποιήθηκε ήταν μια τοπική εγκατάσταση Kimi K2.5, αποδεικνύοντας ότι ακόμα και με τις πιο αργές ταχύτητες πρόσβασης μνήμης του Optane, είναι εφικτή η πρακτική εξαγωγή συμπερασμάτων.

Η παρατηρούμενη απόδοση, που εκτιμάται σε περίπου τέσσερα tokens ανά δευτερόλεπτο, είναι ανταγωνιστική για μια ρύθμιση με μία μόνο GPU, ειδικά λαμβάνοντας υπόψη το τεράστιο μέγεθος του μοντέλου. Αυτό το πείραμα ανοίγει ενδιαφέρουσες δυνατότητες για ερευνητές και ενθουσιώδεις που επιθυμούν να εκτελέσουν μεγάλα μοντέλα χωρίς το απαγορευτικό κόστος του κορυφαίου, εξειδικευμένου υλικού. Υπογραμμίζει τις δυνατότητες επαναχρησιμοποίησης λύσεων μνήμης εταιρικού επιπέδου για εφαρμογές καταναλωτών με υψηλές απαιτήσεις μνήμης, ανατρέποντας τις προσδοκίες για το τι είναι δυνατό με έναν πιο μέτριο προϋπολογισμό.

Προτεινόμενα

Android Authority20 ώρες πριν

Η NordVPN Προσφέρει Πλέον Προστασία Μηνυμάτων στους Χρήστες Android

Η NordVPN επέκτεινε τις υπηρεσίες ασφαλείας της για χρήστες Android, λανσάροντας ένα νέο χαρακτηριστικό προστασίας μηνυμάτων, συμπληρώνοντας την υπάρχουσα προστασία κλήσεων. Αυτή η βελτίωση στοχεύει στην προφύλαξη των χρηστών από μια ποικιλία κακόβουλων μηνυμάτων, ενισχύοντας την ασφάλεια των κινητών.

Διάβασε το άρθρο

Tom's Hardware20 ώρες πριν

Η SK hynix και η TetraMem Συνεργάζονται σε Πειραματικό Τσιπ για Ενεργειακή Απόδοση σε Συσκευές Edge AI

Η SK hynix, σε συνεργασία με την TetraMem και το Πανεπιστήμιο της Νότιας Καλιφόρνια, δημιούργησε ένα σύστημα-σε-τσιπ βασισμένο σε μνήμη memristor για συσκευές AI στην άκρη του δικτύου, επιτυγχάνοντας ελπιδοφόρα ενεργειακή απόδοση. Ωστόσο, η πλήρης απόδοση του πειραματικού αυτού τσιπ δεν έχει ακόμη αποδειχθεί ολοκληρωμένα.

Διάβασε το άρθρο

Android Authority21 ώρες πριν

Επείγουσα Ανάκληση: Power Bank Εγκυμονεί Κίνδυνο Πυρκαγιάς

Ένα ακόμα μοντέλο power bank ανακαλείται λόγω σοβαρών κινδύνων υπερθέρμανσης και πυρκαγιάς, απαιτώντας την άμεση παύση χρήσης του από τους κατόχους. Συνιστάται ανεπιφύλακτα στους καταναλωτές να σταματήσουν να χρησιμοποιούν αυτή τη συγκεκριμένη συσκευή για την αποφυγή πιθανών κινδύνων.

Διάβασε το άρθρο

Dot Esports21 ώρες πριν

ALGS Split 1 στο EWC 2026: Πρόγραμμα, Αποτελέσματα, Βαθμολογίες, Ομάδες και Πληροφορίες Μετάδοσης

Ετοιμαστείτε για μια εντυπωσιακή αναμέτρηση στο τουρνουά ALGS Split 1, το οποίο θα λειτουργήσει ως προκριματικός αγώνας για το Esports World Cup (EWC) 2026. Αυτός ο αναλυτικός οδηγός παρέχει όλες τις βασικές λεπτομέρειες, από τις συνθέσεις των ομάδων έως τα προγράμματα μετάδοσης, διασφαλίζοντας ότι οι φίλαθλοι δεν θα χάσουν καμία στιγμή από τη δράση που εκτυλίσσεται στο Παρίσι.

Διάβασε το άρθρο