Πίσω
Tom's Hardware1 ώρες πριν

Γιγαντιαίο LLM Τρέχει με Μία Μόνο GPU Χάρη σε 768GB Φθηνής Μνήμης Intel Optane

Ένας χρήστης του Reddit κατάφερε να εκτελέσει ένα τεράστιο μεγάλο γλωσσικό μοντέλο (LLM) με 1 τρισεκατομμύριο παραμέτρους σε έναν σταθμό εργασίας με μία μόνο GPU, χρησιμοποιώντας 768GB Intel Optane PMem DIMM ως RAM. Αυτή η καινοτόμος ρύθμιση, χρησιμοποιώντας την τοπική εγκατάσταση Kimi K2.5, πέτυχε εντυπωσιακό ρυθμό παραγωγής "tokens" περίπου τεσσάρων ανά δευτερόλεπτο.

Γιγαντιαίο LLM Τρέχει με Μία Μόνο GPU Χάρη σε 768GB Φθηνής Μνήμης Intel Optane

Σε μια αξιοσημείωτη επίδειξη έξυπνης χρήσης υλικού, ένας χρήστης του Reddit έχει τραβήξει την προσοχή της τεχνολογικής κοινότητας, αναπτύσσοντας ένα Μεγάλο Γλωσσικό Μοντέλο (LLM) 1 τρισεκατομμυρίου παραμέτρων σε ένα σύστημα που διαθέτει μόνο μία GPU. Το μυστικό όπλο πίσω από αυτό το επίτευγμα ήταν 768GB Intel Optane Persistent Memory (PMem) DIMMs, τα οποία επαναχρησιμοποιήθηκαν έξυπνα για να λειτουργήσουν ως RAM συστήματος.

Παραδοσιακά, η εκτέλεση ενός τόσο τεράστιου LLM τοπικά θα απαιτούσε μια υπέρογκη ποσότητα συμβατικής, υψηλής ταχύτητας RAM, συχνά σε συνδυασμό με πολλαπλές A6000 ή A100 GPUs. Το κόστος και η πολυπλοκότητα που σχετίζονται με μια τέτοια ρύθμιση συνήθως παραπέμπουν αυτά τα μοντέλα σε περιβάλλοντα υπερυπολογιστών βασισμένα σε cloud. Ωστόσο, η προσέγγιση αυτού του χρήστη του Reddit υποδεικνύει έναν πιο προσβάσιμο, αν και αντισυμβατικό, δρόμο.

Συνεργατικό περιεχόμενο
Instant Gaming

Παιχνίδια έως -90%

Άμεση παράδοση κωδικών στο Instant Gaming

Δες προσφορές →

Τα Intel Optane PMem DIMMs, αν και όχι τόσο γρήγορα όσο οι στάνταρ RAM DDR4 ή DDR5, προσφέρουν σημαντικά μεγαλύτερες χωρητικότητες και πολύ χαμηλότερο κόστος ανά gigabyte. Με τη διαμόρφωση ενός σταθμού εργασίας ώστε να χρησιμοποιεί αυτά τα DIMMs, ο χρήστης δημιούργησε ένα σύστημα με μια τεράστια δεξαμενή μνήμης ικανή να φιλοξενήσει το μνημειώδες μέγεθος του LLM 1 τρισεκατομμυρίου παραμέτρων. Το συγκεκριμένο μοντέλο που χρησιμοποιήθηκε ήταν μια τοπική εγκατάσταση Kimi K2.5, αποδεικνύοντας ότι ακόμα και με τις πιο αργές ταχύτητες πρόσβασης μνήμης του Optane, είναι εφικτή η πρακτική εξαγωγή συμπερασμάτων.

Η παρατηρούμενη απόδοση, που εκτιμάται σε περίπου τέσσερα tokens ανά δευτερόλεπτο, είναι ανταγωνιστική για μια ρύθμιση με μία μόνο GPU, ειδικά λαμβάνοντας υπόψη το τεράστιο μέγεθος του μοντέλου. Αυτό το πείραμα ανοίγει ενδιαφέρουσες δυνατότητες για ερευνητές και ενθουσιώδεις που επιθυμούν να εκτελέσουν μεγάλα μοντέλα χωρίς το απαγορευτικό κόστος του κορυφαίου, εξειδικευμένου υλικού. Υπογραμμίζει τις δυνατότητες επαναχρησιμοποίησης λύσεων μνήμης εταιρικού επιπέδου για εφαρμογές καταναλωτών με υψηλές απαιτήσεις μνήμης, ανατρέποντας τις προσδοκίες για το τι είναι δυνατό με έναν πιο μέτριο προϋπολογισμό.

Σύνοψη βάσει δημοσιευμάτων τρίτων.

Πρωτότυπη πηγή: Tom's Hardware

Προτεινόμενα

GameNative: Είναι αυτή η εφαρμογή Android το τέλος των φορητών υπολογιστών gaming;
Android Authority1 ώρες πριν

GameNative: Είναι αυτή η εφαρμογή Android το τέλος των φορητών υπολογιστών gaming;

Μια συνέντευξη με τον δημιουργό του GameNative, Utkarsh Dalal, εξερευνά τη δυνατότητα αυτής της εφαρμογής Android να φέρει επανάσταση στο φορητό gaming. Ο Dalal υποστηρίζει ότι το GameNative θα μπορούσε να προσφέρει μια συναρπαστική εναλλακτική λύση στους αποκλειστικούς φορητούς υπολογιστές gaming, αξιοποιώντας τη δύναμη και την πανταχού παρούσα φύση των smartphones.

Διάβασε το άρθρο
Κρυφό Καλώδιο USB Hacking με Wi-Fi Διαθέτει Ενσωματωμένο Μικροελεγκτή και Αποθηκευτικό Χώρο
Tom's Hardware1 ώρες πριν

Κρυφό Καλώδιο USB Hacking με Wi-Fi Διαθέτει Ενσωματωμένο Μικροελεγκτή και Αποθηκευτικό Χώρο

Ένα διακριτικό καλώδιο USB, εξωτερικά αδιαίρετο από ένα κανονικό, έχει κερδίσει σημαντική προσοχή στο Kickstarter λόγω των κρυφών του δυνατοτήτων. Αυτή η συσκευή ενσωματώνει έξυπνα έναν μικροελεγκτή ESP32-S3, μια υποδοχή κάρτας micro SD και συνδεσιμότητα Wi-Fi, επιτρέποντας προηγμένες λειτουργίες όπως απομακρυσμένη εκτέλεση ωφέλιμου φορτίου και εισαγωγή πληκτρολογήσεων.

Διάβασε το άρθρο
Γιατί είμαι σκεπτικός σχετικά με το μέλλον των τιμών του Google One
Android Authority2 ώρες πριν

Γιατί είμαι σκεπτικός σχετικά με το μέλλον των τιμών του Google One

Η νέα συνδρομή AI Premium της Google για το Google One, που προσφέρει προηγμένη πρόσβαση στο Gemini, φαίνεται πολύ καλή για να είναι αληθινή, εγείροντας ανησυχίες για μελλοντικές αυξήσεις τιμών. Η τρέχουσα γενναιόδωρη προσφορά υποδηλώνει ότι η Google ενδέχεται να τοποθετείται στρατηγικά πριν αυξήσει σημαντικά τα κόστη.

Διάβασε το άρθρο
Ο 3D Εκτυπωτής Elegoo Centauri Carbon 2 Combo Τώρα με Έκπτωση $50, Κάνοντας την Πολύχρωμη 3D Εκτύπωση Προσιτή
Tom's Hardware2 ώρες πριν

Ο 3D Εκτυπωτής Elegoo Centauri Carbon 2 Combo Τώρα με Έκπτωση $50, Κάνοντας την Πολύχρωμη 3D Εκτύπωση Προσιτή

Ο φιλικός προς την οικογένεια 3D εκτυπωτής Centauri Carbon 2 Combo της Elegoo είναι τώρα διαθέσιμος με έκπτωση $50, μειώνοντας την τιμή του στα $399. Αυτό καθιστά την τετράχρωμη εκτύπωση, την γρήγορη αλλαγή νήματος και την υποστήριξη υλικών υψηλής θερμοκρασίας πιο προσιτή για τους αρχάριους.

Διάβασε το άρθρο