Garfield: Τι είναι το DeepSeek, πώς λειτουργεί και γιατί μας ενδιαφέρει

H εντυπωσιακή, ξαφνική άνοδος της κινεζικής DeepSeek έχει ταράξει τα νερά της παγκόσμιας τεχνολογίας και των αγορών. Η κινεζική επέλαση στον τομέα των ΑΙ chatbot την τελευταία εβδομάδα, θέτει ερωτήματα για την κυριαρχία των ΗΠΑ στον τομέα της Τεχνητής Νοημοσύνης, για τα χρήματα που δαπανώνται σε αυτόν.

• • •

Η DeepSeek είναι μια κινεζική εταιρεία ΑΙ, η οποία την προηγούμενη εβδομάδα λάνσαρε ένα chatbot τεχνητής νοημοσύνης, το R1. Η εφαρμογή έφτασε στην κορυφή των λήψεων του App Store της Apple στις ΗΠΑ, ενώ προκάλεσε αναταραχή στη Silicon Valley, στη Wall Street και την Ουάσιγκτον.

Η λειτουργία του προσομοιάζει αυτή του ChatGPT της OpenAI, αλλά έχει πολύ μικρότερο κόστος, κάτι που έρχεται σε αντίθεση με την επικρατούσα μέχρι τώρα αμερικανική άποψη πως τέτοια λογισμικά ΑΙ είναι πανάκριβα και πως χρειάζονται τελευταίας τεχνολογίας τσιπ και ημιαγωγούς.

Ο αμερικανός Πρόεδρος Ντόναλντ Τραμπ δήλωσε ότι η επιτυχία της εφαρμογής θα πρέπει να λειτουργήσει ως «αφύπνιση» για τον τεχνολογικό τομέα των ΗΠΑ.

Πώς λειτουργεί η εφαρμογή

Ουσιαστικά πρόκειται για το κινέζικο αντίστοιχο του ChatGPT και λειτουργεί όπως όλα τα ΑΙ chatbot επιτρέποντάς στο χρήστη να πληκτρολογήσει οποιαδήποτε ερώτηση ή αίτημα και, στη συνέχεια, να απαντήσει σε μορφή συνομιλίας, αν και δεν δημιουργεί ακόμα εικόνες. Η εφαρμογή είναι προς το παρόν διαθέσιμη δωρεάν σε συσκευές iOS και Android, αν και για την ώρα έχει περιορίσει τις νέες εγγραφές.

Όπως και άλλα μοντέλα τεχνητής νοημοσύνης, αυτό που τροφοδοτεί την εφαρμογή DeepSeek είναι η επεξεργασία τεράστιων ποσοτήτων δεδομένων για να εντοπίσει μοτίβα, να κάνει προβλέψεις και να λύσει προβλήματα.

Το συγκεκριμένο μοντέλο έχει εκπαιδευτεί σε δεδομένα του περασμένου Ιουλίου, επομένως δεν γνωρίζει για πιο πρόσφατα γεγονότα, αλλά με την επιλογή της αναζήτησης μπορεί να σαρώσει πιο ενημερωμένες πληροφορίες.

Όπως συμβαίνει με τις περισσότερες εφαρμογές, το DeepSeek μπορεί να συλλέξει και να αποθηκεύσει έναν τεράστιο όγκο προσωπικών πληροφοριών και τεχνικών πληροφοριών σχετικά με δεδομένα όπως η συσκευή σας και η σύνδεσή σας στο διαδίκτυο.

Σε αυτά τα δεδομένα βέβαια, θα μπορούσε να έχει πρόσβαση και η κινεζική κυβέρνηση, καθώς έχει την εξουσία να παρεμβαίνει σε κινεζικές εταιρείες.

Η εφαρμογή φαίνεται επίσης για την ώρα να λογοκρίνει ορισμένες πληροφορίες σύμφωνα με τους αυστηρούς κανόνες για το διαδίκτυο της Κίνας, όπως οποιαδήποτε αναφορά στις διαδηλώσεις στην πλατεία Τιενανμέν του 1989.

Πώς τα κατάφερε η DeepSeek και γιατί μας ενδιαφέρει

Η DeepSeek ισχυρίζεται ότι κατάφερε να αναπτύξει την τεχνολογία της χρησιμοποιώντας -πάρα πολύ – λιγότερα χρήματα και λιγότερο προηγμένα τσιπ από τους ανταγωνιστές της στις ΗΠΑ.

Η κυβέρνηση Μπάιντεν έχει εφαρμόσει τα τελευταία χρόνια σαρωτικούς περιορισμούς στις εξαγωγές ισχυρών τσιπ, όπως ημιαγωγοί και μονάδες επεξεργασίας γραφικών ή GPU, σε μια προσπάθεια να επιβραδύνει την ανάπτυξη της τεχνητής νοημοσύνης στην Κίνα και να βοηθήσει στη διατήρηση της ηγετικής θέσης που είχαν οι αμερικανικές εταιρείες στον τομέα της τεχνίτης νοημοσύνης.

Υπό την ανησυχία ότι η Κίνα θα μπορούσε να χρησιμοποιήσει την τεχνίτη νοημοσύνη για να φτάσει τις ΗΠΑ και σε στρατιωτικό και οικονομικό επίπεδο, η κυβέρνηση Μπάιντεν εμπόδισε τις αμερικανικές εταιρείες τσιπ (π.χ Nvidia) να εξάγουν υλικό υψηλής τεχνολογίας τεχνητής νοημοσύνης στην Κίνα. Αλλά σε ορισμένες περιπτώσεις, οι κινεζικές εταιρείες μπόρεσαν να παρακάμψουν αυτούς τους ελέγχους αγοράζοντας τα απαραίτητα τσιπ μέσω άλλων χωρών.

Μάλιστα, τις τελευταίες εβδομάδες του ως πρόεδρος, ο Μπάιντεν επέβαλε ακόμη αυστηρότερους ελέγχους, περιορίζοντας τις εξαγωγές τσιπ στο μεγαλύτερο μέρος του κόσμου για να σταματήσει το λαθρεμπόριο προς στην Κίνα.

Σε ένα έγγραφο που δημοσιεύθηκε τον περασμένο μήνα, η DeepSeek είπε ότι εκπαίδευσε το μοντέλο AI της χρησιμοποιώντας περίπου 2.000 τσιπ H800 της Nvidia και 5,6 εκατομμύρια δολάρια. Τα τσιπ αυτά είναι λιγότερο ισχυρές και παλαιότερες εκδόσεις της Nvidia, τα οποία αποκτήθηκαν το 2021, ενώ και αυτά πλέον έχουν πλέον τεθεί υπό περιορισμούς εξαγωγών στις ΗΠΑ.

Ενδεικτικά, οι αμερικανικές εταιρείες τεχνητής νοημοσύνης έχουν ξοδέψει δισεκατομμύρια δολάρια αγοράζοντας τα πιο πρόσφατα τσιπ Nvidia για να δημιουργήσουν και να εκτελέσουν τα δικά τους προγράμματα τεχνητής νοημοσύνης.

Οι διαφορές με τους αμερικανούς ανταγωνιστές της

Η άποψη που επικρατούσε -μέχρι και πριν λιγότερο από δυο εβδομάδες- ήταν ότι οι εταιρείες τεχνητής νοημοσύνης χρειάζονταν ακριβά, κορυφαία τσιπ υπολογιστών (όπως αυτά που κατασκευάζει η Nvidia) για να εκπαιδεύσουν καλύτερα τα συστήματά τους. Αυτό έχει δικαιολογήσει τεράστιες δαπάνες από τις μεγαλύτερες εταιρείες τεχνολογίας των ΗΠΑ, όπως η Alphabet και η Meta.

Μόλις την περασμένη εβδομάδα, εταιρείες όπως οι SoftBank, Oracle και OpenAI δεσμεύτηκαν να δαπανήσουν 500 δις δολάρια για την κατασκευή μιας νέας υποδομής AI σε μια επιχείρηση που ονομάζουν Stargate.

Ωστόσο, η DeepSeek δεν διέθετε τόσο κορυφαίο τεχνολογικό υλικό – και τα μοντέλα της φαίνεται να είναι περίπου στο ίδιο επίπεδο με τους κορυφαίους αντιπάλους των ΗΠΑ σε ορισμένα σημεία αναφοράς που αξιολογούν την ικανότητα AI, σύμφωνα με τους ειδικούς. Η DeepSeek λέει ότι χρησιμοποιεί λιγότερο προηγμένα τσιπ, σε συνδυασμό με καινοτόμες τεχνικές εκπαίδευσης μοντέλων.

Επιπλέον, το DeepSeek κυκλοφόρησε το μοντέλο R1 του ως ανοιχτό κώδικα (σε αντίθεση με το ChatGPT), που σημαίνει ότι μπορεί κάποιος να προσαρμόσει το μοντέλο για δική του χρήση – και ενδεχομένως να το αναπτύξει έτσι ώστε να παρακάμψει και τους περιορισμούς περιεχομένου της κινεζικής κυβέρνησης. Αυτό σημαίνει μεταξύ άλλων ότι άλλες εταιρείες θα μπορούν να βασιστούν στην προσέγγιση του DeepSeek και ενδεχομένως να δημιουργήσουν και άλλες φθηνές εναλλακτικές λύσεις τεχνητής νοημοσύνης.

Οι κινεζικές δυνατότητες στο πεδίο της ΑΙ;

Η κυβέρνηση της Κίνας –όπως και η αντίστοιχη των ΗΠΑ– έχει θέσει την τεχνητή νοημοσύνη σε εθνική προτεραιότητα καθώς φιλοδοξεί να γίνει παγκόσμιος ηγέτης στην τεχνητή νοημοσύνη έως το 2030. Η χώρα έχει επίσης επενδύσει τεράστια χρηματικά ποσά στην έρευνα και την τεχνολογία τεχνίτης νοημοσύνης, με τον ίδιο περίπου τρόπο όπως και οι αμερικανικές εταιρείες έχουν ρίξει δισεκατομμύρια σε κέντρα δεδομένων και ανάπτυξη AI τα τελευταία δύο χρόνια.

Αν και δεν είναι σαφές αν η επιτυχία της είναι παροδική, κατέδειξε πως οι προηγμένες δυνατότητες τεχνητής νοημοσύνης ενδεχομένως να μπορούν να επιτευχθούν χωρίς την τεράστια ποσότητα υπολογιστικής ισχύος, μικροτσίπ, ενέργειας και νερού που θεωρούνταν αναγκαία – και πως πιθανώς οι ΗΠΑ έχουν πράγματι υπαρκτό και ικανό ανταγωνισμό στον τομέα της τεχνίτης νοημοσύνης.

Αναδημοσίευση: tovima.gr

Garfield

Αναζήτηση αυτού του ιστολογίου

Πέμπτη 30 Ιανουαρίου 2025

Τι είναι το DeepSeek, πώς λειτουργεί και γιατί μας ενδιαφέρει

Πώς λειτουργεί η εφαρμογή

Πώς τα κατάφερε η DeepSeek και γιατί μας ενδιαφέρει

Οι διαφορές με τους αμερικανούς ανταγωνιστές της

Οι κινεζικές δυνατότητες στο πεδίο της ΑΙ;

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου