Ένα λιγότερο γνωστό εργαστήριο τεχνητής νοημοσύνης από την Κίνα έχει προκαλέσει ανησυχία στη Σίλικον Βάλλεϋ, καθώς παρουσίασε μοντέλα τεχνητής νοημοσύνης που φαίνεται να ξεπερνούν τα κορυφαία αμερικανικά, παρά το γεγονός ότι κατασκευάζονται με χαμηλότερο κόστος και λιγότερο ισχυρά τσιπ.

Το εργαστήριο, που ονομάζεται DeepSeek, παρουσίασε ένα δωρεάν γλωσσικό μοντέλο ανοιχτού κώδικα στα τέλη Δεκεμβρίου, το οποίο κατασκευάστηκε σε μόλις δύο μήνες και με κόστος λιγότερο από 6 εκατομμύρια δολάρια. Για την ανάπτυξή του χρησιμοποιήθηκαν τσιπ μειωμένης απόδοσης από τη Nvidia, το μοντέλο H800.

Από την κυκλοφορία της στις 10 Ιανουαρίου, η εφαρμογή έχει γνωρίσει τεράστια απήχηση στους χρήστες των ΗΠΑ, σύμφωνα με τα δεδομένα της εταιρείας ερευνών εφαρμογών Sensor Tower. Αλλά πώς ακριβώς άρχισαν όλα;

Η DeepSeek, η οποία ιδρύθηκε από τον διευθυντή hedge fund Λιανγκ Γουενφένγκ, παρουσίασε το μοντέλο R1, παρέχοντας αναλυτικές πληροφορίες σε ένα έγγραφο για το πώς κατάφερε να δημιουργήσει ένα μεγάλο γλωσσικό μοντέλο με περιορισμένο προϋπολογισμό. Το μοντέλο αυτό έχει την ικανότητα να μαθαίνει και να βελτιώνεται αυτόματα, χωρίς την ανάγκη ανθρώπινης καθοδήγησης.

Λίγα είναι γνωστά για το συγκεκριμένο κινεζικό εργαστήριο και τον Γουενφένγκ. Η DeepSeek γεννήθηκε από ένα κινεζικό hedge fund που ονομάζεται High-Flyer Quant που διαχειρίζεται περίπου 8 δισεκατομμύρια δολάρια σε περιουσιακά στοιχεία, σύμφωνα με δημοσιεύματα.

Η ιστορία ξεκινά το 2021, όταν ο Λιανγκ άρχισε να αγοράζει χιλιάδες κάρτες γραφικών Nvidia για το προσωπικό του έργο τεχνητής νοημοσύνης, ενώ ταυτόχρονα διηύθυνε το αμοιβαίο κεφάλαιο ποσοτικής διαπραγμάτευσης High-Flyer. Ορισμένοι από τους ειδικούς της βιομηχανίας μιλούσαν για «εκκεντρικές κινήσεις» ενός δισεκατομμυριούχου που αναζητούσε νέο ενδιαφέρον.

Στη High-Flyer, ο Λιανγκ δημιούργησε μια τεράστια περιουσία χρησιμοποιώντας τεχνητή νοημοσύνη και αλγόριθμους για να αναγνωρίζει μοτίβα που επηρεάζουν τις τιμές των μετοχών. Η ομάδα του εξειδικεύτηκε στη χρήση των ημιαγωγών της Nvidia για να αποκομίζει κέρδη από τις συναλλαγές μετοχών.

DeepSeek: Οι Κινέζοι έφεραν το δικό τους εργαλείο Τεχνητής Νοημοσύνης και κατακτά την Αμερική - Σφοδρό χτύπημα στο ChatGPT

Το 2023, ίδρυσε την DeepSeek, δηλώνοντας την πρόθεσή του να αναπτύξει τεχνητή νοημοσύνη σε ανθρώπινο επίπεδο. «Δημιούργησε μια εξαιρετική ομάδα υποδομής που κατανοεί βαθιά τη λειτουργία των τσιπ. Έφερε μαζί του τους καλύτερους από το hedge fund στην DeepSeek», δήλωσε ο ιδρυτής μιας ανταγωνιστικής εταιρείας που αναπτύσσει μεγάλα γλωσσικά μοντέλα (LLM).

Παράλληλα, με την DeepSeek να έχει ως μοναδικό της στόχο την έρευνα, καθίσταται επικίνδυνος ανταγωνιστής επειδή είναι πρόθυμη να μοιραστεί τις ανακαλύψεις της αντί να τις προστατεύσει για εμπορικά κέρδη.

Η αντίδραση των αγορών

Η παρουσίαση του DeepSeek-R1 προκάλεσε άμεση αναστάτωση στις χρηματοπιστωτικές αγορές. Τα συμβόλαια μελλοντικής εκπλήρωσης του Nasdaq 100, που επικεντρώνονται στις τεχνολογικές εταιρείες, σημείωσαν πτώση έως και 1,9%, ενώ αυτά του S&P 500 υποχώρησαν περίπου 1%. Αυτές οι εξελίξεις αποτυπώνουν τις ανησυχίες των επενδυτών για την ενδεχόμενη απειλή που συνιστά η DeepSeek για τις αμερικανικές τεχνολογικές επιχειρήσεις, ιδιαίτερα για εκείνες που έχουν επενδύσει σημαντικά κεφάλαια στην έρευνα και ανάπτυξη μοντέλων τεχνητής νοημοσύνης.

Μέχρι τώρα, επικρατούσε η πεποίθηση ότι οι εταιρείες AI χρειάζονταν ακριβά και ιδιαίτερα προηγμένα υπολογιστικά τσιπ για να εκπαιδεύσουν τα πιο εξελιγμένα συστήματά τους. Αυτό είχε ως αποτέλεσμα τεράστιες δαπάνες από τις μεγαλύτερες αμερικανικές τεχνολογικές εταιρείες, όπως η Alphabet και η Meta.

Η DeepSeek, αν και δεν έχει το μέγεθος των αμερικανικών κολοσσών, φαίνεται να έχει αναπτύξει μοντέλα AI που πλησιάζουν σε απόδοση εκείνα των ανταγωνιστών της στις ΗΠΑ. Σύμφωνα με την DeepSeek, χρησιμοποιεί λιγότερο προηγμένα τσιπ σε συνδυασμό με καινοτόμες τεχνικές εκπαίδευσης μοντέλων.

Αυτή η εξέλιξη θα μπορούσε να διαταράξει τα επιχειρηματικά μοντέλα των αμερικανικών τεχνολογικών εταιρειών, που έχουν διαθέσει τεράστια κεφάλαια σε AI πρωτοβουλίες, οδηγώντας πιθανώς σε μια επανεξέταση στρατηγικών επενδύσεων και κατανομής πόρων.

DeepSeek και αμερικανικοί περιορισμοί

Η DeepSeek κλήθηκε να αντιμετωπίσει και τους αυστηρούς περιορισμούς που έχει επιβάλει η κυβέρνηση των ΗΠΑ στους ημιαγωγούς, περιορίζοντας την Κίνα από την πρόσβαση στα πιο ισχυρά τσιπ, όπως τα H100 της Nvidia. Οι τελευταίες εξελίξεις υποδεικνύουν ότι είτε η DeepSeek κατάφερε να βρει έναν τρόπο να παρακάμψει αυτούς τους περιορισμούς, είτε οι έλεγχοι εξαγωγών δεν είναι τόσο αποτελεσματικοί όσο ελπίζει η Ουάσιγκτον.

«Μπορούν να πάρουν ένα πολύ καλό, μεγάλο μοντέλο και να χρησιμοποιήσουν μια διαδικασία που ονομάζεται «απόσταξη»», δήλωσε ο γενικός συνεργάτης της Benchmark Τσετάν Πουταγκούντα. «Βασικά χρησιμοποιείτε ένα πολύ μεγάλο μοντέλο για να βοηθήσετε το μικρό σας μοντέλο να γίνει έξυπνο στο αντικείμενο που θέλετε να γίνει έξυπνο. Αυτό είναι πραγματικά πολύ οικονομικό».

Παρόλο τους περιορισμούς το DeepSeek έρχεται για τα καλά να ταράξει τα (μη) ήρεμα νερά των σχέσεων των ΗΠΑ με κινεζικές εταιρίες. Εταιρίες όπως η Temu και το Tiktok έχουν μπει στο μάτι του προέδρου Τραμπ και κανείς δε ξέρει με την είσοδο ακόμα μιας εφαρμογής όπως το DeepSeek τι αντιδράσεις θα υπάρξουν.

Αλλά η DeepSeek δεν είναι η μόνη κινεζική εταιρεία που ταράζει τα νερά της αμερικανικής κυριαρχίας. Ο κορυφαίος ερευνητής τεχνητής νοημοσύνης Κάι-Φου Λι είπε στο CNBC ότι η startup του 01.ai εκπαιδεύτηκε χρησιμοποιώντας μόνο 3 εκατομμύρια δολάρια.

Η μητρική εταιρεία του TikTok ByteDance κυκλοφόρησε την Τετάρτη (22/12) μια ενημέρωση στο μοντέλο της που ισχυρίζεται ότι ξεπερνά το o1 του OpenAI σε μια βασική δοκιμή αναφοράς.

«Η αναγκαιότητα είναι η μητέρα της εφεύρεσης», δήλωσε στο CNBC ο CEO της Perplexity, Αραβίντ Σρινιβάς. «Επειδή έπρεπε να βρουν λύσεις, στην πραγματικότητα κατέληξαν να χτίσουν κάτι πολύ πιο αποτελεσματικό».

Η τεχνητή νοημοσύνη «ζωντανεύει» τους νεκρούς σου: Είσαι σίγουρος πως θες να ανοίξεις αυτή την πόρτα;

Στα 280 δισεκατομμυρια δολάρια οι επενδύσεις

Οι επενδύσεις σε τεχνητή νοημοσύνη από τους αμερικανικούς κολοσσούς έφτασαν τα 224 δισεκατομμύρια δολάρια το 2024, σύμφωνα με την UBS, η οποία αναμένει ότι θα ξεπεράσουν τα 280 δισεκατομμύρια δολάρια έως το τέλος του 2025.

Η OpenAI και η SoftBank ανακοίνωσαν την περασμένη εβδομάδα ένα σχέδιο επένδυσης 500 δισεκατομμυρίων δολαρίων για τα επόμενα τέσσερα χρόνια σε υποδομές τεχνητής νοημοσύνης.

Οι μετοχές της Siemens Energy, που προμηθεύει ηλεκτρικό υλικό για υποδομές τεχνητής νοημοσύνης, υποχώρησαν 19% ενώ και η Schneider Electric σημείωσε πτώση 8,7%.

Κι ενώ τα διεθνή χρηματιστήρια προσπαθούν να μειώσουν τον αρνητικό αντίκτυπο, ορισμένες κινεζικές μετοχές τεχνολογίας όπως η Alibaba σημείωσε άνοδο 3%, ενώ και η Baidu στο Χονγκ Κονγκ έκλεισε με κέρδη 4%.

Πηγή: CNBC / BBC