Nowy model DeepSeek nie podoba się USA. Oskarżają Chiny o kradzież
DeepSeek wydał nowy duży model językowy V4 z aż 1,6 bilionem parametrów i okienkiem kontekstowym na 1 milion tokenów. Oczy całego świata były skierowane na chiński startup. Niedługo później zareagował Departament Stanu Stanów Zjednoczonych i nie była to przychylna reakcja.
Amerykanie ostrzegają przed DeepSeek
DeepSeek V4 to pierwszy zaawansowany wielkoskalowy model AI (tzw. AI frontier) zoptymalizowany pod procesory Huawei Ascend AI, a nie pod sprzęt Nvidii. W dniu jego wydania amerykański departament stanu przekazał depeszę do ambasad na całym świecie, w którym alarmował o kradzieży własności intelektualnej ze strony DeepSeek i innych chińskich firm.
Model V4 ma ogromną przewagę nad konkurencją, czyli cenę. Bardziej zaawansowana wersja V4-Pro kosztuje 3,48 dolara za milion tokenów, a V4-Flash (284 mld parametrów) – 0,28 dolara za 1 mln tokenów wyjściowych. Konkurencja każe sobie płacić o wiele więcej, bo za analogiczne ilości tokenów na GPT-5.4 zapłacimy 30 dolarów, a za Claude Opus 4.6 – 25 dol. DeepSeek przyznaje, że jest minimalnie za nimi w tyle (ok. 3-6 miesięcy pracy deweloperskiej), ale przewyższa każdy inny model w kodowaniu i złożonych operacjach logicznych.
Wcześniejszy model V3 wytrenowano na 2048 akceleratorach Nvidia H800, które były objęte amerykańskimi ograniczeniami eksportowymi do Chin. Wszczęto śledztwo, czy firma zdobyła ten sprzęt legalnie.
Aby uniknąć takich sytuacji i oskarżeń, V4 wytrenowano w całości na chińskich układach Huawei Ascend. DeepSeek V4 jest w pełni kompatybilny z procesorami Ascend SuperNode, a cena za milion tokenów może jeszcze spaść w drugiej połowie roku, kiedy Huawei zwiększy produkcję serii Ascend 950.
Departament Stanu USA wysłał do ambasad depeszę, w której nakazał dyplomatom informować partnerów zagranicznych o "obawach dotyczących pozyskiwania i destylowania" amerykańskich modeli AI przez chińskie firmy. Wprost wymieniono DeepSeek, Moonshot AI i MiniMax. Dwa dni wcześniej Biały Dom oskarżył chińskie podmioty o prowadzenie "celowych, przemysłowych kampanii" mających na celu destylację amerykańskich systemów frontier AI.
To rozwinięcie wcześniejszych zarzutów Anthropic z lutego — firma twierdziła, że DeepSeek, Moonshot i MiniMax korzystały z 24 tys. fałszywych kont, by wykonać 16 mln zapytań do modelu Claude i w ten sposób odtworzyć jego możliwości. OpenAI również oskarżyło DeepSeek o destylację swoich modeli.
Chiny odrzuciły te zarzuty jako "bezpodstawne". DeepSeek utrzymuje, że model V3 trenowano na danych pozyskanych z naturalnego crawlowania sieci, a nie na syntetycznych danych generowanych przez OpenAI. Depesza dyplomatyczna i premiera V4 pojawiają się na kilka tygodni przed wizytą prezydenta Trumpa u Xi Jinpinga w Pekinie — spotkaniem, które ma dotyczyć m.in. kontroli eksportu chipów i sporów o własność intelektualną.