В останні дні китайська нейромережа DeepSeek викликала справжній фурор у світі технологій, пропонуючи конкурентні з OpenAI моделі, на які за мірками ринку було витрачено копійки.
Модель DeepSeek-V3 вже встигла обійти ChatGPT у рейтингах популярності та змусити американських технологічних гігантів засумніватися у власному лідерстві та доцільному витраті коштів. Розповідаємо, як їй користуватись і чим вона так виділяється.
Як користуватися DeepSeek
Модель безкоштовно доступна на офіційному сайті. DeepSeek не має регіональних обмежень для України, тому їй можна скористатися без будь-яких обхідних шляхів. Також можна завантажити програму в Google Play та App Store .
- Перед використанням необхідно створити безкоштовний обліковий запис: зробити це можна без номера телефону через авторизацію Google або email. Іноді на короткі періоди часу реєстрація на сайті вимикається. За словами компанії, її сервери піддаються масовим DDoS-атакам.

- Інтерфейс програми копіює дизайн ChatGPT. Доступно дві моделі – базова та думаюча (DeepThink R1). Базова модель швидше відповідає і є аналогом ChatGPT 4o, модель, що думає аналогічна o1 від OpenAI і використовує просунуті міркування, за рахунок чого якість її відповідей у вузькоспеціалізованих завданнях буде вищою.
- Ключова особливість DeepSeek – це можливість користуватися думаючою моделлю безкоштовно, ChatGPT вимагає для використання o1 платну підписку за $ 20, при цьому маючи жорсткі ліміти – всього 25 повідомлень на тиждень.
- Також помічник підтримує завантаження файлів і роботу з ними, чого немає в безкоштовній версії ChatGPT.
Ліміти в DeepSeek на даний момент відсутні, але можуть з’явитися пізніше зі зростанням популярності помічника. Поки що нейромережа DeepSeek повністю безкоштовна, заплатити хіба що доведеться розробникам за використання API, яке набагато дешевше, ніж у OpenAI.
Єдиним помітним обмеженням залишається заборона обговорення тим, які вважаються політично чутливими у Китаї. Однак цей факт мало вплинув на популярність продукту за кордоном – користувачів залучають низьку вартість, високу продуктивність та можливість використання щодо дешевих ігрових GPU.
З недоліків також можна відзначити відсутність можливості створювати зображення, проте для цього потрібно розробити окрему нейромережу з іншою архітектурою. Для порівняння, ChatGPT не генерує картинки сам, він використовує для генерації картинок іншу нейромережу від OpenAI – DALLE.
Нове ім’я у світі ІІ
Мобільний додаток AI Assistant від компанії DeepSeek за короткий термін став безкоштовним додатком, що завантажується в американському App Store, випередивши ChatGPT від OpenAI. За даними аналітичної компанії Sensor Tower, стрімке зростання популярності почалося відразу після релізу 10 січня. Розробники стверджують, що їхня модель DeepSeek-V3 “очолює список найбільш просунутих open-source моделей і конкурує із закритими розробками світового рівня”.
Архітектура MLA та «геніальне спрощення»
Одним із ключових факторів, що забезпечили успіх DeepSeek, стала нова архітектура Multi-head Latent Attention (MLA). Завдяки їй модель ігнорує до 95% непотрібних даних, і тим самим зменшує вартість навчання на 90%. Результат вражає: DeepSeek змогла обігнати ChatGPT за всіма основними бенчмарками. Серія моделей R1 навчалася математиці методом спроб і помилок і досягла рівня GPT-4, залишаючись при цьому на 95% дешевше.

Цей підхід викликає суперечки у професійному співтоваристві: а чи коштували того вкладення в OpenAI, якщо китайці змогли зробити це дешевше навіть в умовах санкцій на відеокарти.

Судячи з цифр і тестів, DeepSeek дійсно пропонує ефективне рішення, що кидає виклик усталеним уявленням про те, яким має бути процес навчання ІІ.
Сам глава OpenAI (розробник ChatGPT) Сем Альтман вразився китайському чат-боту:
«DeepSeek-R1 – вражаюча модель, особливо з погляду того, що вони [розробники] змогли зробити за таку ціну. Ми, зрозуміло, випустимо набагато кращі моделі, а поява нового конкурента справді надихає!»
Гонитва за потужностями виявилася помилкою
Останнім часом компанії активно нарощували кількість відеокарт NVIDIA у гонитві за розробкою кращого ІІ, проте успіх DeepSeek ставить під питання потребу в цьому та ефективність експортних обмежень США.
Стартап досяг вражаючих результатів, використовуючи чіпи NVIDIA H800, чиї поставки в Китай були заборонені в рамках санкцій. На навчання моделі було витрачено всього $5,5 млн — сума, незрівнянно менша порівняно з бюджетами, які зазвичай виділяють на подібні завдання великі компанії, як OpenAI або Meta. За деякими даними, OpenAI витратила на ChatGPT-4о близько 100 млн.

У DeepSeek наголошують, що використані чіпи менш потужні, ніж сучасні продукти NVIDIA, заборонені до постачання до Китаю. Це змусило великих американських гравців ІІ-ринку серйозно задуматися про те, наскільки дієвою є система обмежень і чи справді найпередовіші компоненти є вирішальним фактором для навчання передових моделей.
DeepSeek був заснований трохи більше року тому мільярдером Ляном Веньфеном, власником хедж-фонду, який зацікавився нейромережами ще 2021 року. Попри очікування, що ІІ-прорив у Китаї відбудеться завдяки таким гігантам, як ByteDance та Alibaba, саме невеликий стартап зміг за короткий термін створити модель, що конкурує зі свіжою версією ChatGPT-4o.
Резонанс на ринку
Незабаром після виходу програм DeepSeek для iOS та Android фондові ринки відреагували бурхливо.

Акції виробників чіпів, зокрема Advantest Corp. та NVIDIA, пішли вниз через загрозу зниження попиту на дорогі прискорювачі. Одночасно зросли котирування китайських технологічних компаній, що так чи інакше пов’язані з DeepSeek, — наприклад, Iflytek.

Поява DeepSeek вплинула і на курси криптовалют, які найчастіше реагують на динаміку фондового ринку. З погляду інвесторів успіх стартапу є потужним стимулом для переоцінки вартості ІІ-компаній та їх технологій.
Реакція конкурентів
Президент США Дональд Трамп побачив успіх китайського чат-бота DeepSeek стимул для США, він закликав американські компанії «зосередитися на конкуренції для перемоги». Він також наголосив, що США «завжди перші».
«Я читав про Китай і деякі китайські компанії, одна з них розробила більш швидку і дешеву модель ІІ. І це добре, бо на неї не потрібно витрачати багато грошей. Я розцінюю це як позитивний [момент]», – заявив Трамп.
Історія успіху DeepSeek викликала особливе занепокоєння у Кремнієвій долині. Марк Цукербер створив чотири «штаби екстреного реагування» з інженерів Meta для вивчення та аналізу нової технології:
- Дві команди намагаються розібратися, як High-Flyer Capital Management (хедж-фонд, що підтримує DeepSeek) зміг знизити вартість навчання та роботи моделі.
- Інші досліджують, які саме дані використовувалися для навчання DeepSeek та чим корисна архітектура MLA для вдосконалення власної моделі Llama.
Директор з інфраструктури Meta AI Метью Олдхем навіть зізнався, що DeepSeek може перевершити наступну версію Llama, випуск якої запланований на початок 2025 року.
Тим часом відомі інвестори та фахівці з ІІ також не приховують свого подиву. Марк Андріссен назвав DeepSeek «одним із найбільш вражаючих проривів в ІІ», а провідний спеціаліст з ІІ в Meta Ян Лекун вважає, що це «величезний внесок у світову спільноту», особливо з огляду на відкритий вихідний код моделі.
Перспективи для малого та середнього бізнесу
Головна інтрига для ринку – наскільки глобально DeepSeek змінить правила гри у довгостроковій перспективі. Низька вартість обробки токенів (шматків тексту) обіцяє значну економію для компаній, які використовують ІІ у своїх продуктах.

Наприклад, якщо стартап обробляє 10 тисяч запитів на день, витрати на використання DeepSeek можуть виявитися в 10-30 разів нижчими, ніж при роботі через платні API від OpenAI. Вивільнені кошти можна перенаправити на розвиток бізнесу, покращення взаємодії з користувачем або маркетинг. Фактично DeepSeek пропонує новий стандарт доступності технологій ІІ, який особливо цінний для малих і середніх компаній, при цьому практично не поступаючись своїм старшим братом в особі OpenAI.
Переоцінка майбутнього в ІІ-галузі
Результати DeepSeek спростували відразу кілька усталених думок:
- Необов’язково купувати найдорожче обладнання , щоб отримати ефективність на рівні найкращих західних моделей.
- Існують альтернативи передовим чіпам NVIDIA , які раніше вважалися безальтернативними для навчання великих ІІ-моделей.
- Китай не такий далекий від США у сфері ІІ , як вважалося раніше, і здатний створювати продукти світового рівня, незважаючи на санкції та експортні обмеження.
Багато аналітиків вважають, що дату виходу DeepSeek (20 січня) було обрано невипадково: саме цього дня Дональд Трамп (під час своєї інавгурації) обіцяв забезпечити США абсолютне лідерство в галузі ІІ. Тепер ця дата може стати точкою звіту нової ІІ-перегони між двома світовими державами.
Безперечно, це не означає кінець ІІ-буму в США, але вказує на те, що гонка вийшла на новий виток. Найближчим часом ми станемо свідками жорсткої конкуренції, де переглядатимуться і ринкові стратегії, і уявлення про «абсолютне лідерство» у сфері штучного інтелекту.