Newsletter

Еволюція магістерських програм: короткий огляд ринку

Менше 2 відсоткових пунктів розділяють провідних LLM за основними показниками - технологічна війна закінчилася внічию. Справжня битва 2025 року розгорнеться за екосистеми, дистрибуцію та вартість: DeepSeek довів, що може конкурувати з $5,6 млн проти $78-191 млн у GPT-4. ChatGPT домінує над брендом (76% поінформованості), незважаючи на те, що Клод виграв 65% технічних бенчмарків. Для компаній виграшна стратегія полягає не у виборі "найкращої моделі", а в організації взаємодоповнюючих моделей для різних сценаріїв використання.

Підсумуйте цю статтю за допомогою ШІ

Війна мовних моделей 2025: від технічного паритету до битви екосистем

Розвиток великих мовних моделей у 2025 році досягнув критичного переломного моменту: конкуренція більше не базується на фундаментальних можливостях моделей, які зараз практично рівноцінні в основних тестах, а на екосистемі, інтеграції та стратегії розгортання. Хоча Claude Sonnet 4.5 від Anthropic зберігає невелику технічну перевагу в окремих тестах, справжня битва перемістилася на іншу територію.

Технічний розіграш: коли цифри зрівнюються

Бенчмарк MMLU (Massive Multitask Language Understanding)

  • Клод Сонет 4.5: 88.7%.
  • GPT-4o: 88,0%.
  • Спалах Gemini 2.0: 86,9%.
  • DeepSeek-V3: 87.1%.

Відмінності незначні - лідерів розділяють менш ніж 2 відсоткові пункти. Згідно зі звітом AI Index Report 2025 Стенфордського університету, "конвергенція основних можливостей мовних моделей є однією з найбільш значущих тенденцій 2024-2025 років, що має глибокі наслідки для конкурентних стратегій AI-компаній".

Навички міркування (діамантовий рівень GPQA)

  • Клод Сонет 4: 65.0%.
  • GPT-4o: 53,6%.
  • Gemini 2.0 Pro: 59,1%.

Claude зберігає значну перевагу в складних логічних задачах, але GPT-4o перевершує за швидкістю відгуку (середня затримка 1,2 с проти 2,1 с у Claude), а Gemini - у власній мультимодальній обробці.

Революція DeepSeek: Китайська зміна правил гри

У січні 2025 року на ринку з'явився проривний продукт DeepSeek-V3, який продемонстрував, як можна розробляти конкурентоспроможні моделі за $5,6 млн проти $78-191 млн за GPT-4/Gemini Ultra. Марк Андрессен назвав це "одним з найдивовижніших проривів - і, оскільки це відкритий код, глибоким подарунком світові".

Технічні характеристики DeepSeek-V3:

  • 671 мільярд загальних параметрів (37 мільярдів активних через Mixture-of-Experts)
  • Вартість навчання: $5.576M
  • Продуктивність: перевершує GPT-4o в деяких математичних тестах
  • Архітектура: Багатоголова латентна увага (MLA) + DeepSeekMoE

Вплив: акції Nvidia впали на 17% за одну сесію після оголошення, а ринок переоцінив бар'єри для входу на ринок розробки моделей.

Суспільне сприйняття проти технічної реальності

ChatGPT зберігає беззаперечне лідерство: дослідження Pew Research Center (лютий 2025 року) показало, що 76% американців асоціюють "розмовний ШІ" виключно з ChatGPT, тоді як лише 12% знають Claude і 8% активно користуються Gemini.

Парадокс: Claude Sonnet 4 перевершує GPT-4o у 65% технічних тестів, але має лише 8% частки споживчого ринку проти 71% ChatGPT (дані Similarweb, березень 2025 року).

Google реагує масовою інтеграцією: Gemini 2.0 у Пошуку, Gmail, Документах, екосистемі Drive-стратегії, а не як окремий продукт. 2,1 мільярда користувачів Google Workspace - це миттєва дистрибуція без залучення клієнтів.

Використання комп'ютерів та агенти: Наступний рубіж

Claude Computer Use (бета-версія жовтень 2024, випуск 1 квартал 2025)

  • Можливості: пряме керування мишею/клавіатурою, навігація в браузері, взаємодія з додатками
  • Впровадження: 12% корпоративних клієнтів Використання комп'ютерів на виробництві
  • Обмеження: все ще 14% відмов на складних багатокрокових завданнях

GPT-4o з баченням та діями

  • Інтеграція з Zapier: 6000+ керованих додатків
  • Користувацькі GPT: 3 мільйони опубліковано, 800 тисяч активно використовуються
  • Розподіл доходу на кожного творця GPT: $10 млн розподілено у 4 кварталі 2024 року

Глибокі дослідження Близнюків (січень 2025)

  • Автономне багатоджерельне дослідження з бенчмаркінгом
  • Створює повні звіти з окремих підказок
  • Середній час: 8-12 хвилин на звіт на 5000+ слів

Gartner прогнозує, що до кінця 2025 року 33% працівників сфери знань використовуватимуть автономні агенти ШІ, тоді як сьогодні їх буде лише 5%.

Філософські розбіжності щодо безпеки

OpenAI: підхід "Безпека через обмеження

  • Відмовляє 8,7% оперативних споживачів (внутрішні дані витоку OpenAI)
  • Сувора контентна політика спричиняє відтік 23% розробників до альтернатив
  • Система державної готовності з постійним перерозподілом обов'язків

Антропний: "Конституційний ШІ

  • Модель навчена чітко визначеним етичним принципам
  • Вибіркова відмова: 3,1% підказок (більш поблажливий OpenAI)
  • Прозоре прийняття рішень: пояснити, чому відмовляє у задоволенні запитів

Google: "Максимум безпеки, мінімум суперечок".

  • Жорсткіші ринкові фільтри: 11,2% запитів заблоковано
  • Близнюки Збій у зображенні лютого 2024 року (перекосировка зсуву) вимагає особливої обережності
  • Зосередженість на підприємстві знижує толерантність до ризику

Meta Llama 3.1: нуль вбудованих фільтрів, відповідальність на реалізаторі - протилежна філософія.

Вертикальна спеціалізація: справжній диференціатор

Охорона здоров'я:

  • Med-PaLM 2 (Google): 85,4% на MedQA (проти 77% найкращих лікарів-людей)
  • Claude в Epic Systems: прийнятий 305 лікарнями США для підтримки прийняття клінічних рішень

Легально:

  • Harvey AI (GPT-4 на замовлення): 102 топ-100 юридичних фірм, $100 млн ARR
  • Співрадник (Thomson Reuters + Claude): 98% точності юридичних досліджень

Фінанси:

  • Bloomberg GPT: навчання на власних фінансових токенах 363B
  • Goldman Sachs Marcus AI (база GPT-4): схвалює кредити на 40% швидше

Вертикалізація генерує в 3,5 рази більшу готовність платити порівняно з типовими моделями (опитування McKinsey, 500 корпоративних покупців).

Лама 3.1: Стратегія Meta з відкритим вихідним кодом

Параметри 405B, конкурентні можливості з GPT-4o у багатьох тестах, повністю відкриті ваги. Мета-стратегія: комерціалізувати рівень інфраструктури, щоб конкурувати на рівні продукту (окуляри Ray-Ban Meta, штучний інтелект WhatsApp).

Усиновлення лами 3.1:

  • 350K+ завантажень у перший місяць
  • 50+ стартапів будують вертикалі АІ на Llama
  • Вартість самокерованого хостингу: $12 тис. на місяць проти $50 тис. + вартість закритих моделей API для еквівалентного використання

Контрінтуїтивно: Meta втрачає мільярди доларів на Reality Labs, але масово інвестує у відкритий ШІ, щоб захистити основний рекламний бізнес.

Контекстні вікна: перегони за мільйони токенів

  • Claude Sonnet 4.5: 200K токенів
  • Gemini 2.0 Pro: 2M токен (найдовший з комерційно доступних)
  • GPT-4 Turbo: 128K токенів

Контекст Gemini 2M дозволяє аналізувати цілі кодові бази, 10+ годин відео, тисячі сторінок документації - кейси використання, що трансформують підприємства. За даними Google Cloud, 43% корпоративних POC використовують контекст понад 500 тис. токенів.

Адаптивність та кастомізація

Claude Projects & Styles:

  • Користувацькі постійні інструкції для перехресних розмов
  • Пресети стилів: формальний, стислий, пояснювальний
  • Завантаження баз знань (до 5 ГБ документів)

Магазин GPT та власні GPT:

  • Опубліковано 3M GPT, щомісячне активне використання 800K
  • Найкращий творець заробляє $63 тис. на місяць (розподіл доходу)
  • 71% підприємств використовують ≥1 кастомний GPT всередині

Розширення Близнюків:

  • Нативна інтеграція Gmail, Календаря, Диска, Карт
  • Контекст робочого простору: читає електронну пошту + календар для проактивних пропозицій
  • 1.2B виконаних дій у робочому просторі Q4 2024

Ключ: "єдиний запит" на "постійний помічник з пам'яттю та контекстом між сеансами".

Розвиток у 1 кварталі 2025 року та майбутні траєкторії

Тенденція 1: Домінування змішаних експертівУсімоделі 2025 року найвищого рівня використовують МН (активують параметри підмножини для кожного запиту):

  • Зменшення витрат на висновок на 40-60%.
  • Краща затримка зі збереженням якості
  • DeepSeek, GPT-4, Gemini Ultra - всі на базі МО

Тенденція 2: Мультимодальність від початку мультимодальнаGemini2.0 від початку мультимодальна (не окремі склеєні модулі):

  • Одночасне розуміння тексту+зображення+аудіо+відео
  • Крос-модальне міркування: "порівняй фотографію архітектурного стилю будівлі з текстовим описом історичного періоду".

Тенденція 3: Обчислення тестового часу (моделі міркувань)OpenAI o1, DeepSeek-R1: використовують більше часу для складних міркувань:

  • o1: 30-60 секунд на складну математичну задачу проти 2 секунд GPT-4o
  • Точність AIME 2024: 83,3% проти 13,4% GPT-4o
  • Явний компроміс між затримкою та точністю

Тенденція 4: Агентні робочі процесиМодельконтекстного протоколу (MCP) Anthropic, листопад 2024 року:

  • Відкритий стандарт для взаємодії агентів ШІ з інструментами/базами даних
  • 50+ партнерів з усиновлення за перші 3 місяці
  • Дозволяє агентам створювати постійну пам'ять перехресних взаємодій

Витрати та цінові війни

API Ціноутворення на 1M токенів (вхідні дані):

  • GPT-4o: $2.50
  • Клод Сонет 4: $3.00
  • Gemini 2.0 Flash: $0.075 (у 33 рази дешевше)
  • DeepSeek-V3: $0.27 (відкритий вихідний код, витрати на хостинг)

Приклад з Gemini Flash: узагальнення ШІ для стартапу знижує витрати на 94% порівняно з переходом з GPT-4o - така ж якість, порівнянна затримка

Комерціалізація прискорюється: витрати на висновок -70% у порівнянні з 2023-2024 роками (дані Epoch AI).

Стратегічні наслідки для компаній

Система прийняття рішень: яку модель обрати?

Сценарій 1: Критично важливий для безпеки підприємства→Клод Сонет 4

  • Охорона здоров'я, юриспруденція, фінанси, де помилки коштують мільйони
  • Конституційний ШІ знижує ризики відповідальності
  • Преміальна ціна виправдана зниженням ризиків

Сценарій 2: Великі обсяги, чутливі до витрат →Gemini Flash або DeepSeek

  • Чат-боти для обслуговування клієнтів, модерація контенту, класифікація
  • Продуктивність "досить добре", гучність 10x-100x
  • Основний диференціатор вартості

Сценарій 3: Блокування екосистеми →Gemini для Google Workspace, GPT для Microsoft

  • Вже інвестували в екосистему
  • Вбудована інтеграція > чудова маржинальна продуктивність
  • Витрати на навчання працівників на існуючій платформі

Сценарій 4: Налаштування/Керування→відкрито Llama 3.1 або DeepSeek

  • Конкретні вимоги щодо відповідності (резидентність даних, аудит)
  • Важкі тонкі налаштування на власних даних
  • Економний самостійний хостинг за обсягом

Висновок: Від війни технологій до війни платформ

У 2025 році конкурс на отримання ступеня магістра права вже не "яка модель міркує найкраще", а "яка екосистема створює найбільшу цінність". OpenAI домінує над споживчим брендом, Google використовує дистрибуцію з мільярдами користувачів, Anthropic перемагає у боротьбі за безпеку підприємств, Meta перетворює інфраструктуру на товар.

Прогноз на 2026-2027 роки:

  • Подальша конвергенція продуктивності ядра (~90% MMLU у всіх топ-5)
  • Диференціація за: швидкістю, вартістю, інтеграцією, вертикальною спеціалізацією
  • Багатокрокові автономні агенти стають мейнстрімом (33% працівників сфери знань)
  • Відкритий код усуває розрив у якості, зберігає перевагу у вартості/кастомізації

Остаточний переможець? Ймовірно, не єдиний гравець, а взаємодоповнюючі екосистеми, що обслуговують різні кластери використання. Як і у випадку з ОС для смартфонів (iOS + Android співіснують), не "переможець забирає все", а "переможець забирає сегмент".

Для підприємств: мультимодельна стратегія стає стандартною - GPT для загальних задач, Claude для міркувань з високими ставками, Gemini Flash для об'ємних задач, Llama налаштована для пропрієтарних задач.

2025 рік - це не рік "найкращої моделі", а рік розумної оркестровки між взаємодоповнюючими моделями.

Джерела:

  • Звіт Стенфордського індексу штучного інтелекту за 2025 рік
  • Картка антропологічної моделі Клод Сонет 4.5
  • Технічний звіт OpenAI GPT-4o
  • Системна карта Google DeepMind Gemini 2.0
  • Технічний документ DeepSeek-V3 (arXiv)
  • Епоха ШІ - тенденції в машинному навчанні
  • Gartner AI & Analytics Summit 2025
  • Звіт McKinsey про стан штучного інтелекту 2025
  • Опитування Pew Research Center щодо усиновлення штучного інтелекту
  • Аналитика платформи Similarweb

Ресурси для розвитку бізнесу

9 листопада 2025 року

Системи підтримки прийняття рішень зі штучним інтелектом: зростання ролі радників у корпоративному управлінні

77% компаній використовують ШІ, але лише 1% мають "зрілі" впровадження - проблема не в технології, а в підході: тотальна автоматизація vs інтелектуальна співпраця. Goldman Sachs з АІ-консультантом на 10 000 співробітників генерує +30% ефективності охоплення та +12% перехресних продажів, зберігаючи людські рішення; Kaiser Permanente запобігає 500 смертям на рік, аналізуючи 100 предметів на годину за 12 годин до початку, але залишає діагноз лікарям. Модель Advisor вирішує проблему дефіциту довіри (лише 44% довіряють корпоративному ШІ) завдяки трьом стовпам: зрозумілий ШІ з прозорою логікою, відкалібровані показники довіри, постійний зворотній зв'язок для вдосконалення. Цифри: $22,3 трлн до 2030 року, стратегічні співробітники, які використовують ШІ, побачать 4-кратну рентабельність інвестицій до 2026 року. Практична 3-етапна дорожня карта - навички оцінки та управління, пілотний проект з показниками довіри, поступове масштабування з безперервним навчанням - застосовується у фінансовій сфері (контрольована оцінка ризиків), охороні здоров'я (діагностична підтримка), виробництві (прогнозоване технічне обслуговування). Майбутнє - це не заміна людини штучним інтелектом, а ефективна організація людино-машинної співпраці.
9 листопада 2025 року

Повний посібник з програмного забезпечення для бізнес-аналітики для МСП

60% італійських МСП визнають наявність критичних прогалин у збиранні даних, 29% навіть не мають спеціаліста з цього питання — тоді як італійський ринок бізнес-аналітики зросте з 36,79 млрд доларів до 69,45 млрд доларів до 2034 року (середньорічний темп зростання — 8,56%). Проблема не в технології, а в підході: малі та середні підприємства тонуть у даних, розкиданих між CRM, ERP та Excel-таблицями, не перетворюючи їх на рішення. Це стосується як тих, хто починає з нуля, так і тих, хто хоче оптимізувати роботу. Критерії вибору, що мають значення: зручність використання методом «перетягни та кинь» без місяців навчання, масштабованість, що зростає разом з вами, нативна інтеграція з існуючими системами, повна вартість володіння (впровадження + навчання + обслуговування) проти лише ціни ліцензії. Дорожня карта у 4 етапи — вимірювані цілі SMART (зменшити відтік клієнтів на 15% за 6 місяців), картування чистих джерел даних (garbage in=garbage out), навчання команди культурі даних, пілотний проєкт із циклом постійного зворотного зв'язку. Штучний інтелект змінює все: від описової бізнес-аналітики (що сталося) до розширеної аналітики, яка виявляє приховані закономірності, до прогнозної, яка оцінює майбутній попит, та до прескриптивної, яка пропонує конкретні дії. ELECTE цю потужність ELECTE для малих та середніх підприємств.
9 листопада 2025 року

Система охолодження Google DeepMind AI: як штучний інтелект революціонізує енергоефективність центрів обробки даних

Google DeepMind досягає -40% енергії на охолодження центру обробки даних (але лише -4% загального споживання, оскільки охолодження становить 10% від загального) - точність 99,6% з похибкою 0,4% на PUE 1.1 завдяки 5-рівневому глибокому навчанню, 50 вузлам, 19 вхідним змінним на 184 435 навчальних вибірках (дані за 2 роки). Підтверджено на 3 об'єктах: Сінгапур (перше розгортання у 2016 році), Емшавен, Рада Блаффс (інвестиції у розмірі $5 млрд). PUE флоту Google 1,09 проти середнього по галузі 1,56-1,58. Модель Predictive Control прогнозує температуру/тиск на наступну годину, одночасно керуючи ІТ-навантаженням, погодою, станом обладнання. Гарантована безпека: дворівнева верифікація, оператори завжди можуть відключити ШІ. Критичні обмеження: нульова незалежна перевірка з боку аудиторських фірм/національних лабораторій, для кожного дата-центру потрібна індивідуальна модель (8 років не комерціалізована). Впровадження займає 6-18 місяців і потребує мультидисциплінарної команди (наука про дані, ОВіК, управління об'єктами). Застосовується не лише в дата-центрах: промислові підприємства, лікарні, торгові центри, корпоративні офіси. 2024-2025: Перехід Google на пряме рідинне охолодження для TPU v5p, що вказує на практичні межі оптимізації ШІ.