За два года «AI» превратился в кнопку, которую хотят нажать все. Но в реальном проекте важен не модный шильдик, а ответ на вопрос: какая модель реально нужна под вашу задачу — и не платите ли вы за пушку по воробьям.
Разложим по уровням — от самого дешёвого к самому дорогому, на трёх наших проектах. Принцип простой: берём самый лёгкий инструмент, который закрывает задачу.
01 · Вопрос не «какая модель», а «какая задача»
AI — это не одна технология, а лестница: от простого классификатора до больших генеративных моделей. Каждая ступень дороже предыдущей и в разработке, и в эксплуатации. Ошибка — начинать сверху, «потому что GPT умеет всё». Правильно — начинать снизу и подниматься только когда нижняя ступень не справляется.
Самый дорогой AI — тот, который взяли «чтобы было». Каждый запрос к большой модели стоит денег. На масштабе это превращается в счёт, который убивает экономику продукта.
02 · Уровень 1: классификатор / CV
Самый частый и недооценённый случай: задача — что-то распознать или классифицировать. Здесь не нужен GPT, нужна специализированная модель компьютерного зрения.
Пример — «Дача Без Проблем»: дачник фотографирует растение, и приложение определяет вид, болезнь или вредителя и даёт план ухода. Это задача распознавания по фото — её решает модель компьютерного зрения, а не языковая модель. Дешевле, быстрее, точнее под конкретную задачу.
03 · Уровень 2: генеративный AI, но заранее
Иногда контент действительно нужно сгенерировать — тексты, картинки, озвучку. Но это не значит, что генерировать надо на лету при каждом запросе пользователя. Часто умнее подготовить контент заранее и хранить готовым.
Пример — «Воображариум», приложение сказкотерапии. Терапевтические комиксы, сказки, иллюстрации и озвучка созданы с помощью ИИ заранее и лежат в Firebase. Когда человек проходит тест, приложение не дёргает дорогую модель в реальном времени — оно собирает результат из готового контента под его запрос. Дёшево в эксплуатации, мгновенно для пользователя, предсказуемо по качеству.
04 · Уровень 3: дорогой API, но с кэшем
Бывает, что генерация в реальном времени всё-таки нужна. Тогда ключевое слово — кэш: не платить дважды за один и тот же результат.
Пример — MemoDremo: озвучка карточек идёт через ElevenLabs, а это деньги за каждую генерацию. Озвучивать одно и то же слово заново при каждом открытии — расточительно. Поэтому аудио кэшируется и хранится: повторная озвучка того же текста не тратит ни лимиты модели, ни время пользователя. Один и тот же приём экономит и на GPT, и на любых платных API.
05 · Когда GPT правда нужен
Большая языковая модель оправдана, когда задача — это живой диалог или генерация под непредсказуемый ввод: AI-консультант, который отвечает на свободные вопросы, помощник, разбирающий произвольный текст. Но даже тогда есть нюанс — в том же садоводе AI-чат отвечает на вопросы по уходу, но при сложном случае передаёт диалог живому оператору. AI закрывает массовые простые вопросы, человек — сложные. Это дешевле и надёжнее, чем пытаться выжать всё из модели.
Хороший AI-продукт — это не «GPT отвечает на всё», а правильно собранная лестница: классификатор там, где классификация; генерация заранее, где можно; большая модель — только там, где без неё никак.
06 · Как не сжечь бюджет на AI
- Сформулируйте задачу без слова «AI». «Распознать растение», «подобрать историю», «озвучить текст». Из формулировки сразу видно нужный уровень.
- Начинайте с нижней ступени. Классификатор → генерация заранее → API с кэшем → большая модель. Поднимайтесь, только когда нижнее не справляется.
- Считайте стоимость на масштабе. Не «сколько стоит один запрос», а «сколько при 10 000 пользователей в день».
- Кэшируйте всё, что можно. Повторный одинаковый результат не должен стоить второй раз.
- Оставьте человека в контуре. Сложные случаи дешевле отдать оператору, чем строить идеальную модель.
Думаете про AI-функцию? Опишите задачу — на бесплатном «Разборе» мы честно скажем, нужна ли тут нейросеть вообще, и если да — какого уровня, чтобы не переплатить.