17 лет опыта в Kubernetes: как поймать фабрикованное резюме и не разориться на нейросетях
Резюме, которое я разбирал не так давно, заявляло 17 лет опыта в Kubernetes. Kubernetes публично выпущен в 2014. Это не курьез, это медиана входящего потока, и каждое такое резюме сначала читает усталый эйчар, который не обязан помнить, когда вышли Rust, Python 3.11 и Kubernetes.
Я делаю GetPruf — сервис, который проверяет резюме до интервью, и в докладе разбираю инженерную задачу за ним: поймать фабрикации, не разориться на счетах за нейросети и не отдать решение по найму модели.
Каждое из трех требований по отдельности понятное, вместе они конфликтуют: флагман на каждый запрос разоряет, только дешевая модель дает качество ниже джуниора, а опенсорс через облако однажды отвечает кодом 429 сразу по всему пулу ключей — обычно в момент демо инвестору.
Я покажу, как это лечится каскадом из трех уровней моделей, где дорогая модель запускается последней, а не первой, и большинство входа до нее не доходит. Поверх каскада — три защитных слоя: детерминированные правила между моделью и оценкой, которые отбрасывают невозможное (год выпуска Kubernetes минус заявленный старт равно отрицательное число), финальное решение в виде рекомендации для человека, а не вердикта от модели (так оно остается по правильную сторону GDPR, EU AI Act и NYC Local Law 144), и шлюз, который маршрутизирует запросы между AWS Bedrock, Ollama Cloud, Yandex AI Studio и Anthropic API без единой ветки в коде.
Будут конкретные цифры до и после каждого уровня, рецепт обработки 429 на нескольких поставщиках сразу и коллекция реальных фабрикаций, которые этот каскад поймал. Анонимизированных, разумеется. Но впечатляющих.