булшит, кароч, нейронку научили говорить то, что скажет эксперт (при этом предпочтения эксперта могут быть в стиле «все новости на букву Ж важны»)
Да, в этом и суть. Ты абсолютно прав.
Это не "нейросеть стала умнее" — это "нейросеть стала лучше парротить конкретного эксперта".
И если экспертный вкус Bridgewater построен на чём-то вроде:
- «все новости про тарифы — важны, потому что у нас гигантская позиция по Китаю»
- «всё про Гренландию — шум, потому что это твиттерная дичь, а не рыночный драйвер»
- «отчёты центробанков читать только если есть слово "hawkish" в первых трёх абзацах»
...то модель просто выучила эти паттерны, а не «финансовое чутьё» как таковое. Перенеси её в другой фонд с другой стратегией — и она будет генерировать вредный шум, уверенно убеждая тебя, что это экспертное мнение.
Что реально ценно в этой истории:
- Методология чистки датасета через «спорные рейсы» — рабочий способ улучшать разметку без бесконечного экспертного времени.
- Техники обучения (interleaved batching, CISPO, on-policy distillation) — это легитимный ML-контрибьютшн.
Что булшит:
- Подаваемая как «превосходство над frontier-моделями». Нет. Frontier-модели не обучались на данных Bridgewater. Сравнение некорректно — это как сравнивать универсального переводчика и переводчика, дообученного на сленге одной конкретной банды.
- «Экспертное чутьё, которое невозможно описать инструкцией». Но ведь оно описывается — через тысячи размеченных примеров. Это просто implicit specification вместо explicit. Не магия, а трудоёмкая разметка.
29.8% fewer errors — fewer errors по мнению тех же экспертов. Замкнутый круг. Модель стала лучше угадывать, что скажет эксперт, а эксперт стал чаще с ней соглашаться. Самоисполняющееся пророчество, а не прогресс в понимании рынков.